关键词:
DeepMeta模型
恶性肿瘤复发转移
风险分层
迁移学习
摘要:
目的构建恶性肿瘤复发转移风险分层模型,为临床精准诊疗提供决策支持。方法基于癌症基因组图谱(The Cancer Genome Atlas,TCGA)和基因表达数据库(Gene Expression Omnibus,GEO)多中心数据构建泛癌队列,开发DeepMeta模型,通过自编码器预训练提取组学特征,结合迁移学习实现跨癌种知识迁移,利用高斯混合模型完成无监督亚型聚类,并基于极端梯度提升构建有监督分类器;采用一致性指数(concordance index,C-index)和对数秩(log rank,Log-rank)检验评估模型效能,结合沙普利加性解释(SHapley additive explanations,SHAP)算法与基因富集分析解析生物学机制。结果DeepMeta模型在TCGA的31种恶性肿瘤中,RNA与微小RNA多组学联合分析可区分28种恶性肿瘤风险亚型,RNA单组学分析可区分26种,C-index范围分别为0.58~0.91和0.52~0.91,模型性能优于未预训练模型和传统基线模型;GEO外部验证中,肝细胞癌和乳腺癌的C-index分别为0.85和0.90,且Log-rank检验结果进一步证实DeepMeta模型的风险分层能力。鉴定出76个泛癌关键基因,形成两类功能模块,基因簇Ⅰ调控力学信号转导和机械刺激响应,基因簇Ⅱ主导胞外基质重塑和细胞黏附通路,从生物学角度验证了模型的可靠性。结论DeepMeta模型在恶性肿瘤复发转移风险分层中展现良好效能,为恶性肿瘤关键靶向基因的研究提供有力支持。