关键词:
非小细胞肺癌
SMARCA4
机器学习
免疫微环境
单细胞分析
空间转录组学
摘要:
目的 分析SMARCA4缺失的非小细胞肺癌(SMARCA4-deficient non-small cell lung cancer,SMARCA4-dNSCLC)的分子生物学信息与临床预后的相关性,同时探讨SMARCA4-dNSCLC肿瘤微环境(tumor microenvironment,TME)中细胞之间相互作用的空间特征和分子机制。方法 利用来自癌症基因组图谱(The Cancer Genome Atlas,TCGA)和基因表达综合数据库(Gene Expression Omnibus,GEO)的数据,本研究对SMARCA4-dNSCLC中的差异表达基因(differentially expressed genes,DEGs)进行了功能富集分析,并描绘了其基因组变异景观。通过加权基因共表达网络分析(weighted correlation network analysis,WGCNA)和10种不同的机器学习算法组合,以中位风险评分(RiskScore)将训练组患者分为低风险组和高风险组,建立相应的预后预测模型,并在此基础上构建了一个列线图预测患者1、3、5年生存率。绘制K-M生存曲线、受试者工作特征(receiver operating characteristic,ROC)曲线和时间依赖性ROC曲线评价模型的预测能力,GEO外部数据集进一步验证了预测模型的预后价值。此外,我们还评估了预后模型的TME免疫学特征。最后,利用单细胞RNA测序(single cell RNA sequencing,scRNA-seq)和空间转录组(spatial transcriptome,ST)探讨了SMARCA4-dNSCLC TME中细胞之间相互作用的空间特征、细胞间通讯和分子机制。结果 共纳入训练组56例患者,其中男38例、女18例,中位年龄62(56~70)岁,低风险组和高风险组各28例。验证组474例患者,其中男265例、女209例,中位年龄65(58~70)岁。建立了由8个预后特征基因(ELANE、FSIP2、GFI1B、GPR37、KRT81、RHOV、RP1、SPIC)组成的风险评分模型,与低风险组患者相比,高风险组患者表现出更不利的预后结局。免疫学特征分析显示,低风险组和高风险组之间的多种免疫细胞存在浸润差异。ScRNA-seq和ST分析发现,细胞间相互作用主要通过巨噬细胞迁移抑制因子(macrophage migration inhibitory factor,MIF)信号通路(MIF-CD74+CXCR4和MIF-CD74+CD44)的配体-受体对接触,同时描述了MIF信号通路在组织区域的生态位相互作用。结论 本研究构建的8基因组预后模型在预测SMARCA4-dNSCLC的生存方面具有一定的预测精度。结合ScRNA-seq和ST分析,TME中细胞之间可能通过MIF信号通路(MIF-CD74+CXCR4和MIF-CD74+CD44)来进行细胞间通讯和空间生态位相互作用。