正文
TCGA数据库中异常表达的肺鳞状细胞癌(LUSC)lncRNA
通过R语言计算每个LncRNA的表达水平。根据计算标准,在LUSC中获得了884个异常表达的lncRNA,包括669个高表达和215个低表达(Fig.1A)。
异常表达的lncRNA进行ROC分析,列出了在ROC曲线下面积(AUC)超过0.95的前75个lncRNAs ,这些lncRNA可能在LUSC的发生中起重要作用,具有LUSC高诊断价值(表1,未列全)。
AUC:
Area Under Curve被定义为ROC曲线下的面积,面积值在1.0和0.5之间。ROC曲线下的在AUC>0.5的情况下,AUC越接近于1,说明诊断效果越好。AUC在 0.5~0.7时有较低准确性,AUC在0.7~0.9时有一定准确性,AUC在0.9以上时有较高准确性。
选择前10名异常表达的lncRNA(表2)进一步分析,包括表面活性剂相关1(SFTA1P)、LINC00968、LINC00961、LINC01572、RP1-78O14.1,相邻的非编码发育调节RNA(FENDRR)、LINC01314、LINC01272、GATA6-AS1和MIR3945HG。
LUSC中LINC01572的水平明显高于相对应肿瘤组织。相反,其他9个lncRNA在LUSC组织中均明显下调(Fig.2)。
这10个异常表达的lncRNA显示出具有高诊断价值,将LUSC与非癌性肺组织区分,AUC均大于0.99(Fig.3)。
生存分析显示,SFTA1P、LINC01272、GATA6-AS1、MIR3945HG与LUSC的存活时间显著相关(Fig.4)。
多变量cox分析显示,SFTA1P可能是LUSC的独立预后指标(补充表1)。当关注这10个lncRNA与LUSC进展之间的关系时,有几个lncRNA与LUSC的一些临床数据密切相关(表3,Fig.5)。
特别的,LINC01572和LINC01314的水平可以辨别LUSC患者的早期阶段。从TCGA平台提取FGFR1(成纤维细胞生长因子受体1)的原始数据,FGFR1和10个lncRNA之间存在显著正相关(Fig.6)。