今天我为大家带来一篇发表在Genomics杂志上影响因子为6.2分的一篇单基因泛癌文章套路复现。
在本篇文章中,我会一步步带您完整复现文章当中的6张大图,简直就是保姆级教程,小伙伴们学完肯定都可以发生信文章哦~
话不多说,请各位看官往下看吧~
仙桃学术工具(https://www.xiantao.love/products)
Oncomine数据库(www.oncomine.org)
TIMER数据库(http://timer.cistrome.org/)
GEPIA2数据库(http://gepia.cancer-pku.cn/)
UALCAN数据库(http://ualcan.path.uab.edu/)
cBioportal数据库(https://www.cbioportal.org/)
STRING数据库(https://string-db.org/)
Venn数据库(http://bioinformatics.psb.ugent.be/webtools/Venn/)
DAVID数据库(https://david.ncifcrf.gov/)
Figure1 SND1在各个肿瘤的中mRNA/protein/病理分期的表达
Figure2 SND1高表达/低表达对生存的影响
Figure3 探究TCGA包含的不同肿瘤类型中SND1的遗传变异情况
Figure4 比较正常组织和原发性肿瘤组织中SND1磷酸化水平的差异
Figure5 探究不同免疫细胞的浸润水平与TCGA不同癌症类型中SND1基因表达之间的潜在关系
Figure6 探索与SND1结合的蛋白和SND1表达相关的基因,做富集分析,研究SND1在肿瘤发生中的分子机制
Figure1 SND1在各个肿瘤的中mRNA/protein/病理分期的表达
Figure1一般是研究单基因套路文章最常见也是最重要的一环,因为表达有差异是单基因分析的前提。登录TIMER数据库(http://timer.cistrome.org/)选择【Exploration】—【Gene_De】,在搜索框中输入SND1,点击Submit,获得分析结果,保存为PDF格式,可以直接用在文章当中。除了用TIMER可以做泛癌分析外,用我们的仙桃学术工具可以得到更美观的结果哦进入仙桃学术工具(https://www.xiantao.love/products)选择高级版,点击“立即使用”进入首先选择【表达差异(挑)】--【非配对样本】--选择疾病【泛癌】,因为有的癌种正常样本很少,一般会选择纳入来自GTEx数据的正常样本一起分析。参数部分的【类型】选择有4种,分别是点图,箱图/柱状图,小提琴图,组合图,我们这里选择箱图/柱状图,得出来SND1在泛癌中的表达量如下图所示,我们可以直接下载下来,放在文章中使用。Fig 1b 是针对Fig1a中TIMER数据库由于部分癌种没有正常样本,作者利用GEPIA软件将剩余癌种进行补充。选择【表达差异(挑)】--【非配对样本】--选择疾病DLBC,具体步骤详见下图,在底下的说明里,可以查看具体的Normal组,Tumor组有多少例样本,这些数据可以写在文章的材料与方法里同样的方法,将SND1在GBM,LGG,SKCM,TGCT,THYM肿瘤中的表达量做出来用仙桃学术的拼图工具拼起来,就得到了Fig 1b,用仙桃学术工具做出来得图美观又大方。Fig 1c 是关于SND1在不同癌症中蛋白的表达情况本张图是由UALCAN数据库(http://ualcan.path.uab.edu/)得到,它是一个TCGA数据库在线分析和挖掘的网站。我们这里利用CPTAC(蛋白质组数据库)分析SND1在疾病中的蛋白表达水平。从蛋白水平进行验证的优势在于,大多数其他数据库是从mRNA水平分析基因表达情况,CPTAC是从蛋白水平描述基因表达,更加接近疾病最原始表现形式。而且,CPTAC包含很多临床数据,可以很好的验证蛋白与临床的关系。目前CPTAC只能分析Colon cancer, Breast cancer, Ovarian cancer,Clear cell RCC,UCEC,LUAD ,6种癌症类型。图片直接下载即可。同样的步骤在6个癌种里都做一遍,即可得到Fig1c.Fig 1d SND1表达与不同癌症的临床分期之间的关系这里用到了GEPIA网站(http://gepia2.cancer-pku.cn/)第一步在左侧菜单栏中【Expression Analysis】下选择Expression DIY,第三步Datasets selection选择癌种,我们这里选择ACC第四步我们选择stage plot,想证明SND1表达和癌症临床分期有相关性同样的方法,我们将BLCA,CESC,COAD,KICH,LUAD,PAAD,THCA复现出来,拼在一起,即可得到Fig1dFig2a利用GEPIA分别画了SND1表达高低与BLCA,GBM,KICH,LIHC,UCEC癌的Overall survival相关。在BLCA, GBM,KICH,LIHC中,SND1表达越高,预后越差,而在UCEC中,得到相反的结果,SND1表达越高,预后越好。首先选择【survival analysis】,在第二步中输入【SND1】,接着第三步在下方栏中选择【Overall Survival】,第四步选择癌种,这里我们选择了BLCA,点击Plot出图,最后我们点击下载PDF即可。按照同样的方法,只需把BLCA换成GBM,KICH,LIHC,UCEC,即可复现出Fig2a。(不过复现到这里和文章当中的图还是略微不一样的,有些小伙伴可能会疑惑的点是图中黑框框住的这些深浅不一的color bar是什么意思,我们可以看一下右边这个标注,这些color bar是根据log10(HR)的值算出来的,从下图可以看到BLCA生存曲线图上面标的HR(high)是1.6,log10(1.6)=0.20也就是红色,UCEC的HR(high)是0.012,log10(0.012)=-0.40,为蓝色,讲解到这儿,小伙伴们就明白上面的color bar是如何得到的了~)Fig 2b SND1表达和Disease Free Survival生存之间的关系步骤和Fig2a几乎一样,不一样的地方在第三步,这里我们把Overall Survival换成Disease Free Survival,然后选择癌种,点击plot,下载PDF图片。拼起来即可得到Fig2bFigure3 探究TCGA包含的不同肿瘤类型中SND1的遗传变异情况
由cBioportal(https://www.cbioportal.org/)分析得到,我们来一步一步复现A图,我们首先打开cbioportal,在Quick Search这一栏输入基因名SND1我们可以看到SND1在30种肿瘤中的突变情况,这样Fig3a就复现完成,下载待用。接下来我们来看一下Fig3b,本图是展示每个结构域上具体的突变情况选择菜单一栏中【Mutations】鼠标放在每一个小圈圈上会展示具体的突变信息点击右下角的view 3D Structure,会出现3D模型图,更加立体直观,可以直接放在文章中。接下来Fig 3D是探索SND1突变与否和生存之间的关系,作者还是利用cBioportal这个工具。3:正常情况下我们选择来自TCGA的UCEC数据,并且尽量选择样本数大的那个数据集在第2步中,关于mRNA Expression根据需要,自行决定要不要勾选,本文当中没涉及到,我们这里就先不勾选了。接着在基因框中输入:SND1,点击Submit Query接着就会展示SND1具体到UCEC这个癌种里一些突变/生存/共表达等一些信息,我们选择【Comparison/Survival】这一栏,下面的子菜单栏我们选择【Survival】如第3步所示,第4步就出现了SND1突变与否与OS,DFS,PFS,RFS的关系,我们可以从第5步的箭头那里直接下载,放在文章里。至此,Fig3d也复现完成。Fig4 SND1在各个肿瘤中蛋白磷酸化水平的变化
点进来之后,我们首先来复现SND1在乳腺癌中的磷酸化水平的差异,我们从下图可以看到SN4结构域内S645基因座的磷酸化水平增加。如图网站中提供了3个乳腺癌中的SND1磷酸化位点,点击下载,用AI或者PS拼起来。同样的步骤,点击Ovarian cancer查看SND1的蛋白水平,网站提供了四个SND1磷酸化位点的蛋白表达水平,所有图都证明了在所有原发性肿瘤组织中显示比正常组织更高的磷酸化水平。同样的,在clear cell RCC中,网站提供了3个SND1磷酸化位点的蛋白表达,在LUAD中,网站提供了4个SND1磷酸化位点的蛋白表达,在UCSC中,网站提供了2个SND1磷酸化位点的蛋白表达,在Colon cancer中,网站提供了1个SND1磷酸化位点的蛋白表达,这样把所有的图下载,拼接,即可得到Fig4。这里可能会有小伙伴问Fig4a可以通过在线数据库点点点得到吗?这里其实是作者模仿了Fig3b的表达形式,通过画了一个简单的模式图,总结了SND1磷酸化位点,手动将SND1的每个结构域的磷酸化位点标注出来,显得整洁有条理,还和上文呼应。Fig5探究不同免疫细胞的浸润水平与TCGA不同癌症类型中SND1基因表达之间的潜在关系
作者是利用了TIMER数据库(http://timer.cistrome.org/)来分析。出来的结果就是本文中的Fig5a (图中只截了一半,点击下载按钮可以直接下载全图),如下图所示Fig5b 文中b图列举展示了BLCA肿瘤的MCPCOUNTER浸润情况,BRCA肿瘤的XCELL浸润情况,CESC肿瘤的EPIC浸润情况,HNSC肿瘤的MCPCOUNTER浸润情况,PRAD肿瘤的MCPCOUNTER浸润情况,TGCT肿瘤的MCPCOUNTER浸润情况。用鼠标点击BLCA栏的MCP-COUNTER,右边就会出现展示具体的浸润情况,点击BRCA,第三行第三列(-0.192)即可出现右下方关于BRCA具体的免疫浸润情况。依次将感兴趣的癌种具体免疫浸润情况拼接起来即可得到Fig5。Fig6 探索与SND1结合的蛋白和SND1表达相关的基因
首先利用STRING数据库,得到50个和SND1表达有相关性的基因然后作者通过GEPIA得到前100个和SND1表达有相关性的基因,接着往下做分析。首先在左侧菜单栏中选择【protein by name】右侧输入目标基因SND1,Organism选择Homo sapiens,点击SEARCH按钮随后我们点击【Settings】按钮,可以进行一些具体的设置,我们按照作者的设置复现,如下图所示Meaning of network edges选择【evidence】Active interaction sources选择【Experiments】Minimum required interaction score选择【low confidence(0.150)】Max number of interactors选择【no more than 50 interactors】条件设置完毕,点击【update】, 即可得到蛋白相互作用网络接着我们来复现Fig6b 利用GEPIA2得到和SND1表达相关的前100个基因作者取了前5位基因,然后用“correlation analysis”模块,分析排名前5的基因与SND1表达相关性大家可以试着用同样的步骤将另外四个基因与SND1表达相关性画出来,我们这里就不一一重复了。主要是利用热图将5个靶基因在各个肿瘤中的表达展示出来利用TIMER【Exploration】---子菜单栏选择【Gene_Corr】---输入目标基因【SND1】,Gene Expression栏中输入我们想观察的5个基因,分别是TBL2,PLOD3,CALU,GCC1,MYBBP1A。点击【Submit】直接下载PDF,将图片旋转90度即可得到Fig 6cFig 6d 则是用Venn图,将String和GEPIA得到的基因取交集,这个不多说,网址奉上,大家肯定都会。(http://bioinformatics.psb.ugent.be/webtools/Venn/)Fig 6e和6f 利用我们已经前面分析得到的和SND1结合或者相互作用的的蛋白,做KEGG和GO分析,下载word后的形式如下图,可以直接放进文章里,如果想要花哨一点的图的画,可以将这些数据用EXCEL或者其他的工具画出来,非常方便
至此,本篇文章的复现已经全部结束,复现过程非常的详细,看到这里的你是不是已经跃跃欲试了呢,可以按照本篇教程自己动手试一下哦。【福利时间!】
这样一个如此好用的生信工具,你是不是也手痒想一试为快?
现在为关注我的小伙伴提供1个福利,
扫码即可领取仙桃工具的基础版(1年),领取后还有生信文章零代码的复现训练营手把手带教答疑!
原价299/年,限时福利,免费领取!
限量300名!扫码领取!