专栏名称: 生信人
共同学习生物信息学知识,共同探究生物奥秘。
目录
相关文章推荐
BioArt  ·  Immunity丨细菌抗肿瘤免疫治疗“双刃剑 ... ·  7 小时前  
BioArt  ·  Sci. Transl. ... ·  15 小时前  
生物学霸  ·  关于发布 2025 ... ·  昨天  
生信菜鸟团  ·  Nature | 什么可以决定细胞的癌变能力? ·  2 天前  
BioArt  ·  中国药科大学科研院招聘启事 ·  昨天  
51好读  ›  专栏  ›  生信人

TCGA miRNASeq 数据生存分析

生信人  · 公众号  · 生物  · 2017-05-25 07:20

正文

请到「今天看啥」查看全文


3、接下来下载临床数据,同RNASeq 数据一样下载到一指定文件夹,点击“Clinical”,会得到文件Clinical_matrix.txt。


第二步利用R处理文件数据,做RNASeq数据的生存分析


1、首先需要安装相应的R包

需要的第一个包肯定是“survival”,它里面的Surv函数能直接对数据进行生存分析。

library(survival)

我们还需要 “limma”包,需要用到里面的voon函数,对数据进行标准化。

source("http://bioconductor.org/biocLite.R")

biocLite("limma")

library(limma)

2、处理RNASeq文件数据

1)导入文件(记得改变工作目录setwd(目录)):

rna 

2)数据中有许多“0”数据,剔除超过50%的表达值为0的样本:

rna rem    x    x    r    remove dim(x)[2]*0.5)
   return(remove)
}
removerna

3)区别正常和肿瘤样本:根据TCGA样本分类的原则,第4个参数指样本类型,“Tumor types range from 01 - 09, normal types from 10 - 19 and control samples from 20 - 29”例如TCGA-CM-4746-01,第4个参数是01,所以是肿瘤样本。可以看出第4个参数第1位即总第14位如果是“0”,则为肿瘤样本,“1”则为正常样本。







请到「今天看啥」查看全文