专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
目录
相关文章推荐
生物学霸  ·  25 名学者被集中通报批评!基金委公布 ... ·  8 小时前  
生物学霸  ·  高璞课题组招聘启事 ·  11 小时前  
生信宝典  ·  hLife | VarEPS-MPXV: ... ·  2 天前  
51好读  ›  专栏  ›  生信菜鸟团

tinyarray简化多分组芯片数据分析

生信菜鸟团  · 公众号  · 生物  · 2025-04-26 09:38

正文

请到「今天看啥」查看全文



gpl_number = geo $gpl

分组信息在pd的title列,所以从中提取需要的关键词整理为对应的分组即可

分组向量与探针注释整理

#整理分组信息且设置因子排序
Group=str_split(pd$title," ",simplify = T)[,1]
Group=factor(Group,levels = c("normal","hyperplasia","dysplasia","tumor"))
#获取探针注释
gpl_number
find_anno(gpl_number)

get_gpl_txt(gpl_number,download = T)
a = read.delim("GPL18802.txt",skip = 8,comment.char = "!")

colnames(a)
ids = a[,1:2]
#如果有空行怎么去掉
k = ids$GeneSymbol!=""
ids = ids[k,]
colnames(ids)=c("probe_id","symbol")
head(ids)

使用 find_anno 没有找到对应的探针注释,所以还是使用 get_gpl_txt







请到「今天看啥」查看全文