专栏名称: 生信菜鸟团

生信菜鸟团荣誉归来，让所有想分析生物信息学数据的小伙伴找到归属，你值得拥有！

目录

相关文章推荐

生物学霸 · 25 名学者被集中通报批评！基金委公布 ... · 8 小时前

生物学霸 · 高璞课题组招聘启事 · 11 小时前

生信人 · Nature万字综述：癌细胞代谢与抗肿瘤免疫 · 昨天

生信人 · 数据库用的好，一区顶刊跑不了！——多维度聚焦 ... · 2 天前

生信宝典 · hLife | VarEPS-MPXV: ... · 2 天前

51好读 › 专栏 › 生信菜鸟团

tinyarray简化多分组芯片数据分析

生信菜鸟团 · 公众号 · 生物 · 2025-04-26 09:38

正文

请到「今天看啥」查看全文

gpl_number = geo $gpl

分组信息在pd的title列，所以从中提取需要的关键词整理为对应的分组即可

分组向量与探针注释整理

#整理分组信息且设置因子排序
Group=str_split(pd$title," ",simplify = T)[,1]
Group=factor(Group,levels = c("normal","hyperplasia","dysplasia","tumor"))

#获取探针注释
gpl_number
find_anno(gpl_number)

get_gpl_txt(gpl_number,download = T)
a = read.delim("GPL18802.txt",skip = 8,comment.char = "!")

colnames(a)
ids = a[,1:2]
#如果有空行怎么去掉
k = ids$GeneSymbol!=""
ids = ids[k,]
colnames(ids)=c("probe_id","symbol")
head(ids)

使用 find_anno 没有找到对应的探针注释，所以还是使用 get_gpl_txt

请到「今天看啥」查看全文

推荐文章

生物学霸 · 25 名学者被集中通报批评！基金委公布 2025 年第二批科研不端行为案件处理结果

8 小时前

生物学霸 · 高璞课题组招聘启事

11 小时前

生信人 · Nature万字综述：癌细胞代谢与抗肿瘤免疫

昨天

生信人 · 数据库用的好，一区顶刊跑不了！——多维度聚焦临床数据库

2 天前

生信宝典 · hLife | VarEPS-MPXV: 猴痘病毒变异预警系统助力精准防控

2 天前

爱车的诺诺 · 维修技师强迫症发作，竟然把3系车主难住了

7 年前

JitLogistics · 舍弗勒事件的思考：你的供应链够强健吗？

7 年前

投资银行在线 · 逆向投资之父：反向策略投资理念构建者德雷曼的投资真经！

7 年前

小新说车 · 【问答】40万内有哪些内饰质感好，又具备一定越野能力的SUV？

7 年前

APPSO · 为了让你用着舒服，设计师想到头都炸了| 灵感早读

7 年前

移动版

51好读 - 微信公众号文章