专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
目录
相关文章推荐
生物学霸  ·  30 个器官、37 ... ·  昨天  
生物制品圈  ·  连续流、釜式工艺,谁更胜一筹? ·  2 天前  
BioArt  ·  PNAS ... ·  2 天前  
生物学霸  ·  胡荣峰课题组诚聘科研助理 ·  2 天前  
51好读  ›  专栏  ›  生信菜鸟团

Peaks 筛选过滤策略

生信菜鸟团  · 公众号  · 生物  · 2025-04-07 18:19

正文

请到「今天看啥」查看全文



单独样本callpeak

我们一对一进行 callpeak

GLU1=bam/SRR3033154.bam
GLU2=bam/SRR3033155.bam

ETH1=bam/SRR3033156.bam
ETH2=bam/SRR3033157.bam
macs2 callpeak -t $ETH1 -c $GLU1 --gsize 1E7  --name ETH1 --outdir ETH1/ 
macs2 callpeak -t $ETH2 -c $GLU2 --gsize 1E7  --name ETH2 --outdir ETH2/ 
$ wc -l ETH1_summits.bed
90 ETH1_summits.bed

$ wc -l ETH2_summits.bed 
87 ETH2_summits.bed

继续看第一个peak



可以看到 单独样本 peak 的峰值位点都不太一样,也可以看出合并样本的包容性似乎是最强的。

评估重复性

单样本分开分析就可以评估样本的重复性。推荐两个工具吧。

  1. bedtools jaccard
$ bedtools jaccard -a ETH1/*narrow* -b ETH2/*narrow*
intersection    union   jaccard n_intersections
10090   17339   0.581925        58
指标
含义
intersection
两重复峰区域重叠的碱基数(bp)
union






请到「今天看啥」查看全文