专栏名称: 生信圈
关注生物医学大数据、以及数据分析方法在转化医学研究中的应用进展,讨论与生物信息相关的一切话题。
目录
相关文章推荐
广晟控股集团  ·  “广晟杯”篮球决赛倒计时!赛场荣耀待您见证 ·  2 天前  
广晟控股集团  ·  “广晟杯”篮球决赛倒计时!赛场荣耀待您见证 ·  2 天前  
北京厚朴中医  ·  今晚19:00直播 | 夏季变美计划 - 耳穴专题 ·  3 天前  
北京厚朴中医  ·  厚朴电子日历 ·  5 天前  
北京厚朴中医  ·  厚朴电子日历 ·  6 天前  
北京厚朴中医  ·  厚朴电子日历 | 早 ·  2 天前  
51好读  ›  专栏  ›  生信圈

微生物扩增子分析流程——聚类OTU和物种注释

生信圈  · 公众号  ·  · 2017-09-12 21:00

正文

请到「今天看啥」查看全文


-o 输出文件夹;

-m 聚类方法, sortmerna, mothur, trie, uclust_ref, usearch, usearch_ref, blast, usearch61, usearch61_ref,sumaclust, swarm, prefix_suffix, cdhit, uclust共14种可选,默认为uclust;

-c 聚类算法,furthest, nearest, average三种可选,默认为furthest;

-s 相似度,默认为0.97;

--minlen=MINLEN 序列最短长度,默认为64;

--usearch_fast_cluster 快速比对,默认为false;

-r 参考序列

-z 容许序列反向后聚类,默认为false;

--threads=THREADS 线程数目,默认为1。


输出文件;

sample_otus.log #日志文件,程序运行的一些参数等信息,见图1

sample_otus.txt # 聚类结果文件,第一列为OTU编号,后面为序列名称,每条序列以tab隔开,见图2

图1 日志文件

图2 聚类结果文件


选取代表序列


由于每个OTU中的序列不完全相同,因此需要选取一条代表性序列作为该OTU的序列,用于后续分析;

python pick_rep_set.py -i sample_otus.txt -f sample.fa -o sample_rep_set.fasta


参数说明

-f







请到「今天看啥」查看全文