专栏名称: 生信技能树
生物信息学学习资料分析,常见数据格式及公共数据库资料分享。常见分析软件及流程,基因检测及癌症相关动态。
目录
相关文章推荐
酒哥  ·  直降100!BDM醉顶风土!FA97鼎级单一 ... ·  3 小时前  
必经之路  ·  当你一无所有时,请记得还有它 ·  昨天  
51好读  ›  专栏  ›  生信技能树

转录组链特异建库该考虑吗?

生信技能树  · 公众号  ·  · 2017-10-24 09:48

正文

请到「今天看啥」查看全文


有的时候,如果一大片点都是同一种荧光,机器也可能犯晕,不知道到底哪一个荧光属于哪一个序列。这种情况尤其是在序列的前几个碱基容易发生。

The sequencing machine uses the first few bases to establish where the cDNA fragments are on the flow cell. If all of the bases in one part of the flow cell are all the same, like 'C', and all show up green in the picture, then the colors will bleed together and it will not be clear where exactly all of the reads are. In contrast, if you have a lot of different colors in a region, it's easier to determine where each one is, even with a little color bleed.



链特异性测序

和普通的RNAseq不同,链特异性测序可以保留最初产生RNA的方向,普通建库方式为什么不行呢?因为传统建库方式通过两个接头的ligation把RNA已经变成了双链DNA,最后的文库中一部被测序的链对应正义链(sense strand),一部分被测序的链测是反义链。

链特异性建库方式有不止一种,对应到不同的软件又有不同的叫法,下面是几种称呼。 要记住的是dUTP 测序方式的名字是fr-firstrand,也是RF。 至于具体的read方向接下来通过更详细的IGV截图说明问题。



链特异性建库方式(以目前最常用的dUTP为例,如下图所示)首先利用随机引物合成RNA的一条cDNA链,在合成第二条链的时候用dUTP代替dTTP,加adaptor后用UDGase处理,将有U的第二条cDNA降解掉。



这样 最后的insert DNA fragment都是来自于第一条cDNA,也就是dUTP叫fr-firststrand的原因 。对于dUTP数据, tophat 的参数应该为 library - type fr - firststrand 。这里的first-strand cDNA可不是RNA strand,在使用 htseq-count 时,真正的正义链应该是使用参数 - s reverse 得到的结果。

正正反反不清楚

说到链特异性测序,实在让人困惑的是 各种链的概念 ,尤其是翻译成中文就更说不清了。

DNA 的正链和负链,就是那两条反向互补的链。参考基因组给出的那个链就是所谓的正链(forword),另一条链是反链(reverse)。但是这正反一定 不能和正义链(sense strand)反义链(antisense strand)混淆 ,两条互补的DNA链其中一条携带编码蛋白质信息的链称为正义链,另一条与之互补的称为反义链。但是携带编码信息的正义链不是模板,只是因为它的序列和RNA相同,正义链也是编码链。而反义链虽然和RNA反向互补,但它可是真正给RNA当模板的链,因此反义链也是模板链。







请到「今天看啥」查看全文