专栏名称: 深圳国家基因库
深圳国家基因库是中国首个且唯一的国家基因库,致力于大数据、大科学、大产业时代的生物资源收集保藏与开发利用。
目录
相关文章推荐
深圳图书馆  ·  “智慧星”榜单发布!快来看看谁榜上有名! ·  昨天  
深圳图书馆  ·  明起预约 │ ... ·  3 天前  
深圳大件事  ·  注意!深圳这些地方,实施临时交通管制 ·  2 天前  
深圳特区报  ·  藏不住了!免费免预约!附攻略→ ·  2 天前  
51好读  ›  专栏  ›  深圳国家基因库

单分子测序技术的那些事儿

深圳国家基因库  · 公众号  · 深圳  · 2018-01-18 17:20

正文

请到「今天看啥」查看全文



★ZMW有效的限制了激光的激发区域仅仅在ZMW底部以上几十nm的空间,大大降低了游离态的荧光标签分子所带来的背景噪音;


★荧光标签结合在磷酸根上,使得连续合成得以实现,而且能有效地保持聚合酶的活性并大大延长读长。


当然除了这两点,还有很多很重要的技术突破,譬如环状循环模板测序,将光波导和影像传感器集成到测序芯片上等等,才有了今天Sequel这款出色的单分子测序机器。


图2. PacBio的单分子实时测序方法原理介绍,来源2


2.ONT的技术


基本原理更加简单,如图3所示:在电场力作用下,溶液中的带电离子可以穿越蛋白质纳米孔并产生离子电流信号,待测DNA单链分子加入溶液后会在电泳作用下顺次穿孔 并阻断部分离子的穿越而造成离子电流突变减小。不同的碱基会带来不同的离子阻断电流,从而可以根据离子阻断电流大小来识别碱基。


这里面有两个关键的技术点:


★找到最小内径只允许DNA单链通过的蛋白质纳米孔,且其最敏感区域所 容纳 的碱基越少越好 (理想情况只容纳1个碱基), 这样的纳米孔才能有最大的信号区分度, 事实上,很难找到只容纳一个碱基的超薄纳米孔,通常在最敏感区域内是一段碱基序列,但根据离子阻断电流大小的差异同样可以推断出不同的序列组合。 目前Illumina的MspA(4个碱基)和ONT的CsgG(4-6个碱基,不确定)是最优代表;


★利用了机动蛋白(聚合酶或者解旋酶)在单碱基精度上有效控制DNA分子的穿孔过程, 很大程度上解决了穿 孔速度过快所导致的信号分辨率问题。


图3. 纳米孔Strand Sequencing原理,来源3


表格1是PacBio的Sequel和ONT的一系列产品的参数比较.需要指出的是,ONT的指标一般都是最优指标,需要有更多的使用者共享数据,所以目前仅供参考。





PacBio有2个比较难解决的问题:


1. 单次准确率较低 :错误率主要来自于生化反应,包括聚合酶的错误,非配对碱基产生信号,荧光标签失效等等,这么多年的改进中这个基本没有大的变化;虽然这种错误是随机的,因此PacBio可以用环状模板循环测序以达到高共有准确率(consensus accuracy),但必须指出这牺牲了读长的优势,因为聚合酶结合在模板上面的总时间是有限的,太长的环状模板对提高覆盖度无用。


2 .价格昂贵 :单分子光学检测所需要的设备便宜不了,而把光学部分集成在芯片上面的话芯片本身的成本又上去了。


说到这里顺带提提Helicos公司,它的tSMS(truesingle-molecule sequencing)技术首次实现了单分子测序,并在2009年用于测出其创始人Stephen Quake的个人全基因组。当初是很受追捧的一家公司,但回过头来看看,该技术作为一种短读长非实时的单分子测序技术,和二代技术比拼准确率、通量和成本是 ,应该 很难成功的。继承了其技术 衣钵 的瀚海基因能否在短读长靶向测序方向占得一席之地并不明朗。


ONT技术面临的最大困难仍然是 准确率较低 ,主要体现在三个方面:


1.虽然电场力和机动蛋白在一定程度上控制了DNA分子在纳米孔内的随机热运动,但这里面仍然存在极限;


2.此外任何依赖于酶的读取过程都会受到酶本身错误率的影响;


3.最后就是如何解决homopolymer长链的测序, 非官方渠道沟通已经能轻松超越10mer ,有待验证


尽管如此,ONT这几年来在准确率方面的飞速提升十分惊人,目前单次准确率和两次准确率已经对外宣称达到92%和96%,这 一方面来自于蛋白改造的进步,另一方面就是大量数据加上深度学习所带来的算法优化 。此外再考虑到 ONT的设备如此低廉,而且其测序芯片的价格还有空间下降,拥有便携式等特有优势, PacBio的 前途蒙上了阴影。


指标

Sequel

(PacBio)

MinION

(ONT)

GridION

(ONT)

PromethION







请到「今天看啥」查看全文