正文
★ZMW有效的限制了激光的激发区域仅仅在ZMW底部以上几十nm的空间,大大降低了游离态的荧光标签分子所带来的背景噪音;
★荧光标签结合在磷酸根上,使得连续合成得以实现,而且能有效地保持聚合酶的活性并大大延长读长。
当然除了这两点,还有很多很重要的技术突破,譬如环状循环模板测序,将光波导和影像传感器集成到测序芯片上等等,才有了今天Sequel这款出色的单分子测序机器。
图2. PacBio的单分子实时测序方法原理介绍,来源2
基本原理更加简单,如图3所示:在电场力作用下,溶液中的带电离子可以穿越蛋白质纳米孔并产生离子电流信号,待测DNA单链分子加入溶液后会在电泳作用下顺次穿孔
并阻断部分离子的穿越而造成离子电流突变减小。不同的碱基会带来不同的离子阻断电流,从而可以根据离子阻断电流大小来识别碱基。
这里面有两个关键的技术点:
★找到最小内径只允许DNA单链通过的蛋白质纳米孔,且其最敏感区域所
容纳
的碱基越少越好
(理想情况只容纳1个碱基),
这样的纳米孔才能有最大的信号区分度,
事实上,很难找到只容纳一个碱基的超薄纳米孔,通常在最敏感区域内是一段碱基序列,但根据离子阻断电流大小的差异同样可以推断出不同的序列组合。
目前Illumina的MspA(4个碱基)和ONT的CsgG(4-6个碱基,不确定)是最优代表;
★利用了机动蛋白(聚合酶或者解旋酶)在单碱基精度上有效控制DNA分子的穿孔过程,
很大程度上解决了穿
孔速度过快所导致的信号分辨率问题。
图3. 纳米孔Strand Sequencing原理,来源3
表格1是PacBio的Sequel和ONT的一系列产品的参数比较.需要指出的是,ONT的指标一般都是最优指标,需要有更多的使用者共享数据,所以目前仅供参考。
PacBio有2个比较难解决的问题:
1.
单次准确率较低
:错误率主要来自于生化反应,包括聚合酶的错误,非配对碱基产生信号,荧光标签失效等等,这么多年的改进中这个基本没有大的变化;虽然这种错误是随机的,因此PacBio可以用环状模板循环测序以达到高共有准确率(consensus accuracy),但必须指出这牺牲了读长的优势,因为聚合酶结合在模板上面的总时间是有限的,太长的环状模板对提高覆盖度无用。
2
.价格昂贵
:单分子光学检测所需要的设备便宜不了,而把光学部分集成在芯片上面的话芯片本身的成本又上去了。
说到这里顺带提提Helicos公司,它的tSMS(truesingle-molecule sequencing)技术首次实现了单分子测序,并在2009年用于测出其创始人Stephen Quake的个人全基因组。当初是很受追捧的一家公司,但回过头来看看,该技术作为一种短读长非实时的单分子测序技术,和二代技术比拼准确率、通量和成本是
,应该
很难成功的。继承了其技术
衣钵
的瀚海基因能否在短读长靶向测序方向占得一席之地并不明朗。
ONT技术面临的最大困难仍然是
准确率较低
,主要体现在三个方面:
1.虽然电场力和机动蛋白在一定程度上控制了DNA分子在纳米孔内的随机热运动,但这里面仍然存在极限;
2.此外任何依赖于酶的读取过程都会受到酶本身错误率的影响;
3.最后就是如何解决homopolymer长链的测序,
非官方渠道沟通已经能轻松超越10mer
,有待验证
。
尽管如此,ONT这几年来在准确率方面的飞速提升十分惊人,目前单次准确率和两次准确率已经对外宣称达到92%和96%,这
一方面来自于蛋白改造的进步,另一方面就是大量数据加上深度学习所带来的算法优化
。此外再考虑到
ONT的设备如此低廉,而且其测序芯片的价格还有空间下降,拥有便携式等特有优势,
PacBio的
前途蒙上了阴影。
指标
|
Sequel
(PacBio)
|
MinION
(ONT)
|
GridION
(ONT)
|
PromethION
|