La Manno, Gioele, et al. "RNA velocity of single cells."*Nature, *560.7719 (2018): 494-498. 开篇之作,引入了 RNA velocity 的概念,但是在参数估计等方面有值得改进的地方
Bergen, Volker, et al. "Generalizing RNA velocity to transient cell states through dynamical modeling."*Nature biotechnology, *38.12 (2020): 1408-1414. Fabian 组的文章,在参数估计上有了比较大的改进,核心的改进有丢掉了 general constant 的假设,利用 EM 来估计 gene specific 的parameter,从而使得估计更加准确
Li, Tiejun, et al. "On the Mathematics of RNA Velocity I: Theoretical Analysis."bioRxiv(2020). 李铁军老师的文章,系统的梳理 RNA velocity 背后的理论基础,包括确定性模型(ODE),随机模型(化学主方程),连续化等拓展,并且之后其实还有分析不同模型产生的结果的文章,但 in preparation,还未能读到。
Qiu X, Zhang Y, Yang D, et al. Mapping vector field of single cells[J]. Biorxiv, 2021 非常精彩的文章,结合 metabolic labeling 的数据(可以标记新生成的 RNA)与 RNA velocity,从而对于 RNA velocity 有更真实意义上的刻画,并且将离散的 velocity 推广在cell state space 的 Vector Field,并且有一系列的分析(还没读完hhh)
本文主要是起 introduction 的作用,简述一下核心的思想。
Introduction
个人理解 single cell 技术最重要的优势:单细胞水平的分辨率 + 高通量带来的大样本
首先单细胞水平的分辨率使得 single cell 技术可以直接得到单细胞的表达谱,不需要像 bulk 时代那样需要取一堆细胞然后才能测得平均表达谱,因此在研究细胞分化上有天然的优势。并且可以对发育早期的少量细胞进行测序,得到异质性的结果。
私以为上述几篇文章中可以称的上 beyond 的也就是 "Mapping vector field of single cells" [dynamo(https://dynamo-release.readthedocs.io/en/latest/)],结合 metabolic labeling (能够标记新生成的 mRNA),引入真实的时间,从而从两个时间尺度来刻画 velocity
包括三种model
1. model I 单纯的 RNA velocity;
2. model II 单纯的 labeling RNA velocity;
3. model III RNA velocity + labeling velocity。并且在离散的 velocity 基础上得到 vector field。
预告:这个 RNA velocity and beyond 系列之后大概会写 Theory 部分 ,主要介绍 model detail,怎么 estimate parameter等,最后写 beyond 的部分,也就是dynamo 的内容。