正文
此外,其他工具解决了亚群检测(例如,波士顿哈佛医学院Peter Kharchenko开发的Pagoda)和空间定位的问题,其使用了关于组织中基因表达分布的数据来确定每个转录组产生自哪里。Rahul Satija工作于纽约基因组中心,他开发一种这样的工具,名为“Seurat”。他表示,该软件利用这些数据,将细胞定位为三维空间中的点。“这就是为什么我们将其命名为Seurat(Seurat为法国印象派画家,在绘画技法上运用画笔一笔一笔点在画面,这种作品被称为点彩画)。”他解释说,“因为这些点让我们联想起了一副点彩画。”
尽管针对特定的任务,这些工具通常涉及多种功能。例如,Rahul Satija的研究团队通过Seurat进行了细胞亚群分析,以识别新的免疫细胞。
加州大学圣地亚哥分校的生物信息学家Gene Yeo谈道,大多数的scRNA-seq工具都是基于R语言的Unix程序或软件包编程的,但相对而言,很少有生物学家在这些环境中工作。即便是这样,他们也可能没有时间下载和配置所有工作,使这些工具真正发挥作用。
目前,研究人员已经开发了一些即用型的流程。还有端到端的图形工具,包括来自FlowJo的商业化GenSeq软件包,以及一对开源的Web工具:来自Garmire集团的Granatum和来自瑞士联邦理工学院Bart Deplancke实验室的ASAP(自动单细胞分析流程)。
ASAP和Granatum使用Web浏览器提供相对简单的交互式工作流程,使研究人员能够以图形的方式探索数据。用户上传了他们的数据后,软件会逐步走完他们的步骤。对于ASAP,这意味着通过可预处理、可视化、聚类和基因表达差异分析获取数据;Granatum还允许伪时间分析和蛋白质交互作用数据的整合。
Garmire和Deplancke也都表示,ASAP和Granatum旨在让生物信息等多个领域的研究人员共同合作。研究人员曾经认为,“(生物信息学家)获取数据并产生结果是十分神奇的,”夏威夷大学博士生、Granatum首席开发人员Xun Zhu表示,“现在研究人员可以参与一些参数的调整,这是一件好事。”
当然,这些工具并不是完美的。
例如,在识别细胞类型方面性能优异的工具可能会因伪时间分析而出现问题。此外,加州大学伯克利分校生物统计学家Sandrine Dudoit强调,合适的方法是“非常依赖于数据集的”。这可能需要对方法和参数进行调整,以考虑诸如测序长度之类的变量。但Marioni谈道,重要的是不要完全信任这些流程,他打比方说:“就像卫星导航告诉你开车进入河流,但你可不能真开进河里。”
对于初学者来说,保持谨慎的态度是有道理的。生物信息学工具几乎总是能给出答案;但问题是,这些答案究竟意味着什么?
Dudoit的建议是进行一些探索性的分析,并验证你所选择算法的假定条件是有意义的。
Satija还谈道,
一些分析任务仍然颇具挑战性,如在不同实验条件或生物体间进行比较,并整合不同组学的数据。
但是,目前的工具已经基本满足了大多数研究人员的需求。Kendziorski建议那些感兴趣的研究人员可以深入了解。
每一种新的工具都可以揭示生物学的另一个方面,只要你关注科学,并做出明智的选择。
参考资料:
Single-cell sequencing made simple
·
END ·