专栏名称: BioArt
BioArt致力于分享生命科学领域科研学术背后鲜为人知的故事,及时报道和评论生命科学领域有料的动态,BioArt也是一个生命科学领域“百花齐放,百家争鸣”的舞台,循“自由之思想”与“独立之精神”为往圣继绝学。
目录
相关文章推荐
BioArt  ·  J Clin ... ·  8 小时前  
生信宝典  ·  视频 | ... ·  昨天  
生信人  ·  不能被低估的综述:肿瘤是全身性疾病 ·  2 天前  
51好读  ›  专栏  ›  BioArt

Nat Commun|林树海/蔡宗苇/曾珺合作开发新型脂质组学AI模型LipidIN

BioArt  · 公众号  · 生物  · 2025-06-03 08:33

正文

请到「今天看啥」查看全文


8923 种脂质,同时整合 谱图再生成 网络 WMYn 通过深度学习重构脂质碎片特征图谱,使目标分子召回率提升 20% 。在临床队列研究中, LipidIN 已成功应用于脂质注释与生物标志物发现,其标准化分析流程显著提升了跨平台数据的可比性与可重复性。

1 . L i pidIN 计算框架。

在研究结果部分,本文对 LipidIN 的性能进行了全面评估,并将其与现有的分析工具 MS-DIAL LipidSearch Spectral Entropy LipidMatch 进行了比较。该 基准 实验 使用了 NIST 1950 标准品 和多篇高影响力的文章数据集

以下是具体分析的几个要点:
1. 注释速度
为验证 目标任务体量 对匹配速度的影响,研究团队在低内存个人计算机 (单线程 CPU 环境) 上使用公开数据集 MetabolomicsWorkbench ST001794 进行测试,对比 EQ 算法与 Flash Entropy 在不同规模 MassBank 理论谱库中的性能表现。

结果显示 当谱库规模达到千万级时, EQ 算法保持稳定匹配速度 (完成 1000 万次 搜库 仅需 2.3 微秒) ,而 Flash Entropy 在百万级 搜库 时单次 MS2 匹配耗时增至 0.14 秒,速度下降显著。得益于哈希表与二分法的联合优化, EQ 算法可在 0.23 毫秒内完成十亿次 MS2 谱图比对 (每秒可完成超过 4 亿次谱图比对) ,在使用百万级谱库时较 Flash Entropy 提速约 6 万倍。

2. 注释覆盖度
为验证算法性能,研究团队采用已公开数据集 MetabolomicsWorkbench ST001794 ST00 2384 对比了 MS-DIAL LipidSearch Spectral Entropy LipidMatch 等常用小分子化合物注释工具。

实验显示, EQ 模块结合 MS-DIAL 公共数据库在 Top-20 候选列表中实现约 70% 召回率 (召回率定义为工具与文献注释交集数 / 文献总注释数) ,而联合 LCI 模块的四级分层谱库策略,将召回率提升至 90% 以上。






请到「今天看啥」查看全文