专栏名称: AI与医学
分享前沿的人工智能与医学交叉研究,提供医疗科研服务。关注大壮,科研顺畅。做医护人员科研的小助手,为您全心全意服务。
目录
相关文章推荐
龙商网超市周刊  ·  溯源中国好商品——走进中国最大的坚果产业基地 ... ·  4 小时前  
龙商网超市周刊  ·  溯源中国好商品——走进中国最大的坚果产业基地 ... ·  4 小时前  
Python大全  ·  微信自动扣费管理,关闭服务的操作方法(202 ... ·  13 小时前  
债文新说  ·  本周!上海! ... ·  16 小时前  
债文新说  ·  本周!上海! ... ·  16 小时前  
田俊国讲坛  ·  田俊国:如何用萃取的方式实现个人成长 ·  昨天  
河南药品监管  ·  第一监管分局举办药品追溯体系建设培训 ... ·  3 天前  
河南药品监管  ·  第一监管分局举办药品追溯体系建设培训 ... ·  3 天前  
51好读  ›  专栏  ›  AI与医学

顶刊速看:《Nature Communications》IF=14.7 对癌症合成致死率预测的机器学...

AI与医学  · 公众号  ·  · 2024-11-04 02:19

正文

请到「今天看啥」查看全文


缺乏全面的基准测试。


这篇论文系统地对 12 种用于 SL 预测的机器学习方法进行了基准测试,评估了它们在不同数据拆分场景、负样本比率和负采样技术在分类和排名任务中的表现。

研究方法

(1)数据及预处理

①合成致死性(SL)标签数据,进行 数据的过滤及处理。

②蛋白质-蛋白质相互作用(PPI)数据, 构建PPI网络。

③基因本体(GO)数据, 计算基因之间的功能相似性和GO术语之间的语义相似性。

④通路数据, 构建通路数据的对称掩码矩阵。

⑤基因表达和基因依赖性得分数据, 设计这些数据的负样本采样方法。


(2)实验场景设计

①测试了1:1、1:5、1:20和1:50四种正负样本比例。

②设计了CV1、CV2和CV3三种数据分割方法,以模拟不同的预测场景。

③提出了基于 基因表达相关性 基因依赖性得分相关性 的两种新的负样本采样方法(NSMExp和NSMDep)。

(3) 通过分类和排名任务的得分,计算模型的整体性能。

(4) 选择了12种机器学习方法进行基准测试,包括三种基于矩阵分解的方法和九种基于深度学习的方法。


研究结果

(1)分类和排名任务的性能评估

  • 使用分类分数和排名分数来评估模型性能。

  • 发现通过提高数据质量(例如,从训练中排除计算得出的SLs和基于基因表达的负标签采样)可以显著提高所有方法的性能。

(2 )对未见基因的泛化能力

  • 通过三种不同的数据分割方法(CV1、CV2和CV3)评估了模型的一般化能力。

  • SLMGAE在所有DSMs中表现最佳,表明其具有良好的泛化能力。







请到「今天看啥」查看全文