专栏名称: 生物探索
探索生物科技价值的新媒体
目录
相关文章推荐
BioArt  ·  Science | ... ·  昨天  
BioArt  ·  Nat ... ·  昨天  
生信人  ·  最新27+生信,原来只做了这些操作! ·  4 天前  
51好读  ›  专栏  ›  生物探索

Nature Medicine | 从“静态”到“动态”:miRNA如何实时预测1型糖尿病风险与疗效...

生物探索  · 公众号  · 生物  · 2025-06-07 15:30

主要观点总结



关键观点总结



正文

请到「今天看啥」查看全文


非遗传的、动态的因素在遗传易感性(genetic predisposition)中扮演着关键角色 。正因如此,我们需要更“聪明”、更“动态”的生物标志物,来捕捉疾病的实时动态,提供更早、更精准的干预窗口。

“动态”的魔法:miRNA如何成为新焦点?
要理解这项新研究的突破性,我们首先要认识miRNA——这些微小的、非编码的单链RNA分子,它们在基因表达(gene expression)的转录后调控(posttranscriptionally)中发挥着核心作用。换句话说,miRNA就像是细胞内的“总开关”,能够精确地开启或关闭某些基因的功能。正是这种精密的调控能力,让miRNA成为疾病诊断和治疗的强大工具。
miRNA之所以被认为是“动态”的生物标志物,是因为它们的表达水平会随着环境的变化和细胞功能状态的改变而波动。在T1D的背景下,miRNA的这种特性尤为重要,因为胰岛β细胞的功能丧失是T1D进展的关键特征。研究表明,miRNA不仅在免疫细胞亚型(immune cell subtypes)中差异表达,也在T1D患者和健康个体的血浆(plasma)和血清(serum)中呈现出不同的模式。
想象一下,当β细胞受损或死亡时,它们会将特定的miRNA释放到血液中,这些miRNA的浓度变化就成了反映β细胞健康状况的“晴雨表”。它们可以实时监测β细胞功能,并且能够从临床样本中可靠地检测出来。这为我们捕捉T1D的动态变化、预测疾病风险提供了前所未有的窗口,远远超出了传统静态标志物的能力范畴。

大数据淘金:50个“宝藏”miRNA的发现之旅
这项研究的开端,是一次深入的“大数据淘金”之旅。研究人员首先对754个已知和已验证的miRNA进行了分步发现分析。这包括:来自人胰腺发育过程的55个样本,成人胰岛(islet)和非胰腺组织(non-pancreatic tissues)的189个样本,以及5名近期发病T1D患者的血浆样本与5名年龄和性别匹配的对照组血浆样本。通过这些分析,研究人员识别出了一组在胰岛和非胰腺组织之间、β细胞发育过程中以及T1D与对照组血浆样本之间存在显著差异表达的miRNA。此外,还纳入了5个先前研究报告过但本次发现分析中未达统计学意义的miRNA,以确保全面性。最终,共有50个miRNA被确定为“PREDICT T1D miRNA”标志物。
此外,研究人员查阅了截至2020年发表的21项相关研究,发现这50个PREDICT T1D miRNA中的绝大多数(超过90%)在此前的独立研究中已被证实与T1D的遗传风险(HLA)、自身抗体表达、T1D状态或早期发病(15岁以下)相关。这充分验证了这组miRNA的广泛性和重要性,说明它们在全球不同实验室和研究中均被认为是T1D的关键生物标志物。
研究还深入探讨了这些miRNA与T1D相关因素的关联。在丹麦(DNK)的T1D患者兄弟姐妹队列中,研究发现几乎所有miRNA都与自身抗体测量值(如IA-2A、GADA、ZnT8R和ZnT8W)呈负相关,这意味着miRNA水平越高,自身抗体水平可能越低,暗示着miRNA可能参与调节自身免疫反应。而在丹麦的T1D患者中,大多数miRNA则与这三种自身抗体呈正相关。这表明miRNA的表达模式与自身免疫反应的动态密切相关,根据T1D发病阶段的不同,miRNA与抗体水平之间可能存在复杂的互动关系。此外,在丹麦和香港(HKG)T1D患者中,大多数miRNA与T1D发病年龄呈负相关,即发病年龄越小,miRNA水平可能越高;而与糖尿病病程在香港T1D患者中呈正相关,这意味着随着病程的延长,某些miRNA水平可能随之升高。这些发现进一步强调了miRNA作为动态生物标志物的潜力,它们能反映疾病的长期变化和进展。
为了模拟胰岛β细胞在T1D中的受损过程,研究人员进行了一项巧妙的体外实验:将新鲜分离的人类胰岛细胞暴露于不同浓度的硝普钠(sodium nitroprusside)——一种一氧化氮供体(nitric oxide donor),模拟了细胞应激。结果显示,胰岛细胞死亡在10mM硝普钠浓度下达到最大,并且令人瞩目的是,PREDICT T1D miRNA在细胞上清液中的丰度在此浓度下最高。这有力证明了这些miRNA在β细胞应激、死亡或损伤后会被释放出来,能够作为β细胞功能受损的可靠生物标志物,为我们提供了从分子层面洞察β细胞健康状况的“实时报告”。

智慧赋能:AI如何打造“超能力”风险评分?
接下来,是这项研究最令人兴奋的部分之一:人工智能(AI)的赋能。研究人员首先利用机器学习方法中的随机森林算法(random forest algorithm),在来自四大背景(澳洲AUS、丹麦DNK、香港HKG和印度IND)的2,204名研究参与者(包括752名T1D非患者和1,452名T1D患者)血浆样本的PREDICT T1D miRNA数据上,生成了一个四背景miRNA动态风险评分(DRS4C)。初步在661名参与者的测试数据集上评估显示,DRS4C表现出良好的预测能力,AUC达到0.781,准确率(accuracy)为0.746,F1分数(F1 score)为0.818。这表明该模型在初步验证中已经具有相当的区分能力。
然而,研究人员注意到,原始训练数据集中miRNA表达水平和年龄的分布存在一些概率缺失,可能无法全面覆盖所有潜在的生物学状态。为了确保miRNA表达水平和年龄概率的全面覆盖,并进一步提升模型的预测能力,他们引入了生成式人工智能(Generative Artificial Intelligence, GAI)。GAI就像一位“数据魔术师”,能够根据现有数据生成与真实数据分布高度相似的合成数据。通过GAI,研究人员成功创建了1,000、10,000和100,000个合成对照样本,并将其添加到原始训练数据集中,从而构建了三个增强型(enhanced)eDRS4C模型。这种数据增强的方法极大地丰富了训练数据的多样性和代表性。
这些增强型eDRS4C模型在一项独立的、由662名个体(364名非T1D患者和298名T1D患者)组成的多背景验证数据集上进行了严格评估。结果令人印象深刻:所有三个eDRS4C模型的AUC都超过0.797,其中基于100,000个合成样本训练的eDRS4C-100,000模型表现最佳,其AUC高达0.841,准确率为0.779,F1分数为0.770。这表明GAI的引入显著提升了模型的稳健性和预测能力,使其在更广泛、更多样化的真实世界样本中也能保持优异的性能。
为了进一步简化模型并评估其在少量变量下的性能,研究人员还开发了一个仅基于前十大重要变量的eDRS4C10模型。 这前十大变量包括:采样时的年龄,以及miR-26a-5p、miR-16-5p、miR-30e-3p、miR-24-3p、miR-155、miR-20a-5p、miR-125a-5p、miR-22-5p和miR-152a-3p这九个miRNA 。尽管变量数量大幅减少,但eDRS4C10模型仍然保持了可观的预测能力,其AUC达到0.810,准确率为0.675,F1分数为0.711,与eDRS4C-1,000模型的性能相当。这为未来的临床应用提供了更简洁高效的解决方案,降低了检测的复杂性和成本。






请到「今天看啥」查看全文