专栏名称: 中国生物产业信息平台
在中国生物工程学会的支持下,由中国科学院微生物研究所信息中心和中国生物工程学会信息中心组织,为我国生物产业提供高效的科技信息服务。
目录
相关文章推荐
51找翻译  ·  TCL招聘英语和日语翻译 ·  昨天  
51找翻译  ·  欢迎加入自由译者社群 ·  2 天前  
51找翻译  ·  399元-入门兼职笔译班 ·  2 天前  
51找翻译  ·  ESG文件中英翻译课-只需189元 ·  2 天前  
51找翻译  ·  华为正编-20-30K·16薪 | ... ·  2 天前  
51好读  ›  专栏  ›  中国生物产业信息平台

精准医学大数据平台建设的现实与畅想

中国生物产业信息平台  · 公众号  ·  · 2017-06-05 17:17

正文

请到「今天看啥」查看全文


军事医学科学院放射与辐射医学研究所研究员伯晓晨称,该平台是国家精准医学研究重点研发专项的平台,主要用于精准医疗数据的管理和共享等应用,目前搭建了两个数据库:一是疾病数据库群,一是基础组学数据库群。


平台怎么建?


健康界了解到,精准医学大数据管理和共享技术平台主要分成5大块,分别是基础平台、疾病数据库群、基础组学数据库群、支撑数据库群、医学整合注释平台。


基础平台为最基础的要件,国内生物医学界几乎所有知名的组织都参与到该平台的建设中,主要提供安全可靠高效的PB级大数据存储计算。


疾病数据库群是对接整个医学专项,提供6个以上的疾病数据库汇交管理系统,主要涉及到数据整合、关联、查询、数据库建设方面。难点是如何统一模型,划分疾病数据库群,并制定相应的规范。


基础支撑数据库群为在建的国家生物大数据中心,即专门抽出中国人群相关的参考数据,形成相当规模的中国人组学数据。难点就是如何把90个病种提交数据,通过其他的基因组的形式注释出来。“提交上来的是直接测完的结果,并没有标注基因的异常,需要靠注释平台进行注释。”伯晓晨解释:“说白了,就是要做大规模的运算。”


医学整合注释平台则是用于提高医学的黏度。为什么要提供注释?伯晓晨解释,临床整合数据是没有参考的,需要通过注释的方式提供参比的数据。比如,一个突变是稀有的,还是普通的;是针对最早的5个基因组来说的,还是针对千人基因组、万人基因组来说的,“在5个基因组中属于稀有的,放到千人基因组中可能就不是了,所以这里面一定要有参比的数据,你用什么数据就决定了整合和注释这方面的工作量多大。”







请到「今天看啥」查看全文