专栏名称: OSC开源社区
OSChina 开源中国 官方微信账号
目录
相关文章推荐
OSC开源社区  ·  Dev.Together'25 | ... ·  22 小时前  
阿里云云栖号  ·  重磅发布 ... ·  昨天  
伯乐在线  ·  周鸿祎:准备干掉 360 整个市场部! ·  2 天前  
伯乐在线  ·  周鸿祎:准备干掉 360 整个市场部! ·  2 天前  
OSC开源社区  ·  pg_mooncake:PostgreSQL ... ·  5 天前  
OSC开源社区  ·  马建仓 AI ... ·  3 天前  
51好读  ›  专栏  ›  OSC开源社区

Gitee AI助力医疗科研:医用耗材使用分析研究

OSC开源社区  · 公众号  · 程序员  · 2024-12-16 16:14

正文

请到「今天看啥」查看全文


整个项目,基本就是围绕病历、结算数据去进行分析,根据我们的项目计划书, 我们将从全省的省级、市级、县级医院共抽取一亿份相关病历来进行数据分析 。如果熟悉医院信息化相关的小伙伴就会知道,这将是一个非常麻烦的事情,因为「标准不统一」,各家机构都会有个家机构的病历结构,而很多历史病历只有影印版的记录。

归纳起来,任务难点有三点:

多院区非标准数据清洗

因为是从省、市、县多家医疗机构提取病历数据,各家医院的电子病历系统的数据结构、信息化能力各有差异,而根据课题研究的要求,我们需要按照一定规则去提取相关数据,对于结构化数据我们自然可以编写相应的转化程序,但对于非标准数据,如果针对性的去开发提取程序,那将是一个非常庞大的工作量。在咨询了红薯以及 Gitee AI 的小伙伴后,我们认为 AI 的相关能力简直天生就适合来做这件事。

多模态数据识别与抽取

在医疗领域,OCR 识别一直以来都是信息厂家拿捏医院的一个法宝。但传统 OCR 技术的识别率是低的感人的。我们需要一个能读懂病历照片,并根据我们的一些指令提取相关信息的程序,随着 Qwen2-VL-72B 等优秀多模态大模型的开源,这一需要将不再是难题。

多因子影响的耗材使用合理性分析

哪怕不是医疗从业人员,也能想到一个事情,一个患者的耗材使用情况,除了取决于手术方式,还取决于患者的具体病症、基本生命体征等。这些影响因子之间还会有交叉影响,我们可以对真实世界的耗材使用情况进行描述性分析,但针对具体的每一个单例的耗材使用情况,还需要进行更为深层的多元分析。这样的事情,很显然最适合交给 AI 来做。

技术实现路径

专业知识库建设

做为一个野生程序员,我自然也是知道 LLM 是存在幻觉的,这样的幻觉在我们这个案例里面,显然是不行的。RAG 技术是消除幻觉的一大法宝,而恰好医疗行业是一个最不缺少各种知识内容的行业,所以我们需要为 LLM 准备一个诊疗专家知识库和一个耗材专业知识库,前者对具体的诊疗技术做描述,后者则是医用耗材的使用说明书。







请到「今天看啥」查看全文