正文
科大讯飞为什么选在2015年这个时间节点进军医疗行业?
其实讯飞早在2010-11年左右就开始探索医疗,当时的规划只是语音技术在医疗中的应用,因为欧美在这方面的应用已经非常广泛—— 美国医生已经养成习惯,在给患者做检验检查和诊疗的过程中,用语音做记录,也有专人做转录。但这项技术当时还不够成熟,在国内的普及度也不够高,讯飞第一次进军医疗的尝试搁置。
2015年第二次进军医疗,很大程度是源于我们对技术的判断。深度学习技术成功应用于语音和图像识别大概是在2010年后,发展到2015年底,准确率已经大幅提升,不管在电子病历书写还是在阅片上都达到了应用的临界点。讯飞自身的技术也日臻成熟。
我们2014年第一次参加国际口语机器翻译评测比赛(International Workshop on Spoken Language Translation),就拿到中英和英中互译方向的第一。
后来我们又参加了国际语音识别大赛(CHiME),国际认知智能测试(Winograd Schema Challenge)和国际知识图谱构建大赛(NIST TAC Knowledge Base Population Entity Discovery and Linking Track),都拿了第一。
一直以来,科大讯飞都在构建图像识别、翻译、自然语言理解等跟人工智能相关的核心技术,并在此基础之上构建了人工智能平台,在平台上再构建若干个赛道,比如在教育、汽车、智能家居、智能客服,这些领域中,我们都有相当成熟的应用。
背靠这些核心技术构建的人工智能平台,迁移到医疗领域是自然而然的事情。
那么到现在这个时间节点,科大讯飞布局的三个赛道——医疗+智能语音、医疗+智能影像诊断和智能辅助诊疗各自的技术成熟度如何?推广落地的过程中遇到了哪些困难?
语音技术相对成熟,通用的语音识别准确率已经达到95%左右。虽然医疗中很多专业词汇,但只要机器人接收到这些信息,它学起来就非常快。医疗毕竟还是一个很明确的细分领域,因此语音技术应用到医疗的准确率实际上比95%更高。
讯飞目前的语音解决方案已经在全国50多家医院投入使用,我们的产品经理团队也做了大量的工作,和医生不断的磨合,探索如何把语音识别融入医生的工作流程:比如语音转录文字之后,还要形成结构化的电子病历,因为这才对提升医生工作效率有真正的价值,特别在医生双手被占用,但又需要做记录的时候,语音技术都有很强的应用场景,比如B超、内窥、手术等等。
图像识别技术的准确率目前也达到了较高水平。但医院的影像数据比较闭塞,数据孤岛普遍存在,这都给技术提升带来了一些麻烦。
另外,影像识别技术的商业和收费模式都还在探索中。目前看来,商业模式的创新需要有一定影响力和社会资源的公司,联合医疗机构和政府一起推动。因为这已经不是一个技术问题,所以对单靠人工智能技术的创业公司来说,难度会比较大。