专栏名称: 悦智网
悦智网依托国内外独享的科技咨询资源,分享最新的行业技术评论,实时发布国内外最新研究成果,打造技术成果的专业交易平台,促进科技成果的需求转化。
目录
相关文章推荐
新北方  ·  聊天记录有救了!微信将迎史诗级更新 ·  17 小时前  
郑州晚报  ·  央行宣布八项重磅金融开放举措 ·  昨天  
河南发布  ·  河南拟发行165.73亿元地方债券 ·  昨天  
51好读  ›  专栏  ›  悦智网

你真的明白人机交互与智能吗? | 清华AI Time

悦智网  · 公众号  ·  · 2019-10-31 15:30

正文

请到「今天看啥」查看全文



━━ ━━
人机互动的研究领域呈多样化

曹翔介绍道,他现在的工作可以说是“现实版神笔马良”,用一张普通的纸和一个普通的画笔作画之后,用手机采集,瞬间就能转化生成三维动画。 通过技术把创作的门坎降低,让普通人能够表达自己的创意是研究的初衷。
到目前为止还是普适计算的时代,未来人机交互会是多模态的,可以用键盘、语音,也可以用手势、表情、唇动等。 他首先介绍了基于多通道或多模态感知理论的手语识别,原因有二,其一是因为姿势语言太多太泛,没有清晰的目标边界,其二是因为希望技术能服务于残障人士的日常交流。
第二个工作也和多模态相关,人机交互的终极目标是希望人机交互和人人交互一样。 目前通过多模态,包括知识性感知,让机器获知人目前的状态,继而再进行下一步行为。 未来可以利用可穿戴设备,对人的生理和心理的境况进行推断,然后进行交互。
陈益强也认为,未来的人机交互模式会是多模态的。 围绕“多模态”设想,他提到了目前工作。 一个是基于多通道或多模态感知理论的手语识别,将面部识别、手势动作识别和手语识别相融合,用以提高手语识别精度。 二是通过多模态手段,使机器人获知人类当前状态。
田丰主要关注面向教育和医疗的人机交互的研究,他分享了再输入技术和相关理论方面的研究成果。 由于输入不可避免地存在不精确性,希望用智能化的方法进行改善和帮助。
运动目标的选择是人机交互里非常重要的任务,玩游戏的时候就知道,相对静止来说运动目标的选中更难,怎样来提高选中的效率,同时去理解用户选择目标的能力。 他们首先做了大量的用户研究,产生了针对不同速度和尺寸的物体在运动过程的落点分布,建立出模型,计算出用户选中物体的概率。 这个模型不仅可以分析正常人,对帕金森病人等也可以用做辅助诊断。
值得一提的是,田丰带领团队研发的笔式电子教学系统获得了国家科技进步二等奖,并与协和医院共同取得了国家卫健委颁发的医疗健康人工智能应用落地30最佳案例的荣誉。
史元春介绍道,在使用手机软键盘时,26个字母挤在狭窄的输入界面里,再配上胖乎乎的手指,点错的经历太多了。 这是触屏这种自然交互界面上典型的难题: 胖手指难题。
基于研究工作,他们提出了基于贝叶斯推理的自然用户意图理解框架,建模用户行为特征,在模糊的输入信号上推测用户的真实意图。 你点的不准没关系,算法可以猜得准。 利用这项技术,史元春团队已经研究实现了手机、平板、头盔、电视等一系列接口上的输入法,输入准确度大幅度提高,且几乎不需要视觉瞄准,进而还能支持盲人用户准确实现软键盘输入。
未来的接口也会延伸感知人的操控行为,史教授正在研制的手机前置摄像头上就能: “感知到人手在界面上的变化后,我们就能以此做出新的‘输入法’。
比如手握手机的任意边框或位置,就可以输入信息、访问界面,甚至和桌子的交互,也能变成对手机的操作。






请到「今天看啥」查看全文