专栏名称: 腾讯云小微AI助手
和Poweron一起,跟上这个时代
目录
相关文章推荐
51好读  ›  专栏  ›  腾讯云小微AI助手

数字人产业发展趋势报告(2023)|102页报告全文附下载

腾讯云小微AI助手  · 公众号  · 科技媒体  · 2022-12-02 17:55

正文

请到「今天看啥」查看全文



趋势3:AI技术驱动数字人多模态交互更神似人,并逐步覆盖数字人全流程。
当前数字人对语言理解还是以文本为主,动作合成上声唇同步较为完善:
(1)AI驱动数字人是指数字人等语音表达、面部表情和动作形态等通过深度学习模型进行运算,并将其结果实时或者离线驱动,并进行渲染。目前主流的 方式是围绕NLP能力通过文本驱动,本质是通过ASR-NLP-TTS等AI技术进行感知-决策-表达的闭环来驱动数字人交互,同时需要预先设置相关的知 识图谱或问答库等,与数字人的对话系统对接,但目前NLP在通用性场景的能力还需要进一步完善。
(2)计算机视觉(CV)目前数字人声唇同步技术相对完善,在游戏中已经大量应用;而其他表情和动作还需要描述性的数据或者标签驱动,尚未智能合成, 表情动作也是是AI驱动未来发展的重点方向。
未来AI技术的重点方向是在输入端实现多模态感知输入,在输出端提升多模态交互能力,综合提升数字人的表现力,从目前的基于文本的交互,转化为基 于语义的交互,特别是需要强化对人情绪的感知和表达。此外除了利用ASR-NLP-TTS等技术驱动数字人交互外,AI技术也应用在2D数字人的视频生成、3D数字人的建模、视频驱动、物理仿真等多个环节。


趋势4:数字人技术与SLAM、3D交互、体积视频、空间音频等技术深度融合,渲染将从本地到云端。
数字人作为3D呈现的一种方式,未来将与其他3D技术如SLAM (即时定位与地图构建) 、体积视频、空间音频等融合,进一步完善数字人和真实空间的交互。例如在直播场景中虚拟/真实空间中真人和数字人的交互,数字人对真实空间的感知等。同时由于数字人对渲染能力要求较高,未来云端渲染是重要的方向,将推动云服务商从算力 (CPU) 云服务,到渲染力 (GPU) 的云服务。但成本仍是云渲染普及的关键阻碍,需要突破。


趋势5:千行千面的数字人将成为人机交互新入口,但深度上仍需挖掘。
AI驱动的数字人通过AI能力建立人与大数据的连接,提高效率并满足人情感交流需求,提升用户体验,将成为人机交互新入口:应用广度上:目前使用文字或语音交互的场景都可用AI数字人软着陆的方式替代,不需要改变原有的业务逻辑和商业模式,大众接受成本较低,并提供更好的用户体验,未来应用场景非常广泛,可以与各种领域相结合,服务规模化和标准化。应用深度上:数字人作为企业的数字资产,是对员工工作的增强,具有生产力的属性,可以进一步释放生产力,同时降本增效。未来数字人将根据不同行业的业务特点和应用场景进行更深度结合,孵化千行千面的数字员工,提供差异化服务。






请到「今天看啥」查看全文