专栏名称: 懂懂笔记
我们来自知名IT和财经媒体,专注于互联网+、电子商务、大数据、万物互联和人工智能。我们关注产业动态,技术趋势和商业变革,我们与你一起,迎接这个科技转变命运的时代。
目录
相关文章推荐
中科院之声  ·  我国科学家成功合成新核素镤-210 ·  12 小时前  
中科院之声  ·  我国科学家成功合成新核素镤-210 ·  12 小时前  
KubeSphere云原生  ·  “智启云原生・粤览 AI 未来”|云原生 ... ·  2 天前  
KubeSphere云原生  ·  “智启云原生・粤览 AI 未来”|云原生 ... ·  2 天前  
网信广东  ·  广东省开通人脸识别技术应用备案咨询电话 ·  2 天前  
网信广东  ·  广东省开通人脸识别技术应用备案咨询电话 ·  2 天前  
51好读  ›  专栏  ›  懂懂笔记

生产、交互、消费全链路升级,开启“三智”视频新时代

懂懂笔记  · 公众号  · 科技自媒体  · 2024-10-16 17:37

正文

请到「今天看啥」查看全文


升级为更智能、更交互、更沉浸。而要实现这些“更……”,依赖的就是生产、交互、消费等全链路的AI升级。

智能生产,多模态使能高品质


正如谭待所描述的,“视频正迅速崛起为人类的第二语言,其丰富的表达手段和效果远超传统文字,为我们提供了更多元、更生动的交流方式。”

随着视频的重要性不断提升,生产端的挑战便是如何以更少的时间、更低的成本生产出更高质量的内容。





比如在电商领域,过去一年中短视频、直播、数字人占比越来越高。好的内容可以吸引用户的注意力,有效传递品牌信息,并且激发消费者购买决策。显然,“好内容”已经成为电商平台收益增长的第一生产力:优质内容高效快速生产从而拉动商品销量,随着商品运营规模大幅增长,营销成本也在大幅下滑(如上图)。

火山引擎的 多模态电商素材生成方案, 通过融合图像分析、AIGC(人工智能生成内容)、大模型处理、3D物体重建等先进技术,实现了商品氛围图、图文视频、解说视频、AIGC视频和3D商品模型等多模态营销素材的自动化生。
其带来的效果是门槛大幅降低:商家只需要提供基础信息和一些简单的多模态素材,就可以自动提取卖点、智能裁剪、自动生成视频。举些例子,比如输入乳饮产品的受众、产地、营养成分,就可以自动生成一张首销图或是一段营销视频;比如把服装的图片上传,就可以自动生动模特上身的效果图;比如上传商品信息之后,可以自动生成一系列内容匹配直播、短视频、货架等不同场景需求。火山引擎的多模态电商素材生成方案,端到端自动化让素材生成更智能、更快捷、更个性。
不止于电商,在短剧、赛事、演出等各种场景,也都有海量的自动化生成内容需求,比如短剧的宣发,演出的切片传播,赛事的精彩瞬间等等。火山引擎视频云推出的 多模态视频理解与生成方案, 依托多媒体实验室自研的AI视频理解技术和AIGC技术,实现了视频高光的自动化提取和解说内容的生成。一场精彩的演出,可以快速切出多个短片,短剧可以快速生成多段不同视角的预告片,显著缩短了制作周期,大幅降低传播、宣传的成本。
我们知道,声音是视频中的关键要素, 火山引擎视频云提供的 跨语言同声复刻直播服务, 可以实现自动配音、自动匹配字幕,还可以声音复刻。比如在直播中可以使用豆包大模型Seed-ASR,除了能自动打出 字幕,还支持中文、英语、日语、西班牙语、印尼语、葡萄牙语等多国语言输出。在虚拟人的直播中,可以高度还原人声特点、说话风格,还可以调整演讲者口型,让观感更加自然。以“视频云技术大会”活动为例,出现在讲台上的“数字人谭待”,无论是体态、表情还是声音、语气,都实现了对真人的高品质复刻,令人惊羡。
在新视界时代,生产端的挑战是如何以更少的时间、更低的成本生成多角度、高信息密度的优质内容。 火山引擎通过AI赋能,推出一系列解决方案从而推动了生产力变革:多模态内容根据用户需求自动生成,智能生产让创作者的创意得以充分释放,多模态内容的生产与处理已经变得触手可及。


智能交互变革,给AI加点“人味儿”







请到「今天看啥」查看全文


推荐文章
中科院之声  ·  我国科学家成功合成新核素镤-210
12 小时前
中科院之声  ·  我国科学家成功合成新核素镤-210
12 小时前
今日房产  ·  地产商为啥可以当总统 | 5句话读懂
8 年前