专栏名称: 极客公园
科技创新者的大本营。汇聚优秀的产品报道、评测视频和高质量的线下活动。
目录
相关文章推荐
51好读  ›  专栏  ›  极客公园

AI 在移动影像领域,搞了场「无声变革」

极客公园  · 公众号  · 科技媒体  · 2025-04-03 10:00

主要观点总结

本文主要介绍了OPPO在AI影像方面的创新和发展,通过张磊和罗俊等顶尖人才的加入和努力,OPPO在AI影像领域取得了一系列突破。文章从手机影像的革新、AI大模型的应用、算法竞赛、数据挑战、审美与技术的融合等方面详细描述了OPPO在AI影像方面的探索和实践。

关键观点总结

关键观点1: OPPO利用AI技术革新手机影像

OPPO通过引入AI技术,实现了手机影像的重大突破,如用AI模型处理传统的降噪超分计算,尝试AI大模型在影像领域的应用,探索长焦技术,以及利用生成式大模型提高影像质量等。

关键观点2: AI大模型对手机影像的影响

AI大模型的应用在手机影像领域带来了革命性的变化,通过处理复杂的计算任务,帮助手机在光学硬件上实现“逆天改命”,开辟了新的可能。

关键观点3: AI算法的挑战与突破

在执行过程中,OPPO团队面临着算法的挑战,包括算法的复杂性、稳定性、效率等问题。但通过不断的尝试和优化,团队成功解决了这些问题,实现了算法的突破。

关键观点4: 数据在AI影像中的重要性

数据在AI影像中起着至关重要的作用。为了提升AI算法的效果,OPPO通过采集大量数据、开发新的摄像头等方式,为算法提供更优质的数据源。

关键观点5: 技术与审美的融合

在AI影像的发展过程中,技术与审美的融合是一个重要的挑战。OPPO通过成立影像认知组、与美术界合作等方式,解决了这一问题,实现了技术与审美的和谐统一。

关键观点6: OPPO引进顶尖人才推动发展

OPPO通过引进张磊、罗俊等顶尖人才,推动了公司在AI影像领域的快速发展。这些人才带来了先进的技术和理念,为OPPO的发展注入了新的活力。


正文

请到「今天看啥」查看全文



执行任务落到张磊团队身上,成与败,关系到张磊的颜面,更关系到 OPPO 在影像业内的竞争力。
张磊让团队分头行头,利用生成式扩散大模型尝试不同的技术路径。
其中一个方案被称为 CCSR,迭代频数需要 50 步,后面不断优化,经过两个月迭代,降到 15 步,最终降到 3 步,已达到极限。
另一个方案,则被称为 SeeSR。虽然迭代步数略微少,可是输出图像稳定性不如 CCSR。只有减少步数,才可以减少手机能耗,缩短拍照成像时间。
有了初步算法,想试试效果。「最早拿算法效果给手机影像相关的部门的人看,跑完了,大家发现画质几乎没有提升。」但随着算法的演进,生成式大模型的优势逐渐体现,CCSR 达到了预期的效果。
根据项目进程,部署时间挺紧张。大家商量 CCSR 改到极限后,部署同事先着手工程化落地。这已经到了 2024 年 3 月中旬,离 10 月份产品上市只有半年时间。
但 AI 技术进化的频率,还是超出了大家的预料。
有一天,张磊团队看到在图像生成领域用 diffusion 做到单步生成也有不错的效果,这或许也同样可以让图像复原的多步迭代步数减少。在团队尝试做出第一版结果后,张磊颇为兴奋:推理只用了单步,优点明显。随后,张磊猜想另一位同学研究的「文生 3D」使用的分数蒸馏(score distillation)方法,可以加进来。
赶工几周,算法逐渐成型,最后取名 OSEDiff(单步复原)。4 月中旬,大家着手整理实验和写文章,经过团队一起一个月的努力,文章写好投到业内顶会 NeurIPS 上。手机界领先苹果和三星、首创的大模型复原 60 倍长焦图像项目,自此有了算法雏形。
过了一段时间,张磊组织了一次盲选会,准备了 100 张图,分别由单步 OSEDiff 算法和 CCSR 复原而成,发给了认知组、测试组、影像算法组、产品线等各个条线成员,让他们挑选质量更好的照片。单步算法完胜。OPPO 决定「高速路上换发动机」,在项目进度已经基本达到极限的情况下,毅然决定切换更优质的单步算法。
千里长焦项目在 2024 年 10 月发布的 Find X8 上面第一次成功落地,它应用生成式大模型,可以让 60 倍数码变焦拍摄的模糊图像,经过 2 秒钟本地运算后变得异常清晰;又在 2025 年 4 月 2 日发布的 LUMO 凝光影像系统中,脱胎换骨似地升级,把 60 倍甚至 30 倍变焦的效果都大大提升,就像给手机镜头又戴了一幅「AI 望远镜」。张磊与罗俊完成了苹果和其它安卓厂商都没有实现的行业首创。

03

没有先例的困局

做出千里长焦,张磊和罗俊不满足,虽然这项技术展示了超强的 AI 能力,但「只能算 OPPO 的一个阶段性成果」,真正能让 AI 展示实力、向行业证明 OPPO 的 AI 能力,搭载在 OPPO 全新推出的 LUMO 凝光影像系统,以及搭载这个系统的 Find X8 Ultra 上,里面有 AI 征服手机影像「纽北赛道」的一场新赛事。
设想在夜晚的重庆洪崖洞前,光线错综复杂,远处有各种霓虹灯光,近景有人脸,背对着暗处——夜景人像曾经是很多手机影像工程师的噩梦。兴许 AI 加持,才可以有所突破。
不过,罗俊知道内中难处,首先是数据。没有数据的供给,再力大无穷的 AI,也会力不从心。
一方面,夜间光线稀薄,即使对于手机中最大的镜头来说,采集到的光线数据都不富裕,AI 只能反复利用有限的数据,推理出该有的纯净画面,但结果往往令人失望。另一方面,夜间光线又过于复杂,特别是中国城市 LED 灯光近年来的高速发展,即使对于造价十几万的大块头的相机来说,将五光十色的城市夜景和人物同时拍出彩,也不是一件可以轻而易举完成的事情。
第一个问题,相对还算好解决,因为有既定的案例——相机代表的光学规律,就是答案。提升进光量,提升光源的品质,喂给传感器更多、更优质的数据,这意味着下血本地增加光学模组的性能——简单点说,就是用更大的镜头来吸收更多的光线数据,用更好的镜头把光学提纯,用更大尺寸的传感器去接收消化这些数据。「算法不能脱离光学,所以 OPPO 一直讲软硬结合,硬件决定了画质的下限,算法决定了画质上限。」罗俊一直强调。






请到「今天看啥」查看全文