专栏名称: 雷峰网

中国智能硬件第一媒体

目录

相关文章推荐

新浪科技 · 【#研究称每日2.5杯咖啡最佳##研究称咖啡 ... · 20 小时前

新浪科技 · 【#苹果开发者大会Logo公布##苹果开发者 ... · 昨天

新浪科技 · 【#特斯拉财富美国500强排名首次下滑##微 ... · 昨天

36氪 · 当县城职场，来了大厂高管 · 昨天

新浪科技 · 【#卢伟冰称竞争从来不是小米未来的关键#】近 ... · 2 天前

51好读 › 专栏 › 雷峰网

谷歌送上主播福利，手机拍视频也用神经网络实时换背景

雷峰网 · 公众号 · 科技媒体 · 2018-03-02 15:47

正文

请到「今天看啥」查看全文

谷歌的研究人员们借助了机器学习的力量，把这个任务作为一个语义分割问题来考虑，并设计了卷积神经网络来达到目标。具体来说，他们针对手机的特点设计了适用的网络架构和训练过程，遵循着这几个要求和限制：

作为在手机上运行的解决方案，它需要足够轻量，运行速度需要比目前最先进的照片分割模型快 10 倍到 30 倍。对于实时推理任务，所需的模型计算结果的速度至少需要达到每秒 30 帧。
作为视频模型，它应当利用视频的时间冗余性（相邻的帧内容相似），自己展现出时间持续性（相邻的输出结果相似）
作为基本规律，高质量的结果也需要高质量的标注训练数据

数据集

为了给机器学习流水线提供高质量的训练数据，谷歌标注了上万张照片，其中包含了各种各样丰富的前景（人物）姿势和背景内容。标注内容里包括了精确到像素的前景人物的图像结构，比如头发、眼镜、脖子、皮肤、嘴唇等等，各类背景则统一标注为「背景」，标注质量在人类标注员的交叉验证测试中取得了 98% 的 IOU。

一张仔细标注为 9 个类别的训练样本示例；前景元素的标注区域直接覆盖在图像上

请到「今天看啥」查看全文

推荐文章

新浪科技 · 【#研究称每日2.5杯咖啡最佳##研究称咖啡能助人延缓衰老#】适-20250603134814

20 小时前

新浪科技 · 【#苹果开发者大会Logo公布##苹果开发者大会Logo采用毛玻-20250603073700

昨天

新浪科技 · 【#特斯拉财富美国500强排名首次下滑##微软苹果特斯拉排名集体-20250603080112

昨天

36氪 · 当县城职场，来了大厂高管

昨天

新浪科技 · 【#卢伟冰称竞争从来不是小米未来的关键#】近日，小米集团合伙人、-20250602095641

2 天前

静塾文化 · 无趣、无聊、无味的人生，就丢给你们好了

8 年前

美好滁州 · 滁州城南新区重磅规划出炉：学校分布、轨道2号线...一波大消息来了！

7 年前

上海家具展 · 逛展宝典｜打飞的也要看的浦东家居双展，提前探秘（内含交通+住宿+餐饮指南）

7 年前

壹观察 · 王利芬《赢在中国》揭秘：看飞贷“移动信贷整体技术”如何示范全球

7 年前

huobicom · ►【动画】比特币和Q币有哪些不同？丨区块链100问第13集

7 年前

移动版

51好读 - 微信公众号文章