专栏名称: AI科技评论
「AI科技评论」是国内顶尖人工智能媒体和产业服务平台,专注全球 AI 业界、学术和开发三大方向的深度报道。
目录
相关文章推荐
51好读  ›  专栏  ›  AI科技评论

动作和场景不必紧紧绑定,减轻场景偏差,便能轻松识别商场跳舞 球场唱歌

AI科技评论  · 公众号  · AI  · 2020-02-28 00:20

正文

请到「今天看啥」查看全文



1)场景对抗损失(scene adversarial loss),鼓励模型学习场景不变的特征表示;

2)人体遮挡混淆损失(human mask confusion loss),来阻止模型在人体不可见的时候仍然给出动作预测。

为了验证所提方案的有效性,这篇论文在三种动作理解任务上进行了实验:动作分类,时序动作定位和时空动作识别。实验结果表明采用了偏差去除的迁移学习方案要比基准模型表现更好。


一、方案

这篇论文提出的减轻场景偏差的方案如图3所示。

图3. 学习场景偏差消除的视频表征的方案。


这个方案的目标是通过在一个大的视频分类任务上的预训练,学习特征提取器的参数 。在这个过程中,作者们用到了三种损失函数。首先在Mini-Kinetics-200数据集[1]上,通过一个标准的交叉熵损失函数


来训练动作分类。接着加入一个场景对抗损失


使得从学习到的表征中无法推断出场景。最后,通过使用Mask R-CNN[2]检测出人体并加以遮挡,构造出一个被遮挡后的数据集,并应用人体遮挡混淆损失






请到「今天看啥」查看全文