专栏名称: APPSO
让智能手机更好用的秘密。
目录
相关文章推荐
51好读  ›  专栏  ›  APPSO

极限测试豆包视频通话,聊了一天一夜后我发现事情并不简单

APPSO  · 公众号  · app  · 2025-05-23 18:59

主要观点总结

本文主要介绍了豆包AI的视频通话功能,它能通过视觉理解模型识别物品、场景,并理解生成回应。通过极限测试,发现它能提供情绪价值并解决实际问题,如识别物品、提供信息、辅助决策等。作者认为给AI装上“眼睛”能让它成为更好的生活搭子,并朝着通用人工智能的方向发展。

关键观点总结

关键观点1: 豆包AI的视频通话功能介绍

豆包上线了视频通话功能,能够通过视觉理解模型识别物品和场景,并实现理解和生成回应。作者在文章中通过一系列测试展示了豆包在识别物品、提供信息、辅助决策等方面的能力。

关键观点2: 豆包AI的识别与理解能力

豆包AI能够识别各种物品、场景,并理解其中的含义。例如,它能够识别出图片中的物体、场景,理解文字的含义,并根据这些信息生成回应。

关键观点3: 豆包AI的生成与创作能力

除了识别和理解,豆包AI还具有很强的创作能力。它可以根据识别到的内容生成诗歌、rap等,还可以在视频通话中提供拍照姿势指导,帮助用户拍摄出满意的照片。

关键观点4: 豆包AI在实际生活中的应用价值

豆包AI的视频通话功能在日常生活和工作中具有很高的应用价值。它可以帮助用户解决问题,如推荐餐厅、选择商品、辅助烹饪等。作者认为给AI装上“眼睛”能让它成为更好的生活搭子,并朝着通用人工智能的方向发展。


正文

请到「今天看啥」查看全文


咱也不知道它是不是在瞎掰,直到我在旁边找到了介绍的牌子,发现居然完全正确。
更令我意外的是,豆包还猜到了我在一个创意园里,告诉我这里过去是一个纺织园区。
视频通话理解单个物品或许还是太简单了,我让豆包跟我聊聊我收藏的手办。
它依次识别出这些手办角色,甚至认出了不是常规形态的漩涡鸣人。
其中我跟它聊到科比的比赛,当我提到科比生涯最后一场比赛后,有一句话令人难忘但忘了是什么,豆包几乎脱口而出:
Mamba out !
而且语调也随之提高,显得更加兴奋,让我真有和一个知音聊天的感觉。
好了,既然这也难不到豆包,我就要上大招了。
看到同事日渐凌乱的桌面(不是),心想这是什么体质,东西越堆越多——来问问豆包这是什么 MBTI 好了。
这个测试难度在于,它需要先识别出桌面上的各种随意摆放的物品,然后还得懂「人性」才能分析出来。
神奇的是,豆包对 MBTI,是按照拼音的发音,而不是英文的发音,一开始还没有反应过来,以为是网络卡顿。不过,准还是很准的,同事就是一个大 E 人、大 P人。
除了心血来潮的提问,包含更多 「隐藏信息」 的场景,也是最能显示实时通话能力的地方。
比如买咖啡豆,尤其是在咖啡馆时尝到不错的出品,但没法像逛电商时那样慢慢研究,而是需要在短时间内做决定。
记不住产地、海拔到底会对风味有什么影响。这下不用靠脑子记了,只需要点开豆包,打开摄像头。
大大利好 i 人,去咖啡店再也不用跟店员交流,打开手机就可以弄懂所有术语。
你说怕独自对着商品念叨很古怪?低声些,假装在跟朋友语音就不会被发现了!






请到「今天看啥」查看全文