专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
51好读  ›  专栏  ›  大数据文摘

用AI把一段视频变成可视化网页,Google的新模型又卷飞了。

大数据文摘  · 公众号  · 大数据  · 2025-05-07 14:00

正文

请到「今天看啥」查看全文


不是我来营销,是真的人民群众需要啊,我只是顺势而为。
这次Gemini 2.5 Pro 05-06版本(后面就简称05-06版了),跟今年三月DeepSeek V3 03-24的更新很像。都是完全为了代码服务的,把代码能力,往上提升了一个巨大的优先级。
而这次的05-06版,我觉得有两个亮点:
1. 模型代码能力在盲测竞技场登顶,力压Claude 3.7 Sonnet。
2. 得益于2.5 Pro强大的多模态能力,这次不仅可以给参考图生成代码,还可以,给参考视频生成代码。
特别是第二点,目前应该是全球唯一。
先看看代码能力的跑分。
这次最核心的榜单,就是,WebDev Arena。
https://web.lmarena.ai/leaderboard
0506版直接脚踩Claude 3.7 Sonnet,勇得第一。
可能很多人不知道 WebDev Arena是啥,我稍微解释一下,这玩意,还是挺有含金量的。
LMArena,最著名的大模型盲测竞技场,我相信一直关注AI的,大多数人都或多或少的听过。
跟一些传统的测试集不一样,这玩意就是纯粹的盲测,用户提出一个Prompt,然后LMArena直接给你两个你也不知道是什么模型生成的回答,让你选你觉得哪个好。
所以,在这上面,你几乎就做不了弊,全靠普通用户,一票一票投出来的,就跟拆盲盒一样。
WebDev Arena,其实就是一个子榜,还是由 LMArena他们开发的,专为评测网页前端开发任务(比如HTML、CSS 和 JavaScript)而设立的。
玩法跟LMArena一样,也是用户盲测二选一。
唯一不同的是, WebDev Arena会生成代码的预览给你看,而不只是文字了。






请到「今天看啥」查看全文