专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
相关文章推荐
51好读  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20250513

腾讯研究院  · 公众号  · 科技媒体  · 2025-05-13 00:01

主要观点总结

本文汇总了关于生成式AI、视觉语言模型、AI浏览器、AI作图工具、代码模型、AI定价模式以及软件开发模式等领域的多个报道。这些报道涵盖了不同公司和机构在AI领域的最新进展和创新。

关键观点总结

关键观点1: 生成式AI的进展和创新

包括Sakana AI提出的连续思维机器模型CTM,以及其在迷宫求解和图像识别中的表现。

关键观点2: 苹果发布FastVLM模型

介绍了苹果发布的移动端视觉语言模型FastVLM,其采用的双阶段处理、高效率、以及处理高分辨率图像的能力。

关键观点3: 腾讯元宝视觉模型的升级

描述了腾讯元宝升级的视觉模型Hunyuan T1-Vision的多模态原生长思维链功能,以及其在多种应用场景下的表现。

关键观点4: AI浏览器的最新趋势

讨论了Perplexity的Comet AI浏览器的内测情况,以及其集成AI Agent能力的特点。

关键观点5: 电商领域的AI作图工具

介绍了快手推出的专注于电商领域的AI作图工具Poify的功能和优势。

关键观点6: 字节开源的代码模型Seed-Coder

描述了字节团队开源的代码模型Seed-Coder的特点和其在编程领域的表现。

关键观点7: AI系统的隐藏人设

通过逆向工程获取的主流AI系统提示词揭示了不同产品定位,并讨论了系统提示词对AI产品体验的影响。

关键观点8: 天文学领域与AI的结合

18岁高中生利用AI发现上百万个隐藏天体,并获得了Regeneron科学竞赛的奖金。

关键观点9: AI产品的定价模式

探讨了AI产品的四种付费模式,以及AI应用最适合切入的领域和面临的挑战。

关键观点10: 未来软件开发模式的预测

a16z预测的AI时代的全新软件开发模式,包括意图驱动的版本控制、AI驱动的动态仪表盘等趋势。


正文

请到「今天看啥」查看全文


3.FastVLM具有高效处理高分辨率图像的能力,结合轻量级设计,显示出在智能眼镜等移动设备上的应用潜力。

https://mp.weixin.qq.com/s/cwvJ2RiMszU1xvO2pJ426g

三、 腾讯混元T1-Vision上线元宝:融合多模态原生长思维链

1.腾讯元宝升级视觉模型Hunyuan T1-Vision,能深度理解图片内容,支持多模态原生长思维链,完答速度提升1.5倍;

2.应用场景广泛,可识别植物品种、分析棋局、翻译游戏界面、进行选择分析、评估商品价值等实际场景;

3.新版本强调"边看图边思考"的能力,通过开启"深度思考T1"模式,可以更精确地捕捉和分析图片中的关键信息。

https://mp.weixin.qq.com/s/PtH84s3stK_5QjWBTVKaRw

四、 Perplexity 的Comet AI 浏览器开始内测,将在 5 月中旬发布

1.知名AI搜索工具Perplexity推出基于Chromium框架的AI浏览器Comet,预计5月中旬发布,目前开放内测申请;

2.Comet具备AI Agent能力,能自动执行复杂任务,集成Perplexity的分析工具,简化用户工作流程;

3.继Arc推出Dia后,AI浏览器正成为新趋势,并显示出AI与操作系统、跨平台助手深度融合的发展方向。

https://mp.weixin.qq.com/s/KifQhhJ8AISIuayAOWfMLg

五、







请到「今天看啥」查看全文