专栏名称: 腾讯研究院

【腾讯研究院 ★ Tencent Research Institute】网聚智慧，连接世界！网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。

腾讯研究院AI速递 20250513

腾讯研究院 · 公众号 · 科技媒体 · 2025-05-13 00:01

主要观点总结

本文汇总了关于生成式AI、视觉语言模型、AI浏览器、AI作图工具、代码模型、AI定价模式以及软件开发模式等领域的多个报道。这些报道涵盖了不同公司和机构在AI领域的最新进展和创新。

包括Sakana AI提出的连续思维机器模型CTM，以及其在迷宫求解和图像识别中的表现。

介绍了苹果发布的移动端视觉语言模型FastVLM，其采用的双阶段处理、高效率、以及处理高分辨率图像的能力。

描述了腾讯元宝升级的视觉模型Hunyuan T1-Vision的多模态原生长思维链功能，以及其在多种应用场景下的表现。

讨论了Perplexity的Comet AI浏览器的内测情况，以及其集成AI Agent能力的特点。

介绍了快手推出的专注于电商领域的AI作图工具Poify的功能和优势。

描述了字节团队开源的代码模型Seed-Coder的特点和其在编程领域的表现。

通过逆向工程获取的主流AI系统提示词揭示了不同产品定位，并讨论了系统提示词对AI产品体验的影响。

18岁高中生利用AI发现上百万个隐藏天体，并获得了Regeneron科学竞赛的奖金。

探讨了AI产品的四种付费模式，以及AI应用最适合切入的领域和面临的挑战。

a16z预测的AI时代的全新软件开发模式，包括意图驱动的版本控制、AI驱动的动态仪表盘等趋势。

3.FastVLM具有高效处理高分辨率图像的能力，结合轻量级设计，显示出在智能眼镜等移动设备上的应用潜力。

三、腾讯混元T1-Vision上线元宝：融合多模态原生长思维链

1.腾讯元宝升级视觉模型Hunyuan T1-Vision，能深度理解图片内容，支持多模态原生长思维链，完答速度提升1.5倍；

2.应用场景广泛，可识别植物品种、分析棋局、翻译游戏界面、进行选择分析、评估商品价值等实际场景；

3.新版本强调"边看图边思考"的能力，通过开启"深度思考T1"模式，可以更精确地捕捉和分析图片中的关键信息。

四、 Perplexity 的Comet AI 浏览器开始内测，将在 5 月中旬发布

1.知名AI搜索工具Perplexity推出基于Chromium框架的AI浏览器Comet，预计5月中旬发布，目前开放内测申请；

2.Comet具备AI Agent能力，能自动执行复杂任务，集成Perplexity的分析工具，简化用户工作流程；

3.继Arc推出Dia后，AI浏览器正成为新趋势，并显示出AI与操作系统、跨平台助手深度融合的发展方向。

五、