主要观点总结
这篇文章主要介绍了关于生成式AI、GPT-4系列、智谱GLM开源模型系列、可灵AI、腾讯大模型知识引擎、魔搭ModelScope、字节视频生成基础模型Seaweed、开源语音模型Orpheus等相关领域的最新进展和报告观点。包括各个领域的具体成果介绍,研究团队的相关突破以及OpenAI的产品哲学等。
关键观点总结
关键观点1: 英伟达在美国制造AI芯片
英伟达在凤凰城启用制造空间并在休斯顿和达拉斯建设超级计算机工厂,计划四年内在美国生产价值5000亿美元的AI基础设施,推动万亿美元经济效益。
关键观点2: GPT-4.1系列发布
OpenAI发布GPT-4.1系列API,主打性价比,成本较低。新系列在编码测试上表现出强大的性能,其中GPT-4.1的得分超过了GPT-4.5。
关键观点3: 智谱GLM开源模型新成员发布
智谱开源了GLM模型的新成员,包括基座、推理和沉思三种类型。其中,GLM-Z1-32B-0414推理模型性能强劲,且推出了多个商用版本。
关键观点4: 可灵AI 2.0发布
可灵AI发布了其2.0版本,形成了MVL多模态语言系统,支持文本、图片和视频的精准交互。同时,新增了多模态编辑功能和AI音效生成能力。
关键观点5: 腾讯大模型知识引擎升级支持MCP
腾讯云大模型知识引擎升级支持MCP协议,简化了API插件集成,降低了开发门槛。同时提供了三种开发方式,用户可轻松使用MCP Server完成智能体应用开发。
关键观点6: 魔搭ModelScope上线MCP广场
魔搭上线了MCP中文社区“MCP广场”,集成了多款MCP服务。MCP协议可以大幅简化智能体与AI模型、工具、数据的连接配置。
关键观点7: 字节发布视频生成基础模型Seaweed
字节发布了视频生成基础模型Seaweed,该模型参数较少但性能强劲,单GPU即可生成1080P视频。模型支持多种功能,包括长镜头生成、人物动画等。
关键观点8: 开源语音模型Orpheus具备共情能力
开源语音模型Orpheus让LLM具备共情能力,可从文本中生成包含情感的声音。该模型基于Llama架构,拥有流式推理速度快和延迟低的优点。
关键观点9: 最大哺乳动物脑连接图绘制成功
研究团队绘制出了迄今为止最大的哺乳动物脑连接图,展示了小鼠大脑的神经元、突触和神经元线路。这是首次大规模结合神经元活动和连接图谱的研究。
关键观点10: OpenAI产品哲学倡导先发布再迭代
OpenAI倡导“迭代部署”理念,主张先发布产品再进行公开迭代。同时,OpenAI认为未来微调模型的价值被低估,聊天界面将继续是与AI交互的最理想方式。
正文
1. 智谱开源32B/9B系列GLM模型,包括基座、推理、沉思三类型,均采用MIT许可协议,可通过新域名Z.ai免费体验;
2. GLM-Z1-32B-0414推理模型在32B参数规模下性能媲美671B的DeepSeek-R1,实测速度可达200 Tokens/秒,价格为竞品1/30;
3. 全新发布沉思模型支持"自主提问-搜索-分析-完成"研究闭环,并推出多个商用版本,其中Flash版完全免费。
https://mp.weixin.qq.com/s/Cp4pe9tHqGpF3EI5kUBQeg
四、可灵AI 2.0首发实测,让马斯克进厂打工,复活《清明上河图》
1. 可灵AI发布2.0版本,升级了可灵视频生成和可图文生图模型,形成MVL多模态语言系统,可支持文本、图片和视频的精准交互;
2. 新增多模态编辑功能,支持替换、增加和删除三种模式,可在5秒视频基础上进行精确修改,并配备AI音效生成能力;
3. 可灵AI目前已有2200万用户,创作1.68亿视频及3.4亿图片,上万开发者使用其API,累计生成1200万图像和4000万视频。
https://mp.weixin.qq.com/s/EpFt6a1e9I4dVyPpv_vPyg
五、三步搭建MCP Agent,腾讯大模型知识引擎升级支持MCP
1. 腾讯云大模型知识引擎升级支持MCP协议,已集成腾讯位置服务、EdgeOne Pages等多款MCP Server,并支持用户自定义插件配置;