DeepSeek 正式发布开源新模型/苹果 AirPlay 漏洞曝光，影响百万设备/饿了么官宣百亿补贴加入外卖大战

APPSO · 公众号 · app · 2025-05-01 09:01

正文

请到「今天看啥」查看全文

昨日，小米大模型团队宣布开源旗下首个推理大模型「Xiaomi MiMo」。

小米方面介绍，7B 参数规模的 MiMo 在数学和代码领域表现出色。性能表现如下：

在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo 超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

在相同 RL 训练数据情况下，MiMo-7B 的数学&代码领域的强化学习潜力超越 DeepSeek-R1-Distill-7B 和 Qwen2.5-32B。

据介绍，MiMo 的推理能力提升，源于其在预训练和后训练阶段的多项数据与算法的联合驱动创新：

预训练阶段创新：旨在让模型接触更多推理模式。着重挖掘富推理语料，并合成约 200B tokens 推理数据；进行了三阶段训练，逐步提升训练难度，总训练 25T tokens。

后训练阶段创新：旨在建立高效稳定的强化学习系统。提出 Test Difficulty Driven Reward 来缓解困难算法问题中的奖励稀疏问题，并引入 Easy Data Re-Sampling 策略，以稳定 RL 训练；设计了 Seamless Rollout 系统，使得 RL 训练加速 2.29 倍，验证加速 1.96 倍。

目前，MiMo-7B 已在 Hugging Face 平台开源 4 个模型版本，技术报告也同步上线 GitHub，向开发者与研究者全面开放。

另据悉，MiMo 系列由新组建的「小米大模型 Core 团队」打造，意在探索预训练增长瓶颈之外的能力突破路径，激发模型的推理潜能。

HuggingFace：https://huggingface.co/XiaomiMiMo

GitHub 技术报告：https://github.com/XiaomiMiMo/MiMo/blob/main/MiMo-7B-Technical-Report.pdf

扎克伯格首次回应「Llama 4 测试风波」

日前，Meta CEO 扎克伯格接受 Dwarkesh Patel 的采访，前者在采访中首次回应了此前 Llama 4 大模型基准测试争议。

采访中，主持人提到 Llama 4 目前的排名下降多名，表现甚至不如 OpenAI 的 o4-mini 和 Google 的 Gemini 2.5 Flash。对于此情况，扎克伯格表示「这些测试并非用户日常会做的事情，基准测试衡量的内容与人们实际关心的事情有所不同」。

扎克伯格进一步表示，Llama 没有过度优化基准测试中所需测试的相关项目，并表示 Meta 始终将产品定位在用户使用价值上，因此会导致模型在基准测试上的表现不太「好看」。扎克伯格还「拉」了 Anthropic 的 Claude Sonnet 3.7 一同佐证自己的观点：Sonnet 3.7 表现很好，但也没在竞技场的顶部。

扎克伯格表示，团队若想优化 Llama 4 在基准测试的表现并非难事，之所以不选择过度优化，是为了让模型与用户实际体验对齐。

据了解，Meta Llama 4 大模型于 4 月 6 日正式发布，号称原生多模态 MOE 模型，击败 DeepSeek V3，还有 2 万亿参数巨兽。但据网友们实测后反馈，却几乎是一边倒的负面评价，并且有不少人质疑其真实性能。

而我们此前也对这一事件做了详细报道，点击回顾！👇

AI 圈今年最大丑闻曝光！Llama 4 被揭训练作弊，实测惨遭滑铁卢，核心骨干愤然离职

采访链接：https://youtu.be/rYXeQbTuVl0?feature=shared

微软 CEO：公司多达 30% 的代码由 AI 生成

日前，微软 CEO Satya Nadella 参加 Meta 的 LlamaCon AI 开发者大会，并在会上与 Meta CEO 扎克伯格分享了微软内部使用 AI 工具的情况。

Nadella 在对话中称，目前微软的代码库中，约有 20%-30% 的代码由 AI 完成，甚至一些项目，都可能完全由 AI 进行编写。

随后 Nadella 也反问回扎克伯格「Meta 的代码有多少由 AI 编写」，扎克伯格表示「无法提供确切的数字」，但他表示 Meta 正在构建一个 AI 模型，该模型能够开发 Meta 旗下 Llama 系列模型的未来版本。另外，扎克伯格还透露，公司目前预期是「明年约有一半工作由 AI 完成，并且比例不断增加」。

近期，微软还公布了 2025 年度工作趋势指数报告。

微软通过多方数据整合得出一个不可逆转的趋势：AI 已经令人类的工作场合发生了巨大的变化，并且一种名为「前沿公司」的组织模式正在产生。这一模式将会围绕 AI 发展，促使人类与 Agent 成为混合型团队，最后令每个人类员工成为 Agent 的「主管」。

据微软官方介绍，「前沿公司」都会经历「AI 充当助手」「Agent 成为数字同事」「人类员工为 Agent 提供思路方向」这三个步骤。而据微软预测，未来 2-5 年内，每个公司都将会踏上「前沿公司」这一模式的路途。

索尼被传拆分半导体业务后股票大涨

据彭博社消息，索尼正在考虑将其半导体解决方案公司拆分并上市，该计划最早可能在今年内完成。

受到该消息影响，索尼股价在日本股市一度大涨 6.8%，创 4 月 1 日以来的新高点位，位列日经 225 日本蓝筹股指数涨幅前列。日本股市周二因假期休市，周三复市后，日本大盘（即东证指数）上涨约 0.5%。

报道指出，不少业内人士及分析机构对索尼本次拆分计划给出了「好评」，认为索尼半导体业务被剥离后，该公司能转型为一家更纯粹的娱乐公司。

值得一提的是，索尼回应彭博社表示，媒体的报道是基于猜测，而公司目前没有具体的计划。

豆包 PC 生图功能升级

最近，豆包电脑版和网页版「图像生成」功能推出「超能创意 1.0」模式，一次最多生成 20 张差异化图像。

目前，打开豆包电脑版或网页版（doubao.com）选择「图像生成」按钮，即可体验「超能创意 1.0」模式。另外，豆包 App 端也已开启内测，可一次直出 10 张图像。

快手提高可灵 AI 的优先级

据《晚点》获悉，快手在昨日成立了可灵 AI 事业部：

可灵 AI 事业部下设可灵 AI 产品部、运营部和技术部，负责可灵、可图等系列大模型业务，快手高级副总裁盖坤担任可灵 AI 事业部负责人，继续兼任社区科学线负责人。

与此同时，社区科学线下成立基础大模型与应用部，负责 LLM 大模型、多模态理解大模型以及应用技术研发。

调整后，可灵 AI 将作为与主站、电商等并列的一级业务部门，向快手董事长兼 CEO 程一笑汇报。这也是近 3 年时间里，快手唯一成立的独立事业部。

在今年 3 月底的快手财报电话会上，程一笑称，目前可灵 AI「图生视频」功能的综合效果处于全球第一。

官方数据显示，自商业化以来至今年 2 月，可灵 AI 累计营业收入已超过 1 亿元。据了解，可灵 AI 今年前三个月的营收，已超过 2024 年下半年的总和。

报道指出，快手是押注视频模型最坚定的中国互联网公司之一：

快手在 2023 年初启动 AI 战略并制定了相应目标规划。程一笑便提及，AI 是个新时代，对快手来说，推荐和视频生成领域是发力点。