专栏名称: APPSO
让智能手机更好用的秘密。
目录
相关文章推荐
51好读  ›  专栏  ›  APPSO

DeepSeek 正式发布开源新模型/苹果 AirPlay 漏洞曝光,影响百万设备/饿了么官宣百亿补贴加入外卖大战

APPSO  · 公众号  · app  · 2025-05-01 09:01

正文

请到「今天看啥」查看全文


昨日,小米大模型团队宣布开源旗下首个推理大模型「Xiaomi MiMo」。
小米方面介绍,7B 参数规模的 MiMo 在数学和代码领域表现出色。性能表现如下:

在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

在相同 RL 训练数据情况下,MiMo-7B 的数学&代码领域的强化学习潜力超越 DeepSeek-R1-Distill-7B 和 Qwen2.5-32B。
据介绍,MiMo 的推理能力提升,源于其在预训练和后训练阶段的多项数据与算法的联合驱动创新:

预训练阶段创新:旨在让模型接触更多推理模式。着重挖掘富推理语料,并合成约 200B tokens 推理数据;进行了三阶段训练,逐步提升训练难度,总训练 25T tokens。

后训练阶段创新:旨在建立高效稳定的强化学习系统。提出 Test Difficulty Driven Reward 来缓解困难算法问题中的奖励稀疏问题,并引入 Easy Data Re-Sampling 策略,以稳定 RL 训练;设计了 Seamless Rollout 系统,使得 RL 训练加速 2.29 倍,验证加速 1.96 倍。
目前,MiMo-7B 已在 Hugging Face 平台开源 4 个模型版本,技术报告也同步上线 GitHub,向开发者与研究者全面开放。
另据悉,MiMo 系列由新组建的「小米大模型 Core 团队」打造,意在探索预训练增长瓶颈之外的能力突破路径,激发模型的推理潜能。
HuggingFace:https://huggingface.co/XiaomiMiMo
GitHub 技术报告:https://github.com/XiaomiMiMo/MiMo/blob/main/MiMo-7B-Technical-Report.pdf

扎克伯格首次回应「Llama 4 测试风波」

日前,Meta CEO 扎克伯格接受 Dwarkesh Patel 的采访,前者在采访中首次回应了此前 Llama 4 大模型基准测试争议。
采访中,主持人提到 Llama 4 目前的排名下降多名,表现甚至不如 OpenAI 的 o4-mini 和 Google 的 Gemini 2.5 Flash。对于此情况,扎克伯格表示「这些测试并非用户日常会做的事情,基准测试衡量的内容与人们实际关心的事情有所不同」。
扎克伯格进一步表示,Llama 没有过度优化基准测试中所需测试的相关项目,并表示 Meta 始终将产品定位在用户使用价值上,因此会导致模型在基准测试上的表现不太「好看」。扎克伯格还「拉」了 Anthropic 的 Claude Sonnet 3.7 一同佐证自己的观点:Sonnet 3.7 表现很好,但也没在竞技场的顶部。
扎克伯格表示,团队若想优化 Llama 4 在基准测试的表现并非难事,之所以不选择过度优化,是为了让模型与用户实际体验对齐。
据了解,Meta Llama 4 大模型于 4 月 6 日正式发布,号称原生多模态 MOE 模型,击败 DeepSeek V3,还有 2 万亿参数巨兽。但据网友们实测后反馈,却几乎是一边倒的负面评价,并且有不少人质疑其真实性能。
而我们此前也对这一事件做了详细报道,点击回顾!👇
AI 圈今年最大丑闻曝光!Llama 4 被揭训练作弊,实测惨遭滑铁卢,核心骨干愤然离职
采访链接:https://youtu.be/rYXeQbTuVl0?feature=shared

微软 CEO:公司多达 30% 的代码由 AI 生成

日前,微软 CEO Satya Nadella 参加 Meta 的 LlamaCon AI 开发者大会,并在会上与 Meta CEO 扎克伯格分享了微软内部使用 AI 工具的情况。
Nadella 在对话中称,目前微软的代码库中,约有 20%-30% 的代码由 AI 完成,甚至一些项目,都可能完全由 AI 进行编写。
随后 Nadella 也反问回扎克伯格「Meta 的代码有多少由 AI 编写」,扎克伯格表示「无法提供确切的数字」,但他表示 Meta 正在构建一个 AI 模型,该模型能够开发 Meta 旗下 Llama 系列模型的未来版本。另外,扎克伯格还透露,公司目前预期是「明年约有一半工作由 AI 完成,并且比例不断增加」。
近期,微软还公布了 2025 年度工作趋势指数报告。
微软通过多方数据整合得出一个不可逆转的趋势:AI 已经令人类的工作场合发生了巨大的变化,并且一种名为「前沿公司」的组织模式正在产生。这一模式将会围绕 AI 发展,促使人类与 Agent 成为混合型团队,最后令每个人类员工成为 Agent 的「主管」。
据微软官方介绍,「前沿公司」都会经历「AI 充当助手」「Agent 成为数字同事」「人类员工为 Agent 提供思路方向」这三个步骤。而据微软预测,未来 2-5 年内,每个公司都将会踏上「前沿公司」这一模式的路途。

索尼被传拆分半导体业务后股票大涨

据彭博社消息,索尼正在考虑将其半导体解决方案公司拆分并上市,该计划最早可能在今年内完成。
受到该消息影响,索尼股价在日本股市一度大涨 6.8%,创 4 月 1 日以来的新高点位,位列日经 225 日本蓝筹股指数涨幅前列。日本股市周二因假期休市,周三复市后,日本大盘(即东证指数)上涨约 0.5%。
报道指出,不少业内人士及分析机构对索尼本次拆分计划给出了「好评」,认为索尼半导体业务被剥离后,该公司能转型为一家更纯粹的娱乐公司。
值得一提的是,索尼回应彭博社表示,媒体的报道是基于猜测,而公司目前没有具体的计划。

豆包 PC 生图功能升级

最近,豆包电脑版和网页版「图像生成」功能推出「超能创意 1.0」模式,一次最多生成 20 张差异化图像。
目前,打开豆包电脑版或网页版(doubao.com)选择「图像生成」按钮,即可体验「超能创意 1.0」模式。另外,豆包 App 端也已开启内测,可一次直出 10 张图像。

快手提高可灵 AI 的优先级

据《晚点》获悉,快手在昨日成立了可灵 AI 事业部:

可灵 AI 事业部下设可灵 AI 产品部、运营部和技术部,负责可灵、可图等系列大模型业务,快手高级副总裁盖坤担任可灵 AI 事业部负责人,继续兼任社区科学线负责人。

与此同时,社区科学线下成立基础大模型与应用部,负责 LLM 大模型、多模态理解大模型以及应用技术研发。

调整后,可灵 AI 将作为与主站、电商等并列的一级业务部门,向快手董事长兼 CEO 程一笑汇报。这也是近 3 年时间里,快手唯一成立的独立事业部。
在今年 3 月底的快手财报电话会上,程一笑称,目前可灵 AI「图生视频」功能的综合效果处于全球第一。
官方数据显示,自商业化以来至今年 2 月,可灵 AI 累计营业收入已超过 1 亿元。据了解,可灵 AI 今年前三个月的营收,已超过 2024 年下半年的总和。
报道指出,快手是押注视频模型最坚定的中国互联网公司之一:

快手在 2023 年初启动 AI 战略并制定了相应目标规划。程一笑便提及,AI 是个新时代,对快手来说,推荐和视频生成领域是发力点。






请到「今天看啥」查看全文