主要观点总结
本文介绍了百度推出的全球首个内容领域的操作系统——沧舟 OS,它通过融合百度文库和网盘的能力,实现了 AI 的深度思考和深度交付。文章分析了沧舟 OS 的三层架构,即底层能力、中枢调度和应用服务生态,并详细描述了其知识化框架、多模态内容处理、应用服务等关键特性。同时,文章还介绍了百度如何通过打造更多「聪明又能干」的 Agent 来丰富应用生态,并以 GenFlow 超能搭子和 AI 笔记为例,说明了沧舟 OS 在实际场景中的应用。最后,文章指出操作系统的故事没有终点,百度通过积极拥抱生态,成为大模型新物种的创造者和新规则的制定者。
关键观点总结
关键观点1: 百度推出全球首个内容领域的操作系统——沧舟 OS。
沧舟 OS 通过融合百度文库和网盘的能力,实现了 AI 的深度思考和深度交付。
关键观点2: 沧舟 OS 的三层架构。
底层能力是基础,中枢调度是桥梁,应用服务生态是表现。三者相互协作,实现了 AI 的高效运行。
关键观点3: 沧舟 OS 的知识化框架和多模态内容处理能力。
通过知识化框架,对多模态内容进行向量化、标签化的处理,实现高效的内容理解和检索。
关键观点4: 打造更多「聪明又能干」的 Agent。
百度推出了一系列 AI Agent,如 GenFlow 超能搭子和 AI 笔记等,实现了 AI 在实际场景中的深度应用。
关键观点5: 沧舟 OS 的生态开放策略。
百度支持开发者全面拥抱 MCP,构建 MCP Server-Client-Host 三层体系,激发广大开发者的创新能力。
正文
技术会滚滚向前,但商业故事的剧情总是会踏着相似节拍不断重复演绎,
在手机 OS 中被验证过的底层逻辑,在大模型时代的 OS 构建上,依然通用。
总结来说有三:完整的底层能力、灵活的中枢调度、繁荣的应用服务生态。正好对应沧舟 OS 的三层架构:底座基建、中枢系统与应用服务。
唯一的不同是,
应用与
中枢、底座中间的桥梁,从以往的
API
,换成了更加标准化、低门槛的 MCP。
其中,MCP Server 部分的底座基建,它的核心组件是 Chatfile plus
,主要作用是通过知识化框架,对不同模态、不同形态、不同格式的内容做元素级的拆解和解析处理,以及多模理解、多模检索、文件转码解析等一系列工具框架组件。
同时,百度文库和网盘构建了公域知识库、私域知识库、记忆库「三大库」,具体指的是百度文库多年累积的公域知识数据(公域知识库)、网盘的用户授权使用的知识数据(私域知识库)、用户过往在文库或网盘操作的指令、使用习惯和历史生成记录(记忆库)。
这些数据往往以不同模态、不同形态、不同格式呈现。其中,公域知识库提供通用的知识,私域知识库、记忆库则保存用户的个性化数据。
知识化框架中,沧舟 OS 将对「三大库」中的多模态内容进行向量化、标签化的处理,也就是将图片、文本、视频、音频、文档等非结构化数据,通过不同专业模型将其转化为计算机可以读懂的多维向量数据,也就是一组 token。
而在中枢系统上,百度文库和网盘自研了「三大器」,也就是融合编辑器(对应文档、PPT 等内容的编辑)、阅读器(文档与 PPT 等内容的阅读)、播放器(音视频播放)等工具。
同时,沧舟 OS 还可以通过「调度中枢」,通过交互组件、意图模型和传输基建等,结合用户记忆和画像数据,通过模型理解用户意图,高效分配调度 Agent。
最顶层,则是一系列 AI Agent。「沧舟 OS」集成文库、网盘的 PPT、AI 绘本、AI 思维导图、AI 海报、AI 笔记、AI 扫描、AI 听记等数百项 AI Agent,生成模态涵盖了图、文、影、音等各种类型、全面覆盖学习办公、生活娱乐等场景
,并依托于融合编辑器的编辑、修改、精细调控能力,进而让检索和内容生成的质量更高、更符合实际的个性化任务需求。
围绕最顶层的应用服务,百度文库 & 百度网盘既推出了数亿用户验证过的好用的数百项
AI
Agent,同时也接入了大量第三方的专业 Agent 做大应用生态。
作为「一站式 AI 内容获取和创作平台」,百度文库的付费用户已超 4000 万,AI 月活用户达 9700 万。百度网盘也升级为「一站式内容服务平台」,服务超 10 亿用户,使用空间总和超过 1000 亿 GB,AI 月活用户超 8000 万。百度文库、百度网盘已成为大模型时代真正的「超级生产力」。
在大会上,百度文库和百度网盘还展示了基于「沧舟 OS」开发的全新能力:「GenFlow 超能搭子」和「
AI
笔记」。