专栏名称: 独角兽智库
独角兽智库是一个新兴产业投研平台,搭建新兴领域高端技术与投资机构、传统行业的桥梁,让专业的资本找到优质的企业,实现新兴产业的快速发展。平台提供新兴产业干货报告、专家咨询服务。
目录
相关文章推荐
独角兽智库  ·  中国低空经济100家企业梳理 ·  2 天前  
融智有色  ·  2025年5月国内钴产品产量通报 ·  昨天  
我是腾腾爸  ·  这周的瓜,是真大! ·  昨天  
独角兽智库  ·  万亿参数重构AI价值链:DeepSeek ... ·  3 天前  
51好读  ›  专栏  ›  独角兽智库

Manus专家解读会议纪要

独角兽智库  · 公众号  · 科技投资  · 2025-03-07 23:13

正文

请到「今天看啥」查看全文


对垂类应用的助推:Manus能启发垂类AI agent的实现方法,其火爆还教育了市场和用户,加速垂直AI的发展。

6、算力与企业降本

算力消耗:Manus对算力的消耗惊人,相比纯粹的大模型chatbot,计算消耗量至少增加10到100倍,因涉及大量推理、判断、代码生成及结果检查等过程,token消耗量比传统chatbot至少高一个数量级。

企业降本:Manus可能激发大模型企业降低成本,因其作为token消耗大户,会使大模型服务用量激增,促使企业进行大规模部署和深度优化,发展更先进技术以提高效率。

Q&A

Q:解决复杂场景任务的Agent在技术上是如何解决逻辑规划能力以及多工具调用时稳定性问题的?

A:今年链式大模型成熟,如DeepMind的阿尔法接近GPT - 4水平,其基于强化学习,训练数据为代码编程和数学数据,这些数据可被验证。链式大模型处理逻辑问题的准确性相比之前纯粹靠大数据堆的模型有较高提升,准确率可能在90%以上。Manus借助链式大模型的推理能力,提升了工具使用能力。此外,若想获得十分准确且无随机性的推理结果,可将算法中“温度”参数的值调到0,让其遵循严格推理逻辑,保证每次结果一致,以此实现稳定的工具调用输出。

Q:如何定义一个AI产品是Agent、Comparator还是传统嵌入式AI,有没有直接好用的筛选标准?

A:AI Agent与以前的Agent不同,以前很多Agent类似RPA,只是自动化工具。AI Agent以AI作为决策大脑,类似人的大脑负责思考、决策,根据行动反馈形成判断、提炼经验用于下次任务执行。专业来讲,AI Agent要有很强的工具能力和感知能力,能感知周边环境变化,有行动能力,可根据环境变化规划行动、挑选合适方案,还能保留经验,在下次环境变化时参考以前决策优化行动。而之前所说的AI产品,可能在感知能力和工具调用能力上有差距,工具有限且缺乏逻辑性。

Q:从未来格局看,做Agent领域一定是由基础大模型公司完成,还是会有独立第三方基于基础大模型做出通用的Agent产品或能力?

A:从目前发展情况看,AI Agent的基础大模型可能还是由基础大模型公司承担。因为AI Agent公司在经验和能力上可能不具备做基础大模型的能力,且训练基础大模型需要巨大的资金、时间和算力,一般AI团队承担不了。不过,随着行业发展迭代,如果有AI Agent成长为有竞争力的技能,有可能会将基础模型业务拿到自己手里形成技术壁垒,但这要看Agent市场能否跑出这样的“小技能”,若跑不出来,还是会由基础模型公司完成。

Q:以Deepseek、Hugging Face、LLaMA为代表的开源体系的发展,是否会让专门做agent的公司诞生的可能性变大,还是说基于开源体系打造的agent产品难以与基础大模型长出的agent产品竞争?

A:开源和闭源大模型在很长一段时间会同时存在,主导开源大模型的背后也是商业型公司,有商业诉求。目前闭源大模型仍具有领先性,如GPT - 4在编程、情商等方面领先于开源模型,Meta内部也有闭源模型支撑商业化。若未来开源大模型的训练由社区驱动,而非商业公司控制,有可能出现由全球开发者贡献算力和数据形成的高水平开源大模型,在此基础上有可能诞生独立发展的。

Q:Manus产品有哪些优势和不足?

A:优势在于其在AI指标性能测试下超越了OpenAI,引起全球关注,带动国内信创ETF板块股价上涨;在自主完成任务能力上突出领先,多代理架构灵活,能重新定义人机协作模式。不足在于技术细节透明度不高,很多指标数据未完全公开,可信度存疑;成本比以往AI硬件成本高很多,难以大规模应用;用户隐私保护存在隐患。

Q:AI agent未来在中国未来一两年有可能率先在哪些场景落地?

A:抽象来说,可能在固定的支持工作领域率先落地,因为效果相对稳定且成本相对不高。垂直行业方面,法律服务、编程、广告、创作(包括基本创作和影视创作)等行业可能会率先出现很成功的AI应用。

Q:Manus展示的旅行规划应用与原先大模型应用相比,在C端或B端降本等方面有哪些差异和进步?

A:对于C端个人来说,可能会节省做攻略的时间,提升效率;对于B端如旅行社,不太清楚其运作模式,但猜测效率提升可能不体现在做旅行攻略和规划上。以法律服务行业为例,该行业有很多固定化的文书工作,人力效率低且人员流动会带走知识经验,使用AI Agent可将知识沉淀,降低人力成本,原先有一两百写文字的人员,使用后可能降至个位数以下,这类行业可能会率先落地应用。

Q:Manus应用与原先相比,在成本、时间等方面有哪些差异或提高,有哪些指标可做对比?

A:未来大模型可能藏在幕后,普通用户不直接对接大模型。从体验上看,AI Agent的体验比纯粹大模型的聊天机器人要好很多。指标方面,一是个性化能力上,AI Agent学习用户习惯癖好的能力更强;二是产品化方面,AI Agent比大模型公司的聊天机器人更好更强,能帮助用户完成最后一公里。大模型像火车把人从一地运到另一地,但到目的地还需其他步骤,而AI Agent是一站式服务,能直接帮用户达成目的。现在大模型主要用于写作业等文字工作提供参考,未来AI Agent铺开后,用户会用它完成具体工作,如投资分析等,且能感知外部世界变化,而聊天机器人建议浅显,不感知外部变化,参考意义不大。







请到「今天看啥」查看全文