专栏名称: 计算机司令部
安信计算机:严谨研究 真诚服务。
目录
相关文章推荐
经视直播  ·  演员张艺兴,在《人民日报》撰文 ·  15 小时前  
经视直播  ·  武汉公积金新政策落地!有人省了近7万元 ·  昨天  
经视直播  ·  王晓晨回应与俞灏明已婚传闻:我头昏了 ·  2 天前  
51好读  ›  专栏  ›  计算机司令部

【民生计算机】把握AI应用“击球区”

计算机司令部  · 公众号  ·  · 2025-05-19 00:16

正文

请到「今天看啥」查看全文



2025年6月11日,火山引擎2025 FORCE原动力大会即将召开,将围绕豆包大模型升级、企业AI全栈服务、各类AI应用场景召开。 除了《豆包大模型+AI云原生=智能时代更优解》、《AI云原生,繁荣Agent时代,加速模型落地》两个主论坛外,产品论坛将包括AIoT创新硬件、AI云原生、AI应用、Data+AI、大模型安全、视频智能与边缘云、智能体产业应用等;行业论坛将包括AI+汽车、AI+金融、AI+生态、AI+医药大健康等。 截至2025年3月底,豆包大模型日均 tokens 调用量已超过12.7万亿,豆包大模型已在汽车、智能终端、互联网、金融、教育科研、零售消费等行业广泛落地,覆盖4亿终端设备,如小米、OPPO、vivo、荣耀、联想、三星等品牌,火山引擎2025 FORCE原动力大会具备较强影响力,有望进一步催化国内AI产业发展。


1.1.3 阿里巴巴:阿里云AI业务持续高增,持续构建AI产品矩阵

2025Q1,阿里云AI相关产品收入连续七个季度实现三位数同步增长,阿里AI在千行百业加速落地的同时持续打造2C的AI产品矩阵。 据阿里巴巴2025Q1财报,阿里与多个行业头部客户、中小企业开展AI领域合作,在互联网、辅助驾驶、金融、养殖业、传统制造业等行业广泛应用;与此同时,阿里持续深化2C的AI产品矩阵,除了早前的飞猪AI、夸克超级框等产品,近期千问3上线通义APP,能够自动切换深度思考与秒答模式,有望成为用户的生活助理。



阿里开业内首个视频编辑统一模型源通义万相VACE,用户可一站式完成文生视频、图像参考生成、局部编辑与视频扩展等多种任务。 据通义大模型微信公众号,开发团队通过对四类常见任务(文生视频、图生视频、视频生视频、局部视频生视频)的输入形态进行分析和总结,提出了一个灵活统一的输入范式: 视频条件单元 VCU,它将多模态的各类上下文输入,总结成了文本、帧序列、mask 序列三大形态,在输入形式上统一了 4 类视频生成与编辑任务的统一;VCU 的帧序列和 Mask 序列在数学上可以相互叠加,为多任务的自由组合创造条件。 VACE 提供了强大的可控重绘能力,支持基于人体姿态、运动光流、结构保持、空间运动、着色等控制生成,同时也支持基于主体和背景参考的视频生成;对于图像输入,VACE 可支持物体参考图或视频帧;对于视频输入,用户可以通过抹除、局部扩展等操作,使用 VACE 重新生成;对于局部区域,用户可以通过0/1二值信号来指定编辑区域;对于控制信号,VACE支持深度图、光流、布局、灰度、线稿和姿态等;VACE 还支持多种单任务能力的自由组合,打破了传统专家模型各自为战的协作瓶颈。作为统一模型,它能够自然融合文生视频、姿态控制、背景替换、局部编辑等原子能力,无需为单一功能单独训练新模型。




1.1.4 AI Agent竞争进入白热化


全球首个创意设计类AI Agent——Lovart颠覆创意设计流程。 据AI TOP100介绍,Lovart AI是一款集成图像生成、视频制作、音乐创作等功能的一体化AI设计平台。作为全球首个智能设计代理平台,它通过自然语言交互实现从创意拆解到专业交付的全流程自动化。用户无需掌握专业设计技能,仅需输入指令即可生成高质量视觉内容,覆盖品牌视觉设计、故事板制作、海报创作等多个领域:


1)全链路自动化设计任务拆解与执行 :用户输入自然语言指令后,Lovart自动分解需求并生成从草图到成品的完整方案。例如,输入“30秒智能家居广告,6帧故事板”,平台可在数分钟内完成脚本撰写、角色设计、场景填充及光影效果配置。多模态模型集成:无缝接入图像生成模型(如GPT-Image-1、Flux Pro)、视频生成模型(可灵ai)及音乐生成模型(Suno ai),实现跨媒介内容创作。例如,为虚构品牌“VIVIDPIX”设计跨媒体活动时,平台可同步生成Logo、海报、3D动画及背景音乐。

2)智能图文分离技术生成的海报、广告等视觉内容自动分离文字图层: 用户可自由调整文字内容、大小和颜色。例如,为植物蛋白饮料设计宣传海报时,平台可在一分钟内输出标准海报及分离文字的版本,极大简化后期调整流程。

3)互动式设计代理模式Convo模式: 像与创意总监对话一样通过语言生成设计。

4)Tap-Tap模式: 自动提示下一步设计建议(排版、颜色、构图)。

5 )Canvas模式 :传统设计工作区增强版,支持自定义微调作品。



OpenAI发布最强编程智能体CodeX。 据网易、DeepTech深科技,Codex 在一个沙盒化的云端虚拟计算机中运行,通过与 GitHub 连接,可以预先加载代码仓库;用户可以通过 ChatGPT 侧边栏访问 Codex,通过输入提示并点击 Code 按钮来安排新的编码任务,或者点击 Ask 按钮向 Codex 询问关于代码库的问题;每个任务都会在一个隔离的、沙箱化的云端环境中运行,Codex 可以访问整个代码库,包括代码文件、文档和配置文件等,并拥有运行 shell 命令的权限;这一机制让 Codex 能够具备“类开发者”的工作环境,从而实现从问题分析、代码修改,到测试运行、结果反馈的闭环。



以美团为代表的其他互联网大厂纷纷加码AI Agent赛道。 据美团技术团队微信公众号,美团积极推进AI战略,正研发一款全新的AI Native Product,未来会推出一个覆盖美团餐饮酒旅等所有服务的 AI 助手,这款AI助手将深度整合美团全平台的服务资源,依托强大的即时配送网络与丰富的线下服务生态,为用户提供一站式智能生活解决方案。它能主动理解需求,高效完成外卖点单与配送跟踪、餐厅预约与到店核销、本地优惠选购、商超日用采购、旅行路线规划、酒店住宿预订等个性化任务。







请到「今天看啥」查看全文