AI日报：微软必应推出全新视频创作工具；小米将多枚Kimi商标转让给月之暗面；谷歌推AI Edge ...

AIbase基地 · 公众号 · 科技创业科技自媒体 · 2025-06-03 17:01

主要观点总结

本文报道了关于人工智能领域的多个新闻，包括小米转让“Kimi”商标、微软推出Bing Video Creator、ElevenLabs的语音交互平台、谷歌的Gemini Live功能登陆iOS平台等。文章还介绍了各家公司或团队推出的新工具、平台或功能，并强调了它们的特点和亮点。

小米将多枚“Kimi”商标转让给北京月之暗面科技有限公司，此举可能是优化非核心商标资源的战略调整，同时为月之暗面拓展智能助手业务提供支持。

微软必应推出了基于OpenAI Sora模型的Bing视频创作器，用户可通过文本提示免费生成短视频。目前该功能仅支持移动设备，生成速度较慢。

该平台在对话流畅性、多语言支持和企业级应用能力上实现了重大突破，为客服、营销和内容创作等领域带来全新可能。集成了RAG技术，确保回答的专业性和准确性。

该功能利用AI快速识别物体并提供信息，通过摄像头和屏幕共享提供便捷的信息获取体验。目前仅限美国地区用户使用。

用户可制作个性化动画视频，并新增了'场景'和'流'功能。但存在滥用问题。

OpenAI将其AI编程工具Codex CLI从Node.js迁移到Rust语言重写，带来了性能优化、安全性提升及零依赖安装等优势。

通过独特学习框架和模块化架构，在极低成本下实现图像风格化与一致性的完美结合，为开发者提供强大工具。

Hume AI发布的第三代语音交互模型EVI 3具备卓越的情感理解能力和个性化交互体验，标志着语音AI在情感交互和自然沟通领域的重大突破。

苹果计划开放的AI模型性能有限，其更强大的内部AI模型尚无公开计划。领导层分歧导致多项AI项目延期。

该应用允许用户在手机上离线运行复杂的AI模型，支持多种AI功能，增强了隐私保护。

Cerebras Systems宣布其推理API全面开放，并提供每日百万免费Token，显著提升AI推理效率。

英伟达联合MIT与香港大学发布Fast-dLLM框架，通过创新机制大幅提升扩散模型推理速度，为AI应用提供强大支持。

3. ElevenLabs推全新语音交互平台Conversational AI 2.0：AI语音助手比真人还懂你

ElevenLabs发布了Conversational AI 2.0，该平台在对话流畅性、多语言支持和企业级应用能力上实现了重大突破，为客服、营销和内容创作等领域带来全新可能。

亮点提要：

✨ 引入先进轮流对话模型，精准捕捉用户对话节奏，避免中断，提升对话流畅性。

✨ 支持32+语言无缝切换，内置自动语言检测功能，助力全球化企业客户服务。

✨ 集成了RAG技术，从企业知识库提取信息，确保回答专业性和准确性。

详情入口：

🔗 https://elevenlabs.io/blog/conversational-ai-2-0

4. 谷歌 Gemini Live 功能正式登陆 iOS 平台，开启 AI 识别新体验

谷歌的Gemini Live功能已上线iOS和iPadOS平台，支持AI识别场景和屏幕内容，且目前免费使用。该功能通过摄像头和屏幕共享提供便捷的信息获取体验，但目前仅限美国地区用户使用。

亮点提要：

✨Gemini Live现已支持iOS/iPadOS，利用AI快速识别物体并提供信息。

📱屏幕共享功能让用户能轻松分享屏幕内容，增强互动体验。

🌍功能目前仅在美国可用，谷歌正推动AI技术更广泛的应用。

5. Character.AI 推出新功能AvatarFX，用户可制作个性化动画视频

Character.AI 推出了 AvatarFX 工具，允许用户创建自定义动画视频，并新增了 '场景' 和 '流' 功能，同时面临滥用问题。