主要观点总结
本文报道了关于人工智能领域的多个新闻,包括小米转让“Kimi”商标、微软推出Bing Video Creator、ElevenLabs的语音交互平台、谷歌的Gemini Live功能登陆iOS平台等。文章还介绍了各家公司或团队推出的新工具、平台或功能,并强调了它们的特点和亮点。
关键观点总结
关键观点1: 小米将“Kimi”商标转让给月之暗面
小米将多枚“Kimi”商标转让给北京月之暗面科技有限公司,此举可能是优化非核心商标资源的战略调整,同时为月之暗面拓展智能助手业务提供支持。
关键观点2: 微软推出Bing Video Creator
微软必应推出了基于OpenAI Sora模型的Bing视频创作器,用户可通过文本提示免费生成短视频。目前该功能仅支持移动设备,生成速度较慢。
关键观点3: ElevenLabs推出全新语音交互平台Conversational AI 2.0
该平台在对话流畅性、多语言支持和企业级应用能力上实现了重大突破,为客服、营销和内容创作等领域带来全新可能。集成了RAG技术,确保回答的专业性和准确性。
关键观点4: 谷歌的Gemini Live功能正式登陆iOS平台
该功能利用AI快速识别物体并提供信息,通过摄像头和屏幕共享提供便捷的信息获取体验。目前仅限美国地区用户使用。
关键观点5: Character.AI推出新功能AvatarFX
用户可制作个性化动画视频,并新增了'场景'和'流'功能。但存在滥用问题。
关键观点6: OpenAI用Rust重新打造Codex CLI
OpenAI将其AI编程工具Codex CLI从Node.js迁移到Rust语言重写,带来了性能优化、安全性提升及零依赖安装等优势。
关键观点7: NUS推出OmniConsistency项目
通过独特学习框架和模块化架构,在极低成本下实现图像风格化与一致性的完美结合,为开发者提供强大工具。
关键观点8: Hume AI发布EVI 3
Hume AI发布的第三代语音交互模型EVI 3具备卓越的情感理解能力和个性化交互体验,标志着语音AI在情感交互和自然沟通领域的重大突破。
关键观点9: 苹果拥有媲美ChatGPT的AI模型却未公开
苹果计划开放的AI模型性能有限,其更强大的内部AI模型尚无公开计划。领导层分歧导致多项AI项目延期。
关键观点10: 谷歌推出AI Edge Gallery应用
该应用允许用户在手机上离线运行复杂的AI模型,支持多种AI功能,增强了隐私保护。
关键观点11: Cerebras推理API全面开放
Cerebras Systems宣布其推理API全面开放,并提供每日百万免费Token,显著提升AI推理效率。
关键观点12: 英伟达与MIT合作推出Fast-dLLM框架
英伟达联合MIT与香港大学发布Fast-dLLM框架,通过创新机制大幅提升扩散模型推理速度,为AI应用提供强大支持。
正文
3.
ElevenLabs推全新语音交互平台Conversational AI 2.0:AI语音助手比真人还懂你
ElevenLabs发布了Conversational AI 2.0,该平台在对话流畅性、多语言支持和企业级应用能力上实现了重大突破,为客服、营销和内容创作等领域带来全新可能。
亮点提要:
✨ 引入先进轮流对话模型,精准捕捉用户对话节奏,避免中断,提升对话流畅性。
✨ 支持32+语言无缝切换,内置自动语言检测功能,助力全球化企业客户服务。
✨ 集成了RAG技术,从企业知识库提取信息,确保回答专业性和准确性。
详情
入口:
🔗 https://elevenlabs.io/blog/conversational-ai-2-0
4.
谷歌 Gemini Live 功能正式登陆 iOS 平台,开启 AI 识别新体验
谷歌的Gemini Live功能已上线iOS和iPadOS平台,支持AI识别场景和屏幕内容,且目前免费使用。该功能通过摄像头和屏幕共享提供便捷的信息获取体验,但目前仅限美国地区用户使用。
亮点提要:
✨Gemini Live现已支持iOS/iPadOS,利用AI快速识别物体并提供信息。
📱屏幕共享功能让用户能轻松分享屏幕内容,增强互动体验。
🌍功能目前仅在美国可用,谷歌正推动AI技术更广泛的应用。
5.
Character.AI 推出新功能AvatarFX,用户可制作个性化动画视频
Character.AI 推出了 AvatarFX 工具,允许用户创建自定义动画视频,并新增了 '场景' 和 '流' 功能,同时面临滥用问题。