专栏名称: Ai秦始皇
加速解放生产力!
目录
相关文章推荐
株洲交通频道广播电台  ·  湖南再发高温黄色预警!降温将在→ ·  昨天  
新闻株洲  ·  高温黄色预警! ·  昨天  
湖南日报  ·  市监局多人上班时间睡觉?官方通报—— ·  6 天前  
新闻株洲  ·  渌口区快速处置一起网络造谣违法事件 ·  6 天前  
新闻株洲  ·  阵雨、雷阵雨马上到株洲! ·  1 周前  
51好读  ›  专栏  ›  Ai秦始皇

Mini-Omni:全球首个开源实时交互模型,边说话边思考。(附整合包)

Ai秦始皇  · 公众号  ·  · 2024-09-04 22:36

正文

之前开源社区还没有一个像样的实时语音对话模型,Mini-Omni可以说是开了一个先河,相信后续基于人机的实时语音交互模型会越来越多。


Mini-Omni可以倾听、说话、思考同时进行具有实时端到端语音输入和流式音频输出会话能力。实测反应速度极快,仅需5G左右显存,门槛低,大部分人都能体验到。


温馨提示:

你可能需要准备一个麦克风跟它聊天。


(官方演示)


目前只支持英语对话,大家可以拿来做英语学习对话,相信大家英文都比我好。



特点优势:


✅ 实时语音会话功能。无需额外的ASR或TTS模型。

✅ 边说话边思考,具有同时生成文本和音频的功能。

✅ 流媒体音频输出能力。

预判能力,使用“音频到文本”和“音频至音频”批量推断以进一步提升性能。



(作者实测)


一键启动:



这种脏活累活就由我来干吧,大家只需一键下载,就可以体验啦。


🚀 整合包下载链接(免费):

https://openaistore.cn/sp/66d8674fc3e512c778e470ca




预告:comfyui全新内核即将上线,一键运行上百个AI工作流,敬请期待。