“
会员专属，加入会员后，可免费下载！本站资源仅支持搭载Apple Silicon Mac M系列 GPU加速芯片。
”

开源实时多模态AI聊天机器人Moshi，语音对话延迟低至200毫秒！

最近AI圈真是热闹非凡，继Meta发布Llama 3之后，各种开源大模型也是层出不穷。这不，法国一个非盈利AI研究实验室Kyutai，又搞了个大新闻！

他们开源了一个叫Moshi的实时原生多模态基础模型，这玩意儿厉害了，它能同时听、说、还能给出回应，就像跟真人聊天一样自然流畅。更牛的是，它还能理解和表达情感，甚至可以用不同的口音说话！

是不是感觉有点不可思议？别急，我这就带你好好了解一下这个Moshi。

Moshi：实时语音对话的文本语音模型

Kyutai 不仅开源了 Moshi，还发布了详细的技术报告，里面介绍了 Moshi 的一些实现细节。简单来说，Moshi 采用了多流架构，能够同时处理你和系统的语音输入，然后生成相应的语音输出。

更重要的是，Moshi 的延迟非常低！理论上只有160毫秒，实际也才200毫秒，这比我们平时自然对话中动辄几秒的延迟快多了！这意味着，你可以和 Moshi 进行几乎无缝的语音交流，体验感绝对一流。

除了低延迟之外，Moshi 还有一些其他强大的功能：

为了方便大家体验 Moshi 的强大功能，Kyutai 还贴心地提供了一个独立的启动包，Mac 用户可以直接点击运行，不需要配置复杂的 Python 环境。

划重点：目前只支持搭载 Mac M1/2/3 系列芯片的设备哦！

前往下载页面：https://aifun.fans/362/，点击页面右侧的下载按钮进行下载。
下载完成后，你会得到一个 DMG 镜像文件，双击打开，然后将 app 文件拖拽到 Applications 文件夹中就安装完成了。
首次启动时，不要直接在启动台打开，需要在应用程序文件夹右键打开，具体操作如下图所示。这是为了避免一些 Mac 系统的安全限制，具体原因可以参考Mac 安装软件常见问题。