会员专属,加入会员后,可免费下载!本站资源仅支持搭载Apple Silicon Mac M1/M2/M3 GPU加速芯片。
Mac版GPT-SoVITS-WebUI一键启动整合包
GPT-SoVITS是一个功能强大的开源文本到语音转换(TTS)项目。它可以通过仅仅使用1分钟的音频样本来克隆特定的声音,并且支持多语言文本转换。该项目以其便捷的部署、快速的训练速度以及优秀的转换效果受到用户好评。
核心功能
-
零样本文本到语音(TTS):输入5秒的声音样本,立即体验文本到语音转换的魅力。 -
少样本TTS:只需1分钟的训练数据,便可微调模型,进一步提高声音的相似度和真实感。 -
跨语言支持:实现了对英语、日语和中文等语言的支持,即便是与训练数据集不同的语言也能进行高质量的推理。 -
WebUI工具集成:提供了一系列辅助工具,包括声音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注等,帮助初学者更加便捷地创建训练数据集和使用GPT/SoVITS模型。
为了让用户更加轻松地使用这一工具,Mac爱范团队制作了一键启动的整合包。用户通过简单的点击操作即可使用GPT-SoVITS,免去了复杂的下载和配置流程。整合包的下载地址为:https://aifun.fans/117/,请在页面右侧区域点击下载。
特点
-
一键启动:无需安装Xcode command-line tools、brew工具或其他软件,如git、ffmpeg。 -
预训练模型内置:包含了所有必要的预训练模型,无需用户再次下载。 -
GPT-SoVITS Models预训练模型 -
UVR5(人声/伴奏分离和混响移除)预训练模型 -
中文自动语音识别(附加)预训练模型:Damo ASR Model, Damo VAD Model, 和 Damo Punc Model
-
-
支持推理和训练:用户可以使用该整合包进行模型推理和训练操作。
安装及使用步骤
-
下载整合包:访问https://aifun.fans/117/并在页面右侧区域点击下载下载DMG镜像文件。
-
双击打开镜像文件,将会看到如下界面:
将app
文件拖拽到Applications
文件夹中。
-
复制安装完成后, 首次启动先不要在启动台打开,在应用程序文件夹右键打开
,原因参考Mac 安装软件常见问题
-
首次启动可能需要较长时间,请耐心等待。启动成功后界面如下:
-
软件会自动在默认浏览器打开操作界面,地址为 http://127.0.0.1:9874/,此时可以开始在浏览器中使用。
完成以上步骤后,您便可以开始愉快地使用GPT-SoVITS-WebUI了。若需要更多帮助,可参考网上的众多使用教程,或访问中文教程文档:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。