OpenVoice:多功能实时语音克隆
My shell 的这个语音克隆技术上周爆了,只需要一小段说话内容就可以复制对应的声音并生成多种语言的声音。
除了复制参考说话者的音色之外,OpenVoice 还可以对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调。
OpenVoice 的计算效率也很高,其成本比性能较差的商用 API 低数十倍。
论文:https://arxiv.org/pdf/2312.01479.pdf
Github:https://github.com/myshell-ai/OpenVoice
未经允许不得转载:表盘吧 » OpenVoice:多功能实时语音克隆 My shell 的这个语音克隆技术上周爆了,只需要一小段说话内容就可以复制对应的声音并生成多种语言的声音。 除了复制参考说话者的音色之外,OpenVoice 还可以对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调。 OpenVoice 的计算效率也很高,其成本比性能较差的商用 API 低数十倍。 论文:https://arxiv.org/pdf/2312.01479.pdf Github:https://github.com/myshell-ai/OpenVoice Mobile ALOHA:斯坦福家政机械臂