您当前的位置: 首页 > AI语音工具 > 正文
用手机扫一扫点击访问

OpenVoice官网

添加时间2024-08-03 浏览:5人次 TDK更新时间:2024-10-21

腾讯是否拦截 未知 网址是否可以访问 未知
备案号 - 备案主体 -
备案类型 - 审核时间 -
公告声明:本站仅提供网站信息发布展示,请谨慎判断网站真伪,如果发现网站违法请联系我们删除QQ50169001
百度权重 移动权重 360权重 神马权重 搜狗权重 头条权重 更新权重
点击更新
    特别声明

    本站提供的OpenVoice官网信息,均来源于互联网。我们致力于确保所有收录内容在收录时均符合法律法规。本站严格遵守版权法,尊重著作权人的合法权益。 若发现收录内容存在侵权或违法行为,请及时与我们联系。我们将迅速采取措施,断开相关链接并彻底删除侵权内容。请注意,由于网站域名可能经历过期、删除或重新注册等变更,原有链接可能不再代表本站立场。 我们不声明也不保证链接内容的准确性和可靠性。访问者应自行判断链接内容,并对其访问行为负责。如有风险,由访问者自行承担。 我们提醒所有用户:请遵守国家法律法规,谨慎选择并访问网络链接。

    OpenVoice官网

    OpenVoice,一种多功能的即时语音克隆方法,只需要参考说话者的一小段音频剪辑即可复制他们的声音并生成多种语言的语音。OpenVoice 支持对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调,以及复制参考扬声器的音调颜色。OpenVoice 还实现了零样本跨语言语音克隆,适用于未包含在大规模说话人训练集中的语言。OpenVoice 的计算效率也很高,其成本比性能较差的商用 API 低数十倍。

    OpenVoice论文:https://arxiv.org/pdf/2312.01479.pdf

    OpenVoice项目:https://github.com/myshell-ai/OpenVoice

    OpenVoice特征:

    准确的色调颜色克隆。OpenVoice可以准确克隆参考音色,生成多种语言和口音的语音。

    灵活的语音风格控制。OpenVoice 支持对语音风格(如情感和口音)以及其他风格参数(包括节奏、停顿和语调)进行精细控制。

    零样本跨语言语音克隆。生成的语音的语言和参考语音的语言都不需要在大规模说话人多语言训练数据集中呈现。

    OpenVoice用法:

    1.灵活的语音风格控制。请参阅 demo,part1.ipynb,了解 OpenVoice 如何对克隆的语音实现灵活的样式控制的示例用法。

    2.跨语言语音克隆。请参阅 demo,part2.ipynb,了解 MSML 训练集中可见或未可见的语言示例。

    3. 高级用法。基本扬声器型号可以替换为用户喜欢的任何型号(任何语言和风格)。请使用演示中演示的功能来提取新基座扬声器的音色嵌入。se,extractor.get,se

    4. 生成自然语音的技巧。有许多单说话人或多说话人的 TTS 方法可以生成自然语音,并且很容易获得。只需将基本扬声器型号替换为您喜欢的型号,您就可以将语音自然度提升到您想要的水平。

    语言

    我们只支持此版本模型重量的英文和中文。OpenVoice 可以适应任何其他语言,只要提供基础扬声器即可。

    自 2023 年 5 月以来,OpenVoice 一直在为 myshell.ai 的即时语音克隆功能提供支持。截止到2023年11月,语音克隆模式已被全球用户使用数千万次,见证了平台用户爆发式增长。