E2/F5-TTS AI人工智能 文字转语音工具,可克隆声音,可训练,一键中文整合包 已支持最新50系显卡 v1.1.7

AI,开源 42 10424

SWivid/F5-TTS 是一个开源项目,旨在提供一个基于 Diffusion Transformer 和 ConvNeXt V2 架构的文本到语音(TTS)系统,该系统名为 F5-TTS。F5-TTS 的全称是“A Fairytaler that Fakes Fluent and Faithful Speech with Flow Matching”,意味着它通过流匹配技术,生成流畅且忠实的语音,如同童话故事中的讲述者一般。以下是对该开源项目的详细介绍:

  1. 项目背景与目的

    • 目的:F5-TTS 旨在通过创新的算法和技术,提升文本到语音的转换质量,使得生成的语音更加自然、流畅,并能够忠实反映文本内容。

    • 背景:随着人工智能技术的不断发展,文本到语音技术已经广泛应用于语音助手、智能客服、有声读物等领域。然而,传统的 TTS 系统在语音的自然度和忠实度方面仍存在不足。F5-TTS 通过引入 Diffusion Transformer 和 ConvNeXt V2 等先进技术,试图解决这些问题。

  2. 核心技术与架构

    • Diffusion Transformer:这是一种基于扩散模型(Diffusion Model)的 Transformer 架构,通过逐步去噪的方式生成高质量的语音数据。

    • ConvNeXt V2:这是一种改进的卷积神经网络架构,用于特征提取和语音合成。

    • 流匹配技术:通过匹配参考音频和生成音频之间的流特征,进一步提升语音的自然度和忠实度。

  3. 项目特点

    • 高效训练与推理:F5-TTS 采用了优化的训练策略和推理算法,使得模型能够在较短的时间内完成训练和推理。

    • 多风格与多说话人生成:该项目支持生成不同风格和不同说话人的语音,满足不同场景下的需求。

    • Gradio 应用:提供了基于 Gradio 的可视化界面,方便用户进行模型训练和推理的交互操作。

  4. 安装与使用方法

    • 安装方式:用户可以选择通过 pip 包安装(仅用于推理),或者通过本地可编辑方式安装(用于训练和微调)。

    • 使用方法:提供了 CLI 命令行工具和 Gradio 应用两种方式进行推理。用户可以根据自己的需求选择合适的方式。

  5. 训练与评估

    • 训练指导:项目提供了详细的训练与微调指导,帮助用户更好地理解和使用 F5-TTS 模型。

    • 评估方法:通过对比生成的语音与参考音频之间的质量差异,评估模型的性能。

  6. 代码结构与文档

    • 代码结构:项目代码结构清晰,分为模型定义、数据处理、训练与推理等多个模块。

    • 文档:提供了详尽的文档和示例代码,帮助用户快速上手和理解项目。

  7. 社区与支持

    • 社区:项目在 GitHub 上拥有活跃的社区,用户可以在这里提出问题、分享经验和贡献代码。

    • 支持:项目团队提供了及时的技术支持和解答,帮助用户解决在使用过程中遇到的问题。

  8. 致谢与引用

    • 致谢:项目团队对所有贡献者表示感谢,感谢他们的辛勤工作和无私奉献。

    • 引用:如果用户的工作或代码库受益于 F5-TTS 项目,请按照提供的引用格式进行引用。

综上所述,SWivid/F5-TTS 是一个功能强大、易于使用的文本到语音开源项目,通过引入先进的技术和架构,实现了高质量、自然流畅的语音生成。无论是对于研究人员还是开发者来说,都是一个值得关注和尝试的项目。

下面是截图

2025-03-19_23-42-45.png

下面是我随手做的几个演示 你们听下

我放了一些参考音频在audios文件夹里,整合包已经集合了AI环境,我只汉化了界面其他功能未作任何修改增强。官方的模型全部都已经下载好了。

请勿将该工具用于任何非法行为,一切后果自负

v1.14整合包说明

1 未做任何修改,也未汉化

2 第一次运行,一定要执行一次 一定要运行一次.bat

v1.1.7整合包说明

1 支持50系显卡,8g英伟达即可愉快玩耍,安装好显卡能支持的最高cuda版本即可

2 汉化了界面。更方便使用

3 增加了自动保存音频功能,生成的音频会自动保存到output目录下 以日期+随机数命名

4 修正部分小bug


视频演示

点击查看

下载有疑问看下这里


相关推荐:

我要评论:

◎欢迎参与讨论,请自觉遵守国家法律法规。

已有 42 条评论

  1. 犹豫迎眼神 犹豫迎眼神

    后面更新同类软件 大佬可以做下推荐不 比如哪个效果更好。 哈哈 谢谢拉

  2. 会撒娇的眼睛 会撒娇的眼睛

    楼主好,要想使用这个AI语音软件电脑必须有独立显卡吗?

    1. 剑心 剑心

      英伟达8G以上吧。如果想生成语音但是没有显卡 可以试试这个 https://www.jian27.com/html/2656.html

  3. 会撒娇的眼睛 会撒娇的眼睛

    第一次下载使用必须把三个压缩包:F5-TTS v1.1.4.rar 、 F5-TTS v1.1.0.rar 、 F5-TTS-1.0.8.rar 都下载下来还是?

    1. 剑心 剑心

      你这个脑回路是怎么思考?我很好奇,这是出于什么思维才会问这样的问题的?

      1. 会撒娇的眼睛 会撒娇的眼睛

        只下载了个F5-TTS v1.1.4.rar,解压教程操作,运行不了,怀疑是不是文件没下载全。

        1. 剑心 剑心

          运行不了 看看黑色窗口提示什么

  4. 外套温婉 外套温婉

    大佬点启动以后闪退咋回事啊?点了那个一定要运行一次.bat了,也没有出现红字!

    1. 剑心 剑心

      拖到cmd上执行 看看提示什么

      1. 外套温婉 外套温婉

        启动拖到cmd上,回车运行,什么都没有,页面上就是下面这些内容:
        --------更多AI工具,开源免费软件 请前往 https://www.jian27.com--------
        请关注我的微信公众号 剑二十七
        The system cannot find the path specified.

        C:\Users\Administrator>

        1. 剑心 剑心

          找不到AI环境了,2个原因,第一个 你解压的文件不全,第二个跟你本机系统安装的python 有冲突

      2. 外套温婉 外套温婉

        咋样操作啊?把启动那个文件拖到cmd上?

  5. 清秀和星星 清秀和星星

    大佬,E2/F5-TTS v1.1.4 这个版本的文件夹解压是不是需要密码啊?解压到50%的时候显示(客户端没有所需的特权),jian27或者jian27.com 这两个密码均已试过还是不行,强行解压之后一打开(启动)软件就闪退,完完全全按照教程来的,还是闪退

    1. 剑心 剑心

      管理员身份启动winrar 再解压

  6. 爱你的鹿 爱你的鹿

    WARNING: Ignoring invalid distribution -5-tts (f:\yunpan\jian27\lib\site-packages)

    大佬,一直提示这个,黄色字体,更新了CUDA12.4也还是这样,求解!我接下来该怎么操作?

    1. 剑心 剑心

      2 第一次运行,一定要执行一次 一定要运行一次.bat

      1. 爱你的鹿 爱你的鹿

        感谢大佬百忙中给我的回复。现在还是出现闪退的问题,一定要运行一次.bat 这个也是按教程一步步操作的。期间360报了一次runw_d.exe的毒,但是已经恢复过了,查看文件也没有少什么东西,但是就是闪退,无法运行。
        0s错误:[WinError 126]我不到指定的模块。加载“F:\yunpan\F5-TTS\jian27\1ib\site packages\torch\1ib\fbgem.d1或其依赖项之一时出错。
        这个是闪退之前提示的信息,是不是下载的时候少了什么文件?

        1. 剑心 剑心

          什么显卡?自行查下是否可以支持Flash-Attention

  7. 爱你的鹿 爱你的鹿

    这个IP地址,是不是我上传了东西都会存到这个服务器里?

    1. 剑心 剑心

      不是 这个是你本地的ip地址

  8. 感动踢金鱼 感动踢金鱼

    不知道是不是设置的不对,音色差距很大,机器人的尖锐声比较多,对比了一下noiz的AI配音,这个软件失真太大

    1. 剑心 剑心

      仔细看视频 你看我的演示尖锐声吗?

      1. 爱你的鹿 爱你的鹿

        有,话尾有电流声,类似机器人的声音

        1. 剑心 剑心

          为什么我没听到?

  9. 水池沉默 水池沉默

    大佬可以更新一下训练模式吗

    1. 剑心 剑心

      记录下 下次官方更新一起更新

  10. 外套魁梧111 外套魁梧111

    点击(必须运行一次)后,没有报红,然后运行(启动),网页弹出来后, CMD窗口显示完找不到模块后就闪退,
    OSError: [WinError 126]找不到指的模块。DSError: [WinError 126]找不到指的模块。Error 1oading "H: BaiduNetdiskDownload\F5-TTS v1. 1.4\jian27\1ib\site-packages\torch\1ib\fbgemm.dll”or one of its dependencies.

    1. 剑心 剑心

      安装好cuda12.4

  11. 小蚂蚁土豪 小蚂蚁土豪

    大佬怎么开启训练模式呀?

    1. 剑心 剑心

      我没去弄

  12. 俏皮的画笔 俏皮的画笔

    DSError: [WinError 126]找不到指的模块。Error 1oading "H: BaiduNetdiskDownload\F5-TTS v1. 1.4\jian27\1ib\site-packages\torch\1ib\fbgemm.dll”or one of its dependencies.

    1. 剑心 剑心

      仔细看说明

  13. 健壮糖豆 健壮糖豆

    三个,用哪一个啊 ,大哥

    1. 剑心 剑心

      你看看标题

  14. 谨慎硬币 谨慎硬币

    三个版本都用了闪退是不是我电脑设置有问题

  15. 日记本耍酷 日记本耍酷

    下载不了

    1. 剑心 剑心

      文件太大,还在上传

只显示最新的15条留言