一键克隆你的声音：higgs-audio-v3-tts AI语音生成工具支持情绪标签，支持停顿，支持音速调整中文一键整合包 v20260609

2026-06-09 AI 5903

HiggsAudio 是由 Boson AI 开发的开源文本转语音(TTS)系统，基于先进的深度学习技术，能够生成高质量、自然的人声。该项目在 GitHub 上开源，提供了强大的语音合成能力。

🌟 项目亮点

🎵 高质量语音生成

生成接近真人发音的语音
支持多种语言和口音
能够处理情感表达和语调变化

🏗️ 先进的模型架构

基于 Transformer 的端到端架构
结合了最新的语音合成技术
支持长文本合成

🛠️ 功能丰富

语音克隆：通过少量样本克隆特定声音
多说话人支持
背景音乐生成
情感控制

🔬 技术特点

🧠 模型结构

使用类似 GPT 的自回归架构
结合声学模型和声码器
支持条件生成（说话人、情感等）

📊 训练数据

使用大规模高质量语音数据集
包含多种语言和口音
包含情感丰富的语音样本

💡 创新技术

高效的注意力机制
改进的语音表示
鲁棒的长文本处理

🎯 使用场景

📹 内容创作

视频配音
播客生成
有声读物制作

♿ 辅助技术

屏幕阅读器
语音助手
无障碍应用

🎮 娱乐应用

游戏角色语音
虚拟主播
个性化语音消息

下面是higgs-audio-v3-tts 截图

随手生成的音频你们听下

整合包说明

1 支持50系显卡，最低英伟达12G显卡即可运行，安装好你显卡能支持的最高cuda版本。

2 在原作基础上进行了二开，增加了自动保存生成的语音文件，汉化了界面

3 解压如果失败，请用管理员身份运行winrar 解压。

20260609 更新记录

1 升级到官方最新语音模型，10G英伟达显卡即可愉快玩耍

2 虽然是第一个版本，但是我进行了比较大的二次开发，解压即可使用

3 目前这个TTS的模型，我感觉是我目前所见过的开源TTS模型里面最强的

4 人气高就会继续开发

点击查看

下载地址

夸克网盘视频教程

下载有疑问看下这里

语音工具日常应用绿色软件开源人工智能 AI 语音工具整合包 Tag

图生图新的选择 AI 重绘支持批量图生图新增动作和姿态控制+滤镜+自动关机+自动去水印剑二十七洗图专用 z-image-turbo-xitu v12

开源免费直播必备实时流媒体和屏幕录制软件 OBS Studio v32.1.2

我要评论：

◎欢迎参与讨论，请自觉遵守国家法律法规。

已有 10 条评论

健忘和寒风

2025-09-04

老师，哪种ai克隆声音比较适合翻译德语类型的

回复
1. 剑心
  
  2025-09-04
  
  没留意过德语
  
  回复
钥匙害羞

2025-08-23

win10 x64 5700G 5060ti

回复
1. 剑心
  
  2025-08-23
  
  安装好你显卡能支持的最高cuda版本。
  
  回复
  1. 钥匙害羞
    
    2025-08-23
    
    尝试了CUDA13.0和12.4 ，问题均未解决，LLVM ERROR: Symbol not found: __svml_cosf8_ha，直接文字生成语音是可以的，就是克隆报错
    PyTorch: 2.6.0+cu124
    Python: 3.12.5
    CUDA(Torch): 12.4
    CUDA(Runtime): 12.4
    GPU可用: True
    
    回复
钥匙害羞

2025-08-22

LLVM ERROR: Symbol not found: __svml_cosf8_ha
跑出来这么个错误，语音克隆

回复
1. 剑心
  
  2025-08-22
  
  什么显卡？电脑什么系统？
  
  回复
犹豫迎眼神

2025-08-03

最近更新的几款哪个对中文适配度比较高呢大佬推荐下字节出品 MegaTTS3-----------E2/F5-TTS AI人工智能文字转语音工具----------IndexTTS：重新定义中文语音合成这三个软件我之前下过最后一个感觉还行其他没试过大佬给个建议。哪个更好些。 8g 40系统显卡

回复
1. 剑心
  
  2025-08-03
  
  都各有优势，看你自己需求了。MegaTTS3 比较平衡，E2/F5-TTS 克隆效果还可以，但是有时候断句差点意思。indextts 克隆一般，但是断句很强
  
  回复
小笼包孤独

2025-07-28

剑兄果然是勤劳啊，刚想问这个整合包啥时候有就出来了

回复

只显示最新的15条留言

一键克隆你的声音：higgs-audio-v3-tts AI语音生成工具 支持情绪标签，支持停顿，支持音速调整 中文一键整合包 v20260609