高德开源项目 PilotTTS - 让AI学会"说话"的语音生成开源项目,支持11种情绪+14种方言 一键整合包 v20260530 解压即可使用

AI 1712
这是高德地图语音团队开发的一个AI语音合成工具,可以让电脑用自然的声音朗读文字,还能模仿不同人的声音、表达不同情绪。

✨ 它能做什么?

1️⃣模仿任何人说话

  • 只需录一段5-15秒的音频,AI就能学会这个人的声音

  • 比如:用你朋友的声音读你写的文字

2️⃣带感情地朗读

支持11种情绪:
  • 😊 开心、😢 悲伤、😠 生气

  • 😲 惊讶、😨 害怕、🤢 厌恶

  • 😐 严肃、🥺 关切、😔 忧郁

  • 😒 轻蔑、💭 心理活动

3️⃣说方言

支持14种中国方言:
  • 东北话、山东话、河南话、四川话

  • 上海话、广东话、福建话等

4️⃣加入笑声和呼吸声

可以让AI在说话时自然地笑、呼吸、咳嗽,让声音更像真人

🎯 有什么用?

  • 做视频配音:不用自己录音,AI帮你读

  • 有声书制作:快速生成不同角色的声音

  • 导航播报:高德地图用它来播报路线

  • 帮助视障人士:把文字转成语音朗读


💡 厉害之处

完全免费开源:任何人都能用
效果很好:只用20万小时数据训练,效果媲美大公司的百万小时系统
简单易用:提供完整的数据处理方案,小团队也能复现

简单说:这是一个让AI"会说话、说得好、说得像"的开源工具,而且谁都能用!

整合包说明

1 10G英伟达显卡即可玩耍

2 基于官方开源代码,少少二次开发

3 生成的语音效果还行

4 人气高就会继续开发

随手生成的语音

点击查看

下载地址
夸克网盘

下载有疑问看下这里


相关推荐:

我要评论:

◎欢迎参与讨论,请自觉遵守国家法律法规。