"90分钟不间断!微软新AI能把你的文字变成专业播客 一键整合包 VibeVoice v20251211

AI,开源 19 6549

🎙️ VibeVoice:你的超级AI配音员

"把文字变成自然对话的魔法工具"


🌟 什么是VibeVoice?

想象一下,有一位永不疲倦的配音员,能一口气生成90分钟不间断的语音内容,还能在对话中自如切换不同角色的声音——这就是微软开发的VibeVoice,一款革命性的AI语音生成工具!


💡 它能为你做什么?(实用场景)

场景
用途
效果
🎙️ 播客/有声书制作
输入文字稿,自动生成多人对话的完整音频
无需真人录制,省时省力
🎬 视频配音
为长视频内容提供专业级解说配音
声音自然有感情,提升视频质量
🎮 游戏/创意项目
为游戏角色或动画角色配音
多角色对话,丰富你的创作

一句话总结:VibeVoice能将你的文字内容转化为听起来极其自然的人声,让音频创作变得前所未有的简单!


✨ 四大超能力(为什么它这么厉害?)

🔋 超长待机模式

别的AI语音工具说几分钟就"喘不过气",而VibeVoice能一口气生成90分钟的连续语音,完美适配长内容创作需求。

👥 多人对话剧场

你可以在文本中指定"这句话是张三说的,下一句是李四说的",它就能自动切换不同声音,创造出真实的对话效果,就像真人演员在表演!

😢 情感智能识别

它能读懂文字中的情绪!悲伤的内容不会用欢快语调,紧张的场景会自动调整语气,让生成的语音自然又有感染力

高压缩高效能

采用先进的压缩技术,生成速度快,占用存储空间小,效率与质量兼得


操作步骤

  1. 在网页中输入你的文字内容

  2. 选择喜欢的声音角色

  3. 点击生成按钮

  4. 享受专业级的AI语音!


⚠️ 使用小贴士(注意事项)

项目
说明
语言支持
主要优化中文和英语,其他语言效果可能稍逊
多人同时说话
目前还无法模拟多人同时抢话的场景
偶发小问题
有时会生成轻微背景音或气声(官方幽默称为"驱魔"模式)
最佳实践
长文本建议分段处理,效果更佳

💬 最后一句话

"VibeVoice不仅是一款工具,更是降低音频创作门槛的革命性产品。无论你是专业内容创作者,还是单纯好奇的AI爱好者,都值得体验一下这项让文字'活'起来的神奇技术!"


🌐 更多AI工具,开源免费软件请前往 https://www.jian27.com
📱 请关注微信公众号:剑二十七

整合包说明

1 支持50系显卡,最低12G英伟达显卡,8G 如果你内存大点 应该也可以

2 未修改任何代码

3 安装好你显卡能支持的最高cuda版本。

4 集合了1.5B和7B 2个模型,启动的时候自己根据需要选择

5 如果解压出错,用管理员身份运行winrar解压。

6 如果启动出错, 双击运行 一定要运行一次.bat 即可修复。

随便生成一段 你们听听

20250906 更新记录

1 增加了Large这个模型

2 修改了启动选择模型,改为webui界面自行选择

3 增加了几个默认的发音人

20251211 更新记录

1 修正一些bug。

2 最新的那个0.5b的效果不好,没加上去

点击查看

下载有疑问看下这里


相关推荐:

我要评论:

◎欢迎参与讨论,请自觉遵守国家法律法规。

已有 19 条评论

  1. 吐司醉熏 吐司醉熏

    百度盘的压缩包有错误,下载了两次,解压都出现发现损坏的压缩文件头错误提示。

    1. 剑心 剑心

      你下10次都会这样。用管理员身份运行winrar 解压即可。电脑基础好好补习一下

      1. 吐司醉熏 吐司醉熏

        大佬莫激动嘛,只是给您反馈一下问题而已。
        我会编程,您说我电脑基础差还是不差?我肯定是用了管理员身份运行winrar 解压还是有问题才说一下。问题无非就是两个:要么是压缩包本身有问题,要么是我下载过程中有丢数据问题。如果真的下载10次都仍然是同一问题,概率上说应该是压缩包本身的问题可能性大些吧?
        谢谢大佬每天的辛苦分享!

        1. 剑心 剑心

          要不 你退一步想,这个压缩包肯定不至你一个人下载,那为什么别人都可以解压,到你这里却是解压失败了?那是说明是什么问题呢?

  2. 积极就雨 积极就雨

    请选择要加载的模型:
    1 → microsoft/VibeVoice-1.5B
    2 → WestZhang/VibeVoice-Large-pt
    请输入 1 或 2(10秒内无输入将自动选择 1):
    2
    [自动选择] 正在加载 1.5B 模型 (microsoft/VibeVoice-1.5B)
    2无法切换呀

    1. 剑心 剑心

      输入1或者2 回车即可 要换什么?

      1. 积极就雨 积极就雨

        切换第二个模型 输入2 最后还是第一个模型

        1. 剑心 剑心

          要不你超过10秒没有输入,要不就是输入错误,没有发现你说的情况

  3. 小火星 小火星

    大佬,迅雷的连接只有补丁

    1. 剑心 剑心

      迅雷不知道发什么神经 认为这个整合包违规,被禁止分享了

  4. 菠萝失眠 菠萝失眠

    谢谢分享,下载学习

  5. 毛衣细心 毛衣细心

    剑哥,微软这个强还是GPT-SoVITS厉害啊?

    1. 剑心 剑心

      各有优势,这个可以对话

  6. 毛衣细心 毛衣细心

    中文女性声音模型太少了

    1. 剑心 剑心

      等官方继续更新

  7. 毛衣细心 毛衣细心

    请选择要加载的模型:
    1 → microsoft/VibeVoice-1.5B
    2 → WestZhang/VibeVoice-Large-pt
    请输入 1 或 2(10秒内无输入将自动选择 1):

    [自动选择] 正在加载 1.5B 模型 (microsoft/VibeVoice-1.5B)
    Traceback (most recent call last):
    File "", line 3, in
    File "", line 23, in
    ModuleNotFoundError: No module named 'vibevoice'
    管理员解压缩,没有提示错误,没有中文文件夹,选1或者2都是提示这个,剑哥帮忙看看吧,谢谢

    1. 剑心 剑心

      解压的时候 仔细看 不要有错误

      1. 含羞草灵巧 含羞草灵巧

        能分享个 共享文件的 异地共享的工具吗

        1. 剑心 剑心

          各种网盘

只显示最新的15条留言