GLM-TTS 大语言模型重塑语音合成 3秒克隆人声?GLM-TTS 做到了!声音克隆相似度极高 一键整合包 v20251212

GLM-TTS 大语言模型重塑语音合成 3秒克隆人声?GLM-TTS 做到了!声音克隆相似度极高 一键整合包 v20251212

GLM-TTS是由ZAI 组织开发并开源的高质量文本转语音(Text-to-Speech, TTS)系统。它基于大语言模型(LLM),专注于实现可控、富有情感表达的零样本语音克隆,并通过多奖励强化学习框架显著提升传统 TTS 系统的自然度与表现力。核心特性🗣️ 零样本语音克隆仅需3–10 秒的目标说话人提示音频,即可克隆任意声音,无需微调或说...
AI,开源 0
一键克隆任意人声!VoxCPM 1.5 开源语音大模型,无需训练,3秒搞定声音复刻!最低6G英伟达即可运行 剑二十七二开汉化整合包 v20251207

一键克隆任意人声!VoxCPM 1.5 开源语音大模型,无需训练,3秒搞定声音复刻!最低6G英伟达即可运行 剑二十七二开汉化整合包 v20251207

VoxCPM 是一个支持中英文、零样本语音克隆、情感可控、音素/公式输入的统一端到端语音合成大模型。它不依赖传统 TTS 流水线(如文本分析 → 音素对齐 → 声码器),而是直接从文本生成高质量语音波形。🎯 目标:打造一个像大语言模型一样“通用、灵活、强大”的语音生成基础模型。🔧 核心特性(技术亮点)1. ✅ 端到端架构(End-to-End...
AI,开源 0
语音识别 + 声音克隆 + 模型训练,一个工具全搞定!Easy-Voice-Toolkit v1.3.2

语音识别 + 声音克隆 + 模型训练,一个工具全搞定!Easy-Voice-Toolkit v1.3.2

Easy-Voice-Toolkit 是由 Spr-Aachen开发的一款开源、用户友好的 AI 语音工具箱,旨在为开发者、研究人员和爱好者提供一站式、本地化部署的语音处理解决方案。项目设计注重易用性与功能性,支持多种主流语音任务,适用于科研实验、产品原型开发、语音助手构建等多种应用场景。🌟 核心特性本地部署:所有功能均可在本地运行,保障数据...
AI,开源 0
免费 开源  虚拟声音效增强器FxSound 2 Pro 数字媒体音效增强工具中文免费版 v1.2.1.0

免费 开源 虚拟声音效增强器FxSound 2 Pro 数字媒体音效增强工具中文免费版 v1.2.1.0

Fxsound 是一款免费无广告的且功能强大音效增强神器。通过对比输出声音的算法优化,让声音听起来更清晰,音质效果大幅提升。而且均衡器定制性强,内置多种预设,包含:3D环绕音响、超重低音、立体声音场、高保真还原、动态增强等等。自从由之前的付费转为免费软件之后,对于上古机型的声卡有较大的音质提升效果。软件特色:增强声音:全新算法改进音质提高音质...
开源 0
不只是语音合成:MiMo-Audio 能理解、能生成、还能创作声音,一键整合包 v20251018

不只是语音合成:MiMo-Audio 能理解、能生成、还能创作声音,一键整合包 v20251018

🎧 什么是 MiMo-Audio?MiMo-Audio 是小米推出的一个能听、会说、还能创作声音的智能 AI 模型。你可以把它想象成一个“超级语音大脑”——不仅能听懂你说的话,还能模仿你的声音说话、讲故事、主持节目,甚至帮你把一段话变成不同风格的语音(比如更温柔、更激昂)。🌟 它厉害在哪里?不用专门训练就能学会新任务(Few-Shot Lea...
AI,开源 0
腾讯AI会“配音”了!给视频能自动配上声音+音乐 一键整合包 HunyuanVideo-Foley v20250830

腾讯AI会“配音”了!给视频能自动配上声音+音乐 一键整合包 HunyuanVideo-Foley v20250830

HunyuanVideo-Foley 是一个基于深度学习的音效生成系统,能够根据输入的视频内容,自动识别其中的视觉动作和场景(如脚步、关门、物体碰撞等),并生成与之同步、逼真的环境音效或动作音效。这类技术在影视后期、短视频制作、游戏开发、虚拟现实等领域具有广泛的应用前景,能够显著降低人工配音效的成本和时间。🔧 核心功能视频驱动音效生成(Vid...
AI,开源 0
E2/F5-TTS AI人工智能 文字转语音工具,可克隆声音,可训练,一键中文整合包 已支持最新50系显卡 v1.1.7

E2/F5-TTS AI人工智能 文字转语音工具,可克隆声音,可训练,一键中文整合包 已支持最新50系显卡 v1.1.7

SWivid/F5-TTS 是一个开源项目,旨在提供一个基于 Diffusion Transformer 和 ConvNeXt V2 架构的文本到语音(TTS)系统,该系统名为 F5-TTS。F5-TTS 的全称是“A Fairytaler that Fakes Fluent and Faithful Speech with Flow Mat...
AI,开源 0
一键克隆你的声音:Higgs-Audio 高质量的文本转语音生成 开源语音生成工具 中文一键整合包 v20250728

一键克隆你的声音:Higgs-Audio 高质量的文本转语音生成 开源语音生成工具 中文一键整合包 v20250728

HiggsAudio 是由 Boson AI 开发的开源文本转语音(TTS)系统,基于先进的深度学习技术,能够生成高质量、自然的人声。该项目在 GitHub 上开源,提供了强大的语音合成能力。🌟 项目亮点🎵 高质量语音生成生成接近真人发音的语音支持多种语言和口音能够处理情感表达和语调变化🏗️ 先进的模型架构基于 Transformer 的端到...
AI,开源 0
Echo(回声) v0.9.1 文字合成语音 声音克隆AI工具

Echo(回声) v0.9.1 文字合成语音 声音克隆AI工具

B站UP主凯凯-你好 开发的一款文字合成语音 声音克隆工具,免费使用,操作简单“灵声妙语”是一款集创新、高效、个性化于一体的智能声音工具软件,它以其极简的设计风格、卓越的性能表现以及全球多平台覆盖的能力,赢得了广大用户的青睐。该软件以“让创意更简单,让艺术走进生活”为核心理念,致力于为用户提供极致的用户体验。从下载安装的那一刻起,用户就能感受...
软件 0
MMAudio  v0.1 AI视频生成背景声音  文生生成声音 一键整合包 8G英伟达显卡可用,无需安装环境,解压即可使用

MMAudio v0.1 AI视频生成背景声音 文生生成声音 一键整合包 8G英伟达显卡可用,无需安装环境,解压即可使用

MMAudio是一个开源项目,旨在通过多模态联合训练生成高质量的同步音频。以下是关于这个项目的详细介绍:项目概述MMAudio由香港中文大学的程浩基(Ho Kei Cheng)等人开发,主要功能是根据视频和/或文本输入生成同步音频。其核心创新在于多模态联合训练方法,能够在广泛的音视频和音文本数据集上进行训练。此外,同步模块可以将生成的音频与视...
AI,开源 0
开源 Fish Speech v1.5.0 优化版 文字转语音 可以克隆声音 一键整合包 附效果演示

开源 Fish Speech v1.5.0 优化版 文字转语音 可以克隆声音 一键整合包 附效果演示

Fish Speech是一个由Fish Audio团队开发的全新文本转语音(TTS)解决方案,旨在通过先进的机器学习和深度学习技术,将文本转换成高质量、逼真的语音输出。该项目基于CC-BY-NC-SA-4.0许可证发布,意味着任何人都可以在遵守许可证规定的前提下自由使用、改进和分享代码和模型。技术亮点Fish Speech项目采用了一系列前沿...
开源 0
开源 AI声音克隆,用任意声音说话,解压即可使用 clone-voice v0.908 附模型

开源 AI声音克隆,用任意声音说话,解压即可使用 clone-voice v0.908 附模型

大伙好,我是剑二十七,好像早几天有小伙伴在问是否有声音克隆工具,今天找了一个,而且作者很贴心做成了 可执行文件,解压即可使用。真是超级方便。效果也不错。关键是我没有N卡也可以运行,效率也不错。下面看截图下面是实操过程截图点击开始生成 其他都是默认我没有去录音自己的声音,用的是默认的样品下面是生成后的声音 你们听听。今天比较匆忙 没有...
软件,开源 0
神器 免费 Moo0 Mp3声音改善器 1.34 批量处理音频 变声

神器 免费 Moo0 Mp3声音改善器 1.34 批量处理音频 变声

我想找下变声之类的工具,找了好久,找了很多都不是很理想,没想到这个工具确给我惊喜了。虽然官方很久没有更新了,但是效果还是不错的。想批量处理下音频的话可以试试这款工具。操作也是极其简单,只要把音频文件拖到这个工具上就可以自动处理了。Moo0 Mp3声音改善器让您可以根据自己的喜好改善Mp3文件的声音。它目前支持Mp3和Wav文件格式。以下是目前...
软件 0