Kani TTS:轻量、流式、类人 — 开源AI语音合成系统一键整合包  v20251008

Kani TTS:轻量、流式、类人 — 开源AI语音合成系统一键整合包 v20251008

🎙️ Kani TTS — 高质量、模块化、类人语音合成开源项目Kani TTS 是一个由 nineninesix-ai维护的开源文本到语音(TTS)系统,致力于从文本输入生成高质量、自然流畅的语音。项目支持本地独立运行与Web 流式服务,适用于开发、研究及个性化 TTS 场景。GitHub 仓库地址:https://github.com/n...
AI,开源 4890 0
Qwen3-TTS 通义千问推出的高质量文本转语音工具,API调用,小巧,轻量,无需显卡即可快速生成语音,剑二十七二次开发 一键整合包 v20250924

Qwen3-TTS 通义千问推出的高质量文本转语音工具,API调用,小巧,轻量,无需显卡即可快速生成语音,剑二十七二次开发 一键整合包 v20250924

一、什么是 TTS?TTS(Text-To-Speech)是一种将文字转换为自然语音的技术,广泛应用于语音助手、有声书、导航播报、智能客服等场景。二、Qwen-TTS功能简介该项目提供了一个简单的 Web 界面(基于 Gradio),用户可以输入任意文本,并通过 Qwen 的 TTS 模型生成对应的语音文件。该工具支持中文和英文的语音合成。🔧...
AI 6626 9
IndexTTS  v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS是由B站推出的一款基于XTTS和Tortoise的GPT风格文本转语音(TTS)模型。该项目在中文文本转语音领域展现出显著的技术优势和应用,以下从项目背景、技术架构、应用场景、社区支持及未来挑战五个维度进行详细介绍。一、项目背景:重新定义中文TTS技术标杆IndexTTS的诞生旨在解决传统TTS系统在中文语音合成中的两大核心痛...
AI,软件 1.7万 51
"90分钟不间断!微软新AI能把你的文字变成专业播客 一键整合包 VibeVoice v20250906

"90分钟不间断!微软新AI能把你的文字变成专业播客 一键整合包 VibeVoice v20250906

🎙️ VibeVoice:你的超级AI配音员"把文字变成自然对话的魔法工具"🌟 什么是VibeVoice?想象一下,有一位永不疲倦的配音员,能一口气生成90分钟不间断的语音内容,还能在对话中自如切换不同角色的声音——这就是微软开发的VibeVoice,一款革命性的AI语音生成工具!💡 它能为你做什么?(实用场景)场景用途效...
AI,开源 5297 19
GiliSoft AI Toolkit v10.5  一款功能丰富的AI工具综合软件包

GiliSoft AI Toolkit v10.5 一款功能丰富的AI工具综合软件包

GiliSoft AI Toolkit 是一款功能丰富的综合软件包,专为希望将AI技术集成到其工作流程中的企业和个人设计。该软件包集成了多种AI工具,包括但不限于聊天机器人、OCR(光学字符识别)、TTS(文本到语音)和ASR(自动语音识别)等功能,为用户提供了全方位、高效便捷的AI解决方案。在OCR方面,GiliSoft AI Toolki...
软件 4140 2
E2/F5-TTS AI人工智能 文字转语音工具,可克隆声音,可训练,一键中文整合包 已支持最新50系显卡 v1.1.7

E2/F5-TTS AI人工智能 文字转语音工具,可克隆声音,可训练,一键中文整合包 已支持最新50系显卡 v1.1.7

SWivid/F5-TTS 是一个开源项目,旨在提供一个基于 Diffusion Transformer 和 ConvNeXt V2 架构的文本到语音(TTS)系统,该系统名为 F5-TTS。F5-TTS 的全称是“A Fairytaler that Fakes Fluent and Faithful Speech with Flow Mat...
AI,开源 1万 42
一键克隆你的声音:Higgs-Audio 高质量的文本转语音生成 开源语音生成工具 中文一键整合包 v20250728

一键克隆你的声音:Higgs-Audio 高质量的文本转语音生成 开源语音生成工具 中文一键整合包 v20250728

HiggsAudio 是由 Boson AI 开发的开源文本转语音(TTS)系统,基于先进的深度学习技术,能够生成高质量、自然的人声。该项目在 GitHub 上开源,提供了强大的语音合成能力。🌟 项目亮点🎵 高质量语音生成生成接近真人发音的语音支持多种语言和口音能够处理情感表达和语调变化🏗️ 先进的模型架构基于 Transformer 的端到...
AI,开源 3383 10
ACE-Step:解锁音乐创作无限可能,以技术革新重塑音乐生成生态,AI生成音乐 支持中文 v20250512

ACE-Step:解锁音乐创作无限可能,以技术革新重塑音乐生成生态,AI生成音乐 支持中文 v20250512

ACE-Step是一个开源的音乐生成基础模型项目,旨在通过全面的架构设计克服现有音乐生成方法的局限性,并实现最先进的性能。以下是对该项目的详细介绍:项目背景与目标:ACE-Step项目针对当前音乐生成方法中存在的生成速度、音乐连贯性和可控性之间的权衡问题,提出了一种新的解决方案。项目的目标是建立一个快速、通用、高效且灵活的音乐AI基础模型,使...
AI 3593 7
文本转语音,如此简单真实:Nari Labs开源Dia,一轮处理生成高度逼真的对话音频

文本转语音,如此简单真实:Nari Labs开源Dia,一轮处理生成高度逼真的对话音频

Dia是一个由Nari Labs创建的文本转语音(TTS)模型,它拥有16亿(1.6B)参数,能够在一轮处理中生成超逼真的对话。这个项目的核心特点是其高度真实的语音生成能力,可以直接从文本中生成高度逼真的对话,同时支持通过音频条件来控制输出,实现情感和语调的调整。主要功能高度逼真的对话生成:Dia能够直接从文本中生成高质量的对话,无需多轮处理...
AI 3113 0
Spark-TTS 一款开源 功能强大、高效且灵活的文本转语音工具 一键整合包

Spark-TTS 一款开源 功能强大、高效且灵活的文本转语音工具 一键整合包

Spark-TTS是一款先进的文本转语音(Text-to-Speech,TTS)系统,它利用大型语言模型(Large Language Model,LLM)的强大功能,实现了高度准确且自然流畅的语音合成。该系统旨在为研究和生产使用提供高效、灵活且强大的解决方案。Spark-TTS的核心优势在于其简洁性和效率。它完全基于Qwen2.5构建,无需...
安卓 6563 14
开源 CosyVoice v20250229整合包 一款AI人工智能 多语言语音生成模型 文字生成语音工具 附效果演示

开源 CosyVoice v20250229整合包 一款AI人工智能 多语言语音生成模型 文字生成语音工具 附效果演示

CosyVoice是由阿里通义实验室开源的一款多语言语音生成模型,旨在提升人类与大型语言模型(LLMs)之间的自然语音交互体验。该项目作为FunAudioLLM框架中的核心模型之一,专注于高质量的语音合成,能够生成自然且逼真的语音。以下是对CosyVoice开源项目的详细介绍:一、项目背景与目的随着人工智能技术的不断发展,语音交互已成为人机交...
软件 9919 30
一点红语音合成v20250210 正式版 文字转语音工具 绿色免安装

一点红语音合成v20250210 正式版 文字转语音工具 绿色免安装

版本介绍:版本:一点红语音合成2.4-吾爱专版字数控制:无限制,程序文本框建议一次字数5000文字,你用50万个也是可以的;合成速度:测试40万字1分40秒左右;线程数量:默认是4个,这个是在参数设置里面配置的,你可以自行调整,也就是你点合成时,文本会被智能分隔成每500字左右的文字N份,然后这N份文本被4个线程 同时去调用语音合成服务;这也...
软件 1万 16
开源 Fish Speech v1.5.0 优化版 文字转语音 可以克隆声音 一键整合包 附效果演示

开源 Fish Speech v1.5.0 优化版 文字转语音 可以克隆声音 一键整合包 附效果演示

Fish Speech是一个由Fish Audio团队开发的全新文本转语音(TTS)解决方案,旨在通过先进的机器学习和深度学习技术,将文本转换成高质量、逼真的语音输出。该项目基于CC-BY-NC-SA-4.0许可证发布,意味着任何人都可以在遵守许可证规定的前提下自由使用、改进和分享代码和模型。技术亮点Fish Speech项目采用了一系列前沿...
开源 1.1万 23
免费 文本转语音便捷小工具 V1.0.2 自带10个多语音模型 绿色免安装

免费 文本转语音便捷小工具 V1.0.2 自带10个多语音模型 绿色免安装

这个工具超级简单,只有不到2M大小。简单的文本转语音,自带十多个语音模型,本软件运行逻辑:软件开发软件:易语言,报错请无视。API接口 → 软件API的出处:https://api.mhimg.cn/doc/txt_yy.htmlAPI接口的音频只保留30秒就很蛋疼,所以我把每次生成的音频都下载了,方便大家使用我随手生成一段语音你们听下效果
软件 2658 5
神器 Audio Toolbox Suite v12.1 一款功能强大的音频编辑与处理软件

神器 Audio Toolbox Suite v12.1 一款功能强大的音频编辑与处理软件

Audio Toolbox Suite,一款功能强大的音频编辑与处理软件,为用户提供了全面且专业的音频解决方案。该软件集成了多种音频编辑处理工具,包括但不限于录音机、音频切割器、音频转换器、音频编辑器等,几乎可以完成所有可以想象的音频翻录、转换、刻录和编辑任务。主要功能特点:录音机:允许用户录制来自音乐网站、视频平台、广播电台的流式音频,或者...
软件 2452 4
Bark UI Enhanced v0.7.4 整合包 一款开源的具有 Gradio 网络用户界面的文本触发的生成音频模型

Bark UI Enhanced v0.7.4 整合包 一款开源的具有 Gradio 网络用户界面的文本触发的生成音频模型

最近都在留意这个文字转语音工具,无意发现了这个开源项目,效果相当不错,所以顺手就做成了整合包,本身这个项目是支持N卡的,但是因为我没有N卡,所以就只能做成了用CPU跑。。。如果你有N卡,想高效率去生成语音的话可以去开源项目那里看看。群里有小伙伴说这个能否做小说推文,我自己测试了下完全可以,而且我感觉比某音某手上面的小说推文的语音好多了,文末会...
AI,开源 3370 6
开源 免费 ChatTTS 一个用于日常对话的生成式语音模型 自带情感 文字转语音工具

开源 免费 ChatTTS 一个用于日常对话的生成式语音模型 自带情感 文字转语音工具

ChatTTS是一个开源的基于PyTorch的文本到语音(TTS)转换项目,旨在为开发者提供一个简便、高效的方式来将文本转换为自然 sounding 的语音。尽管项目的文档表明它还在开发完成阶段,这个项目具有实验和开发潜力,特别是在人工智能和机器学习领域的应用中。功能与使用方式:ChatTTS 项目的主要功能是将文本输入转换为语音输出。项目内...
开源 6454 44