免费 开源 Constme-Whisper(离线语音识别) v1.12 识别率高 速度快 附模型 文末有教程及下载地址,

工具 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包

Orpheus-TTS：AI文字合成语音，让语言更有温度一键整合包支持生成中文语音

Orpheus-TTS是一个前沿的开源文本转语音（Text-To-Speech，TTS）系统，它基于Llama-3b这一强大的大型语言模型（LLM）构建。该项目展示了在语音合成领域使用大型语言模型的新兴能力，为用户带来了前所未有的自然语音体验。Orpheus-TTS的核心优势在于其人类般的语音表现。它能够生成具有自然语调、情感和节奏的语音，这...

2025-4-15 AI,开源 0

工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

ClearerVoice-Studio AI语音增强、语音降噪工具，一键整合包，二开作品支持批量操作

ClearerVoice-Studio是由阿里巴巴达摩院通义实验室开源的综合性语音处理工具包，旨在为语音技术研究和应用提供高效解决方案。其核心功能覆盖语音增强、分离、目标说话人提取及超分辨率处理，通过融合复数域深度学习算法与先进模型架构，显著提升了复杂声学场景下的语音处理效果。技术架构与核心优势该框架采用复数域深度学习技术，通过FRCRN（复...

2025-3-25 AI,开源 0

工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

MeloTTS v0.1.2 AI文本生成语音工具，支持英伟达显卡+cpu运行，速度极快支持六国语言，一键整合包

MeloTTS：高质量多语言文本到语音合成工具详解MeloTTS是由MyShell AI开发的一款开源文本到语音（TTS）合成工具，其核心目标是提供高效、自然的多语言语音合成解决方案。该工具通过深度学习技术实现了从文本到语音的流畅转换，支持包括英语、中文、日语、韩语在内的多种语言，尤其在中英混合发音场景中具有显著优势。以下从技术架构、核心功能...

2025-3-24 AI,开源 0

工具 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 语音工具

Spark-TTS 一款开源功能强大、高效且灵活的文本转语音工具一键整合包

Spark-TTS是一款先进的文本转语音（Text-to-Speech，TTS）系统，它利用大型语言模型（Large Language Model，LLM）的强大功能，实现了高度准确且自然流畅的语音合成。该系统旨在为研究和生产使用提供高效、灵活且强大的解决方案。Spark-TTS的核心优势在于其简洁性和效率。它完全基于Qwen2.5构建，无需...

2025-3-5 安卓 0

工具 # 绿色软件 # 开源 # 人工智能 # AI # 语音工具

开源 CosyVoice v20250229整合包一款AI人工智能多语言语音生成模型文字生成语音工具附效果演示

CosyVoice是由阿里通义实验室开源的一款多语言语音生成模型，旨在提升人类与大型语言模型（LLMs）之间的自然语音交互体验。该项目作为FunAudioLLM框架中的核心模型之一，专注于高质量的语音合成，能够生成自然且逼真的语音。以下是对CosyVoice开源项目的详细介绍：一、项目背景与目的随着人工智能技术的不断发展，语音交互已成为人机交...

2025-2-28 软件 0

工具 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 语音工具

开源 Fish Speech v1.5.0 优化版文字转语音可以克隆声音一键整合包附效果演示

Fish Speech是一个由Fish Audio团队开发的全新文本转语音（TTS）解决方案，旨在通过先进的机器学习和深度学习技术，将文本转换成高质量、逼真的语音输出。该项目基于CC-BY-NC-SA-4.0许可证发布，意味着任何人都可以在遵守许可证规定的前提下自由使用、改进和分享代码和模型。技术亮点Fish Speech项目采用了一系列前沿...

2024-12-20 开源 0

工具 # 开源 # 人工智能 # AI # 翻唱

开源免费 RVC WebUI v2.2.231006支持AMD+N卡+I卡（AI歌曲翻唱工具）附视频教程和200+语音模型

RVC 是一款前沿的音色替换项目，可以进行歌曲的翻唱和实时的变声，具有低延迟、优秀的变声效果、声音模型扩展性、个性化和先进的深度学习技术等特点。该项目的核心功能之一是有更高的自由性和声音模型扩展性，可以对任意动漫角色和人物进行实时的声音转换，前提是进行训练声音模型。这为用户提供了极大的自由度和创新空间。,这种声音模型的转换是通过深度学习实现的...

2024-10-21 开源 0

语音 # 工具 # 神器 # 绿色软件 # 开源 # 人工智能 # AI # 整合包

开源 AI EmotiVoice 易魔声文本生成语音一款功能强大且现代的开源文本转语音（TTS）引擎

EmotiVoice（易魔声）是一款功能强大且现代的开源文本转语音（TTS）引擎，由网易有道开源并维护。该软件以其中英文双语支持和超过2000种不同的音色而闻名，为用户提供了极为丰富的声音选择。以下是对EmotiVoice（易魔声）的详细介绍：一、核心功能双语言支持：EmotiVoice支持中英文两种语言的文本转语音，满足了不同用户的语言需求...

2024-7-31 AI,软件 0

语音 # 音频 # 素材

9000+语音包——剪辑短视频必备素材

群里网友分享，我看了下感觉还不错，就转发出来了，大概有9000个音频文件。具体如图所示下面是随便选了几个音频你们听听我也不知道版权所属，如果想使用，请自行解决版权问题

2024-6-11 素材 0

开源 # 人工智能 # AI # 免费 # 语音工具

开源免费 ChatTTS 一个用于日常对话的生成式语音模型自带情感文字转语音工具

ChatTTS是一个开源的基于PyTorch的文本到语音（TTS）转换项目，旨在为开发者提供一个简便、高效的方式来将文本转换为自然 sounding 的语音。尽管项目的文档表明它还在开发完成阶段，这个项目具有实验和开发潜力，特别是在人工智能和机器学习领域的应用中。功能与使用方式：ChatTTS 项目的主要功能是将文本输入转换为语音输出。项目内...

2024-6-9 开源 0

视频处理 # 人工智能 # AI # 视频转文字