一键克隆任意音色,生成自然口语级语音  1B/3.5B 双模型自由切换,还原你最真实的声音  LongCat-AudioDiT v1.0 20260402 更新 一键整合包

一键克隆任意音色,生成自然口语级语音 1B/3.5B 双模型自由切换,还原你最真实的声音 LongCat-AudioDiT v1.0 20260402 更新 一键整合包

LongCat-AudioDiT 语音合成工具 - 功能说明🎯 主要功能本工具基于美团开源的 LongCat-AudioDiT 扩散模型,提供高质量的文本到语音合成,并支持零样本语音克隆(只需几秒参考音频即可克隆音色)。界面采用 Gradio 构建,操作直观,适用于中文和英文混合文本。📌 核心功能模块1. 模型选择支持 1B&nbs...
AI 1706 2
专为无显卡的小伙伴打造的AI语音生成工具,小巧,免费,无字数限制,速度超快,解压即可使用 Edge-TTS-Text-to-Speech-1.0

专为无显卡的小伙伴打造的AI语音生成工具,小巧,免费,无字数限制,速度超快,解压即可使用 Edge-TTS-Text-to-Speech-1.0

🎙️ Edge TTS 文本转语音 - 功能说明一、核心功能表格功能说明文本转语音使用微软 Edge TTS 引擎,将输入文本转换为自然流畅的 MP3 音频长文本支持自动分段处理(每段 ≤800 字符),支持超长文本合成音频合并自动将分段音频合并为单一文件输出多国语言支持中文、英语、日语、韩语、法语、德语等数十种语言二、语音选择系统两级联动选...
AI 3124 0
ACE-Step-1.5 解锁音乐创作无限可能,以技术革新重塑音乐生成生态,AI生成音乐 翻唱音乐 重绘音乐 支持中文 v20260206

ACE-Step-1.5 解锁音乐创作无限可能,以技术革新重塑音乐生成生态,AI生成音乐 翻唱音乐 重绘音乐 支持中文 v20260206

ACE-Step是一个开源的音乐生成基础模型项目,旨在通过全面的架构设计克服现有音乐生成方法的局限性,并实现最先进的性能。以下是对该项目的详细介绍:项目背景与目标:ACE-Step项目针对当前音乐生成方法中存在的生成速度、音乐连贯性和可控性之间的权衡问题,提出了一种新的解决方案。项目的目标是建立一个快速、通用、高效且灵活的音乐AI基础模型,使...
AI 4876 7
Qwen3-TTS:让文字拥有灵魂的声音艺术家 文字生成语音 语音克隆 新增多人对话 一键整合包 v20260130

Qwen3-TTS:让文字拥有灵魂的声音艺术家 文字生成语音 语音克隆 新增多人对话 一键整合包 v20260130

Qwen3-TTS 开源项目介绍Qwen3-TTS 是由 Qwen 团队开发的一系列强大语音生成模型,于 2026 年 1 月 22 日正式发布。该项目提供全面的语音生成能力,包括语音克隆、语音设计、超高质量类人语音生成和基于自然语言的语音控制,为开发者和用户提供了目前最广泛的语音生成功能集。核心特性1. 多语言支持Qwen3-TTS 覆盖 ...
AI 6366 6
开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v20250805 整合包 附全部模型

开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v20250805 整合包 附全部模型

下面文字是作者原话这是一个离线运行的本地语音识别转文字工具,基于 fast-whipser 开源模型,可将视频/音频中的人类声音识别并转为文字,可输出json格式、srt字幕带时间戳格式、纯文字格式。可用于自行部署后替代 openai 的语音识别接口或百度语音识别等,准确率基本等同openai官方api接口。部署或下载后,双击 start.e...
AI,开源 5262 6
Qwen3-TTS 通义千问推出的高质量文本转语音工具,API调用,无字数限制,批量生成,小巧,轻量,无需显卡即可快速生成语音,剑二十七二次开发 一键整合包 v2060119 4.0

Qwen3-TTS 通义千问推出的高质量文本转语音工具,API调用,无字数限制,批量生成,小巧,轻量,无需显卡即可快速生成语音,剑二十七二次开发 一键整合包 v2060119 4.0

一、什么是 TTS?TTS(Text-To-Speech)是一种将文字转换为自然语音的技术,广泛应用于语音助手、有声书、导航播报、智能客服等场景。二、Qwen-TTS功能简介该项目提供了一个简单的 Web 界面(基于 Gradio),用户可以输入任意文本,并通过 Qwen 的 TTS 模型生成对应的语音文件。该工具支持中文和英文的语音合成。🔧...
AI 8671 9
轻量、快速、免费、无需显卡 EasyTTS 重新定义本地 TTS 体验 一键整合包 v20260117

轻量、快速、免费、无需显卡 EasyTTS 重新定义本地 TTS 体验 一键整合包 v20260117

EasyTTS(由 GitHub 用户 yunchenqwq 开发)是一个专注于中文语音合成的开源文本转语音(Text-to-Speech, TTS)系统,其核心目标是提供一个无需复杂依赖、无需训练、本地运行、开箱即用的高质量 TTS 解决方案。该项目特别针对中文用户在实际使用中常见的痛点(如多音字错误、语调生硬、部署困难等)进行了优化,强调...
AI,开源 2791 0
"90分钟不间断!微软新AI能把你的文字变成专业播客 一键整合包 VibeVoice v20251211

"90分钟不间断!微软新AI能把你的文字变成专业播客 一键整合包 VibeVoice v20251211

🎙️ VibeVoice:你的超级AI配音员"把文字变成自然对话的魔法工具"🌟 什么是VibeVoice?想象一下,有一位永不疲倦的配音员,能一口气生成90分钟不间断的语音内容,还能在对话中自如切换不同角色的声音——这就是微软开发的VibeVoice,一款革命性的AI语音生成工具!💡 它能为你做什么?(实用场景)场景用途效...
AI,开源 7239 19
Kani TTS:轻量、流式、类人 — 开源AI语音合成系统一键整合包  v20251008

Kani TTS:轻量、流式、类人 — 开源AI语音合成系统一键整合包 v20251008

🎙️ Kani TTS — 高质量、模块化、类人语音合成开源项目Kani TTS 是一个由 nineninesix-ai维护的开源文本到语音(TTS)系统,致力于从文本输入生成高质量、自然流畅的语音。项目支持本地独立运行与Web 流式服务,适用于开发、研究及个性化 TTS 场景。GitHub 仓库地址:https://github.com/n...
AI,开源 5207 0
IndexTTS  v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS是由B站推出的一款基于XTTS和Tortoise的GPT风格文本转语音(TTS)模型。该项目在中文文本转语音领域展现出显著的技术优势和应用,以下从项目背景、技术架构、应用场景、社区支持及未来挑战五个维度进行详细介绍。一、项目背景:重新定义中文TTS技术标杆IndexTTS的诞生旨在解决传统TTS系统在中文语音合成中的两大核心痛...
AI,软件 2万 51
一键克隆你的声音:Higgs-Audio 高质量的文本转语音生成 开源语音生成工具 中文一键整合包 v20250728

一键克隆你的声音:Higgs-Audio 高质量的文本转语音生成 开源语音生成工具 中文一键整合包 v20250728

HiggsAudio 是由 Boson AI 开发的开源文本转语音(TTS)系统,基于先进的深度学习技术,能够生成高质量、自然的人声。该项目在 GitHub 上开源,提供了强大的语音合成能力。🌟 项目亮点🎵 高质量语音生成生成接近真人发音的语音支持多种语言和口音能够处理情感表达和语调变化🏗️ 先进的模型架构基于 Transformer 的端到...
AI,开源 4047 10
InspireMusic AI人工智能音乐、歌曲和音频生成的开源一键中文整合包

InspireMusic AI人工智能音乐、歌曲和音频生成的开源一键中文整合包

InspireMusic是一个专注于音乐、歌曲和音频生成的开源项目,它提供了一个统一的框架来实现这些生成任务。以下是对该项目的详细介绍:主要功能音乐生成:支持文本提示、音乐类型、音乐结构等多种控制方式,可生成高质量的音乐作品。歌曲生成:能够根据用户的文本描述或音乐结构生成完整的歌曲。音频生成:可以生成各种类型的音频,包括但不限于背景音乐、音效...
AI,开源 3530 0
开源 AI EmotiVoice 易魔声 文本生成语音  一款功能强大且现代的开源文本转语音(TTS)引擎

开源 AI EmotiVoice 易魔声 文本生成语音 一款功能强大且现代的开源文本转语音(TTS)引擎

EmotiVoice(易魔声)是一款功能强大且现代的开源文本转语音(TTS)引擎,由网易有道开源并维护。该软件以其中英文双语支持和超过2000种不同的音色而闻名,为用户提供了极为丰富的声音选择。以下是对EmotiVoice(易魔声)的详细介绍:一、核心功能双语言支持:EmotiVoice支持中英文两种语言的文本转语音,满足了不同用户的语言需求...
AI,软件 5406 6
免费开源抖音采集工具TikTokTool v1.4.2.2 灰常好用,强烈推荐

免费开源抖音采集工具TikTokTool v1.4.2.2 灰常好用,强烈推荐

要批量下载抖音视频 解压软件后 双击 TikTokTool.exe  然后打开 conf.iniuid = https://v.douyin.com/JcjJ5Tq/ 这一行修改成你要下载的用户的链接 会弹出一个二维码的图片 用你自己抖音账号扫描 然后等待即可剩下的小伙伴慢慢去摸索吧...
开源 7493 24
 开源 Seam 多平台直播源获取工具 支持 斗鱼,虎牙,哔哩哔哩,抖音,网易CC,快手,花椒,映客 等

开源 Seam 多平台直播源获取工具 支持 斗鱼,虎牙,哔哩哔哩,抖音,网易CC,快手,花椒,映客 等

获取斗鱼,虎牙,哔哩哔哩,抖音,网易CC,快手,花椒,映客 等直播平台的真实流媒体地址(直播源),可在mpv,PotPlayer、flv.js等播放器中播放。开源地址:https://github.com/Borber/seam下载地址:https://jian27.lanzouk.com/izsDv14uypfa
开源 2341 0
先给大伙看看近期用AI生成的一些图片,然后分享一下市面上能免费使用(白嫖)的chatgpt 服务器地址

先给大伙看看近期用AI生成的一些图片,然后分享一下市面上能免费使用(白嫖)的chatgpt 服务器地址

最近一直在研究玩这个AI,真是欲罢不能啊,越玩越沉迷了。。。废话不多说,先给你们看看我用ai生成的图片,你们就大致明白了,还有些估计不能过审就不发了。图片分享就到这里。下面说说是什么个情况。所以各位小伙伴如果肾不大好的话就不要继续往下看了。怕你们顶不住。我老年人定力比较强就没事。。。这些图片都是用Stable Diffusion 加一些关键词...
AI 2616 4
免费 强大  轻量 易用 只有420KB的截图工具XSnip V1.1.0.4

免费 强大 轻量 易用 只有420KB的截图工具XSnip V1.1.0.4

如果你需要最快捷、 轻量和易用的截图工具,我觉得这个XSnip就非常符合你的需求。大小仅420kb,仅需要按下Alt+X强大的截图窗口区域自动检测像素级的鼠标移动控制、截图范围控制取色器 (放大镜模式下 R, H)多屏支持高分屏支持全面Windows系统支持多种图片格式支持PNG, JPG, BMP丰富的画图工具矩形椭圆箭头铅笔文字高级标注工...
开源 1486 0