站长推荐

新一代开源 免费 AI换脸神器 FaceFusion v3.6.1 中文版 支持AMD显卡+N卡 速度更快 支持50系显卡+批量换脸,效果更惊艳 操作更简单 附视频演示 20260421 更新新一代开源 免费 AI换脸神器 FaceFusion v3.6.1 中文版 支持AMD显卡+N卡 速度更快 支持50系显卡+批量换脸,效果更惊艳 操作更简单 附视频演示 20260421 更新
开源 换脸工具 roop_unleashed v7.0 中文版 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示开源 换脸工具 roop_unleashed v7.0 中文版 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示
0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v11.31 支持Magi Human LTX-2.3 wan2.2 HunyuanVideo-1.5等 数字人文生视频+图生视频+批量生成 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v11.31 支持Magi Human LTX-2.3 wan2.2 HunyuanVideo-1.5等 数字人文生视频+图生视频+批量生成 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了
批量下载视频 闪豆视频下载器 支持抖音 快手 哔哩哔哩 爱优腾 YouTube等60多个视频平台 v4.0.0.0-2026.02.27批量下载视频 闪豆视频下载器 支持抖音 快手 哔哩哔哩 爱优腾 YouTube等60多个视频平台 v4.0.0.0-2026.02.27
 VisoMaster +VisoMaster-Fusion v1.0  基于rope的二次开发 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持50系英伟达显卡运行 一键整合包 VisoMaster +VisoMaster-Fusion v1.0 基于rope的二次开发 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持50系英伟达显卡运行 一键整合包
一键克隆任意人声!VoxCPM 2.02 开源语音大模型,无需训练,3秒搞定声音复刻!支持30种语言,9种方言,支持情绪表达+语气标签+超长文本+音色一致性+批量文本合成。最低8G英伟达即可运行 剑二十七二开汉化整合包 v20260426

一键克隆任意人声!VoxCPM 2.02 开源语音大模型,无需训练,3秒搞定声音复刻!支持30种语言,9种方言,支持情绪表达+语气标签+超长文本+音色一致性+批量文本合成。最低8G英伟达即可运行 剑二十七二开汉化整合包 v20260426

VoxCPM 是一个支持中英文、零样本语音克隆、情感可控、音素/公式输入的统一端到端语音合成大模型。它不依赖传统 TTS 流水线(如文本分析 → 音素对齐 → 声码器),而是直接从文本生成高质量语音波形。🎯 目标:打造一个像大语言模型一样“通用、灵活、强大”的语音生成基础模型。🔧 核心特性(技术亮点)1. ✅ 端到端架构(End-to-End...
AI,开源 7681 9
新一代开源 免费 AI换脸神器 FaceFusion v3.6.1 中文版 支持AMD显卡+N卡 速度更快 支持50系显卡+批量换脸,效果更惊艳 操作更简单 附视频演示 20260421 更新

新一代开源 免费 AI换脸神器 FaceFusion v3.6.1 中文版 支持AMD显卡+N卡 速度更快 支持50系显卡+批量换脸,效果更惊艳 操作更简单 附视频演示 20260421 更新

FaceFusion这个AI换脸的项目已经太久没有更新了。作者终于在昨天更新了3.0,更新幅度大得惊人。这么久不更新,原来是一直在憋大招,这个CD冷却也太久了。。。我第一次时间就去做整合包了。本以为这还不是有手就行的事,但是有点难度。因为3.0更新太大了,所以之前版本的模型还有一些东西根本用不上了,我只能慢慢去研究了。搞半天最后把我的系统的c...
AI,开源 51万 3617
这不是换脸,这是换头! 效果炸裂 AI 图片换头 Flux2-Klein-Face-Swap 一键整合包 v20260421

这不是换脸,这是换头! 效果炸裂 AI 图片换头 Flux2-Klein-Face-Swap 一键整合包 v20260421

本项目是一个基于 FLUX.2 Klein 模型开发的 AI 智能换头工具。通过集成 SDNQ (Spatial Dynamic Neural Quantization) 4-bit 动态量化技术,在显著降低显存占用的同时,保持了卓越的图像生成质量。配合 BFS (Best Face Swap) LoRA 模型,能够精准地实现人头替换,并完美...
AI,开源 1.1万 37
开源免费 gridplayer 0.5.4 网格播放器,同时播放多个视频 64位便携版

开源免费 gridplayer 0.5.4 网格播放器,同时播放多个视频 64位便携版

简单的基于VLC的媒体播放器,可以同时播放多个视频。你可以随心所欲地播放视频,唯一的限制是你的硬件。它支持VLC支持的所有视频格式(即所有视频格式)。您可以保存播放列表,保留位置、音量、循环、纵横比等信息。软件截图我最多一次播放27个视频,太卡了,基本10个以内 还是很流畅的。如果你的电脑硬件配置高 可能好点
开源 3682 3
开源 换脸工具 roop_unleashed v7.0 中文版 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示

开源 换脸工具 roop_unleashed v7.0 中文版 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示

昨天分享了roop的整合包支持AMD显卡来运行,今天分享的这个工具是roop的一个分支,虽然roop的作者已经弃更了,但是还有其他人继续更新。这就有产生了一个新的项目roop_unleashed。估计是这个项目出来并没有多久,所以知道的人不是很多,这2天我心血来潮就把这个项目也做了一个整合包,这个roop_unleashed是支持N卡的,但是...
AI,开源 7.6万 214
开源 Cherry Studio 一个支持多模型服务的桌面客户端工具 支持deepseek v1.9.1

开源 Cherry Studio 一个支持多模型服务的桌面客户端工具 支持deepseek v1.9.1

Cherry Studio是一款专为专业用户打造的桌面客户端,它支持多模型服务,集成了超过300多个大语言模型,涵盖了30多个行业,旨在帮助用户在多种场景下提升工作效率。这款软件的设计初衷是满足各行各业对GPT技术的需求,无论是开发者、设计师还是作家,都能从中受益。对于开发者而言,Cherry Studio是一个强大的代码伙伴。它可以进行代码...
开源 7902 3
0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v11.31 支持Magi Human LTX-2.3 wan2.2 HunyuanVideo-1.5等 数字人文生视频+图生视频+批量生成 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了

0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v11.31 支持Magi Human LTX-2.3 wan2.2 HunyuanVideo-1.5等 数字人文生视频+图生视频+批量生成 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了

Wan2GP 是专为“显卡资源有限”的用户打造的**开源视频生成工具箱**。它把目前最先进的文生视频、图生视频、视频编辑模型(Wan 2.1、Hunyuan Video、LTX Video 等)做了重度优化和封装,让只有 6-8 GB 显存的旧显卡也能跑得动、跑得快,并提供了一整套 Web 界面与周边工具,做到“开箱即玩”。一句话总结:**把...
AI,开源 3.7万 153
DeepSeek 本地部署一键运行 DeepSeek-tool v18,解压即可使用 最低支持2G显卡 支持99%的语言大模型 支持联网搜索+知识库

DeepSeek 本地部署一键运行 DeepSeek-tool v18,解压即可使用 最低支持2G显卡 支持99%的语言大模型 支持联网搜索+知识库

琢磨了一天,把DeepSeek的本地部署彻底完成了,并测试了一下午基本完美运行了。当然AI环境你们必须要先安装好。然后下载这个这个本地部署压缩,解压即可完美运行。我的4070ti spuer 运行32b已经是极限了,所以我也只能把模型下载到32b了,如果你们有更牛的显卡,可以继续下载模型。这是我运行14b的截图 你们看看显...
AI,开源 1.5万 36
 VisoMaster +VisoMaster-Fusion v1.0  基于rope的二次开发 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持50系英伟达显卡运行 一键整合包

VisoMaster +VisoMaster-Fusion v1.0 基于rope的二次开发 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持50系英伟达显卡运行 一键整合包

VisoMaster 还不错的一个换脸工具,界面也是简洁的很,花了一天的时间做了整合包+汉化。VisoMaster是一款功能强大且易于使用的面部替换与编辑工具,专为图像和视频设计。它利用先进的人工智能技术,能够以最少的努力产生自然逼真的效果,因此无论是普通用户还是专业人士都能轻松上手。这款软件以其独特的魅力和实用性,在图像与视频编辑领域脱颖而...
AI,开源 3.2万 74
造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图+人物一致性图片+自定义lora 一键整合包 20260326 v17

造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图+人物一致性图片+自定义lora 一键整合包 20260326 v17

Z-Image-Turbo Generator 是一个基于 Tongyi-MAI/Z-Image-Turbo 模型的高性能AI图像生成应用。通过简洁直观的Gradio界面,用户可以轻松生成高质量的1024x1024分辨率图像,特别擅长生成具有中国传统文化元素与现代风格融合的艺术作品。✨ 核心特性⚡ 极致性能优化8步极速生成:仅需8个推理步骤即...
AI,开源 1.8万 60
开源 Deep-Live-Cam v2.7 beta AI人工智能 图片视频换脸+直播换脸 汉化整合包 支持AMD+英伟达N卡50系

开源 Deep-Live-Cam v2.7 beta AI人工智能 图片视频换脸+直播换脸 汉化整合包 支持AMD+英伟达N卡50系

Deep-Live-Cam是一款由hacksider开发并维护的创新性软件,旨在为快速发展的AI生成媒体行业贡献一份力量。该软件的主要功能是通过深度学习技术,实现实时的人脸替换与增强,为艺术家、设计师以及内容创作者提供了一个强大的工具,帮助他们以全新的方式创作和表达。项目概述Deep-Live-Cam的核心价值在于其广泛的应用场景。艺术家可以...
AI,开源 1.9万 19
语音识别 + 声音克隆 + 模型训练,一个工具全搞定!Easy-Voice-Toolkit v1.3.5

语音识别 + 声音克隆 + 模型训练,一个工具全搞定!Easy-Voice-Toolkit v1.3.5

Easy-Voice-Toolkit 是由 Spr-Aachen开发的一款开源、用户友好的 AI 语音工具箱,旨在为开发者、研究人员和爱好者提供一站式、本地化部署的语音处理解决方案。项目设计注重易用性与功能性,支持多种主流语音任务,适用于科研实验、产品原型开发、语音助手构建等多种应用场景。🌟 核心特性本地部署:所有功能均可在本地运行,保障数据...
AI,开源 4739 0
lmstudio 一款强大而灵活的本地大模型部署工具 我的rx580 都能流畅运行 附模型文件 支持DeepSeek v0.4.6

lmstudio 一款强大而灵活的本地大模型部署工具 我的rx580 都能流畅运行 附模型文件 支持DeepSeek v0.4.6

LM Studio是由lmstudio.ai提供的一款强大而灵活的本地大模型部署工具。它不仅降低了机器学习的使用门槛,还为用户提供了一个安全、高效、隐私保护的环境,以便在本地运行各种大型语言模型。首先,LM Studio具备强大的离线使用能力。这意味着用户无需互联网连接即可运行模型,极大地提升了使用的便捷性和灵活性。对于那些需要保护数据隐私或...
AI,开源 9436 20
网文作者的 AI 外挂:日更万字还能保证剧情连贯的秘密武器 AI自动写小说  AI_NovelGenerator V1.4.4

网文作者的 AI 外挂:日更万字还能保证剧情连贯的秘密武器 AI自动写小说 AI_NovelGenerator V1.4.4

AI_NovelGenerator 是由 YILING0013 开发并开源在 GitHub 上的一款 基于大语言模型的 AI 长篇小说自动生成工具。它专注于解决 AI 写作中最棘手的长文本连贯性问题,能够创作多章节长篇小说,并确保剧情连贯、设定统一、伏笔合理呼应。核心定位"让 AI 从写作玩具变成生产力工具"传统 AI 写...
AI,开源 4785 1
电商降本增效神器:FASHN VTON v1.5 模特图自动生成 新一代开源虚拟试衣黑科技 一键整合包 v20260210

电商降本增效神器:FASHN VTON v1.5 模特图自动生成 新一代开源虚拟试衣黑科技 一键整合包 v20260210

FASHN VTON v1.5 是由 Fashn AI 推出的开源虚拟试衣项目。该项目基于先进的扩散模型技术,旨在解决电商、时尚设计和图像生成领域中“模特换装”的核心需求。它能够将任意一张服装图片逼真地“穿”在指定人物身上,同时保持人物的面部、姿态和背景环境高度一致。以下是该项目的详细介绍:1. 项目概述FASHN VTON v1.5 是一个...
AI,开源 4354 8
别再瞎试了!用这个神器,一键优化你的大模型提示词 Prompt Optimizer v2.5.3

别再瞎试了!用这个神器,一键优化你的大模型提示词 Prompt Optimizer v2.5.3

该项目聚焦于提升大语言模型(LLM)在实际应用中对提示语的理解与响应质量,旨在通过系统化的方法改进原始提示语的表达结构、清晰度和有效性,从而获得更准确、更稳定、更符合预期的模型输出。核心理念随着大模型在各类场景中的广泛应用,提示工程(Prompt Engineering)成为影响输出质量的关键因素。prompt-optimizer 的设计初衷...
AI,开源 3万 148
SoulX-Singer:一键克隆任意声音,让AI替你唱歌 无需训练,秒变歌手 一键整合包 v20260208

SoulX-Singer:一键克隆任意声音,让AI替你唱歌 无需训练,秒变歌手 一键整合包 v20260208

SoulX-Singer 是一个由 Soul-AI Lab 开发的零样本歌声合成(Zero-Shot Singing Voice Synthesis)开源项目。该项目旨在通过先进的深度学习技术,让用户能够在无需大量训练数据的情况下,克隆任意人的声音并用于歌声合成。核心功能1. 零样本音色克隆SoulX-Singer 的核心能力是零样本音色迁移...
AI,开源 5770 4
"让AI有‘灵魂’的神器:开源项目免费下载,语音聊天不尬聊,打游戏能当军师,关键数据不传云端!" airi v0.8.4

"让AI有‘灵魂’的神器:开源项目免费下载,语音聊天不尬聊,打游戏能当军师,关键数据不传云端!" airi v0.8.4

Project AIRI 是一个基于大语言模型驱动的AI虚拟伴侣系统,旨在创建AI"女仆"(waifu)/虚拟角色的灵魂容器,将这些虚拟角色带入现实世界。该项目致力于重现Neuro-sama(一个知名的AI虚拟角色)的功能高度,完全由LLM和AI驱动。核心功能🎙️ 实时语音聊天支持与AI进行自然流畅的语音对话交互实现低延迟...
AI,开源 6463 12
轻如羽,快如电 LuxTTS 语音克隆 一键整合包 CPU也能跑,30秒音频 1秒生成 v20260206

轻如羽,快如电 LuxTTS 语音克隆 一键整合包 CPU也能跑,30秒音频 1秒生成 v20260206

LuxTTS 项目介绍LuxTTS 是由开发者 Yatharth Sharma 创建的开源轻量级文本转语音(TTS)系统,专注于高质量零样本语音克隆与超高速推理。项目在保持卓越音质的同时,显著降低了计算资源需求,适用于资源受限环境下的语音合成任务。核心特性1. 零样本语音克隆仅需 3–5 秒参考音频即可克隆任意人声,无需针对目标说话人进行额外...
AI,开源 4702 23
开源 免费 pyVideoTrans v3.96 视频翻译开源软件 自动识别并生成字幕后,翻译 + 配音 绿色免安装

开源 免费 pyVideoTrans v3.96 视频翻译开源软件 自动识别并生成字幕后,翻译 + 配音 绿色免安装

这个工具我用来很长一段时间了,只是我居然一直忘记给大伙分享出来,直到昨天群里有人在问这样的工具。我才想起来把这个分享出来给大伙。虽然这个工具的标题叫视频翻译,实际上远远不只这些功能,我一直用这个工具来做字幕识别,比如我以前的教程那些字幕很多都是这个工具帮我做的。识别率也很高,超级方便。本来想今天一早就分享出来,但是事情比较多,又是瞎折腾的一天...
AI,开源 1.5万 29
影像重获新生 SeedVR2 图片+视频批量超分神器 一键整合包 AI 超分,让每一帧都惊艳 v20260205

影像重获新生 SeedVR2 图片+视频批量超分神器 一键整合包 AI 超分,让每一帧都惊艳 v20260205

SeedVR2 图像/视频超分工具这是一款基于 ComfyUI-SeedVR2_VideoUpscaler 官方推理 CLI 开发的图形化 Web 封装工具。它提供了一个现代化、汉化且高度可配置的网页界面,使用户无需编写命令行代码即可轻松对图片和视频进行高质量的 AI 超分辨率处理。核心功能1. 多模态与批量处理图片超分:支持单张图片或批量上...
AI,开源 3170 0
轻量 高效 AI生图工具 基于 Stable Diffusion XL 模型二次开发,6G英伟达显卡就可以愉快玩耍 Diaomo v8.0 六秒出图 支持更换模型+图片超分+图生图

轻量 高效 AI生图工具 基于 Stable Diffusion XL 模型二次开发,6G英伟达显卡就可以愉快玩耍 Diaomo v8.0 六秒出图 支持更换模型+图片超分+图生图

CyberIllustrious是一个基于 Stable Diffusion模型架构的二次创作(LoRA 或 Dreambooth)模型,主要专注于生成具有“未来感”、“赛博朋克”和“华丽视觉风格”的高质量插画内容。它通常被用于图像生成平台如 NovelAI、Stable Diffusion WebUI或 ComfyUI中。🧠 模型简介项目内...
AI,开源 1.4万 31
开源 神器 Stability Matrix  一款功能强大、易于使用的Stable Diffusion管理工具 v2.15.5

开源 神器 Stability Matrix 一款功能强大、易于使用的Stable Diffusion管理工具 v2.15.5

Stability Matrix是由Lykos AI开发的一款革命性工具,专为简化Stable Diffusion的使用和管理而设计。作为一款多平台包管理器和推理用户界面,它极大地提升了Stable Diffusion的易用性和用户体验。核心功能多平台支持:Stability Matrix支持macOS、Windows和Linux系统,确保用...
AI,开源 6005 1
输入歌词,AI自动作曲:你的音乐创作助手 HeartMuLa 一键中文整合包 v20260126

输入歌词,AI自动作曲:你的音乐创作助手 HeartMuLa 一键中文整合包 v20260126

HeartMuLa/heartlib:开源音乐基础模型家族深度解析项目定位与愿景HeartMuLa是一个全面的开源音乐基础模型家族,旨在推动跨任务与多模态的大规模音乐理解与生成技术发展。该项目不仅仅是一个单一的模型,而是一个完整的生态系统,涵盖了从音乐理解到完整曲目生成的全链条能力。其核心目标是为研究社区和开发者提供可复现、可扩展的音乐AI工...
AI,开源 7421 11
开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v20250805 整合包 附全部模型

开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v20250805 整合包 附全部模型

下面文字是作者原话这是一个离线运行的本地语音识别转文字工具,基于 fast-whipser 开源模型,可将视频/音频中的人类声音识别并转为文字,可输出json格式、srt字幕带时间戳格式、纯文字格式。可用于自行部署后替代 openai 的语音识别接口或百度语音识别等,准确率基本等同openai官方api接口。部署或下载后,双击 start.e...
AI,开源 5398 6
轻量、快速、免费、无需显卡 EasyTTS 重新定义本地 TTS 体验 一键整合包 v20260117

轻量、快速、免费、无需显卡 EasyTTS 重新定义本地 TTS 体验 一键整合包 v20260117

EasyTTS(由 GitHub 用户 yunchenqwq 开发)是一个专注于中文语音合成的开源文本转语音(Text-to-Speech, TTS)系统,其核心目标是提供一个无需复杂依赖、无需训练、本地运行、开箱即用的高质量 TTS 解决方案。该项目特别针对中文用户在实际使用中常见的痛点(如多音字错误、语调生硬、部署困难等)进行了优化,强调...
AI,开源 2910 0
 VoiceSculptor:基于指令驱动的下一代语音合成开源框架——让AI语音拥有精准的情感与音色控制能力 v20260108 一键整合包

VoiceSculptor:基于指令驱动的下一代语音合成开源框架——让AI语音拥有精准的情感与音色控制能力 v20260108 一键整合包

🎵 VoiceSculptor - 指令驱动的语音合成模型📌 项目概述VoiceSculptor是由ASLP实验室(Audio, Speech and Language Processing Laboratory)开发的一款先进的指令式文本到语音(instruct text-to-speech)开源模型。2该项目代表了语音合成技术的前沿发展方...
开源 2629 0
GPT-SoVITS2507+SAVA46 一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包

GPT-SoVITS2507+SAVA46 一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包

GPT-SoVITS是一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成。该工具由RVC-Boss团队开发,并在GitHub上公开分享,为用户提供了一个灵活且功能丰富的平台,以满足语音合成的多样化需求。核心功能GPT-SoVITS的核心功能包括零样本和少样本TTS。零样本TTS允许用户仅通过输入一个5秒的语音样本,就能即时体...
AI,开源 1万 4
视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包 v20251231

视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包 v20251231

🎥 FlashVSR 是什么?FlashVSR 是一个能让模糊、低清视频“秒变高清”的智能工具。它专门用来做一件事:把低分辨率的视频,快速、高质量地放大成 4 倍清晰度的高清视频。比如:把 480p 的老视频 → 变成接近 4K 的清晰视频让手机拍的模糊视频 → 变得锐利、细节丰富⚡ 它有什么厉害的地方?过去很多“视频超分”(放大变清晰)工具...
AI,开源 5258 2
别只截图——让AI看懂它!Snippai秒出翻译、表格、配色方案 v0.2.1

别只截图——让AI看懂它!Snippai秒出翻译、表格、配色方案 v0.2.1

Snippai 是一款开源的 AI 截图分析工具,主打“截一下,秒懂一切”。它把传统截图工具的功能边界彻底打破:截完图后,AI 会自动识别图片里的内容并给出“下一步”服务,而不是简单保存一张图片。核心能力一览公式识别:截图里的数学公式直接变成可编辑的 LaTeX。文字提取:OCR 精准抓字,支持多语言,抓完还能顺手翻译。表格识别:把图片中的表...
AI,开源 1.2万 19
洗图必备 基于 Z-Image Turbo 的多模态 ControlNet 工具:ZIT-ControlNet  v2.0 一键整合包

洗图必备 基于 Z-Image Turbo 的多模态 ControlNet 工具:ZIT-ControlNet v2.0 一键整合包

ZIT-ControlNet(Z-Image Turbo ControlNet)—— 精准可控的 AI 图像生成与编辑工具项目简介ZIT-ControlNet(全称Z-Image Turbo ControlNet)是一个基于ControlNet 技术构建的开源图像生成控制项目,致力于在生成图像时实现高精度引导与编辑,同时最大程度保留原始图像的...
开源 1.1万 18
"方言通+翻译官:一个AI,能说18种中国方言和9国语言" Fun-CosyVoice3-0.5B AI语音生成工具 一键整合包 v20251217

"方言通+翻译官:一个AI,能说18种中国方言和9国语言" Fun-CosyVoice3-0.5B AI语音生成工具 一键整合包 v20251217

CosyVoice:基于大语言模型的先进语音合成系统CosyVoice 是一个由 FunAudioLLM 团队开发的开源文本到语音(TTS)系统,目前已迭代至Fun-CosyVoice 3.0版本。该项目基于大语言模型(LLM)架构,在语音合成领域实现了多项技术突破。核心技术特点Fun-CosyVoice 3.0作为最新版本,在内容一致性、说...
AI,开源 4487 2