索尼开源AI模型 Woosh 一句话生成音效，一键为视频配音 一键AI整合包 解压即可使用 v20260424,

AI 工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # tts # 语音工具 # 整合包

Audio8-TTS 智能语音合成工具，一键生成自然人声上传一段音频，AI 学会用你的声音朗读任何文字一键整合包 v20260801

这是什么？这是一个智能语音合成工具，能把您输入的文字转换成自然流畅的语音。无论是几百字的短文还是几千字的长文章，它都能轻松处理。核心功能🎯 智能长文本处理自动分块：遇到长文本会自动切分成多个小段，一段一段合成无缝拼接：合成后自动拼接，使用智能淡入淡出技术，听起来流畅自然智能识别：自动判断文本是中文还是英文，调整最佳分割策略🎤 声音克隆功能参考...

2026-8-1 5小时前 AI 2808 0

AI 语音 # 工具 # 日常应用 # 绿色软件 # 开源 # 人工智能 # AI # 语音工具 # 整合包

一键克隆你的声音：higgs-audio-v3-tts AI语音生成工具支持情绪标签，支持停顿，支持音速调整中文一键整合包 v20260731

HiggsAudio 是由 Boson AI 开发的开源文本转语音(TTS)系统，基于先进的深度学习技术，能够生成高质量、自然的人声。该项目在 GitHub 上开源，提供了强大的语音合成能力。🌟 项目亮点🎵 高质量语音生成生成接近真人发音的语音支持多种语言和口音能够处理情感表达和语调变化🏗️ 先进的模型架构基于 Transformer 的端到...

2026-7-31 AI 5971 10

AI#开源翻译 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 字幕 # 整合包

开源免费 pyVideoTrans 视频翻译开源软件自动识别并生成字幕后，翻译 + 配音绿色免安装 v4.07

这个工具我用来很长一段时间了，只是我居然一直忘记给大伙分享出来，直到昨天群里有人在问这样的工具。我才想起来把这个分享出来给大伙。虽然这个工具的标题叫视频翻译，实际上远远不只这些功能，我一直用这个工具来做字幕识别，比如我以前的教程那些字幕很多都是这个工具帮我做的。识别率也很高，超级方便。本来想今天一早就分享出来，但是事情比较多，又是瞎折腾的一天...

2026-7-25 AI,开源 1.7万 23

AI#开源图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 人工智能 # AI # 整合包 # 文生图

27image AI文生图一键整合包支持Mage-Flow+Krea 2 Turbo+ERNIE-Image-Turbo+Qwen_Image+Ovis-Image 解压即可使用，8G英伟达显卡就可以运行 v20260724更新

一个让 AI 绘画变"傻瓜"的本地部署的AI生图工具——每行写一句话，它就能帮你批量出图你有没有这样的经历？想试试 AI 绘画，打开网页版要么排队、要么收费；想本地运行，又被满屏的英文参数和命令行劝退；好不容易跑起来了，发现每次只能生成一张图，换个提示词又要重新等半天……如果你只想安安静静地打字、批量出图、自动保存，那这个...

2026-7-24 AI,开源 1.8万 11

AI#开源工具 # 日常应用 # 视频处理 # 视频下载 # 绿色软件 # 办公软件 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

视频创作者的新宠：这个开源工具正在悄悄改变内容生产方式一键整合包 MoneyPrinterPlus v1.3.2

你可以把它想象成一个 “AI全自动视频工厂”。它最大的特点就是：输入一段文字，就能自动生成一个完整的高清视频。是不是有点像你写一篇作文，然后机器帮你拍成了短视频？没错，就是这个意思！🧠 它是怎么工作的？简单来说，它的流程是这样的：你告诉它要说什么内容（文字）比如：“今天教你怎么在家做蛋糕”它会自动找合适的画面素材比如网上免费的高清视频片段：打...

2026-7-24 AI,开源 8823 4

AI#开源图像处理 # 工具 # 日常应用 # 视频处理 # 神器 # 绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包

0 基础也能当导演：输入一句话，AI 自动生成视频 Wan2GP 中文版 v12.34 支持JoyAI-Echo Bernini LTX-2.3 wan2.2 HunyuanVideo-1.5等数字人文生视频+图生视频+批量生成英伟达6G显卡就可以跑起来，有这个你其他视频生成的整合包都可以删了

Wan2GP 是专为“显卡资源有限”的用户打造的**开源视频生成工具箱**。它把目前最先进的文生视频、图生视频、视频编辑模型（Wan 2.1、Hunyuan Video、LTX Video 等）做了重度优化和封装，让只有 6-8 GB 显存的旧显卡也能跑得动、跑得快，并提供了一整套 Web 界面与周边工具，做到“开箱即玩”。一句话总结：**把...

2026-7-22 AI,开源 4.6万 161

AI#开源视频处理 # 人工智能 # AI # 换脸 # 整合包

新一代开源 AI换脸神器 FaceFusion v3.7.1 中文版支持AMD显卡+N卡速度更快支持50系显卡+批量换脸，效果更惊艳操作更简单附视频演示 20260709 更新

FaceFusion这个AI换脸的项目已经太久没有更新了。作者终于在昨天更新了3.0，更新幅度大得惊人。这么久不更新，原来是一直在憋大招，这个CD冷却也太久了。。。我第一次时间就去做整合包了。本以为这还不是有手就行的事，但是有点难度。因为3.0更新太大了，所以之前版本的模型还有一些东西根本用不上了，我只能慢慢去研究了。搞半天最后把我的系统的c...

2026-7-9 AI,开源 55.7万 2434

AI 工具 # 日常应用 # 神器 # 绿色软件 # 办公软件 # 音频处理 # 人工智能 # AI # 效率工具 # 整合包

AI 音视频深度分析引擎 audio-think v1.0 生成字幕+音频内容分析+转录文本一键整合包解压即可使用

🎙️ 你的音视频“第二大脑”：AI 深度分析引擎，让每一段声音都变成可检索的智慧你有没有过这样的经历——收藏了几百个小时的播客，却再也没打开过第二期；开完一场两小时的会议，翻遍笔记也找不到那个关键数据；刷到一个干货满满的视频教程，一周后只记得“好像讲了个很厉害的东西”；听完一本有声小说，想和朋友分享某个情节，却怎么也想不起在第几章……信息爆炸...

2026-7-2 AI 3495 3

AI#开源工具 # 开源 # 人工智能 # AI # 换脸 # 免费 # 整合包

VisoMaster +VisoMaster-Fusion v1.0 基于rope的二次开发一款功能强大、易于使用且高效的开源换脸工具中文版支持50系英伟达显卡运行一键整合包

VisoMaster 还不错的一个换脸工具，界面也是简洁的很，花了一天的时间做了整合包+汉化。VisoMaster是一款功能强大且易于使用的面部替换与编辑工具，专为图像和视频设计。它利用先进的人工智能技术，能够以最少的努力产生自然逼真的效果，因此无论是普通用户还是专业人士都能轻松上手。这款软件以其独特的魅力和实用性，在图像与视频编辑领域脱颖而...

2026-7-1 AI,开源 3.6万 69

AI 图像处理 # 变脸 # 人工智能 # AI # 换脸 # 整合包

开源 AI人脸替换工具离线版V8.7 兼容50系列显卡 CPU、显存占用优化，速度更快一张图实现视频或者图片换脸，完全免费！附演示和教程视频

这是热心网友万能君做的一个整合包，整合包里面已经包含了几个换脸项目和一些高清修复功能等，具体可以看下图截图所示。要顺利使用这个工具，必须做好以下几点第一个这个工具只支持CPU+N卡。如果需要使用N卡，一定要先安装好驱动和CUDA。第二个一定要安装好运行库。https://www.jian27.com/html/2290.html第三个所...

2026-7-1 AI 526.7万 7552

AI#开源工具 # 绿色软件 # 开源 # 人工智能 # AI # 换脸 # 直播 # 免费 # 整合包

开源 Deep-Live-Cam v2.7-RC2 AI人工智能图片视频换脸+直播换脸汉化整合包支持AMD+英伟达N卡50系

Deep-Live-Cam是一款由hacksider开发并维护的创新性软件，旨在为快速发展的AI生成媒体行业贡献一份力量。该软件的主要功能是通过深度学习技术，实现实时的人脸替换与增强，为艺术家、设计师以及内容创作者提供了一个强大的工具，帮助他们以全新的方式创作和表达。项目概述Deep-Live-Cam的核心价值在于其广泛的应用场景。艺术家可以...

2026-7-1 AI,开源 2.2万 21

AI#开源工具 # 绿色软件 # 开源 # 人工智能 # AI # 换脸 # 免费 # 整合包

开源换脸工具 roop_unleashed v8.0 中文版可支持批量换脸，直播换脸，整合包支持AMD显卡+N卡。速度超快附视频教程演示

昨天分享了roop的整合包支持AMD显卡来运行，今天分享的这个工具是roop的一个分支，虽然roop的作者已经弃更了，但是还有其他人继续更新。这就有产生了一个新的项目roop_unleashed。估计是这个项目出来并没有多久，所以知道的人不是很多，这2天我心血来潮就把这个项目也做了一个整合包，这个roop_unleashed是支持N卡的，但是...

2026-7-1 AI,开源 8.5万 214

AI#开源图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 换脸 # 整合包 # 付费

这不是换脸，这是换头！效果炸裂 AI 图片换头 HeadFusion v3.0 一键整合包 v20260601

本项目是一个基于 FLUX.2 Klein 模型开发的 AI 智能换头工具。通过集成 SDNQ (Spatial Dynamic Neural Quantization) 4-bit 动态量化技术，在显著降低显存占用的同时，保持了卓越的图像生成质量。配合 BFS (Best Face Swap) LoRA 模型，能够精准地实现人头替换，并完美...

2026-7-1 AI,开源 2.1万 50

AI 工具 # 日常应用 # 视频处理 # 音乐 # 绿色软件 # 音频处理 # 人工智能 # AI # 效率工具 # 整合包

音乐卡点视频一键生成支持图片+视频素材新增镜头分镜切割+人声分离+ MTV 模式+音频编辑无显卡要求剑二十七原创作品 KA v20260629

卡点视频生成器是一款基于 AI大模型智能视频自动生成工具，专为音乐爱好者、短视频创作者、自媒体运营者设计。它能根据你上传的音乐节拍/鼓点，自动从指定图片或视频素材中智能选取片段，生成节奏精准、视觉流畅的“卡点”视频，适用于抖音、快手、B站、Instagram 等平台。无需剪辑经验，一键生成专业级卡点视频！🎯 核心功能1. 🖼️ 图片卡点模式...

2026-6-28 AI 1.4万 0

AI 图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 修图 # 效率工具 # 整合包 # 付费

一键修复老照片、智能上色、超清还原，去除水印，转动漫 48个超强预设-全能AI图像编辑神器来了！beterpic v20260621

—— 高清图像修复、增强与风格化处理工具本系统基于先进的 qwen 图片编辑模型与 Nunchaku 量化技术构建，结合 LoRA 微调模型支持，提供强大且高效的图像编辑能力。无论是老照片修复、人像增强、风景优化，还是黑白图上色，都能一键实现高质量输出。🔧 核心功能✅ 高清图像修复与增强支持上传任意分辨率图像（最小边自动放大至 1024p...

2026-6-26 AI 1.9万 19

AI#开源工具 # 神器 # 绿色软件 # 开源 # 人工智能 # AI # 多图预览 # 效率工具 # 整合包

开源神器 Stability Matrix 一款功能强大、易于使用的Stable Diffusion管理工具 v2.16.1

Stability Matrix是由Lykos AI开发的一款革命性工具，专为简化Stable Diffusion的使用和管理而设计。作为一款多平台包管理器和推理用户界面，它极大地提升了Stable Diffusion的易用性和用户体验。核心功能多平台支持：Stability Matrix支持macOS、Windows和Linux系统，确保用...

2026-6-23 AI,开源 6920 1

AI 工具 # 日常应用 # 视频处理 # 绿色软件 # 开源 # 人工智能 # AI # 效率工具 # 整合包 # 视频反推

视频反推提示词生成器分镜处理+镜头设定 + 场景描述 + 主体动作 + 角色细节 + 运镜方式 + 风格美学+去水印+高清修复 thinkvideo v5.0

🎬 剑二十七｜视频反推提示词生成器让每一帧画面，都转化为可复用的创作语言🔮 核心定位这是一款面向专业内容创作者的智能视频理解工具。它不满足于简单的画面识别，而是以「镜头语言」为最小单元，深度解析视频内容，自动生成符合影视工业标准的中文提示词描述。不是「看图说话」，而是「读镜写意」。✨ 六大核心能力🎯 智能镜头分割精准识别场景切换点自适应阈值调...

2026-6-22 AI 5798 10

AI 语音 # 工具 # 日常应用 # 音频 # 音频处理 # 开源 # 人工智能 # AI # tts # 语音工具 # 效率工具 # 整合包

网易开源AI语音克隆大模型Confucius4-TTS 极速克隆支持14种语言支持情感迁移一键整合包 v20260621 解压即可使用

想象一下这样的场景：录一段自己说话的声音，AI 就能用你的音色，带着你的情绪，流利地说出英语、日语、韩语……而且完全听不出是外国人在说。这不是科幻电影，而是Confucius4-TTS正在做的事。Confucius4-TTS 是由网易有道开发的一款前沿语音合成（TTS）系统。它的核心理念可以用一句话概括：「一种音色，任意语言」简单来说...

2026-6-21 AI 3818 0

AI 语音 # 工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 语音工具 # 效率工具 # 整合包

小红书开源配音神器 dots.tts 只需3秒音频，完美复刻你的声音！一键整合包 v20260617 解压即可使用

dots.tts是由小红书人工智能实验室（RedNote Hilab）研发并免费开源的一款新一代 AI 语音合成（配音）系统。抛开复杂的技术术语，你可以把它简单理解为一个“拥有录音棚级音质的超级 AI 配音员”。你只需要输入一段文字，它就能用极其逼真、富有感情的声音把文字读出来，甚至能完美模仿任何人的声音。以下是它最核心的几个“超能力”，也是...

2026-6-17 AI 1.2万 31

AI 图像处理 # 工具 # 日常应用 # 绿色软件 # 办公软件 # 图形图像 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包 # 付费

图生图新的选择 AI 重绘支持批量图生图新增动作和姿态控制+滤镜+自动关机+自动去水印剑二十七洗图专用 z-image-turbo-xitu v12

🎨 Z-Image-Turbo 剑二十七·洗图专用版—— 神似而形不似，AI 重绘的终极答案"目前市面上能做到神似而形不似的类似图生图，在我面前一个能打的都没有"🔍 产品定位本工具专为「高质量图像重绘」场景打造，聚焦「洗图」核心需求：在保留原图构图、光影、神态的前提下，通过 AI 进行艺术化重绘，实现「神似而形不似」的进阶...

2026-6-4 AI 1.1万 23

AI 工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 大模型 # 效率工具 # 整合包

MOSS-TTS-v1.5+MOSS-TTSD+ MOSS-TTS-Nano 支持CPU运行，一个高质量的开源中文文本到语音合成系统一键整合包 v20260604 支持免费商业使用支持暂停

🎙️ MOSS-TTS：让文字拥有“千人千面”的超级嗓音一句话看懂：这是一个由复旦大学和模思智能联合开发的开源人工智能项目。它的核心本领就是把文字变成极其逼真、带有感情的真人声音。✨ 为什么它比传统的“机器朗读”更厉害？传统的配音软件听起来往往像没有感情的机器人，而 MOSS-TTS 拥有以下 5 大“超能力”：1. 🎭 神奇的“声音克隆”魔...

2026-6-4 AI 9780 20

AI 工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 配音 # 整合包

给你配了个“AI配音导演”：阿里这款新模型，能直接给电影配音了！ Fun-CineForge 一键整合包 v20260603 解压即可使用

Fun-CineForge是阿里通义实验室（FunAudioLLM 团队）推出的一款非常强大的AI影视配音模型。如果用一句话来概括：它就像一个不知疲倦的“AI配音导演+全能配音演员”，能够直接给电影、电视剧或各类视频进行高质量的自动配音，而且对口型、分角色都不在话下。为了让你轻松了解这个模型，我们从它的核心能力、应用场景以及背后的黑科技三个方...

2026-6-3 AI 4030 0

AI 工具 # 视频处理 # 开源 # 人工智能 # AI # 整合包 # 视频理解 # 反推视频

Marlin-2B 一个会"看懂"视频的AI大模型能精确描述视频中每一个镜头一键整合包 v20260602 解压即可使用

Marlin-2B 是一个会"看懂"视频的小助手，它能自动告诉你视频里发生了什么、什么时候发生的，还能根据你的描述快速定位到具体片段。🤔 它能帮你做什么？✅ 自动写视频"解说词"把一段视频交给它，它会像解说员一样，用文字告诉你：🎞️场景：办公室里，一位穿白衬衫的男士坐在电脑前工作⏱️事件：<0.0...

2026-6-1 AI 3653 1

AI 语音 # 工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 语音工具 # 效率工具 # 整合包

高德开源项目 PilotTTS - 让AI学会"说话"的语音生成开源项目，支持11种情绪+14种方言一键整合包 v20260530 解压即可使用

这是高德地图语音团队开发的一个AI语音合成工具，可以让电脑用自然的声音朗读文字，还能模仿不同人的声音、表达不同情绪。✨ 它能做什么？1️⃣模仿任何人说话只需录一段5-15秒的音频，AI就能学会这个人的声音比如：用你朋友的声音读你写的文字2️⃣带感情地朗读支持11种情绪：😊 开心、😢 悲伤、😠 生气😲 惊讶、😨 害怕、🤢 厌恶😐 严肃、🥺 关切...

2026-5-30 AI 2535 0

AI 工具 # 日常应用 # 音乐 # 绿色软件 # 音频 # 开源 # 人工智能 # AI # 语音工具 # 整合包

自媒体人的AI音乐工坊：打字描述，自动生成专属BGM stable-audio-3 AI音乐自动生成一键整合包 v20260524

Stable Audio 3 是 Stability AI（就是出 Stable Diffusion 那家公司）做的一款AI 音乐/音效生成工具。你只需要打字描述，它就能帮你生成一段音频——可以是一段背景音乐、一个音效、甚至是一首完整的歌。这个增强版把原来的英文界面全部翻译成了中文，还加了一些方便国内用户使用的功能。它能做什么？举几个例子你想...

2026-5-24 AI 4814 0

AI#开源图像处理 # 工具 # 日常应用 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 大模型 # 整合包

造相 Z-Image-Turbo AI生图大模型高性能AI图像生成工具 5秒一张图片支持批量生图+人物一致性图片+自定义lora 一键整合包 20260519 v19

Z-Image-Turbo Generator 是一个基于 Tongyi-MAI/Z-Image-Turbo 模型的高性能AI图像生成应用。通过简洁直观的Gradio界面，用户可以轻松生成高质量的图像，特别擅长生成具有中国传统文化元素与现代风格融合的艺术作品。✨ 核心特性⚡ 极致性能优化8步极速生成：仅需8个推理步骤即可完成高质量图像生成零指...

2026-5-19 AI,开源 2.6万 62

AI#开源图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 效率工具 # 整合包

轻量高效 AI生图工具基于 Stable Diffusion XL 模型二次开发，6G英伟达显卡就可以愉快玩耍 Diaomo v9.0 六秒出图支持更换模型+图片超分+图生图

基于 Stable Diffusion XL 的一站式 AI 绘画工作台，支持文生图、图生图与批量自动化生产，内置智能中文翻译，零门槛直接用中文描述生成高质量图像。一、三大核心创作模式1. 文生图（Text-to-Image）输入一段画面描述，AI 直接生成全新图像。智能中文提示词：输入中文即可，系统自动调用轻量翻译模型转为英文提示词；若输入...

2026-5-17 AI,开源 1.6万 31

AI 图像处理 # 工具 # 日常应用 # 图形图像 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包 # 文生图

一句话画出动漫世界！支持中文的AI绘画神器来了 Anima文生动漫图片AI大模型 ,8G英伟达显卡即可愉快玩耍

Anima 动漫文生图基于 circlestone-labs/Anima 模型的图像生成工具。支持中文提示词自动翻译，生成结果自动保存至本地 output 目录。✨ 主要特性🎨 高质量动漫风格生成 – 专精二次元、动漫、CG 渲染。🌐 中文提示词自动翻译 – 使用...

2026-5-16 AI 4.1万 105

AI 图像处理 # 图形图像 # 图片处理 # 人工智能 # AI # 图片编辑 # 效率工具 # 整合包

klein-edit AI图片编辑工具摄影师狂喜：86个AI修图预设，从人像到风景全覆盖 v1.0 20260514更新记录新增lora支持

FLUX.2 Klein 图像编辑工具：86个一键预设，打造专业级本地 AI 图像处理工作站一、项目概述在 AI 图像生成与编辑领域，FLUX系列模型以其卓越的图像理解能力和编辑精度备受开发者青睐。本文介绍的这套基于FLUX.2-klein的本地图像编辑工具，通过Gradio构建了一个功能完备的 Web 界面，集成了86个实用预设功能，支持多...

2026-5-14 AI 5752 7

AI 图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 整合包 # 文生图

百度开源图片大模型文生图 ERNIE-Image-Turbo 一键整合包 8G英伟达 16秒出图文字理解能力超强 v20260416

🎨 ERNIE-Image-Turbo 模型介绍【核心定位】• 极速生成：基于单流 Diffusion Transformer 架构，仅需 8 步推理即可完成高质量图像生成，速度提升 6 倍以上• 精准可控：强调对复杂指令的准确还原，适合需要内容精确落地的实用型创作任务• 轻量化部署：经蒸馏优化，可在消费级显卡上流畅运行，大幅降低商用门槛【...

2026-5-14 AI 4173 7

AI#开源工具 # 日常应用 # 音乐 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包

输入歌词，AI自动作曲：你的音乐创作助手 HeartMuLa 一键中文整合包 v20260507

HeartMuLa/heartlib：开源音乐基础模型家族深度解析项目定位与愿景HeartMuLa是一个全面的开源音乐基础模型家族，旨在推动跨任务与多模态的大规模音乐理解与生成技术发展。该项目不仅仅是一个单一的模型，而是一个完整的生态系统，涵盖了从音乐理解到完整曲目生成的全链条能力。其核心目标是为研究社区和开发者提供可复现、可扩展的音乐AI工...

2026-5-7 AI,开源 9102 9

AI 工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 整合包

索尼开源AI模型 Woosh 一句话生成音效，一键为视频配音一键AI整合包解压即可使用 v20260424

索尼人工智能研究院（Sony AI）发布的音效生成基础模型📌 项目定位Woosh是专为音效生成（Sound Effects）优化的多模态生成式 AI 模型套件，旨在为音频研究社区提供高质量的开源基座模型，支持文本到音频（T2A）和视频到音频（V2A）两大核心任务。🔗 技术报告：arXiv:2604.01929🧩 核心模块组成1️⃣ Woosh...

2026-4-24 AI 3560 0