图像生成神器：用AI画图，零代码也能玩，拖拽操作就能生成精美图片ComfyUI 官方英伟达显卡版 v0.3.70,

AI 工具 # 日常应用 # 图像编辑 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 大模型 # 效率工具 # 整合包

京东开源图片编辑AI大模型 JoyAI-Image-Edit v20260422 二次开发一键整合包附演示和操作教程

JoyAI-Image-Edit 是京东开源的多模态基础模型，专注于指令引导的图像编辑任务。它基于 JoyAI-Image 多模态底座构建，通过自然语言指令实现对图像的精确、可控编辑。🔹 核心技术特点1. 强大的空间理解能力场景解析：自动识别图像中的物体、区域及空间关系关系定位：精准理解"物体A在物体B左侧"等空间描述指令...

2026-4-22 AI 5546 0

AI 图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 图片处理 # 人工智能 # AI # 免费 # 效率工具 # 整合包

一键生成AI绘画提示词：让你的图片秒变顶级写真描述跟之前的图片反推工具不同的是这个会思考 thinkpic-6.0-20260420

这个工具是做什么的？这个程序可以自动为你的人物照片生成一段“AI绘画提示词”。简单来说：你放一张人物照片进去，它就能写出一段详细、生动、充满吸引力的文字描述，这段文字可以直接用在 AI 绘画工具（比如 Stable Diffusion）中，让 AI 画出类似风格或效果的图片。例如，它会描述：人物有多美、眼睛多勾人、嘴唇多诱人；身材曲线多么火辣...

2026-4-20 AI 1.4万 8

AI 图像处理 # 工具 # 日常应用 # 图像编辑 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 多图预览 # 效率工具 # 整合包

本地部署一键整合包FLUX.2-klein-9B-KV-LoRA-Studio 图像编辑大模型海量lora支持 v3.0

FLUX.2-Klein-LoRA-Studio是一款基于 Gradio 构建的本地化图像编辑工作台，集成 Black Forest Labs 最新发布的FLUX.2-klein-9B多模态生成模型，支持通过 LoRA 适配器实现多样化图像编辑任务。⚡ 核心功能🔹 多图像输入编辑支持上传 1~2 张参考图：Picture 1（Base）：作为...

2026-4-14 AI 4940 8

AI 图像处理 # 工具 # 日常应用 # 图像编辑 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包

你想怎么改图？它就怎么改 Qwen-Image-Edit-2511 实现真正可控的 AI 图片编辑支持海量lora v20260413 一键整合包

Qwen-Image-Edit-2511 是由阿里云推出的新一代多模态图像编辑大模型，属于 Qwen 系列在视觉生成与编辑方向的重要迭代。该模型基于 Qwen-Image-Edit 系列的持续演进（如 2509、2511 版本），在保留原始图像语义结构和细节的前提下，支持高保真、高可控性的图像编辑任务。该模型主要特点包括：高保真图像编辑：在执...

2026-4-13 AI 7508 16

AI 工具 # 文本 # 绿色软件 # 人工智能 # AI # 整合包

AI 提示词智能增强工具可生成一致性强的文生图提示词，可直接用于图像生成的专业级提示词，专为AI图像生成创作者打造 27PromptEnhancer v2.0

本工具基于 Qwen3 系列轻量化大模型（Qwen3-0.6B 与 Qwen3-1.7B，GPTQ Int8 量化版本），专为图像生成（如 Stable Diffusion、Midjourney 等）用户设计，帮助你将简单粗糙的提示词自动优化为高细节、高表现力、风格明确的专业级描述。🔧 核心功能双模型可选Qwen3-0.6B：轻量快速，适合日...

2026-4-12 AI 4290 2

AI 语音 # 工具 # 日常应用 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # tts # 语音工具 # 效率工具 # 整合包

小米开源大模型AI语音合成，600种语言+声音克隆，生成速度提升40倍不限字数支持自动语气标签 OmniVoice v20260407 一键整合包

OmniVoice：600+语种的语音合成新纪元剑二十七 · 技术前沿🔹一句话了解由小米下一代 Kaldi 团队（k2-fsa）打造的超大规模多语言零样本 TTS 模型，支持600+ 语种，以卓越音质与极速推理，重新定义语音合成体验。✨ 核心能力一览🗣️全球语种覆盖支持 600+ 语言与方言，从英语、中文到低资源语种，一模型通全球。🔁声音克隆...

2026-4-7 AI 4354 0

AI#开源工具 # 日常应用 # 绿色软件 # 编程开发 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包 # deepseek

DeepSeek 本地部署一键运行 DeepSeek-tool v18，解压即可使用最低支持2G显卡支持99%的语言大模型支持联网搜索+知识库

琢磨了一天，把DeepSeek的本地部署彻底完成了，并测试了一下午基本完美运行了。当然AI环境你们必须要先安装好。然后下载这个这个本地部署压缩，解压即可完美运行。我的4070ti spuer 运行32b已经是极限了，所以我也只能把模型下载到32b了，如果你们有更牛的显卡，可以继续下载模型。这是我运行14b的截图你们看看显...

2026-4-5 AI,开源 1.7万 36

AI 语音 # 工具 # 日常应用 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 语音工具 # 效率工具 # 整合包

一键克隆任意音色，生成自然口语级语音 1B/3.5B 双模型自由切换，还原你最真实的声音 LongCat-AudioDiT v1.0 20260402 更新一键整合包

LongCat-AudioDiT 语音合成工具 - 功能说明🎯 主要功能本工具基于美团开源的 LongCat-AudioDiT 扩散模型，提供高质量的文本到语音合成，并支持零样本语音克隆（只需几秒参考音频即可克隆音色）。界面采用 Gradio 构建，操作直观，适用于中文和英文混合文本。📌 核心功能模块1. 模型选择支持 1B&nbs...

2026-4-2 AI 3472 2

AI 图像处理 # 日常应用 # 图像编辑 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包

EditMGT 用文字"指挥"AI修图，想改哪里改哪里 5秒即可完成编辑一键整合包 v20260219

EditMGT（Masked Generative Transformer for Image Editing）是一个基于掩码生成式变压器的先进图像编辑框架，由字节跳动（ByteDance）主导研发，联合上海交通大学、新加坡国立大学、香港科技大学（广州）等高校共同完成。✨ 核心特点1. 技术创新采用**掩码生成式变压器（Masked Gene...

2026-2-18 AI 3626 3

AI#开源图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包

电商降本增效神器：FASHN VTON v1.5 模特图自动生成新一代开源虚拟试衣黑科技一键整合包 v20260210

FASHN VTON v1.5 是由 Fashn AI 推出的开源虚拟试衣项目。该项目基于先进的扩散模型技术，旨在解决电商、时尚设计和图像生成领域中“模特换装”的核心需求。它能够将任意一张服装图片逼真地“穿”在指定人物身上，同时保持人物的面部、姿态和背景环境高度一致。以下是该项目的详细介绍：1. 项目概述FASHN VTON v1.5 是一个...

2026-2-10 AI,开源 5058 7

AI#开源工具 # 日常应用 # 音乐 # 绿色软件 # 人工智能 # AI # 整合包

SoulX-Singer：一键克隆任意声音，让AI替你唱歌无需训练，秒变歌手一键整合包 v20260208

SoulX-Singer 是一个由 Soul-AI Lab 开发的零样本歌声合成（Zero-Shot Singing Voice Synthesis）开源项目。该项目旨在通过先进的深度学习技术，让用户能够在无需大量训练数据的情况下，克隆任意人的声音并用于歌声合成。核心功能1. 零样本音色克隆SoulX-Singer 的核心能力是零样本音色迁移...

2026-2-8 AI,开源 6906 4

AI#开源工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 整合包

轻如羽，快如电 LuxTTS 语音克隆一键整合包 CPU也能跑，30秒音频 1秒生成 v20260206

LuxTTS 项目介绍LuxTTS 是由开发者 Yatharth Sharma 创建的开源轻量级文本转语音（TTS）系统，专注于高质量零样本语音克隆与超高速推理。项目在保持卓越音质的同时，显著降低了计算资源需求，适用于资源受限环境下的语音合成任务。核心特性1. 零样本语音克隆仅需 3–5 秒参考音频即可克隆任意人声，无需针对目标说话人进行额外...

2026-2-6 AI,开源 6819 22

AI 语音 # 音乐 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 语音工具 # 效率工具 # 整合包

ACE-Step-1.5 解锁音乐创作无限可能，以技术革新重塑音乐生成生态，AI生成音乐翻唱音乐重绘音乐支持中文 v20260206

ACE-Step是一个开源的音乐生成基础模型项目，旨在通过全面的架构设计克服现有音乐生成方法的局限性，并实现最先进的性能。以下是对该项目的详细介绍：项目背景与目标：ACE-Step项目针对当前音乐生成方法中存在的生成速度、音乐连贯性和可控性之间的权衡问题，提出了一种新的解决方案。项目的目标是建立一个快速、通用、高效且灵活的音乐AI基础模型，使...

2026-2-5 AI 5941 7

AI#开源图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 图片放大 # 效率工具 # 整合包

影像重获新生 SeedVR2 图片+视频批量超分神器一键整合包 AI 超分，让每一帧都惊艳 v20260205

SeedVR2 图像/视频超分工具这是一款基于 ComfyUI-SeedVR2_VideoUpscaler 官方推理 CLI 开发的图形化 Web 封装工具。它提供了一个现代化、汉化且高度可配置的网页界面，使用户无需编写命令行代码即可轻松对图片和视频进行高质量的 AI 超分辨率处理。核心功能1. 多模态与批量处理图片超分：支持单张图片或批量上...

2026-2-4 AI,开源 3786 0

AI 语音 # 工具 # 日常应用 # 文本 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 语音工具 # 效率工具 # 整合包

Qwen3-TTS：让文字拥有灵魂的声音艺术家文字生成语音语音克隆新增多人对话一键整合包 v20260130

Qwen3-TTS 开源项目介绍Qwen3-TTS 是由 Qwen 团队开发的一系列强大语音生成模型，于 2026 年 1 月 22 日正式发布。该项目提供全面的语音生成能力，包括语音克隆、语音设计、超高质量类人语音生成和基于自然语言的语音控制，为开发者和用户提供了目前最广泛的语音生成功能集。核心特性1. 多语言支持Qwen3-TTS 覆盖 ...

2026-1-30 AI 7553 4

AI 图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包 # 文生图

Z-Image（造相）AI文生图 v20260128 一键整合包，支持批量生成图片，可直接用于生产的一键整合包

Z-Image（造相）是阿里巴巴通义实验室（Tongyi MAI）推出的高效图像生成基础模型家族，以"小参数、高质量、极速推理"为核心设计理念，在开源图像生成领域树立了新的性能标杆。核心技术特点参数规模与架构：采用 60 亿参数（6B）的轻量级设计，基于创新的可扩展单流扩散 Transformer（S3-DiT）架构，将文...

2026-1-28 AI 6215 10

AI 图像处理 # 工具 # 图像编辑 # 图形图像 # 图片处理 # 人工智能 # AI # 语音工具 # 整合包

Qwen-Image-Edit-Object-Manipulator 一个工具搞定加物、去杂、缩放与服装设计一键整合包 v20260128

欢迎使用基于 Qwen-Image-Edit 模型的全功能 AI 图像编辑工具。本项目集成了先进的 SDNQ 量化技术，将庞大的大语言模型与扩散模型压缩至极致，在保持高质量输出效果的同时，大幅降低了显存占用并提升了推理速度。这不是一个简单的图像滤镜工具，而是一个能够理解复杂自然语言指令的“数字修图师”。通过动态加载专用的 LoRA 适配器，它...

2026-1-27 AI 6110 2

AI#开源语音 # 神器 # 人工智能 # AI # 文字 # 字幕 # 识别 # 利器 # 整合包

开源免费 AI语音识别转文字工具，制作视频字幕的利器 stt v20250805 整合包附全部模型

下面文字是作者原话这是一个离线运行的本地语音识别转文字工具，基于 fast-whipser 开源模型，可将视频/音频中的人类声音识别并转为文字，可输出json格式、srt字幕带时间戳格式、纯文字格式。可用于自行部署后替代 openai 的语音识别接口或百度语音识别等，准确率基本等同openai官方api接口。部署或下载后，双击 start.e...

2026-1-23 AI,开源 5950 3

AI 图像处理 # 工具 # 日常应用 # 图像编辑 # 绿色软件 # 图形图像 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包

深度整合 FLUX.2-klein-base-9B：一款为内容创作者打造的本地化 AI 绘图+多图片编辑工具一键整合包 v20260123

🎨 FLUX.2 Klein 本地图像生成与编辑工具 —— 功能详解这是一款基于FLUX.2 Klein 模型的本地化 AI 图像生成与编辑工具，专为内容创作者、自媒体运营者和设计师打造。无需联网，完全离线运行，支持文生图与图生图编辑，界面简洁直观，开箱即用。🖼️ 功能一：文生图（Text-to-Image）输入一段中文或英文提示词，即可生成...

2026-1-23 AI 5764 21

AI 语音 # 工具 # 日常应用 # 文本 # 绿色软件 # 人工智能 # AI # 免费 # 语音工具 # 效率工具 # 整合包

Qwen3-TTS 通义千问推出的高质量文本转语音工具，API调用，无字数限制，批量生成，小巧，轻量，无需显卡即可快速生成语音，剑二十七二次开发一键整合包 v2060119 4.0

一、什么是 TTS？TTS（Text-To-Speech）是一种将文字转换为自然语音的技术，广泛应用于语音助手、有声书、导航播报、智能客服等场景。二、Qwen-TTS功能简介该项目提供了一个简单的 Web 界面（基于 Gradio），用户可以输入任意文本，并通过 Qwen 的 TTS 模型生成对应的语音文件。该工具支持中文和英文的语音合成。🔧...

2026-1-19 AI 1万 9

AI#开源语音 # 工具 # 日常应用 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 语音工具 # 整合包

轻量、快速、免费、无需显卡 EasyTTS 重新定义本地 TTS 体验一键整合包 v20260117

EasyTTS（由 GitHub 用户 yunchenqwq 开发）是一个专注于中文语音合成的开源文本转语音（Text-to-Speech, TTS）系统，其核心目标是提供一个无需复杂依赖、无需训练、本地运行、开箱即用的高质量 TTS 解决方案。该项目特别针对中文用户在实际使用中常见的痛点（如多音字错误、语调生硬、部署困难等）进行了优化，强调...

2026-1-17 AI,开源 3288 0

开源工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 效率工具 # 整合包

VoiceSculptor：基于指令驱动的下一代语音合成开源框架——让AI语音拥有精准的情感与音色控制能力 v20260108 一键整合包

🎵 VoiceSculptor - 指令驱动的语音合成模型📌 项目概述VoiceSculptor是由ASLP实验室（Audio, Speech and Language Processing Laboratory）开发的一款先进的指令式文本到语音（instruct text-to-speech）开源模型。2该项目代表了语音合成技术的前沿发展方...

2026-1-7 开源 3001 0

AI 图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 整合包

AI 绘万象，细节见真章：Qwen-Image-2512 专业AI图像生成支持批量生成图片一键整合包 v20260105

Qwen-Image-2512 图像生成器一键整合包基于 Qwen3 大模型的专业级 AI 图像生成工具采用 BNB-NF4 4-bit 量化优化技术，在保障超高图像质量的同时显著降低硬件资源消耗，为创作者提供流畅、高效、稳定的 AI 绘图体验。搭载直观的 Gradio Web 界面，告别命令行，一键生成专业级图像。⚙️ 系统要求显卡：NV...

2026-1-5 AI 4579 5

AI#开源工具 # 神器 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

GPT-SoVITS2507+SAVA46 一个强大的开源工具，专注于少样本语音转换和文本到语音（TTS）的合成一键整合包

GPT-SoVITS是一个强大的开源工具，专注于少样本语音转换和文本到语音（TTS）的合成。该工具由RVC-Boss团队开发，并在GitHub上公开分享，为用户提供了一个灵活且功能丰富的平台，以满足语音合成的多样化需求。核心功能GPT-SoVITS的核心功能包括零样本和少样本TTS。零样本TTS允许用户仅通过输入一个5秒的语音样本，就能即时体...

2026-1-4 AI,开源 1.1万 4

AI#软件开源 # 人工智能 # AI # 整合包

人工智能AI相关工具软件合集整理

一键修复老照片、智能上色、超清还原，去除水印，转动漫 ——全能AI图像编辑神器来了！beterpic造相 Z-Image-Turbo AI生图大模型高性能AI图像生成工具 5秒一张图片支持批量生图一键整合包一键生成AI绘画提示词：让你的图片秒变顶级写真描述跟之前的图片反推工具不同的是这个会思考 thinkpic视频4倍高清修复，一键...

2026-1-1 AI,软件 4.6万 16

开源工具 # 日常应用 # 绿色软件 # 图形图像 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包

洗图必备基于 Z-Image Turbo 的多模态 ControlNet 工具：ZIT-ControlNet v2.0 一键整合包

ZIT-ControlNet（Z-Image Turbo ControlNet）—— 精准可控的 AI 图像生成与编辑工具项目简介ZIT-ControlNet（全称Z-Image Turbo ControlNet）是一个基于ControlNet 技术构建的开源图像生成控制项目，致力于在生成图像时实现高精度引导与编辑，同时最大程度保留原始图像的...

2025-12-23 开源 1.1万 12

AI#开源工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 语音工具 # 效率工具 # 整合包

"方言通+翻译官：一个AI，能说18种中国方言和9国语言" Fun-CosyVoice3-0.5B AI语音生成工具一键整合包 v20251217

CosyVoice：基于大语言模型的先进语音合成系统CosyVoice 是一个由 FunAudioLLM 团队开发的开源文本到语音（TTS）系统，目前已迭代至Fun-CosyVoice 3.0版本。该项目基于大语言模型（LLM）架构，在语音合成领域实现了多项技术突破。核心技术特点Fun-CosyVoice 3.0作为最新版本，在内容一致性、说...

2025-12-17 AI,开源 5196 1

AI#开源工具 # 日常应用 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 效率工具 # 整合包

GLM-TTS 大语言模型重塑语音合成 3秒克隆人声？GLM-TTS 做到了！声音克隆相似度极高一键整合包 v20251212

GLM-TTS是由ZAI 组织开发并开源的高质量文本转语音（Text-to-Speech, TTS）系统。它基于大语言模型（LLM），专注于实现可控、富有情感表达的零样本语音克隆，并通过多奖励强化学习框架显著提升传统 TTS 系统的自然度与表现力。核心特性🗣️ 零样本语音克隆仅需3–10 秒的目标说话人提示音频，即可克隆任意声音，无需微调或说...

2025-12-12 AI,开源 4670 6

AI#开源语音 # 工具 # 开源 # 人工智能 # AI # 免费 # 语音工具 # 整合包

"90分钟不间断！微软新AI能把你的文字变成专业播客一键整合包 VibeVoice v20251211

🎙️ VibeVoice：你的超级AI配音员"把文字变成自然对话的魔法工具"🌟 什么是VibeVoice？想象一下，有一位永不疲倦的配音员，能一口气生成90分钟不间断的语音内容，还能在对话中自如切换不同角色的声音——这就是微软开发的VibeVoice，一款革命性的AI语音生成工具！💡 它能为你做什么？（实用场景）场景用途效...

2025-12-11 AI,开源 8021 18

AI#开源工具 # 日常应用 # 音乐 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包

AI音乐生成工具v2.0 基于 DiffRhythm 二次开发。webui界面不卡死，速度快英伟达显卡6g即可运行, 一键整合包

DiffRhythm：基于差分节奏建模的通用音乐流派分类开源项目DiffRhythm是由ASLP实验室提出的开源项目，旨在通过创新的差分节奏建模（Differential Rhythm Modeling）框架解决音乐流派分类任务。该项目结合传统信号处理与深度学习技术，从节奏这一音乐核心要素出发，构建了具有强解释性和泛化能力的分类模型。其代码已...

2025-12-7 AI,开源 6052 6

AI 工具 # 视频处理 # 绿色软件 # 人工智能 # AI # 大模型 # 整合包

AI智能去水印神器 27Watermark v2.0 一键去除视频水印，保持原画质 v20251012 针对sora和通义AI生成的视频水印去除效果非常好

📖 什么是27Watermark？27Watermark 是一款基于先进AI技术的智能视频和图片去水印工具。它使用最新的FLUX.1-Kontext模型，能够智能识别并移除视频和图片中的水印，同时完美保持原始内容的完整性和质量。🎯 核心功能✨ 智能去水印精准识别：AI自动识别水印位置和类型智能修复：用周围背景自然填补水印区域质量保持：保持原始...

2025-11-21 AI 8163 2

AI#开源图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 整合包

图像生成神器：用AI画图，零代码也能玩，拖拽操作就能生成精美图片ComfyUI 官方英伟达显卡版 v0.3.70

ComfyUI 是一个基于节点（Node-based）的图形界面工具，专为使用 Stable Diffusion及其衍生模型进行图像生成而设计。它通过可视化的流程图方式，让用户无需编写代码即可构建复杂的生成工作流。🧩 1. 可视化流程图系统节点式编辑器：将每一个操作（如加载模型、输入提示词、图像采样等）封装为独立节点，用户可以通过拖拽连接这些...

2025-11-19 AI,开源 8269 3