轻量、快速、免费、无需显卡 EasyTTS 重新定义本地 TTS 体验 一键整合包 v20260117,AI工具，开源整合包

AI#开源图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 效率工具 # 整合包

轻量高效 AI生图工具基于 Stable Diffusion XL 模型二次开发，6G英伟达显卡就可以愉快玩耍 Diaomo v9.0 六秒出图支持更换模型+图片超分+图生图

基于 Stable Diffusion XL 的一站式 AI 绘画工作台，支持文生图、图生图与批量自动化生产，内置智能中文翻译，零门槛直接用中文描述生成高质量图像。一、三大核心创作模式1. 文生图（Text-to-Image）输入一段画面描述，AI 直接生成全新图像。智能中文提示词：输入中文即可，系统自动调用轻量翻译模型转为英文提示词；若输入...

2026-5-17 AI,开源 1.6万 31

AI 图像处理 # 工具 # 日常应用 # 图形图像 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包 # 文生图

一句话画出动漫世界！支持中文的AI绘画神器来了 Anima文生动漫图片AI大模型 ,8G英伟达显卡即可愉快玩耍

Anima 动漫文生图基于 circlestone-labs/Anima 模型的图像生成工具。支持中文提示词自动翻译，生成结果自动保存至本地 output 目录。✨ 主要特性🎨 高质量动漫风格生成 – 专精二次元、动漫、CG 渲染。🌐 中文提示词自动翻译 – 使用...

2026-5-16 AI 4.1万 105

AI 图像处理 # 图形图像 # 图片处理 # 人工智能 # AI # 图片编辑 # 效率工具 # 整合包

klein-edit AI图片编辑工具摄影师狂喜：86个AI修图预设，从人像到风景全覆盖 v1.0 20260514更新记录新增lora支持

FLUX.2 Klein 图像编辑工具：86个一键预设，打造专业级本地 AI 图像处理工作站一、项目概述在 AI 图像生成与编辑领域，FLUX系列模型以其卓越的图像理解能力和编辑精度备受开发者青睐。本文介绍的这套基于FLUX.2-klein的本地图像编辑工具，通过Gradio构建了一个功能完备的 Web 界面，集成了86个实用预设功能，支持多...

2026-5-14 AI 5751 7

AI 图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 整合包 # 文生图

百度开源图片大模型文生图 ERNIE-Image-Turbo 一键整合包 8G英伟达 16秒出图文字理解能力超强 v20260416

🎨 ERNIE-Image-Turbo 模型介绍【核心定位】• 极速生成：基于单流 Diffusion Transformer 架构，仅需 8 步推理即可完成高质量图像生成，速度提升 6 倍以上• 精准可控：强调对复杂指令的准确还原，适合需要内容精确落地的实用型创作任务• 轻量化部署：经蒸馏优化，可在消费级显卡上流畅运行，大幅降低商用门槛【...

2026-5-14 AI 4173 7

AI#开源工具 # 小说 # 绿色软件 # 开源 # 人工智能 # AI

网文作者的 AI 外挂：日更万字还能保证剧情连贯的秘密武器 AI自动写小说 AI_NovelGenerator V1.4.4

AI_NovelGenerator 是由 YILING0013 开发并开源在 GitHub 上的一款基于大语言模型的 AI 长篇小说自动生成工具。它专注于解决 AI 写作中最棘手的长文本连贯性问题，能够创作多章节长篇小说，并确保剧情连贯、设定统一、伏笔合理呼应。核心定位"让 AI 从写作玩具变成生产力工具"传统 AI 写...

2026-5-9 AI,开源 7564 0

AI#开源工具 # 日常应用 # 音乐 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包

输入歌词，AI自动作曲：你的音乐创作助手 HeartMuLa 一键中文整合包 v20260507

HeartMuLa/heartlib：开源音乐基础模型家族深度解析项目定位与愿景HeartMuLa是一个全面的开源音乐基础模型家族，旨在推动跨任务与多模态的大规模音乐理解与生成技术发展。该项目不仅仅是一个单一的模型，而是一个完整的生态系统，涵盖了从音乐理解到完整曲目生成的全链条能力。其核心目标是为研究社区和开发者提供可复现、可扩展的音乐AI工...

2026-5-7 AI,开源 9102 9

AI 工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 整合包

索尼开源AI模型 Woosh 一句话生成音效，一键为视频配音一键AI整合包解压即可使用 v20260424

索尼人工智能研究院（Sony AI）发布的音效生成基础模型📌 项目定位Woosh是专为音效生成（Sound Effects）优化的多模态生成式 AI 模型套件，旨在为音频研究社区提供高质量的开源基座模型，支持文本到音频（T2A）和视频到音频（V2A）两大核心任务。🔗 技术报告：arXiv:2604.01929🧩 核心模块组成1️⃣ Woosh...

2026-4-24 AI 3557 0

AI 工具 # 日常应用 # 图像编辑 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 大模型 # 效率工具 # 整合包

京东开源图片编辑AI大模型 JoyAI-Image-Edit v20260422 二次开发一键整合包附演示和操作教程

JoyAI-Image-Edit 是京东开源的多模态基础模型，专注于指令引导的图像编辑任务。它基于 JoyAI-Image 多模态底座构建，通过自然语言指令实现对图像的精确、可控编辑。🔹 核心技术特点1. 强大的空间理解能力场景解析：自动识别图像中的物体、区域及空间关系关系定位：精准理解"物体A在物体B左侧"等空间描述指令...

2026-4-22 AI 5543 0

AI 图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 图片处理 # 人工智能 # AI # 免费 # 效率工具 # 整合包

一键生成AI绘画提示词：让你的图片秒变顶级写真描述跟之前的图片反推工具不同的是这个会思考 thinkpic-6.0-20260420

这个工具是做什么的？这个程序可以自动为你的人物照片生成一段“AI绘画提示词”。简单来说：你放一张人物照片进去，它就能写出一段详细、生动、充满吸引力的文字描述，这段文字可以直接用在 AI 绘画工具（比如 Stable Diffusion）中，让 AI 画出类似风格或效果的图片。例如，它会描述：人物有多美、眼睛多勾人、嘴唇多诱人；身材曲线多么火辣...

2026-4-20 AI 1.4万 8

AI 图像处理 # 工具 # 日常应用 # 图像编辑 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 多图预览 # 效率工具 # 整合包

本地部署一键整合包FLUX.2-klein-9B-KV-LoRA-Studio 图像编辑大模型海量lora支持 v3.0

FLUX.2-Klein-LoRA-Studio是一款基于 Gradio 构建的本地化图像编辑工作台，集成 Black Forest Labs 最新发布的FLUX.2-klein-9B多模态生成模型，支持通过 LoRA 适配器实现多样化图像编辑任务。⚡ 核心功能🔹 多图像输入编辑支持上传 1~2 张参考图：Picture 1（Base）：作为...

2026-4-14 AI 4938 8

AI 图像处理 # 工具 # 日常应用 # 图像编辑 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包

你想怎么改图？它就怎么改 Qwen-Image-Edit-2511 实现真正可控的 AI 图片编辑支持海量lora v20260413 一键整合包

Qwen-Image-Edit-2511 是由阿里云推出的新一代多模态图像编辑大模型，属于 Qwen 系列在视觉生成与编辑方向的重要迭代。该模型基于 Qwen-Image-Edit 系列的持续演进（如 2509、2511 版本），在保留原始图像语义结构和细节的前提下，支持高保真、高可控性的图像编辑任务。该模型主要特点包括：高保真图像编辑：在执...

2026-4-13 AI 7505 16

AI 工具 # 文本 # 绿色软件 # 人工智能 # AI # 整合包

AI 提示词智能增强工具可生成一致性强的文生图提示词，可直接用于图像生成的专业级提示词，专为AI图像生成创作者打造 27PromptEnhancer v2.0

本工具基于 Qwen3 系列轻量化大模型（Qwen3-0.6B 与 Qwen3-1.7B，GPTQ Int8 量化版本），专为图像生成（如 Stable Diffusion、Midjourney 等）用户设计，帮助你将简单粗糙的提示词自动优化为高细节、高表现力、风格明确的专业级描述。🔧 核心功能双模型可选Qwen3-0.6B：轻量快速，适合日...

2026-4-12 AI 4288 2

AI 语音 # 工具 # 日常应用 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # tts # 语音工具 # 效率工具 # 整合包

小米开源大模型AI语音合成，600种语言+声音克隆，生成速度提升40倍不限字数支持自动语气标签 OmniVoice v20260407 一键整合包

OmniVoice：600+语种的语音合成新纪元剑二十七 · 技术前沿🔹一句话了解由小米下一代 Kaldi 团队（k2-fsa）打造的超大规模多语言零样本 TTS 模型，支持600+ 语种，以卓越音质与极速推理，重新定义语音合成体验。✨ 核心能力一览🗣️全球语种覆盖支持 600+ 语言与方言，从英语、中文到低资源语种，一模型通全球。🔁声音克隆...

2026-4-7 AI 4352 0

AI#开源工具 # 日常应用 # 绿色软件 # 编程开发 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包 # deepseek

DeepSeek 本地部署一键运行 DeepSeek-tool v18，解压即可使用最低支持2G显卡支持99%的语言大模型支持联网搜索+知识库

琢磨了一天，把DeepSeek的本地部署彻底完成了，并测试了一下午基本完美运行了。当然AI环境你们必须要先安装好。然后下载这个这个本地部署压缩，解压即可完美运行。我的4070ti spuer 运行32b已经是极限了，所以我也只能把模型下载到32b了，如果你们有更牛的显卡，可以继续下载模型。这是我运行14b的截图你们看看显...

2026-4-5 AI,开源 1.7万 36

AI 语音 # 工具 # 日常应用 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 语音工具 # 效率工具 # 整合包

一键克隆任意音色，生成自然口语级语音 1B/3.5B 双模型自由切换，还原你最真实的声音 LongCat-AudioDiT v1.0 20260402 更新一键整合包

LongCat-AudioDiT 语音合成工具 - 功能说明🎯 主要功能本工具基于美团开源的 LongCat-AudioDiT 扩散模型，提供高质量的文本到语音合成，并支持零样本语音克隆（只需几秒参考音频即可克隆音色）。界面采用 Gradio 构建，操作直观，适用于中文和英文混合文本。📌 核心功能模块1. 模型选择支持 1B&nbs...

2026-4-2 AI 3471 2

AI 图像处理 # 图像编辑 # 批量处理 # 在线 # 免费 # webp图片

TTS开源新王炸！Ming-omni-tts：一个模型搞定语音/音乐/音效，还能听懂你的情绪指令新增支持长文本一键整合包 v20260327

Ming-omni-tts是一款高性能的统一音频生成模型，能够在单通道中实现语音、环境音和音乐的协同合成，并支持对语音属性的精细化控制。其核心创新在于将多种音频模态统一建模，同时保持高效的推理速度与专业的文本处理能力。🚀 核心能力1️⃣ 精细化语音控制支持通过简单指令精确调控语速、音量、音高、情绪、方言等属性粤语方言控制准确率达93%，情绪控...

2026-3-26 AI 9159 16

AI#开源工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 效率工具

语音识别 + 声音克隆 + 模型训练，一个工具全搞定！Easy-Voice-Toolkit v1.3.5

Easy-Voice-Toolkit 是由 Spr-Aachen开发的一款开源、用户友好的 AI 语音工具箱，旨在为开发者、研究人员和爱好者提供一站式、本地化部署的语音处理解决方案。项目设计注重易用性与功能性，支持多种主流语音任务，适用于科研实验、产品原型开发、语音助手构建等多种应用场景。🌟 核心特性本地部署：所有功能均可在本地运行，保障数据...

2026-3-10 AI,开源 5237 0

AI#开源工具 # 开源 # 人工智能 # AI # 大模型 # deepseek

lmstudio 一款强大而灵活的本地大模型部署工具我的rx580 都能流畅运行附模型文件支持DeepSeek v0.4.6

LM Studio是由lmstudio.ai提供的一款强大而灵活的本地大模型部署工具。它不仅降低了机器学习的使用门槛，还为用户提供了一个安全、高效、隐私保护的环境，以便在本地运行各种大型语言模型。首先，LM Studio具备强大的离线使用能力。这意味着用户无需互联网连接即可运行模型，极大地提升了使用的便捷性和灵活性。对于那些需要保护数据隐私或...

2026-3-5 AI,开源 1万 15

AI 图像处理 # 日常应用 # 图像编辑 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包

EditMGT 用文字"指挥"AI修图，想改哪里改哪里 5秒即可完成编辑一键整合包 v20260219

EditMGT（Masked Generative Transformer for Image Editing）是一个基于掩码生成式变压器的先进图像编辑框架，由字节跳动（ByteDance）主导研发，联合上海交通大学、新加坡国立大学、香港科技大学（广州）等高校共同完成。✨ 核心特点1. 技术创新采用**掩码生成式变压器（Masked Gene...

2026-2-18 AI 3624 3

AI#开源图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包

电商降本增效神器：FASHN VTON v1.5 模特图自动生成新一代开源虚拟试衣黑科技一键整合包 v20260210

FASHN VTON v1.5 是由 Fashn AI 推出的开源虚拟试衣项目。该项目基于先进的扩散模型技术，旨在解决电商、时尚设计和图像生成领域中“模特换装”的核心需求。它能够将任意一张服装图片逼真地“穿”在指定人物身上，同时保持人物的面部、姿态和背景环境高度一致。以下是该项目的详细介绍：1. 项目概述FASHN VTON v1.5 是一个...

2026-2-10 AI,开源 5058 7

AI#开源工具 # 日常应用 # 音乐 # 绿色软件 # 人工智能 # AI # 整合包

SoulX-Singer：一键克隆任意声音，让AI替你唱歌无需训练，秒变歌手一键整合包 v20260208

SoulX-Singer 是一个由 Soul-AI Lab 开发的零样本歌声合成（Zero-Shot Singing Voice Synthesis）开源项目。该项目旨在通过先进的深度学习技术，让用户能够在无需大量训练数据的情况下，克隆任意人的声音并用于歌声合成。核心功能1. 零样本音色克隆SoulX-Singer 的核心能力是零样本音色迁移...

2026-2-8 AI,开源 6903 4

AI#开源工具 # 日常应用 # 绿色软件 # 开源 # 人工智能 # AI

"让AI有‘灵魂’的神器：开源项目免费下载，语音聊天不尬聊，打游戏能当军师，关键数据不传云端！" airi v0.8.4

Project AIRI 是一个基于大语言模型驱动的AI虚拟伴侣系统，旨在创建AI"女仆"（waifu）/虚拟角色的灵魂容器，将这些虚拟角色带入现实世界。该项目致力于重现Neuro-sama（一个知名的AI虚拟角色）的功能高度，完全由LLM和AI驱动。核心功能🎙️ 实时语音聊天支持与AI进行自然流畅的语音对话交互实现低延迟...

2026-2-7 AI,开源 7119 5

AI#开源工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 整合包

轻如羽，快如电 LuxTTS 语音克隆一键整合包 CPU也能跑，30秒音频 1秒生成 v20260206

LuxTTS 项目介绍LuxTTS 是由开发者 Yatharth Sharma 创建的开源轻量级文本转语音（TTS）系统，专注于高质量零样本语音克隆与超高速推理。项目在保持卓越音质的同时，显著降低了计算资源需求，适用于资源受限环境下的语音合成任务。核心特性1. 零样本语音克隆仅需 3–5 秒参考音频即可克隆任意人声，无需针对目标说话人进行额外...

2026-2-6 AI,开源 6816 22

AI 语音 # 音乐 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 语音工具 # 效率工具 # 整合包

ACE-Step-1.5 解锁音乐创作无限可能，以技术革新重塑音乐生成生态，AI生成音乐翻唱音乐重绘音乐支持中文 v20260206

ACE-Step是一个开源的音乐生成基础模型项目，旨在通过全面的架构设计克服现有音乐生成方法的局限性，并实现最先进的性能。以下是对该项目的详细介绍：项目背景与目标：ACE-Step项目针对当前音乐生成方法中存在的生成速度、音乐连贯性和可控性之间的权衡问题，提出了一种新的解决方案。项目的目标是建立一个快速、通用、高效且灵活的音乐AI基础模型，使...

2026-2-5 AI 5941 7

AI#开源图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 图片放大 # 效率工具 # 整合包

影像重获新生 SeedVR2 图片+视频批量超分神器一键整合包 AI 超分，让每一帧都惊艳 v20260205

SeedVR2 图像/视频超分工具这是一款基于 ComfyUI-SeedVR2_VideoUpscaler 官方推理 CLI 开发的图形化 Web 封装工具。它提供了一个现代化、汉化且高度可配置的网页界面，使用户无需编写命令行代码即可轻松对图片和视频进行高质量的 AI 超分辨率处理。核心功能1. 多模态与批量处理图片超分：支持单张图片或批量上...

2026-2-4 AI,开源 3785 0

AI 语音 # 工具 # 日常应用 # 文本 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 语音工具 # 效率工具 # 整合包

Qwen3-TTS：让文字拥有灵魂的声音艺术家文字生成语音语音克隆新增多人对话一键整合包 v20260130

Qwen3-TTS 开源项目介绍Qwen3-TTS 是由 Qwen 团队开发的一系列强大语音生成模型，于 2026 年 1 月 22 日正式发布。该项目提供全面的语音生成能力，包括语音克隆、语音设计、超高质量类人语音生成和基于自然语言的语音控制，为开发者和用户提供了目前最广泛的语音生成功能集。核心特性1. 多语言支持Qwen3-TTS 覆盖 ...

2026-1-30 AI 7549 4

AI 图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包 # 文生图

Z-Image（造相）AI文生图 v20260128 一键整合包，支持批量生成图片，可直接用于生产的一键整合包

Z-Image（造相）是阿里巴巴通义实验室（Tongyi MAI）推出的高效图像生成基础模型家族，以"小参数、高质量、极速推理"为核心设计理念，在开源图像生成领域树立了新的性能标杆。核心技术特点参数规模与架构：采用 60 亿参数（6B）的轻量级设计，基于创新的可扩展单流扩散 Transformer（S3-DiT）架构，将文...

2026-1-28 AI 6214 10

AI 图像处理 # 工具 # 图像编辑 # 图形图像 # 图片处理 # 人工智能 # AI # 语音工具 # 整合包

Qwen-Image-Edit-Object-Manipulator 一个工具搞定加物、去杂、缩放与服装设计一键整合包 v20260128

欢迎使用基于 Qwen-Image-Edit 模型的全功能 AI 图像编辑工具。本项目集成了先进的 SDNQ 量化技术，将庞大的大语言模型与扩散模型压缩至极致，在保持高质量输出效果的同时，大幅降低了显存占用并提升了推理速度。这不是一个简单的图像滤镜工具，而是一个能够理解复杂自然语言指令的“数字修图师”。通过动态加载专用的 LoRA 适配器，它...

2026-1-27 AI 6110 2

AI#开源语音 # 神器 # 人工智能 # AI # 文字 # 字幕 # 识别 # 利器 # 整合包

开源免费 AI语音识别转文字工具，制作视频字幕的利器 stt v20250805 整合包附全部模型

下面文字是作者原话这是一个离线运行的本地语音识别转文字工具，基于 fast-whipser 开源模型，可将视频/音频中的人类声音识别并转为文字，可输出json格式、srt字幕带时间戳格式、纯文字格式。可用于自行部署后替代 openai 的语音识别接口或百度语音识别等，准确率基本等同openai官方api接口。部署或下载后，双击 start.e...

2026-1-23 AI,开源 5949 3

AI 图像处理 # 工具 # 日常应用 # 图像编辑 # 绿色软件 # 图形图像 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包

深度整合 FLUX.2-klein-base-9B：一款为内容创作者打造的本地化 AI 绘图+多图片编辑工具一键整合包 v20260123

🎨 FLUX.2 Klein 本地图像生成与编辑工具 —— 功能详解这是一款基于FLUX.2 Klein 模型的本地化 AI 图像生成与编辑工具，专为内容创作者、自媒体运营者和设计师打造。无需联网，完全离线运行，支持文生图与图生图编辑，界面简洁直观，开箱即用。🖼️ 功能一：文生图（Text-to-Image）输入一段中文或英文提示词，即可生成...

2026-1-23 AI 5764 21

AI 语音 # 工具 # 日常应用 # 文本 # 绿色软件 # 人工智能 # AI # 免费 # 语音工具 # 效率工具 # 整合包

Qwen3-TTS 通义千问推出的高质量文本转语音工具，API调用，无字数限制，批量生成，小巧，轻量，无需显卡即可快速生成语音，剑二十七二次开发一键整合包 v2060119 4.0

一、什么是 TTS？TTS（Text-To-Speech）是一种将文字转换为自然语音的技术，广泛应用于语音助手、有声书、导航播报、智能客服等场景。二、Qwen-TTS功能简介该项目提供了一个简单的 Web 界面（基于 Gradio），用户可以输入任意文本，并通过 Qwen 的 TTS 模型生成对应的语音文件。该工具支持中文和英文的语音合成。🔧...

2026-1-19 AI 1万 9

AI#开源语音 # 工具 # 日常应用 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 语音工具 # 整合包

轻量、快速、免费、无需显卡 EasyTTS 重新定义本地 TTS 体验一键整合包 v20260117

EasyTTS（由 GitHub 用户 yunchenqwq 开发）是一个专注于中文语音合成的开源文本转语音（Text-to-Speech, TTS）系统，其核心目标是提供一个无需复杂依赖、无需训练、本地运行、开箱即用的高质量 TTS 解决方案。该项目特别针对中文用户在实际使用中常见的痛点（如多音字错误、语调生硬、部署困难等）进行了优化，强调...

2026-1-17 AI,开源 3288 0

站长推荐