一键提取伴奏/人声！轻松搞定音乐音轨分离 支持批量处理 开源一键整合包 6G N卡就可以愉快玩耍 UVR5 UI v1.8.4,

AI#开源工具 # 音乐 # 绿色软件 # 字体 # 开源 # 人工智能 # AI # 整合包 # 音乐生成

这个开源AI，让你0基础创作歌曲 YuE v20250902 支持50系显卡，最低英伟达12G 显卡

YuE 是由 Multimodal Art Projection (MAP) 团队推出的开源音乐生成基础模型项目，旨在推动开放、可控、高质量的 AI 音乐生成技术发展。该项目专注于实现从文本（如歌词和风格描述）到完整歌曲的端到端生成，是当前 AI 音乐领域中一个功能强大且具有前瞻性的开源解决方案。核心特点与技术亮点全曲生成 (Full-Son...

2025-9-1 AI,开源 3289 0

AI#开源图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 整合包

nunchaku-flux.1-kontext-dev AI生图一键整合包最低4G显卡可运行 30秒出图 v20250830 支持无限生图+批量图片编辑+lora模型+超分

心血来潮，想试试FLUX.1-Kontext-dev 这个新出的模型，但是奈何显卡不是很牛X，生图效率不够高，所以找了下，发现nunchaku 双截棍这个量化模型还不错，就花了点时间学习下。然后又花点时间写了个界面，方便大伙来玩玩这个。我的4070ti spuer 16G 30步出1024x1024 大概30秒，显卡占用不到4G，这个效...

2025-8-31 AI,开源 2.1万 95

AI#开源工具 # 视频处理 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 整合包

腾讯AI会“配音”了！给视频能自动配上声音+音乐一键整合包 HunyuanVideo-Foley v20250830

HunyuanVideo-Foley 是一个基于深度学习的音效生成系统，能够根据输入的视频内容，自动识别其中的视觉动作和场景（如脚步、关门、物体碰撞等），并生成与之同步、逼真的环境音效或动作音效。这类技术在影视后期、短视频制作、游戏开发、虚拟现实等领域具有广泛的应用前景，能够显著降低人工配音效的成本和时间。🔧 核心功能视频驱动音效生成（Vid...

2025-8-29 AI,开源 4860 16

AI#开源工具 # 绿色软件 # 开源 # 人工智能 # AI # 数字人 # 整合包

开源免费、无时间限制数字人图片+音频一键生成视频 InfiniteTalk v20250825

InfiniteTalk 是由 MeiGen-AI 团队开发的先进开源项目，专注于解决长视频生成中的关键挑战——实现无限长度的高质量会说话视频生成。该项目突破了传统数字人技术的时长限制，能够生成任意长度的自然流畅的"会说话"视频内容。核心功能与特点1. 无限长度视频生成突破性技术：解决了传统TTS(文本转语音)和数字人视频...

2025-8-24 AI,开源 7061 27

安卓工具 # 快手 # 日常应用 # 视频处理 # 转换翻译 # 开源 # 抖音 # 人工智能 # AI # 免费 # 效率工具

视频创作者必备！KrillinAI提供从翻译到配音的全流程解决方案，智能分段与精确字幕，打造专业级视频内容 v1.4.0

KrillinAI是一个基于AI大模型的视频翻译和配音工具，它提供了专业级的翻译服务以及一键部署的全流程解决方案。这个开源工具旨在帮助用户轻松实现视频内容的本地化与增强，使其能够适配多种内容平台，如YouTube、TikTok、Bilibili、抖音（国内版）、微信视频号、快手等。KrillinAI的核心功能包括视频翻译、配音与声音克隆、字幕...

2025-8-24 安卓 5110 4

AI 工具 # 日常应用 # 绿色软件 # 开源 # 人工智能 # AI # 效率工具 # 整合包

赛博算命上线！让人工智能为你抽一支未来签赛博算命师一键整合包 v20250823

🔮 什么是 CyberFortune_Telling？这是一个基于人工智能模型驱动的虚拟占卜系统。它可能结合了自然语言处理、生成模型与命理知识库，能够根据用户输入的信息（如生辰、问题、关键词等），生成个性化的运势解读、塔罗牌占卜、星座分析或签文预测等内容。界面充满赛博朋克美学，科技感与神秘主义交织，带来前所未有的互动体验。🤖 技术亮点：基于M...

2025-8-23 AI 6066 14

AI#开源工具 # 视频处理 # 文本 # 绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 效率工具 # 整合包

Ovis2图片反推提示词工具v5.0 基于AI大模型反推图片+视频批量生成提示词英伟达6G显卡即可愉快玩耍

本工具基于Ovis2-4B和Ovis2-2B 这2个大模型制作而成。其实早之前我就有分享过反推提示词工具 moondream，但是我昨天遇到了这个大模型，发现功能更加强大，反推出来的提示更加丰富，更多细节描述。这个工具要求显卡比较低，英伟达显卡6g及以上就可以愉快玩耍了我用同一张图片反推提示词下面是Ovis2-4B生成的提示词The...

2025-8-21 AI,开源 1.9万 52

AI#开源图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 大模型 # 效率工具 # 整合包 # 文生图

开源·高速·高质：Shuttle Jaguar 生成电影级图像剑二十七二次开发 20秒出图最低6G英伟达显卡支持50系 v20250818

我在网上瞎逛的时候，发现了这个模型还不错，就花点时间做了二次开发。Shuttle Jaguar 是一款由 ShuttleAI 开发的文本生成图像（Text-to-Image）人工智能模型，专注于生成具有高度审美感、电影级质感和逼真视觉效果的图像。该模型能够在仅需四步推理的极短时间内，将自然语言描述的文本提示（prompt）转化为高质量的图...

2025-8-18 AI,开源 6121 9

AI 图像处理 # 工具 # 日常应用 # 神器 # 绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 效率工具 # 整合包

AI 一键换衣，想穿哪件试哪件！AI-Clothes-Changer 一键整合包支持50系显卡 v20250818

AI-Clothes-Changer 是一个基于深度学习的交互式图像生成项目，旨在实现“虚拟试衣”功能 —— 用户上传一张人物穿着衣服的照片，再上传一件想要试穿的服装图像，系统即可将目标服装自然地“穿”在人物身上，生成逼真的换装效果图像。🔍 核心功能虚拟换衣（Virtual Try-On）输入：一张人物全身照 + 一件衣服的正面图像（如 T ...

2025-8-18 AI 6034 5

AI#开源工具 # 绿色软件 # 开源 # 人工智能 # AI # 数字人 # 整合包

EchoMimic 一个由阿里巴巴推出的开源AI数字人项目支持50系显卡一键整合包 v3 20250815更新

EchoMimic是一个由阿里巴巴推出的开源AI数字人项目，该项目在数字人技术领域内实现了显著的创新与突破。以下是对EchoMimic的详细介绍：一、项目背景与意义随着人工智能、深度学习、计算机视觉以及自然语言处理技术的飞速发展，数字人技术逐渐成为连接现实世界与虚拟世界的重要桥梁。EchoMimic项目的诞生，旨在通过先进的技术手段，将静态图...

2025-8-15 AI,开源 6305 8

AI#开源图像处理 # 工具 # 神器 # 绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 整合包 # 文生图

不用会设计！用 FLUX.1-Krea-dev，打几个字就能出高质量图片剑二十七二次开发整合包 v2.0

FLUX.1 [Krea-dev] —— 是 Black Forest Labs 推出的 FLUX.1 系列文本到图像生成模型的一个变体，专为设计类应用优化。一、模型背景1. 开发者：Black Forest Labs由前 Stability AI 核心团队成员（包括部分 Stable Diffusion 开发者）创立。2024 年推出 FL...

2025-8-3 AI,开源 4751 11

AI#开源图像处理 # 工具 # 日常应用 # 神器 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包

让每一张旧照重获新生，从模糊老照片到高清重现：HYPIR 高清修复图片一键整合包 v20250801

HYPIR 是由 XPixel Group（一个专注于图像恢复与底层视觉研究的学术团队）提出的一种基于混合先验的图像恢复模型。该项目的核心目标是解决图像在退化过程中（如模糊、噪声、压缩等）丢失的细节信息，通过引入数据驱动先验与模型驱动先验的融合机制，实现高质量的图像复原。HYPIR 的名称来源于其核心思想：Hybrid Prior（混合先验）...

2025-8-1 AI,开源 1.3万 34

AI#开源工具 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 语音工具 # 整合包

E2/F5-TTS AI人工智能文字转语音工具，可克隆声音，可训练，一键中文整合包已支持最新50系显卡 v1.1.7

SWivid/F5-TTS 是一个开源项目，旨在提供一个基于 Diffusion Transformer 和 ConvNeXt V2 架构的文本到语音（TTS）系统，该系统名为 F5-TTS。F5-TTS 的全称是“A Fairytaler that Fakes Fluent and Faithful Speech with Flow Mat...

2025-8-1 AI,开源 1.3万 42

AI#开源工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 整合包

字节出品 MegaTTS3 - AI智能语音合成系统，文字秒变自然语音，支持多语言高质量输出 v20250725

MegaTTS3 是字节跳动开源的一个先进的文本到语音（TTS）合成系统，具有以下特点：🌟 核心特性1. 高质量语音合成基于扩散模型的语音生成技术支持高保真度的语音合成生成自然、流畅的语音输出2. 强大的语音克隆能力能够克隆特定人的声音特征只需少量参考音频即可实现声音复制保持原始音色的同时合成新内容3. 多语言支持支持中文、英文等多种语言跨语...

2025-7-25 AI,开源 5947 0

AI#开源图像处理 # 工具 # 日常应用 # 文本 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 整合包

阿里出品 Ovis-U1-3b 多模态理解、文本到图像生成+图像编辑。一键整合包

Ovis-U1 是由阿里巴巴AIDC-AI团队开发的一个先进的多模态大语言模型项目。这个项目专注于构建能够同时处理文本和图像信息的AI系统。核心特点多模态融合能力能够同时理解和处理文本与图像数据实现跨模态的信息理解和生成支持图文混合的输入输出场景统一架构设计采用统一的模型架构处理不同类型的模态数据简化了传统多模态系统中复杂的模块组合提高了模型...

2025-7-23 AI,开源 4200 0

AI#开源图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 整合包

LoRA 千面 AI图片编辑超N多风格转换 Kontext-Style-LoRAs v20250722

在huggingface瞎逛的时候，无意中发现了这个开源的模型，真的超级强，聚集了N多风格lora模型，操作也是极其简单，感觉可能有小伙伴能用的上，就花了时间做了整合，并进行了小小的二次开发，自我感觉还行。整合包说明1 支持50系显卡，最低英伟达8G显卡可以运行，如果你的显卡刚好是8G的话，可能内存要超过30G,安装好你显卡能支持的最高版本c...

2025-7-21 AI,开源 4356 6

AI#开源图像处理 # 工具 # 日常应用 # 绿色软件 # 办公软件 # 图形图像 # 图片处理 # 人工智能 # AI # 免费 # 效率工具 # 整合包

光影魔法来了！AI一键切换日光/夜景/霓虹灯效果 relighting-kontext v20250720

在网上瞎逛的时候，发现了这个模型，很不错，光影效果做出来很逼真，虽然我以前也做过一个类似的整合包，但是跟这个没法比，所以抽空进行了二次开发。🌟 Relighting Kontext [dev] LoRA v3 模型介绍Relighting Kontext [dev] LoRA v3是一个针对 FLUX.1-Kontext-dev模型优化的低秩...

2025-7-21 AI,开源 5457 10

AI#开源图像处理 # 工具 # 开源 # 人工智能 # AI # 免费 # 整合包

开源 UltraPixel 文生图超高分辨率出图细节非常丰富远超Stable-diffusion等一键整合包附视频演示 v20250717 增强版支持50系显卡

UltraPixel是一个由华为诺亚方舟实验室联合香港科技大学共同开发的开源项目，旨在生成具有丰富细节的高质量图像，其分辨率范围可以从1K一直延伸至6K。该项目不仅优化了细节处理，还显著提升了整体图像效果，将超高清图像合成推向了新的高峰。项目背景与目的随着人工智能技术的不断发展，生成高分辨率图像成为了一个研究热点。然而，现有的图像生成模型在生...

2025-7-18 AI,开源 6895 6

AI#开源视频处理 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

AI 视频生成新突破：FramePack 开源项目引领视频扩散技术变革一键汉化整合包 FramePack-F1 20250716更新支持magcache加速支持50系显卡

FramePack 是一个开源项目，旨在通过创新的神经网络结构实现高效的视频生成。以下是对其的详细介绍：项目概述FramePack 是 “Packing Input Frame Contexts in Next - Frame Prediction Models for Video Generation” 论文的官方实现和桌面软件。它采用逐帧...

2025-7-16 AI,开源 1.8万 48

AI#开源图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费

FLUX.1-Kontext-dev：图文协同，让AI图像编辑更可控,支持局部重绘与图文控制,英伟达12G可运行 v20250716

前段时间一直死劲在更新的nunchaku-flux.1-kontext-dev，还算受到大伙的欢迎，主要是显卡要求很低。运行速度快，但是有些好显卡的小伙伴说能否出一个出图质量更好的版本？量化不要这么强的，对出图有一定要求的小伙伴。所以我今天就分享了这个FLUX.1-Kontext-dev，虽然也是nunchaku量化下的，但是相对来讲这个出图...

2025-7-15 AI,开源 3178 6

AI#开源工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 效率工具 # 整合包

FishAudio 推出 OpenAudio-S1-Mini：革新语音合成技术, 一键整合包 v20250627

openaudio-s1-mini 是一个开源的音频生成模型，主要特点是能够将文本高效地转换为自然流畅的语音。下面是对该模型的详细介绍：基本信息模型名称：openaudio-s1-mini开源平台：ModelScope.cn开发者：FishAudio 团队主要特点高效的文本转语音能力：该模型经过大量数据训练，能够将输入的文本快速转换为自然流畅...

2025-6-27 AI,开源 5124 13

AI#开源工具 # 视频处理 # 绿色软件 # 开源 # 抠像 # 人工智能 # AI # 整合包

MiniMax-Remover：基于 Minimax 优化的高效视频物体移除工具 v20250621 一键整合包

MiniMax-Remover是一个基于 minimax 优化的视频物体移除工具，旨在高效、高质量地从视频中移除指定对象，并生成视觉上无缝的修复结果。该项目由 Bojia Zi 等人开发，核心目标是实现快速（Fast）、有效（Effective）和鲁棒（Robust）的视频内容编辑。核心特性两阶段训练策略第一阶段：使用简化版的 DiT（Di...

2025-6-21 AI,开源 5318 0

AI#开源图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包

让模糊照片变清晰 —— AI 图像增强器 GSASR v20250620 一键整合包

GSASR（Generalized and Efficient 2D Gaussian Splatting for Arbitrary-scale Super-Resolution），是由研究人员开发的一种新型的图像超分辨率技术。它的核心目标是：让图片“变清晰”，而且可以按任意倍数放大，不会失真或模糊。🌟 什么是图像超分辨率？简单来说，图像超...

2025-6-20 AI,开源 6489 11

AI#开源工具 # 日常应用 # 神器 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 效率工具

AI 人工智能一键高清修复模糊照片（支持批量处理），还原清晰细节 Finegrain Image Enhancer v20250617 一键汉化整合包

Finegrain Image Enhancer开源图像增强工具通过人工智能技术将低分辨率图像转化为高分辨率版本，智能生成细节以提升画质。核心功能超分辨率放大支持模糊或低分辨率图像放大（最高可达4倍），增强细节的清晰度和真实感。细粒度参数控制提供增强强度、风格一致性等参数调节，允许用户进行精细化编辑。结果可重复性通过种子管理保存特定增强...

2025-6-19 AI,开源 7904 11

AI#开源工具 # 日常应用 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 整合包

Meissonic 开源高性能文生图模型一键整合包 v20250619

Meissonic 是一个基于 Masked Generative Transformer的高效高分辨率文本到图像生成模型，旨在通过消费级显卡实现高质量的图像生成任务。该项目在 ICLR 2025 上发表，其核心目标是重新激发 Masked Generative Transformers 在图像合成中的潜力，并提供一种高效的推理方案。核心特性...

2025-6-18 AI,开源 2827 0

AI#开源图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 整合包

字节开源BAGEL：70亿参数多模态大模型，图像生成+理解全新突破 v20250613 一键整合包

BAGEL 是一个由 ByteDance-Seed团队开发的开源多模态基础模型，具有 70 亿（7B）活跃参数（总参数为 140 亿），并在大规模交错的多模态数据（包括语言、图像、视频和网页数据）上进行了训练。该项目的目标是通过统一的架构来实现强大的多模态理解和生成能力，并进一步扩展到复杂的视觉操作任务。核心特点1. 先进的模型架构BAGEL...

2025-6-13 AI,开源 4402 0

AI#开源图像处理 # 工具 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 整合包

它把AI画画的天花板又抬高了一截又一国产AI绘画模型 Chroma v20250609 一键整合包

1. 模型概述Chroma 是一个开源、无审查且面向社区构建的大模型。参数规模：Chroma 是一个拥有 89 亿（8.9B）参数的模型，基于 FLUX.1-schnell架构开发（技术报告即将发布）。它完全采用 Apache 2.0 许可证，这意味着任何人都可以自由使用、修改和在该模型基础上进行二次开发，无需企业或机构控制。训练状态：该模型...

2025-6-9 AI,开源 5763 11

AI#开源图像处理 # 工具 # 日常应用 # 图形图像 # 开源 # 人工智能 # AI # 整合包

想自己生成图片但怕侵权？试试这个新AI模型！f-lite v20250607 一键整合包支持40系+50系显卡

F Lite是由 Fal AI与 Freepik联合开发的一个基于扩散模型的图像生成工具。它提供了一个轻量但功能强大的模型架构，并在数据合规性方面做出了显著努力。📌 核心特点✅ 合法合规的数据集训练模型仅使用了 8000 万张版权安全（copyright-safe）和 SFW（适合所有年龄层，Safe For Work）内容进行训练。数据来源...

2025-6-7 AI,开源 4081 3

AI#开源图像处理 # 图形图像 # 开源 # 人工智能 # AI # 免费 # 整合包

开源神器来袭！HelloMeme 让你秒变表情包制造机 v20250601 一键整合包

一个专注于 AI 自动生成表情包（meme）的开源项目。它结合了人工智能技术，特别是图像生成和自然语言理解的能力，来自动创建有趣、符合网络文化风格的表情包。💡 主要功能：利用 AI 技术自动生成表情包（meme）支持根据用户输入的文字内容或模板生成带有幽默感的图片可能集成了图像生成模型（如 Stable Diffusion）、文本理解和模因风...

2025-6-2 AI,开源 3505 0

AI#开源工具 # 日常应用 # 视频处理 # 视频下载 # 绿色软件 # 办公软件 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

视频创作者的新宠：这个开源工具正在悄悄改变内容生产方式一键整合包 MoneyPrinterPlus v1.2.6

你可以把它想象成一个 “AI全自动视频工厂”。它最大的特点就是：输入一段文字，就能自动生成一个完整的高清视频。是不是有点像你写一篇作文，然后机器帮你拍成了短视频？没错，就是这个意思！🧠 它是怎么工作的？简单来说，它的流程是这样的：你告诉它要说什么内容（文字）比如：“今天教你怎么在家做蛋糕”它会自动找合适的画面素材比如网上免费的高清视频片段：打...

2025-5-25 AI,开源 7758 4

AI#开源工具 # 日常应用 # 视频处理 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

AI 自动生成短剧解说视频输入一段话就能生成短剧解说视频一键整合包 NarratoAI v0.6.1

这个工具是做什么的？你可以把 NarratoAI 理解成一个“AI自动剪辑视频的神器”，它最大的特点就是：输入一段文字或口播内容，就能自动生成一部短剧解说视频。是不是听起来像你写了个剧本，AI 就帮你拍成了短视频？没错，就是这样！🧠 它是怎么工作的？它的流程大概是这样的：你提供一段文字内容（比如口播文案、剧情简介）比如：“今天给大家讲一个爱情...

2025-5-25 AI,开源 8050 3

AI#开源工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

一键提取伴奏/人声！轻松搞定音乐音轨分离支持批量处理开源一键整合包 6G N卡就可以愉快玩耍 UVR5 UI v1.8.4

UVR5-UI是基于 python-audio-separator（即 UVR5 的命令行版本）开发的，提供了友好的可视化界面，使得用户无需掌握编程知识或命令行操作即可使用强大的音频处理功能。它支持多种模型和功能，包括：所有主流音源分离模型：VR Arch 模型MDX-NET 模型Demucs v4 模型Mel-Band Roformer 和...

2025-5-24 AI,开源 6196 3