Clarity-Refiners-UI 一个专注于图像增强的开源项目 一键整合包,

AI#开源图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 整合包

字节开源BAGEL：70亿参数多模态大模型，图像生成+理解全新突破 v20250613 一键整合包

BAGEL 是一个由 ByteDance-Seed团队开发的开源多模态基础模型，具有 70 亿（7B）活跃参数（总参数为 140 亿），并在大规模交错的多模态数据（包括语言、图像、视频和网页数据）上进行了训练。该项目的目标是通过统一的架构来实现强大的多模态理解和生成能力，并进一步扩展到复杂的视觉操作任务。核心特点1. 先进的模型架构BAGEL...

2025-6-13 AI,开源 4393 0

AI#开源图像处理 # 工具 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 整合包

它把AI画画的天花板又抬高了一截又一国产AI绘画模型 Chroma v20250609 一键整合包

1. 模型概述Chroma 是一个开源、无审查且面向社区构建的大模型。参数规模：Chroma 是一个拥有 89 亿（8.9B）参数的模型，基于 FLUX.1-schnell架构开发（技术报告即将发布）。它完全采用 Apache 2.0 许可证，这意味着任何人都可以自由使用、修改和在该模型基础上进行二次开发，无需企业或机构控制。训练状态：该模型...

2025-6-9 AI,开源 5744 11

AI#开源图像处理 # 工具 # 日常应用 # 图形图像 # 开源 # 人工智能 # AI # 整合包

想自己生成图片但怕侵权？试试这个新AI模型！f-lite v20250607 一键整合包支持40系+50系显卡

F Lite是由 Fal AI与 Freepik联合开发的一个基于扩散模型的图像生成工具。它提供了一个轻量但功能强大的模型架构，并在数据合规性方面做出了显著努力。📌 核心特点✅ 合法合规的数据集训练模型仅使用了 8000 万张版权安全（copyright-safe）和 SFW（适合所有年龄层，Safe For Work）内容进行训练。数据来源...

2025-6-7 AI,开源 4067 3

AI#开源图像处理 # 图形图像 # 开源 # 人工智能 # AI # 免费 # 整合包

开源神器来袭！HelloMeme 让你秒变表情包制造机 v20250601 一键整合包

一个专注于 AI 自动生成表情包（meme）的开源项目。它结合了人工智能技术，特别是图像生成和自然语言理解的能力，来自动创建有趣、符合网络文化风格的表情包。💡 主要功能：利用 AI 技术自动生成表情包（meme）支持根据用户输入的文字内容或模板生成带有幽默感的图片可能集成了图像生成模型（如 Stable Diffusion）、文本理解和模因风...

2025-6-2 AI,开源 3493 0

AI#开源工具 # 日常应用 # 视频处理 # 视频下载 # 绿色软件 # 办公软件 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

视频创作者的新宠：这个开源工具正在悄悄改变内容生产方式一键整合包 MoneyPrinterPlus v1.2.6

你可以把它想象成一个 “AI全自动视频工厂”。它最大的特点就是：输入一段文字，就能自动生成一个完整的高清视频。是不是有点像你写一篇作文，然后机器帮你拍成了短视频？没错，就是这个意思！🧠 它是怎么工作的？简单来说，它的流程是这样的：你告诉它要说什么内容（文字）比如：“今天教你怎么在家做蛋糕”它会自动找合适的画面素材比如网上免费的高清视频片段：打...

2025-5-25 AI,开源 7741 4

AI#开源工具 # 日常应用 # 视频处理 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

AI 自动生成短剧解说视频输入一段话就能生成短剧解说视频一键整合包 NarratoAI v0.6.1

这个工具是做什么的？你可以把 NarratoAI 理解成一个“AI自动剪辑视频的神器”，它最大的特点就是：输入一段文字或口播内容，就能自动生成一部短剧解说视频。是不是听起来像你写了个剧本，AI 就帮你拍成了短视频？没错，就是这样！🧠 它是怎么工作的？它的流程大概是这样的：你提供一段文字内容（比如口播文案、剧情简介）比如：“今天给大家讲一个爱情...

2025-5-25 AI,开源 8033 3

AI#开源工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

一键提取伴奏/人声！轻松搞定音乐音轨分离支持批量处理开源一键整合包 6G N卡就可以愉快玩耍 UVR5 UI v1.8.4

UVR5-UI是基于 python-audio-separator（即 UVR5 的命令行版本）开发的，提供了友好的可视化界面，使得用户无需掌握编程知识或命令行操作即可使用强大的音频处理功能。它支持多种模型和功能，包括：所有主流音源分离模型：VR Arch 模型MDX-NET 模型Demucs v4 模型Mel-Band Roformer 和...

2025-5-24 AI,开源 6154 3

AI#开源图像处理 # 日常应用 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包

你负责写文字(支持中文)，画画交给 AI！Kolors 让想象秒变现实一键整合包 v20250523

Kolors 是一个“文字生成图片”的人工智能工具，你可以输入一段中文或英文的文字描述，它就能根据你的描述自动生成一张对应的图像。比如你写：“一只穿着西装的熊猫，在山顶上喝咖啡，背景是日出，风格是写实高清”它就能根据这段话，画出这样的一张图！🧠 它是怎么工作的？简单来说，这个 AI 模型已经学习了非常多的文字和图片之间的对应关系。所以当你输入...

2025-5-23 AI,开源 7899 3

AI 图像处理 # 工具 # 日常应用 # 绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 整合包

小巧实用效率高AI生成动漫图片整合包，12G英伟达显卡即可愉快玩耍 v20250520

今天在网上逛的时候，无意发现这个模型，一个动漫图片生成的模型，感觉还不错，生成的动漫效果也还可以，所以就花了几分钟写了个界面，然后又汉化了下，感觉还可以，就随手发到群里，各位小伙伴要求分享出来，所以就打包上传上来了。这个模型是支持NSFW ，所以请勿用于任何非法途径，所造成的任何后果请自行承担，本人只做AI图片生成技...

2025-5-20 AI 5088 6

AI#开源图像处理 # 工具 # 文本 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

开源AI图像描述：JoyCaption ，图片AI反推提示词支持批量操作 v20250515 一键整合包

JoyCaption 是一个开源的图像描述生成视觉语言模型（VLM），旨在为社区提供一个免费、开放且无审查的工具，用于训练扩散模型。以下是该项目的主要特点和相关信息：项目特点免费与开放：JoyCaption 以免费、开放的权重发布，没有使用限制，并且提供训练脚本及详细的构建细节。无审查：平等覆盖适合工作场合（SFW）和不适合工作场合（NSFW...

2025-5-15 AI,开源 9625 11

AI#开源文本 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 模型 # 大模型 # 整合包

穿越千年的文字魔法：AI助力现代文变古文 ancient_text_generation_LLM v20250514一键整合包

一个专注于将现代汉语句子转换为古汉语风格句子的创新项目。以下是对该项目的详细介绍：项目概述：该项目旨在通过先进的自然语言处理技术，实现现代汉语到古汉语风格的自动转换，为文化传承、文学创作等领域提供有力支持。技术背景：项目基于荀子基座大模型，该模型作为起点，为项目提供了强大的语言理解和生成能力。通过采用LoRA（Low-Rank Adaptat...

2025-5-14 AI,开源 4937 0

AI#开源图像处理 # 工具 # 日常应用 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

想换脸、换衣服还是换风格？DreamO图像定制，一键搞定！v20250513 AI生成图片一键整合包

DreamO是一个由字节跳动开源的统一图像定制化框架（A Unified Framework for Image Customization），旨在通过先进的算法和技术，为用户提供高度灵活和高质量的图像定制化服务。以下是该项目的详细介绍说明：核心功能：图像定制化：DreamO允许用户根据需求定制图像，支持多种定制化任务，包括但不限于人物形象定...

2025-5-13 AI,开源 5665 9

AI 工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 语音工具 # 整合包

文本转语音，如此简单真实：Nari Labs开源Dia，一轮处理生成高度逼真的对话音频

Dia是一个由Nari Labs创建的文本转语音（TTS）模型，它拥有16亿（1.6B）参数，能够在一轮处理中生成超逼真的对话。这个项目的核心特点是其高度真实的语音生成能力，可以直接从文本中生成高度逼真的对话，同时支持通过音频条件来控制输出，实现情感和语调的调整。主要功能高度逼真的对话生成：Dia能够直接从文本中生成高质量的对话，无需多轮处理...

2025-4-25 AI 3501 0

AI 图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 人工智能 # AI # 免费 # 整合包

OmniGen：统一框架，高效灵活，图像生成从未如此简单基于最新模型一键整合包已经汉化

OmniGen 是一个由 VectorSpaceLab 开发的开源项目，旨在提供一个统一的图像生成模型，能够处理多种图像生成任务，而无需依赖额外的插件或复杂的预处理步骤。该项目的核心目标是简化图像生成流程，使其像 GPT 在语言生成中的应用一样灵活和高效。OmniGen 支持多种任务，包括文本到图像生成、图像编辑、主题驱动生成和经典计算机视觉...

2025-4-24 AI 6689 7

AI#开源图像处理 # 工具 # 日常应用 # 绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 整合包

字节开源 UNO：电商图片生成的高效利器，一键汉化整合包，支持文生图和图生图

UNO（Universal Customization）是由字节跳动公司开发并开源的一个通用自定义方法的项目，旨在解决单主体和多主体条件下的图像生成问题，具有很强的可控性和通用性。该项目通过提出一种高度一致的数据合成流程，利用扩散变换器的内在上下文生成能力，生成高一致性的多主体配对数据。UNO模型包含渐进式跨模态对齐和通用旋转位置嵌入，是从文...

2025-4-21 AI,开源 4221 4

AI#开源工具 # 日常应用 # 文本 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 文本编辑 # 整合包

SenseVoice：解锁语音理解新高度，多语言情感识别与事件检测全攻略语音转文本一键汉化整合包 v1.0

FunAudioLLM/SenseVoice: Multilingual Voice Understanding Model 是一个专注于语音理解的开源项目，旨在提供高精度的多语言语音识别、语音情感识别和音频事件检测功能。这个项目由 FunAudioLLM 团队开发和维护，基于 FunASR 工具包构建，支持多种语言和方言，包括中文、英语、粤...

2025-4-21 AI,开源 4506 2

AI#开源工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包

Free-TTS_unlimted-words v1.0 AI文字生成语音，调用Edge TTS接口运行一键整合包无需要显卡即可运行

Edge TTS（Edge Text-to-Speech）是微软推出的一款基于深度学习技术的文本转语音（TTS）工具，具有高质量语音合成、多语言支持、灵活配置和开源可扩展等特点，广泛应用于语音助手、电子书阅读、视频制作、教育及智能客服等领域。核心功能高质量语音合成Edge TTS 采用先进的深度学习技术，能够生成自然流畅、接近真人...

2025-4-15 AI,开源 3042 0

AI#开源工具 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包

Orpheus-TTS：AI文字合成语音，让语言更有温度一键整合包支持生成中文语音

Orpheus-TTS是一个前沿的开源文本转语音（Text-To-Speech，TTS）系统，它基于Llama-3b这一强大的大型语言模型（LLM）构建。该项目展示了在语音合成领域使用大型语言模型的新兴能力，为用户带来了前所未有的自然语音体验。Orpheus-TTS的核心优势在于其人类般的语音表现。它能够生成具有自然语调、情感和节奏的语音，这...

2025-4-15 AI,开源 5092 6

AI#软件工具 # 编程开发 # 免费 # 整合包

LNMP v2.2正式版一键网站环境部署包

LNMP一键安装包是一个用Linux Shell编写的可以为Linux服务器搭建网站环境的shell程序，LNMP代指Linux，Nginx，MySQL和PHP，相似的我们还可以到LAMP（Linux，Apache，Mysql，Php），WAMP（Windows，Apache，Mysql，Php）等等一键部署包。LNMP支持自定义Nginx、...

2025-4-14 AI,软件 2750 0

AI#开源日常应用 # 音乐 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包

AudioX 一个极具创新性和实用性的AI开源音频和视频生成工具。一键汉化整合包

AudioX是一个创新的开源项目，专注于实现一种全新的音频与音乐生成方式。该项目由Zeyue Tian及其团队开发，并在GitHub上公开分享，为音频生成领域带来了革命性的突破。AudioX的核心是一个统一的Diffusion Transformer模型，旨在解决现有音频生成方法中的局限性，如模态隔离、高质量多模态训练数据稀缺以及多样化输入整...

2025-4-10 AI,开源 6792 14

AI#开源图像处理 # 工具 # 日常应用 # 视频处理 # 绿色软件 # 开源 # 抠像 # 抠图 # 人工智能 # AI # 免费 # 效率工具 # 整合包

BEN2 v1.1 AI人工智能图片批量抠图+视频抠像工具一键整合包视频可以输出透明通道

虽然我已经分享了不少的抠图和视频抠像的工具，但是谁又会嫌弃好工具多呢？所以抽空做了这个BEN2的整合包，这个整合包最大的特点就是可以输出带有透明通道的webm视频格式。在图像和视频处理领域，前景分割技术一直是研究和应用的热点。无论是视频编辑、特效制作，还是人工智能驱动的内容生成，精准的前景分割都是实现高质量输出的关键。而今天我们要介绍的，是一...

2025-4-1 AI,开源 7390 5

AI#开源工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

ClearerVoice-Studio AI语音增强、语音降噪工具，一键整合包，二开作品支持批量操作

ClearerVoice-Studio是由阿里巴巴达摩院通义实验室开源的综合性语音处理工具包，旨在为语音技术研究和应用提供高效解决方案。其核心功能覆盖语音增强、分离、目标说话人提取及超分辨率处理，通过融合复数域深度学习算法与先进模型架构，显著提升了复杂声学场景下的语音处理效果。技术架构与核心优势该框架采用复数域深度学习技术，通过FRCRN（复...

2025-3-25 AI,开源 5807 0

AI#开源工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

MeloTTS v0.1.2 AI文本生成语音工具，支持英伟达显卡+cpu运行，速度极快支持六国语言，一键整合包

MeloTTS：高质量多语言文本到语音合成工具详解MeloTTS是由MyShell AI开发的一款开源文本到语音（TTS）合成工具，其核心目标是提供高效、自然的多语言语音合成解决方案。该工具通过深度学习技术实现了从文本到语音的流畅转换，支持包括英语、中文、日语、韩语在内的多种语言，尤其在中英混合发音场景中具有显著优势。以下从技术架构、核心功能...

2025-3-24 AI,开源 4224 4

AI#开源工具 # 日常应用 # 视频处理 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 数字人 # 效率工具 # 整合包

LatentSync v1.5 字节跳动联合北京交通大学推出AI数字人工具，汉化一键整合包

LatentSync是由字节跳动联合北京交通大学推出的端到端唇形同步框架，基于音频条件潜在扩散模型（Latent Diffusion Models），旨在实现语音与唇形运动的高精度同步。该项目通过结合Stable Diffusion的生成能力与音视频联合建模技术，解决了传统方法依赖中间表示（如3D模型或2D关键点）的复杂性问题，直接生成动态逼...

2025-3-23 AI,开源 7394 17

AI#开源图像处理 # 工具 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

AI人工智能图片高清修复放大Tile-Upscaler v1.0 一键汉化整合包

本工具基于Tile-Upscaler二次开发，简单直接，操作点2下即可，图片高清修复效果还不错,处理速度我的4070tisuper一张1080x1920的图片大概8秒就可以完成高清修复。效果演示原图我个人觉得高清修复效果还可以。所以就花了点时间整合了一下，另外修改了部分代码1 修正一些小bug2 删除没用的演示例子3&nb...

2025-3-16 AI,开源 5432 2

AI#开源图像处理 # 工具 # 视频处理 # 绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 效率工具 # 整合包

MatAnyone v1.0.0 人工智能AI 自定义视频抠图一键汉化整合包附视频演示

MatAnyone是一个专注于人类视频抠图（Matting）的实用框架，其独特之处在于支持目标分配功能，并能在核心区域语义和精细边界细节上表现出稳定的性能。该项目由Peiqing Yang等人在2025年提出，并在CVPR（Conference on Computer Vision and Pattern Recognition）这一顶级计算...

2025-3-14 AI,开源 9082 12

AI#开源语音 # 工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

InspireMusic AI人工智能音乐、歌曲和音频生成的开源一键中文整合包

InspireMusic是一个专注于音乐、歌曲和音频生成的开源项目，它提供了一个统一的框架来实现这些生成任务。以下是对该项目的详细介绍：主要功能音乐生成：支持文本提示、音乐类型、音乐结构等多种控制方式，可生成高质量的音乐作品。歌曲生成：能够根据用户的文本描述或音乐结构生成完整的歌曲。音频生成：可以生成各种类型的音频，包括但不限于背景音乐、音效...

2025-3-13 AI,开源 3777 0

AI#开源工具 # 视频处理 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包

MMAudio v0.1 AI视频生成背景声音文生生成声音一键整合包 8G英伟达显卡可用，无需安装环境，解压即可使用

MMAudio是一个开源项目，旨在通过多模态联合训练生成高质量的同步音频。以下是关于这个项目的详细介绍：项目概述MMAudio由香港中文大学的程浩基（Ho Kei Cheng）等人开发，主要功能是根据视频和/或文本输入生成同步音频。其核心创新在于多模态联合训练方法，能够在广泛的音视频和音文本数据集上进行训练。此外，同步模块可以将生成的音频与视...

2025-2-24 AI,开源 5653 0

AI#开源工具 # 神器 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 整合包

HivisionIDPhotos v1.3.1 一个专注于证件照智能制作的开源项目一键整合包支持批量处理附视频演示

HivisionIDPhotos 是一个专注于证件照智能制作的开源项目，由Zeyi-Lin开发并维护。该项目旨在通过先进的图像处理和机器学习技术，为用户提供一种高效、便捷的证件照制作解决方案。项目结合了轻量级抠图、多尺寸规格生成、智能换底等多种功能，让用户能够轻松制作出符合标准的证件照。核心功能轻量级抠图：HivisionIDPhotos采用...

2025-1-22 AI,开源 7180 21

AI#开源视频处理 # 开源 # 人工智能 # AI # 视频工具 # 整合包

开源 DCT-Net_Webui v20250116 修改增强版一款将图片/视频转绘漫画效果工具支持批量处理附三倍快乐演示

视频转动漫的工具貌似有不少，之前我也分享了，但是今天分享的这个，操作是极其简单，我顺手还做了个批量处理。这样就更方便了。Q群一个小伙伴提供了一台远程4060显卡的机器给我远程测试，所以也顺手把N卡包也整合好了。N卡的效率确实是超级高啊，我用CPU跑10秒的视频大概要3-5分钟，但是N卡的话一分钟不到就搞定了。确实是爽。下面是截图一下给你们看...

2025-1-16 AI,开源 9071 10

AI#软件工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 整合包

moondream v1.2 开源 AI人工智能图片反推提示词神器，可批量处理图片提示词一键整合包

vikhyat/moondream是一个开源的、轻量级的视觉语言模型项目，旨在提供强大的图像理解和生成能力，同时确保模型可以在各种环境下高效运行。该项目在GitHub上托管，拥有简洁的代码库和丰富的文档资源，为开发者提供了便捷的使用和定制体验。项目的核心是一个视觉语言模型，该模型能够接收图像作为输入，并基于图像内容生成相应的文本描述或回答相关...

2024-12-10 AI,软件 8701 11

AI#开源图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 图片增强 # 整合包

Clarity-Refiners-UI 一个专注于图像增强的开源项目一键整合包

Pinokiofactory/Clarity-Refiners-UI 是一个专注于图像增强的开源项目，它基于 Pinokio UI 框架，并融合了多项先进的图像处理技术。该项目旨在为用户提供一种高效、易用且功能强大的图像增强解决方案。项目背景与目的Pinokiofactory/Clarity-Refiners-UI 是 Pinokio 工厂团...

2024-11-30 AI,开源 3151 2