站长推荐

新一代开源 AI换脸神器 FaceFusion v3.6.1 中文版 支持AMD显卡+N卡 速度更快 支持50系显卡+批量换脸,效果更惊艳 操作更简单 附视频演示 20260421 更新新一代开源 AI换脸神器 FaceFusion v3.6.1 中文版 支持AMD显卡+N卡 速度更快 支持50系显卡+批量换脸,效果更惊艳 操作更简单 附视频演示 20260421 更新
开源 换脸工具 roop_unleashed v8.0 中文版 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示开源 换脸工具 roop_unleashed v8.0 中文版 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示
0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v11.70 支持Magi Human LTX-2.3 wan2.2 HunyuanVideo-1.5等 数字人文生视频+图生视频+批量生成 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v11.70 支持Magi Human LTX-2.3 wan2.2 HunyuanVideo-1.5等 数字人文生视频+图生视频+批量生成 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了
一句话画出动漫世界!支持中文的AI绘画神器来了 Anima文生动漫图片AI大模型 ,8G英伟达显卡即可愉快玩耍一句话画出动漫世界!支持中文的AI绘画神器来了 Anima文生动漫图片AI大模型 ,8G英伟达显卡即可愉快玩耍
造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图+人物一致性图片+自定义lora 一键整合包 20260519 v19造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图+人物一致性图片+自定义lora 一键整合包 20260519 v19
阿里出品 Ovis-U1-3b 多模态理解、文本到图像生成+图像编辑。 一键整合包

阿里出品 Ovis-U1-3b 多模态理解、文本到图像生成+图像编辑。 一键整合包

Ovis-U1 是由阿里巴巴AIDC-AI团队开发的一个先进的多模态大语言模型项目。这个项目专注于构建能够同时处理文本和图像信息的AI系统。核心特点多模态融合能力能够同时理解和处理文本与图像数据实现跨模态的信息理解和生成支持图文混合的输入输出场景统一架构设计采用统一的模型架构处理不同类型的模态数据简化了传统多模态系统中复杂的模块组合提高了模型...
AI,开源 4135 0
光影魔法来了!AI一键切换日光/夜景/霓虹灯效果 relighting-kontext v20250720

光影魔法来了!AI一键切换日光/夜景/霓虹灯效果 relighting-kontext v20250720

在网上瞎逛的时候,发现了这个模型,很不错,光影效果做出来很逼真,虽然我以前也做过一个类似的整合包,但是跟这个没法比,所以抽空进行了二次开发。🌟 Relighting Kontext [dev] LoRA v3 模型介绍Relighting Kontext [dev] LoRA v3是一个针对 FLUX.1-Kontext-dev模型优化的低秩...
AI,开源 5328 10
LoRA 千面 AI图片编辑 超N多风格转换 Kontext-Style-LoRAs v20250722

LoRA 千面 AI图片编辑 超N多风格转换 Kontext-Style-LoRAs v20250722

在huggingface瞎逛的时候,无意中发现了这个开源的模型,真的超级强,聚集了N多风格lora模型,操作也是极其简单,感觉可能有小伙伴能用的上,就花了时间做了整合,并进行了小小的二次开发,自我感觉还行。整合包说明1 支持50系显卡,最低英伟达8G显卡可以运行,如果你的显卡刚好是8G的话,可能内存要超过30G,安装好你显卡能支持的最高版本c...
AI,开源 4257 6
开源 UltraPixel 文生图 超高分辨率出图 细节非常丰富 远超Stable-diffusion等 一键整合包 附视频演示 v20250717 增强版 支持50系显卡

开源 UltraPixel 文生图 超高分辨率出图 细节非常丰富 远超Stable-diffusion等 一键整合包 附视频演示 v20250717 增强版 支持50系显卡

UltraPixel是一个由华为诺亚方舟实验室联合香港科技大学共同开发的开源项目,旨在生成具有丰富细节的高质量图像,其分辨率范围可以从1K一直延伸至6K。该项目不仅优化了细节处理,还显著提升了整体图像效果,将超高清图像合成推向了新的高峰。项目背景与目的随着人工智能技术的不断发展,生成高分辨率图像成为了一个研究热点。然而,现有的图像生成模型在生...
AI,开源 6792 6
AI 视频生成新突破:FramePack 开源项目引领视频扩散技术变革 一键汉化整合包 FramePack-F1 20250716更新 支持magcache加速 支持50系显卡

AI 视频生成新突破:FramePack 开源项目引领视频扩散技术变革 一键汉化整合包 FramePack-F1 20250716更新 支持magcache加速 支持50系显卡

FramePack 是一个开源项目,旨在通过创新的神经网络结构实现高效的视频生成。以下是对其的详细介绍:项目概述FramePack 是 “Packing Input Frame Contexts in Next - Frame Prediction Models for Video Generation” 论文的官方实现和桌面软件。它采用逐帧...
AI,开源 1.7万 48
FLUX.1-Kontext-dev:图文协同,让AI图像编辑更可控,支持局部重绘与图文控制,英伟达12G可运行 v20250716

FLUX.1-Kontext-dev:图文协同,让AI图像编辑更可控,支持局部重绘与图文控制,英伟达12G可运行 v20250716

前段时间一直死劲在更新的nunchaku-flux.1-kontext-dev,还算受到大伙的欢迎,主要是显卡要求很低。运行速度快,但是有些好显卡的小伙伴说能否出一个出图质量更好的版本?量化不要这么强的,对出图有一定要求的小伙伴。所以我今天就分享了这个FLUX.1-Kontext-dev,虽然也是nunchaku量化下的,但是相对来讲这个出图...
AI,开源 3099 6
让AI绘画更听你的话:DRA-Ctrl 实现图像局部控制生成 v20250712 一键整合包,最低支持8G英伟达,支持50系显卡

让AI绘画更听你的话:DRA-Ctrl 实现图像局部控制生成 v20250712 一键整合包,最低支持8G英伟达,支持50系显卡

DRA-Ctrl 是一个由 Kunbyte-AI开发的开源项目,其核心目标是为扩散模型(Diffusion Models)提供一种可控的生成机制。该项目专注于实现对图像生成过程中的“区域感知控制”(Region-aware Control),即在图像生成过程中,允许用户对图像的不同区域施加不同的控制条件,从而实现更加精细化和结构化的生成效果。...
AI,开源 4026 3
FishAudio 推出 OpenAudio-S1-Mini:革新语音合成技术, 一键整合包 v20250627

FishAudio 推出 OpenAudio-S1-Mini:革新语音合成技术, 一键整合包 v20250627

openaudio-s1-mini 是一个开源的音频生成模型,主要特点是能够将文本高效地转换为自然流畅的语音。下面是对该模型的详细介绍:基本信息模型名称:openaudio-s1-mini开源平台:ModelScope.cn开发者:FishAudio 团队主要特点高效的文本转语音能力:该模型经过大量数据训练,能够将输入的文本快速转换为自然流畅...
AI,开源 5018 13
MiniMax-Remover:基于 Minimax 优化的高效视频物体移除工具 v20250621 一键整合包

MiniMax-Remover:基于 Minimax 优化的高效视频物体移除工具 v20250621 一键整合包

MiniMax-Remover是一个基于 minimax 优化的视频物体移除工具,旨在高效、高质量地从视频中移除指定对象,并生成视觉上无缝的修复结果。该项目由 Bojia Zi 等人开发,核心目标是实现 快速(Fast)、有效(Effective)和鲁棒(Robust)的视频内容编辑。核心特性两阶段训练策略第一阶段:使用简化版的 DiT(Di...
AI,开源 5193 0
 让模糊照片变清晰 —— AI 图像增强器 GSASR v20250620 一键整合包

让模糊照片变清晰 —— AI 图像增强器 GSASR v20250620 一键整合包

GSASR(Generalized and Efficient 2D Gaussian Splatting for Arbitrary-scale Super-Resolution),是由研究人员开发的一种新型的图像超分辨率技术。它的核心目标是:让图片“变清晰”,而且可以按任意倍数放大,不会失真或模糊。🌟 什么是图像超分辨率?简单来说,图像超...
AI,开源 6382 11
AI 人工智能 一键高清修复模糊照片(支持批量处理),还原清晰细节 Finegrain Image Enhancer  v20250617 一键汉化整合包

AI 人工智能 一键高清修复模糊照片(支持批量处理),还原清晰细节 Finegrain Image Enhancer v20250617 一键汉化整合包

Finegrain Image Enhancer开源图像增强工具通过人工智能技术将低分辨率图像转化为高分辨率版本,智能生成细节以提升画质 。核心功能超分辨率放大支持模糊或低分辨率图像放大(最高可达4倍),增强细节的清晰度和真实感 。细粒度参数控制提供增强强度、风格一致性等参数调节,允许用户进行精细化编辑 。结果可重复性通过种子管理保存特定增强...
AI,开源 7742 11
Meissonic 开源高性能文生图模型 一键整合包 v20250619

Meissonic 开源高性能文生图模型 一键整合包 v20250619

Meissonic 是一个基于 Masked Generative Transformer的高效高分辨率文本到图像生成模型,旨在通过消费级显卡实现高质量的图像生成任务。该项目在 ICLR 2025 上发表,其核心目标是重新激发 Masked Generative Transformers 在图像合成中的潜力,并提供一种高效的推理方案。核心特性...
AI,开源 2776 0
字节开源BAGEL:70亿参数多模态大模型,图像生成+理解全新突破 v20250613 一键整合包

字节开源BAGEL:70亿参数多模态大模型,图像生成+理解全新突破 v20250613 一键整合包

BAGEL 是一个由 ByteDance-Seed团队开发的开源多模态基础模型,具有 70 亿(7B)活跃参数(总参数为 140 亿),并在大规模交错的多模态数据(包括语言、图像、视频和网页数据)上进行了训练。该项目的目标是通过统一的架构来实现强大的多模态理解和生成能力,并进一步扩展到复杂的视觉操作任务。核心特点1. 先进的模型架构BAGEL...
AI,开源 4334 0
它把AI画画的天花板又抬高了一截 又一国产AI绘画模型 Chroma v20250609 一键整合包

它把AI画画的天花板又抬高了一截 又一国产AI绘画模型 Chroma v20250609 一键整合包

1. 模型概述Chroma 是一个开源、无审查且面向社区构建的大模型。参数规模:Chroma 是一个拥有 89 亿(8.9B)参数的模型,基于 FLUX.1-schnell架构开发(技术报告即将发布)。它完全采用 Apache 2.0 许可证,这意味着任何人都可以自由使用、修改和在该模型基础上进行二次开发,无需企业或机构控制。训练状态:该模型...
AI,开源 5658 11
 想自己生成图片但怕侵权?试试这个新AI模型!f-lite v20250607 一键整合包 支持40系+50系显卡

想自己生成图片但怕侵权?试试这个新AI模型!f-lite v20250607 一键整合包 支持40系+50系显卡

F Lite是由 Fal AI与 Freepik联合开发的一个基于扩散模型的图像生成工具。它提供了一个轻量但功能强大的模型架构,并在数据合规性方面做出了显著努力。📌 核心特点✅ 合法合规的数据集训练模型仅使用了 8000 万张版权安全(copyright-safe)和 SFW(适合所有年龄层,Safe For Work)内容进行训练。数据来源...
AI,开源 3998 3
开源神器来袭!HelloMeme 让你秒变表情包制造机 v20250601 一键整合包

开源神器来袭!HelloMeme 让你秒变表情包制造机 v20250601 一键整合包

一个专注于 AI 自动生成表情包(meme)的开源项目。它结合了人工智能技术,特别是图像生成和自然语言理解的能力,来自动创建有趣、符合网络文化风格的表情包。💡 主要功能:利用 AI 技术自动生成表情包(meme)支持根据用户输入的文字内容或模板生成带有幽默感的图片可能集成了图像生成模型(如 Stable Diffusion)、文本理解和模因风...
AI,开源 3434 0
视频创作者的新宠:这个开源工具正在悄悄改变内容生产方式 一键整合包 MoneyPrinterPlus v1.2.6

视频创作者的新宠:这个开源工具正在悄悄改变内容生产方式 一键整合包 MoneyPrinterPlus v1.2.6

你可以把它想象成一个 “AI全自动视频工厂”。它最大的特点就是:输入一段文字,就能自动生成一个完整的高清视频。是不是有点像你写一篇作文,然后机器帮你拍成了短视频?没错,就是这个意思!🧠 它是怎么工作的?简单来说,它的流程是这样的:你告诉它要说什么内容(文字)比如:“今天教你怎么在家做蛋糕”它会自动找合适的画面素材比如网上免费的高清视频片段:打...
AI,开源 7663 4
AI 自动生成短剧解说视频 输入一段话就能生成短剧解说视频  一键整合包 NarratoAI v0.6.1

AI 自动生成短剧解说视频 输入一段话就能生成短剧解说视频 一键整合包 NarratoAI v0.6.1

这个工具是做什么的?你可以把 NarratoAI 理解成一个“AI自动剪辑视频的神器”,它最大的特点就是:输入一段文字或口播内容,就能自动生成一部短剧解说视频。是不是听起来像你写了个剧本,AI 就帮你拍成了短视频?没错,就是这样!🧠 它是怎么工作的?它的流程大概是这样的:你提供一段文字内容(比如口播文案、剧情简介)比如:“今天给大家讲一个爱情...
AI,开源 7915 3
一键提取伴奏/人声!轻松搞定音乐音轨分离 支持批量处理 开源一键整合包 6G N卡就可以愉快玩耍 UVR5 UI v1.8.4

一键提取伴奏/人声!轻松搞定音乐音轨分离 支持批量处理 开源一键整合包 6G N卡就可以愉快玩耍 UVR5 UI v1.8.4

UVR5-UI是基于 python-audio-separator(即 UVR5 的命令行版本)开发的,提供了友好的可视化界面,使得用户无需掌握编程知识或命令行操作即可使用强大的音频处理功能。它支持多种模型和功能,包括:所有主流音源分离模型:VR Arch 模型MDX-NET 模型Demucs v4 模型Mel-Band Roformer 和...
AI,开源 6003 3
你负责写文字(支持中文),画画交给 AI!Kolors 让想象秒变现实 一键整合包 v20250523

你负责写文字(支持中文),画画交给 AI!Kolors 让想象秒变现实 一键整合包 v20250523

Kolors 是一个“文字生成图片”的人工智能工具,你可以输入一段中文或英文的文字描述,它就能根据你的描述自动生成一张对应的图像。比如你写:“一只穿着西装的熊猫,在山顶上喝咖啡,背景是日出,风格是写实高清”它就能根据这段话,画出这样的一张图!🧠 它是怎么工作的?简单来说,这个 AI 模型已经学习了非常多的文字和图片之间的对应关系。所以当你输入...
AI,开源 7808 3
开源AI图像描述:JoyCaption ,图片AI反推提示词 支持批量操作 v20250515 一键整合包

开源AI图像描述:JoyCaption ,图片AI反推提示词 支持批量操作 v20250515 一键整合包

JoyCaption 是一个开源的图像描述生成视觉语言模型(VLM),旨在为社区提供一个免费、开放且无审查的工具,用于训练扩散模型。以下是该项目的主要特点和相关信息:项目特点免费与开放:JoyCaption 以免费、开放的权重发布,没有使用限制,并且提供训练脚本及详细的构建细节。无审查:平等覆盖适合工作场合(SFW)和不适合工作场合(NSFW...
AI,开源 9520 11
穿越千年的文字魔法:AI助力现代文变古文 ancient_text_generation_LLM v20250514一键整合包

穿越千年的文字魔法:AI助力现代文变古文 ancient_text_generation_LLM v20250514一键整合包

一个专注于将现代汉语句子转换为古汉语风格句子的创新项目。以下是对该项目的详细介绍:项目概述:该项目旨在通过先进的自然语言处理技术,实现现代汉语到古汉语风格的自动转换,为文化传承、文学创作等领域提供有力支持。技术背景:项目基于荀子基座大模型,该模型作为起点,为项目提供了强大的语言理解和生成能力。通过采用LoRA(Low-Rank Adaptat...
AI,开源 4880 0
想换脸、换衣服还是换风格?DreamO图像定制,一键搞定!v20250513 AI生成图片 一键整合包

想换脸、换衣服还是换风格?DreamO图像定制,一键搞定!v20250513 AI生成图片 一键整合包

DreamO是一个由字节跳动开源的统一图像定制化框架(A Unified Framework for Image Customization),旨在通过先进的算法和技术,为用户提供高度灵活和高质量的图像定制化服务。以下是该项目的详细介绍说明:核心功能:图像定制化:DreamO允许用户根据需求定制图像,支持多种定制化任务,包括但不限于人物形象定...
AI,开源 5556 11
字节开源 UNO:电商图片生成的高效利器,一键汉化整合包 ,支持文生图和图生图

字节开源 UNO:电商图片生成的高效利器,一键汉化整合包 ,支持文生图和图生图

UNO(Universal Customization)是由字节跳动公司开发并开源的一个通用自定义方法的项目,旨在解决单主体和多主体条件下的图像生成问题,具有很强的可控性和通用性。该项目通过提出一种高度一致的数据合成流程,利用扩散变换器的内在上下文生成能力,生成高一致性的多主体配对数据。UNO模型包含渐进式跨模态对齐和通用旋转位置嵌入,是从文...
AI,开源 4142 4
SenseVoice:解锁语音理解新高度,多语言情感识别与事件检测全攻略 语音转文本 一键汉化整合包 v1.0

SenseVoice:解锁语音理解新高度,多语言情感识别与事件检测全攻略 语音转文本 一键汉化整合包 v1.0

FunAudioLLM/SenseVoice: Multilingual Voice Understanding Model 是一个专注于语音理解的开源项目,旨在提供高精度的多语言语音识别、语音情感识别和音频事件检测功能。这个项目由 FunAudioLLM 团队开发和维护,基于 FunASR 工具包构建,支持多种语言和方言,包括中文、英语、粤...
AI,开源 4404 2
探索AI与古典诗歌的完美融合:中文诗词生成器 一键整合包 chinese-poem v1.0 附效果演示

探索AI与古典诗歌的完美融合:中文诗词生成器 一键整合包 chinese-poem v1.0 附效果演示

在数字化与智能化飞速发展的今天,人工智能技术正以前所未有的速度改变着我们的生活。从日常的语音助手到复杂的图像识别,AI的应用无处不在。然而,你是否想过,AI也能与古典文化相结合,创造出令人惊叹的艺术作品?今天,我要向大家介绍一款独特的工具——中文诗歌生成器,它将AI的强大功能与中华古典诗歌的韵味完美融合,为诗歌创作带来了全新的可能。一、工具简...
开源 2902 0
Free-TTS_unlimted-words v1.0 AI文字生成语音,调用Edge TTS接口运行 一键整合包 无需要显卡即可运行

Free-TTS_unlimted-words v1.0 AI文字生成语音,调用Edge TTS接口运行 一键整合包 无需要显卡即可运行

Edge TTS(Edge Text-to-Speech) 是微软推出的一款基于深度学习技术的文本转语音(TTS)工具,具有高质量语音合成、多语言支持、灵活配置和开源可扩展等特点,广泛应用于语音助手、电子书阅读、视频制作、教育及智能客服等领域。核心功能高质量语音合成Edge TTS 采用先进的深度学习技术,能够生成自然流畅、接近真人...
AI,开源 2992 0
Orpheus-TTS:AI文字合成语音,让语言更有温度 一键整合包 支持生成中文语音

Orpheus-TTS:AI文字合成语音,让语言更有温度 一键整合包 支持生成中文语音

Orpheus-TTS是一个前沿的开源文本转语音(Text-To-Speech,TTS)系统,它基于Llama-3b这一强大的大型语言模型(LLM)构建。该项目展示了在语音合成领域使用大型语言模型的新兴能力,为用户带来了前所未有的自然语音体验。Orpheus-TTS的核心优势在于其人类般的语音表现。它能够生成具有自然语调、情感和节奏的语音,这...
AI,开源 5001 6
AudioX  一个极具创新性和实用性的AI开源音频和视频生成工具。一键汉化整合包

AudioX 一个极具创新性和实用性的AI开源音频和视频生成工具。一键汉化整合包

AudioX是一个创新的开源项目,专注于实现一种全新的音频与音乐生成方式。该项目由Zeyue Tian及其团队开发,并在GitHub上公开分享,为音频生成领域带来了革命性的突破。AudioX的核心是一个统一的Diffusion Transformer模型,旨在解决现有音频生成方法中的局限性,如模态隔离、高质量多模态训练数据稀缺以及多样化输入整...
AI,开源 6695 14
BEN2 v1.1 AI人工智能 图片批量抠图+视频抠像工具 一键整合包 视频可以输出透明通道

BEN2 v1.1 AI人工智能 图片批量抠图+视频抠像工具 一键整合包 视频可以输出透明通道

虽然我已经分享了不少的抠图和视频抠像的工具,但是谁又会嫌弃好工具多呢?所以抽空做了这个BEN2的整合包,这个整合包最大的特点就是可以输出带有透明通道的webm视频格式。在图像和视频处理领域,前景分割技术一直是研究和应用的热点。无论是视频编辑、特效制作,还是人工智能驱动的内容生成,精准的前景分割都是实现高质量输出的关键。而今天我们要介绍的,是一...
AI,开源 7299 5
ClearerVoice-Studio   AI语音增强、语音降噪工具,一键整合包,二开作品 支持批量操作

ClearerVoice-Studio AI语音增强、语音降噪工具,一键整合包,二开作品 支持批量操作

ClearerVoice-Studio是由阿里巴巴达摩院通义实验室开源的综合性语音处理工具包,旨在为语音技术研究和应用提供高效解决方案。其核心功能覆盖语音增强、分离、目标说话人提取及超分辨率处理,通过融合复数域深度学习算法与先进模型架构,显著提升了复杂声学场景下的语音处理效果。技术架构与核心优势该框架采用复数域深度学习技术,通过FRCRN(复...
AI,开源 5704 0
MeloTTS v0.1.2  AI文本生成语音工具,支持英伟达显卡+cpu运行,速度极快 支持六国语言,一键整合包

MeloTTS v0.1.2 AI文本生成语音工具,支持英伟达显卡+cpu运行,速度极快 支持六国语言,一键整合包

MeloTTS:高质量多语言文本到语音合成工具详解MeloTTS是由MyShell AI开发的一款开源文本到语音(TTS)合成工具,其核心目标是提供高效、自然的多语言语音合成解决方案。该工具通过深度学习技术实现了从文本到语音的流畅转换,支持包括英语、中文、日语、韩语在内的多种语言,尤其在中英混合发音场景中具有显著优势。以下从技术架构、核心功能...
AI,开源 4150 4