站长推荐

新一代开源 免费 AI换脸神器 FaceFusion v3.6.1 中文版 支持AMD显卡+N卡 速度更快 支持50系显卡+批量换脸,效果更惊艳 操作更简单 附视频演示 20260421 更新新一代开源 免费 AI换脸神器 FaceFusion v3.6.1 中文版 支持AMD显卡+N卡 速度更快 支持50系显卡+批量换脸,效果更惊艳 操作更简单 附视频演示 20260421 更新
开源 换脸工具 roop_unleashed v7.0 中文版 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示开源 换脸工具 roop_unleashed v7.0 中文版 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示
0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v11.31 支持Magi Human LTX-2.3 wan2.2 HunyuanVideo-1.5等 数字人文生视频+图生视频+批量生成 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v11.31 支持Magi Human LTX-2.3 wan2.2 HunyuanVideo-1.5等 数字人文生视频+图生视频+批量生成 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了
批量下载视频 闪豆视频下载器 支持抖音 快手 哔哩哔哩 爱优腾 YouTube等60多个视频平台 v4.0.0.0-2026.02.27批量下载视频 闪豆视频下载器 支持抖音 快手 哔哩哔哩 爱优腾 YouTube等60多个视频平台 v4.0.0.0-2026.02.27
 VisoMaster +VisoMaster-Fusion v1.0  基于rope的二次开发 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持50系英伟达显卡运行 一键整合包 VisoMaster +VisoMaster-Fusion v1.0 基于rope的二次开发 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持50系英伟达显卡运行 一键整合包
LatentSync v1.5 字节跳动联合北京交通大学推出AI数字人工具,汉化一键整合包

LatentSync v1.5 字节跳动联合北京交通大学推出AI数字人工具,汉化一键整合包

LatentSync是由字节跳动联合北京交通大学推出的端到端唇形同步框架,基于音频条件潜在扩散模型(Latent Diffusion Models),旨在实现语音与唇形运动的高精度同步。该项目通过结合Stable Diffusion的生成能力与音视频联合建模技术,解决了传统方法依赖中间表示(如3D模型或2D关键点)的复杂性问题,直接生成动态逼...
AI,开源 7016 17
Stable Diffusion(AI绘画) 绘世 WebUI+comfyui+SD-Forge  自更新一键下载安装汉化版 4.9 202408更新 附A卡整合包 附我常用的大模型和ControlNet 模型

Stable Diffusion(AI绘画) 绘世 WebUI+comfyui+SD-Forge 自更新一键下载安装汉化版 4.9 202408更新 附A卡整合包 附我常用的大模型和ControlNet 模型

距离我上次更新这个已经过去了三个月多了,这中间AI发展实在是太迅速了,我也中间分享了无数用AI生成的图片素材,感兴趣的小伙伴可以在文末的链接进去看看,基本都是基于这个工具生成的。全部免费下载。大概有几千张,大部分都是精品。目前秋叶同学的这个离线包已经更新到了2.58,因为实在是太大了,上传速度实在是慢,所以更新时间稍稍晚了一点点。喜欢这个工具...
开源 25.6万 865
AI人工智能 图片高清修复放大Tile-Upscaler v1.0  一键汉化整合包

AI人工智能 图片高清修复放大Tile-Upscaler v1.0 一键汉化整合包

本工具基于Tile-Upscaler二次开发,简单直接,操作点2下即可,图片高清修复效果还不错,处理速度我的4070tisuper一张1080x1920的图片大概8秒就可以完成高清修复。效果演示原图我个人觉得高清修复效果还可以。所以就花了点时间整合了一下,另外修改了部分代码1 修正一些小bug2 删除没用的演示例子3&nb...
AI,开源 5253 2
MatAnyone v1.0.0 人工智能AI 自定义视频抠图 一键汉化整合包 附视频演示

MatAnyone v1.0.0 人工智能AI 自定义视频抠图 一键汉化整合包 附视频演示

MatAnyone是一个专注于人类视频抠图(Matting)的实用框架,其独特之处在于支持目标分配功能,并能在核心区域语义和精细边界细节上表现出稳定的性能。该项目由Peiqing Yang等人在2025年提出,并在CVPR(Conference on Computer Vision and Pattern Recognition)这一顶级计算...
AI,开源 8770 12
InspireMusic AI人工智能音乐、歌曲和音频生成的开源一键中文整合包

InspireMusic AI人工智能音乐、歌曲和音频生成的开源一键中文整合包

InspireMusic是一个专注于音乐、歌曲和音频生成的开源项目,它提供了一个统一的框架来实现这些生成任务。以下是对该项目的详细介绍:主要功能音乐生成:支持文本提示、音乐类型、音乐结构等多种控制方式,可生成高质量的音乐作品。歌曲生成:能够根据用户的文本描述或音乐结构生成完整的歌曲。音频生成:可以生成各种类型的音频,包括但不限于背景音乐、音效...
AI,开源 3620 0
CogView4 一键整合包 一个功能强大且易于使用的文本到图像生成模型 支持中文提示词

CogView4 一键整合包 一个功能强大且易于使用的文本到图像生成模型 支持中文提示词

该项目由群里傻木推荐,我测试了下 说实话 效果真是一般,对中文的支持还是不够好,下面有截图。我目前这个整合包只能算是半成品,目前只做到了可以运行,但是效率性能什么的都没有去做优化。以后看心血来潮了再动动。CogView4是一个前沿的文本到图像生成模型,由THUDM(清华大学计算机系自然语言处理与人机交互实验室)开发并开源在...
开源 3011 0
MMAudio  v0.1 AI视频生成背景声音  文生生成声音 一键整合包 8G英伟达显卡可用,无需安装环境,解压即可使用

MMAudio v0.1 AI视频生成背景声音 文生生成声音 一键整合包 8G英伟达显卡可用,无需安装环境,解压即可使用

MMAudio是一个开源项目,旨在通过多模态联合训练生成高质量的同步音频。以下是关于这个项目的详细介绍:项目概述MMAudio由香港中文大学的程浩基(Ho Kei Cheng)等人开发,主要功能是根据视频和/或文本输入生成同步音频。其核心创新在于多模态联合训练方法,能够在广泛的音视频和音文本数据集上进行训练。此外,同步模块可以将生成的音频与视...
AI,开源 5411 0
HivisionIDPhotos v1.3.1 一个专注于证件照智能制作的开源项目 一键整合包 支持批量处理 附视频演示

HivisionIDPhotos v1.3.1 一个专注于证件照智能制作的开源项目 一键整合包 支持批量处理 附视频演示

HivisionIDPhotos 是一个专注于证件照智能制作的开源项目,由Zeyi-Lin开发并维护。该项目旨在通过先进的图像处理和机器学习技术,为用户提供一种高效、便捷的证件照制作解决方案。项目结合了轻量级抠图、多尺寸规格生成、智能换底等多种功能,让用户能够轻松制作出符合标准的证件照。核心功能轻量级抠图:HivisionIDPhotos采用...
AI,开源 6659 19
开源 DCT-Net_Webui v20250116 修改增强版 一款将图片/视频转绘漫画效果工具 支持批量处理 附三倍快乐演示

开源 DCT-Net_Webui v20250116 修改增强版 一款将图片/视频转绘漫画效果工具 支持批量处理 附三倍快乐演示

视频转动漫的工具貌似有不少,之前我也分享了,但是今天分享的这个,操作是极其简单,我顺手还做了个批量处理。这样就更方便了。Q群一个小伙伴提供了一台远程4060显卡的机器给我远程测试,所以也顺手把N卡包也整合好了。N卡的效率确实是超级高啊,我用CPU跑10秒的视频大概要3-5分钟,但是N卡的话 一分钟不到就搞定了。确实是爽。下面是截图一下给你们看...
AI,开源 8768 10
开源 Fish Speech v1.5.0 优化版 文字转语音 可以克隆声音 一键整合包 附效果演示

开源 Fish Speech v1.5.0 优化版 文字转语音 可以克隆声音 一键整合包 附效果演示

Fish Speech是一个由Fish Audio团队开发的全新文本转语音(TTS)解决方案,旨在通过先进的机器学习和深度学习技术,将文本转换成高质量、逼真的语音输出。该项目基于CC-BY-NC-SA-4.0许可证发布,意味着任何人都可以在遵守许可证规定的前提下自由使用、改进和分享代码和模型。技术亮点Fish Speech项目采用了一系列前沿...
开源 1.2万 23
Clarity-Refiners-UI  一个专注于图像增强的开源项目 一键整合包

Clarity-Refiners-UI 一个专注于图像增强的开源项目 一键整合包

Pinokiofactory/Clarity-Refiners-UI 是一个专注于图像增强的开源项目,它基于 Pinokio UI 框架,并融合了多项先进的图像处理技术。该项目旨在为用户提供一种高效、易用且功能强大的图像增强解决方案。项目背景与目的Pinokiofactory/Clarity-Refiners-UI 是 Pinokio 工厂团...
AI,开源 3007 2
RMBG-2-Studio AI人工智能 抠图神器 一键整合包

RMBG-2-Studio AI人工智能 抠图神器 一键整合包

RMBG-2-Studio是一个基于BRIA-RMBG-2.0模型构建的增强型Pinokio应用程序,它不仅包含了安装文件,还提供了一系列强大的图像处理功能。以下是对该开源项目的详细介绍:项目背景与目的:RMBG-2-Studio旨在为用户提供一种高效、便捷的图像背景移除和图像合成工具。它利用了BRIA AI公司开发的RMBG v2.0背景移...
AI,开源 4843 2
开源AI 免费抠图工具,可以批量抠图rembg v2.0.60 抠图速度超快 附教程+视频效果演示 一键整合包

开源AI 免费抠图工具,可以批量抠图rembg v2.0.60 抠图速度超快 附教程+视频效果演示 一键整合包

我基于rembg 开源项目打包制作,部分运行代码参考了一些网友的代码。下面是截图下面是放一些抠图的对比图片这是我批量抠图的演示,因为选的都是一个模型,所以效果确实一般,但是实际上还可以更精细,我已经把所有模型都下载下来了看截图不同的模型可以针对不同类型的图片,不是一个模型就能走天下的。这是官方的说明 可以参考下u2net : 用于一般用例的预...
AI,软件,开源 1.2万 30
InstantIR 一键整合包 AI智能高清修复图片工具 超分辨率工具

InstantIR 一键整合包 AI智能高清修复图片工具 超分辨率工具

这个项目群里的小伙伴 推荐了好多次了,之前我也试过做整合包,做完后发现BUG太多了,我就删了,看到作者最近又更新了,所以抽空把这个整合包做出来了。效果嘛 你们自己看。先来一张官方的示例图下面是我跑完的效果下面继续看我用其他图片跑的出来的效果跑一张图片大概需要3-4分钟。下面是界面截图下面是这个项目的AI介绍nstantIR 是一个在 GitH...
AI,开源 4965 0
复旦、百度联手推出全新AI模型Hallo2 AI数字人 一键整合包,可生成高清4K数字人视频

复旦、百度联手推出全新AI模型Hallo2 AI数字人 一键整合包,可生成高清4K数字人视频

Hallo是一个由复旦大学、百度公司、苏黎世联邦理工学院和南京大学共同开发的AI对口型肖像图像动画技术,该技术能够基于语音音频输入生成逼真且动态的肖像图像视频。以下是该项目的详细介绍:项目背景:肖像图像动画技术:该技术旨在从单个静态图像和相应的语音音频中生成一个说话的人像,在视频游戏和虚拟现实、电影和电视制作、社交媒体和数字营销等领域具有巨大...
AI,开源 8397 23
diffusers-image-outpaint  超强AI人工智能扩图工具 一键整合包

diffusers-image-outpaint 超强AI人工智能扩图工具 一键整合包

Diffusers Image Outpaint 是一个在 Hugging Face 上的开源项目,它为图像外绘(image outpainting)提供了强大的工具和解决方案。一、项目背景与目标在图像处理领域,有时我们需要对图像进行扩展或修复,尤其是在图像的边缘部分进行外绘,以创造出更完整或更具创意的图像效果。Diffusers Image...
AI,开源 1.2万 17
PuLID-flux模型 AI整合包 字节 开源的图像生成ID定制化项目,通过对比对齐技术引领纯净高效新纪元

PuLID-flux模型 AI整合包 字节 开源的图像生成ID定制化项目,通过对比对齐技术引领纯净高效新纪元

PuLID是一个由ByteDance Inc.开发的开源项目,专注于通过对比对齐技术实现纯净且高效的图像生成ID定制化。该项目由Zinan Guo、Yanze Wu、Zhuowei Chen、Lang Chen和Qian He等研究人员共同贡献,其中Zinan Guo和Yanze Wu为等量贡献者,Yanze Wu为通讯作者。PuLID项目的...
AI,开源 6796 13
Flux 文生图模型 一键整合包 解压即可食用 出图效果超级惊艳 附图片演示

Flux 文生图模型 一键整合包 解压即可食用 出图效果超级惊艳 附图片演示

Flux文生图模型是由Black Forest Labs(黑森林实验室)开发的一款高质量文本到图像生成模型。该模型在多个维度上展现了卓越性能,特别是在文本引导的图像生成、多主体场景构建以及精细的手部细节生成等方面,实现了显著的提升,为文生图领域设定了新的技术标杆。Flux模型的核心特点包括:高性能与高质量:Flux模型采用了先进的混合架构,融...
AI,开源 1.2万 59
开源 CogVideoX 文字生成视频 整合包

开源 CogVideoX 文字生成视频 整合包

CogVideoX是智谱AI推出的一款开源视频生成模型,该项目在视频生成领域引起了广泛关注。以下是对CogVideoX开源项目的详细介绍:一、项目背景与简介CogVideoX作为智谱AI的创新成果,旨在通过深度学习技术将文本或图像转换为高质量的视频内容。该项目不仅推动了视频生成技术的边界,还为创作者提供了全新的创作工具和平台。CogVideo...
AI,开源 4736 3
开源 ReHiFace-S 一款集高保真、实时性、易用性于一身的换脸神器 附视频演示 整合包

开源 ReHiFace-S 一款集高保真、实时性、易用性于一身的换脸神器 附视频演示 整合包

这个项目我已经做好了几天了,在群里也是分享了,经过几天的运行测试后,现在已经非常稳定了,所以今天抽空整理下分享出来。换脸的效果还是很不错的,你们可以下面的视频演示就知道了。虽然我之前也已经分享了几个换脸的工具了,但是谁又会在意多一个呢?多一个选择总是好的。这个操作是极其简单的。选择人脸,选择视频点下提交就可以换脸了。特别适合那些电脑基础差的小...
AI,开源 1万 35
神器 Civitai-Web-Scraper C站图片下载工具 整合包

神器 Civitai-Web-Scraper C站图片下载工具 整合包

Civitai-Web-Scraper是一款专为挖掘CivitAI平台上丰富的人工智能生成图像及其灵感提示而设计的开源工具。该项目由ScreamingHawk在GitHub上开源,旨在帮助艺术家、设计师、AI研究人员以及普通爱好者轻松访问和获取CivitAI网站上的AI创作内容。主要功能与特点:一键式抓取:Civitai-Web-Scrape...
AI,开源 4104 4
PhotoMaker v2 整合包 高效地定制化生成任意风格的逼真人类照片!附视频教程

PhotoMaker v2 整合包 高效地定制化生成任意风格的逼真人类照片!附视频教程

PhotoMaker是一个由腾讯ARC实验室和南开大学MCG-NKU联合开发的前沿图像生成工具,该项目在CVPR 2024会议上进行了展示。PhotoMaker旨在通过堆叠的ID嵌入技术,实现对真实人类照片的定制化编辑与生成。其核心功能在于能够迅速根据用户提供的参考图像(ID图像),结合文本提示,生成具有高度身份一致性(ID fidelity...
AI,开源 6378 6
开源 MDX23  v1.0.1 一款超强AI背景音人声分离工具

开源 MDX23 v1.0.1 一款超强AI背景音人声分离工具

MVSEP-MDX23-music-separation-model 是一个专为2023年音乐分离挑战赛(MDX'23)设计的音频分离模型,它能够将音乐分解为四个独立的音轨:“低音”、“鼓声”、“人声”和“其他”。该模型在挑战赛中取得了第三名的好成绩(Leaderboard C),证明了其在音乐分离领域的强大实力。此模型基于Demuc...
开源 3065 0
开源 Pure Live v1.1.0 免费聚合直播平台录制工具

开源 Pure Live v1.1.0 免费聚合直播平台录制工具

Pure Live是一款基于Flutter框架开发的直播转码软件,专为Android和Windows平台设计,旨在提供用户轻松观看直播的体验。该软件的核心特点在于其所有数据均由本地机器获取并处理,不依赖于云端存储,确保直播数据和视频版权始终归原平台所有,为用户的数据安全和隐私保护提供了坚实保障。Pure Live的界面设计简洁直观,支持多种设...
开源 3118 2
开源 Waifu2x Caffe v1.2.0.4 一个功能强大且效果优秀的图像无损放大处理工具

开源 Waifu2x Caffe v1.2.0.4 一个功能强大且效果优秀的图像无损放大处理工具

waifu2x-caffe 是一个开源软件项目,旨在通过使用深度学习技术来提高图像的分辨率和质量。这个项目最初是由日本工程师lltcggie开发的,基于 Caffe 深度学习框架实现。waifu2x-caffe 的主要功能是将低分辨率的图像放大至高分辨率,并提升图像的视觉质量,尤其在处理动漫风格的图像方面表现出色。这个软件的强大之处在于其通过...
开源 7989 0
LivePortrait 整合包 AI表情同步(表情迁移),支持N卡。附视频演示

LivePortrait 整合包 AI表情同步(表情迁移),支持N卡。附视频演示

LivePortrait是一款由快手科技与中国科学技术大学和复旦大学合作开发的先进AI驱动的肖像动画框架,其项目地址位于https://github.com/KwaiVGI/LivePortrait。该软件旨在通过创新的图像处理技术,将静态的照片转化为栩栩如生的动态视频,为用户带来更加生动有趣的视觉体验。核心特点高效性:LivePortrai...
AI,开源 4597 2
开源 MimicBrush 一款创新性AI图像编辑工具 图片局部自动重绘 一键整合包 附模型

开源 MimicBrush 一款创新性AI图像编辑工具 图片局部自动重绘 一键整合包 附模型

MimicBrush是一款由阿里巴巴、中国香港大学和蚂蚁集团共同研发的创新性AI图像编辑工具,该软件通过先进的AI技术,实现了零样本图像编辑,为用户带来了前所未有的图像编辑体验。核心特点模仿式编辑:MimicBrush能够自动识别并模仿参考图像中的视觉元素,将其应用到源图像中指定的编辑区域,实现精准且自然的图像融合。自动化编辑:用户只需简单指...
开源 4956 3
UltimateVocalRemoverGUI 5.6 开源人声分离软件 适配A卡

UltimateVocalRemoverGUI 5.6 开源人声分离软件 适配A卡

转换速度还可以,我玩了一上午,大概10多秒就可以转一次1分钟左右的音频。效果还是不错的,分离出来的人声很干净,如果搭配其他字幕软件是很容易被识别出来的。关键是这个软件安装好就可以用了,不需要去设置一些复杂的参数什么的。UltimateVocalRemoverGUI是一款开源的人声分离软件,采用了最先进的音源分离模型,以去除音频文件中的人声。该...
开源 4609 6
开源 AI重现人类绘图过程,并生成视频 Paints-UNDO 一键整合包 附视频演示

开源 AI重现人类绘图过程,并生成视频 Paints-UNDO 一键整合包 附视频演示

Paints-Undo是一个专注于数字绘画行为的创新AI模型项目,其目标是为人类艺术家和研究者提供一个基础模型,以更好地理解和模拟人类绘画的过程。Paints-Undo的核心功能在于它能够通过输入图像,反向推导出绘制该图像的一系列步骤。这一功能不仅限于简单的素描、着色等过程,还能模拟复杂的阴影处理、图层变换、颜色曲线调整等人类艺术家在创作过程...
开源 4199 1
开源 免费 AI无损图片放大工具 v3.1.0 绿色免安装

开源 免费 AI无损图片放大工具 v3.1.0 绿色免安装

本程序使用了来自腾讯ARC Lab提供的Real-ESRGAN模型,目前模型主要来自于人像,能对人像进行一个较快的处理,特别是动漫图片,进行一个很好的放大。功能说明支持多线程处理支持批量图片处理支持设置选项支持自定义输出格式和自定义输出路径支持AI引擎选择支持批量清理任务系统要求:系统: Windows 7+ 运行时: .net framew...
开源 3051 7
开源 免费 AI工具 视频补帧 速度超快 让视频更丝滑 附视频演示 附下载地址

开源 免费 AI工具 视频补帧 速度超快 让视频更丝滑 附视频演示 附下载地址

首先先说明一下,这个工具不是提升视频高清质量的工具,而是补帧工具。我这里简单说下什么补帧,比如有些运动画面。看起来会有点一卡一卡的。播放不是很丝滑流畅,就可以用这个补帧工具来补帧,这样处理好后的视频就会更丝滑了。这个工具没有N卡也可以跑,我用cpu跑速度也不错。解压即可食用,简单方便。下面是详细介绍 你们看看随着高清和超高清视频的普及,对于视...
开源 5827 14