LivePortrait 整合包 AI表情同步(表情迁移)，支持N卡。附视频演示,AI工具，开源整合包

AI#软件工具 # 编程开发 # 免费 # 整合包

LNMP v2.2正式版一键网站环境部署包

LNMP一键安装包是一个用Linux Shell编写的可以为Linux服务器搭建网站环境的shell程序，LNMP代指Linux，Nginx，MySQL和PHP，相似的我们还可以到LAMP（Linux，Apache，Mysql，Php），WAMP（Windows，Apache，Mysql，Php）等等一键部署包。LNMP支持自定义Nginx、...

2025-4-14 AI,软件 2420 0

AI#开源日常应用 # 音乐 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包

AudioX 一个极具创新性和实用性的AI开源音频和视频生成工具。一键汉化整合包

AudioX是一个创新的开源项目，专注于实现一种全新的音频与音乐生成方式。该项目由Zeyue Tian及其团队开发，并在GitHub上公开分享，为音频生成领域带来了革命性的突破。AudioX的核心是一个统一的Diffusion Transformer模型，旨在解决现有音频生成方法中的局限性，如模态隔离、高质量多模态训练数据稀缺以及多样化输入整...

2025-4-10 AI,开源 5632 14

AI#开源图像处理 # 工具 # 日常应用 # 视频处理 # 绿色软件 # 开源 # 抠像 # 抠图 # 人工智能 # AI # 免费 # 效率工具 # 整合包

BEN2 v1.1 AI人工智能图片批量抠图+视频抠像工具一键整合包视频可以输出透明通道

虽然我已经分享了不少的抠图和视频抠像的工具，但是谁又会嫌弃好工具多呢？所以抽空做了这个BEN2的整合包，这个整合包最大的特点就是可以输出带有透明通道的webm视频格式。在图像和视频处理领域，前景分割技术一直是研究和应用的热点。无论是视频编辑、特效制作，还是人工智能驱动的内容生成，精准的前景分割都是实现高质量输出的关键。而今天我们要介绍的，是一...

2025-4-1 AI,开源 6468 5

AI#开源工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

ClearerVoice-Studio AI语音增强、语音降噪工具，一键整合包，二开作品支持批量操作

ClearerVoice-Studio是由阿里巴巴达摩院通义实验室开源的综合性语音处理工具包，旨在为语音技术研究和应用提供高效解决方案。其核心功能覆盖语音增强、分离、目标说话人提取及超分辨率处理，通过融合复数域深度学习算法与先进模型架构，显著提升了复杂声学场景下的语音处理效果。技术架构与核心优势该框架采用复数域深度学习技术，通过FRCRN（复...

2025-3-25 AI,开源 4661 0

AI#开源工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

MeloTTS v0.1.2 AI文本生成语音工具，支持英伟达显卡+cpu运行，速度极快支持六国语言，一键整合包

MeloTTS：高质量多语言文本到语音合成工具详解MeloTTS是由MyShell AI开发的一款开源文本到语音（TTS）合成工具，其核心目标是提供高效、自然的多语言语音合成解决方案。该工具通过深度学习技术实现了从文本到语音的流畅转换，支持包括英语、中文、日语、韩语在内的多种语言，尤其在中英混合发音场景中具有显著优势。以下从技术架构、核心功能...

2025-3-24 AI,开源 3394 4

AI#开源工具 # 日常应用 # 视频处理 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 数字人 # 效率工具 # 整合包

LatentSync v1.5 字节跳动联合北京交通大学推出AI数字人工具，汉化一键整合包

LatentSync是由字节跳动联合北京交通大学推出的端到端唇形同步框架，基于音频条件潜在扩散模型（Latent Diffusion Models），旨在实现语音与唇形运动的高精度同步。该项目通过结合Stable Diffusion的生成能力与音视频联合建模技术，解决了传统方法依赖中间表示（如3D模型或2D关键点）的复杂性问题，直接生成动态逼...

2025-3-23 AI,开源 5857 17

AI#开源工具 # 日常应用 # 音乐 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包

AI音乐生成工具v1.1基于 DiffRhythm 二次开发。webui界面不卡死，速度快英伟达显卡6g即可运行, 一键整合包

DiffRhythm：基于差分节奏建模的通用音乐流派分类开源项目DiffRhythm是由ASLP实验室提出的开源项目，旨在通过创新的差分节奏建模（Differential Rhythm Modeling）框架解决音乐流派分类任务。该项目结合传统信号处理与深度学习技术，从节奏这一音乐核心要素出发，构建了具有强解释性和泛化能力的分类模型。其代码已...

2025-3-20 AI,开源 4301 5

AI#开源图像处理 # 工具 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

AI人工智能图片高清修复放大Tile-Upscaler v1.0 一键汉化整合包

本工具基于Tile-Upscaler二次开发，简单直接，操作点2下即可，图片高清修复效果还不错,处理速度我的4070tisuper一张1080x1920的图片大概8秒就可以完成高清修复。效果演示原图我个人觉得高清修复效果还可以。所以就花了点时间整合了一下，另外修改了部分代码1 修正一些小bug2 删除没用的演示例子3&nb...

2025-3-16 AI,开源 4692 2

AI#开源图像处理 # 工具 # 视频处理 # 绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 效率工具 # 整合包

MatAnyone v1.0.0 人工智能AI 自定义视频抠图一键汉化整合包附视频演示

MatAnyone是一个专注于人类视频抠图（Matting）的实用框架，其独特之处在于支持目标分配功能，并能在核心区域语义和精细边界细节上表现出稳定的性能。该项目由Peiqing Yang等人在2025年提出，并在CVPR（Conference on Computer Vision and Pattern Recognition）这一顶级计算...

2025-3-14 AI,开源 7217 12

AI#开源语音 # 工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

InspireMusic AI人工智能音乐、歌曲和音频生成的开源一键中文整合包

InspireMusic是一个专注于音乐、歌曲和音频生成的开源项目，它提供了一个统一的框架来实现这些生成任务。以下是对该项目的详细介绍：主要功能音乐生成：支持文本提示、音乐类型、音乐结构等多种控制方式，可生成高质量的音乐作品。歌曲生成：能够根据用户的文本描述或音乐结构生成完整的歌曲。音频生成：可以生成各种类型的音频，包括但不限于背景音乐、音效...

2025-3-13 AI,开源 3167 0

AI#开源工具 # 视频处理 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包

MMAudio v0.1 AI视频生成背景声音文生生成声音一键整合包 8G英伟达显卡可用，无需安装环境，解压即可使用

MMAudio是一个开源项目，旨在通过多模态联合训练生成高质量的同步音频。以下是关于这个项目的详细介绍：项目概述MMAudio由香港中文大学的程浩基（Ho Kei Cheng）等人开发，主要功能是根据视频和/或文本输入生成同步音频。其核心创新在于多模态联合训练方法，能够在广泛的音视频和音文本数据集上进行训练。此外，同步模块可以将生成的音频与视...

2025-2-24 AI,开源 4630 0

AI#开源工具 # 神器 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 整合包

HivisionIDPhotos v1.3.1 一个专注于证件照智能制作的开源项目一键整合包支持批量处理附视频演示

HivisionIDPhotos 是一个专注于证件照智能制作的开源项目，由Zeyi-Lin开发并维护。该项目旨在通过先进的图像处理和机器学习技术，为用户提供一种高效、便捷的证件照制作解决方案。项目结合了轻量级抠图、多尺寸规格生成、智能换底等多种功能，让用户能够轻松制作出符合标准的证件照。核心功能轻量级抠图：HivisionIDPhotos采用...

2025-1-22 AI,开源 5486 19

AI#开源视频处理 # 开源 # 人工智能 # AI # 视频工具 # 整合包

开源 DCT-Net_Webui v20250116 修改增强版一款将图片/视频转绘漫画效果工具支持批量处理附三倍快乐演示

视频转动漫的工具貌似有不少，之前我也分享了，但是今天分享的这个，操作是极其简单，我顺手还做了个批量处理。这样就更方便了。Q群一个小伙伴提供了一台远程4060显卡的机器给我远程测试，所以也顺手把N卡包也整合好了。N卡的效率确实是超级高啊，我用CPU跑10秒的视频大概要3-5分钟，但是N卡的话一分钟不到就搞定了。确实是爽。下面是截图一下给你们看...

2025-1-16 AI,开源 8036 10

AI#软件工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 整合包

moondream v1.2 开源 AI人工智能图片反推提示词神器，可批量处理图片提示词一键整合包

vikhyat/moondream是一个开源的、轻量级的视觉语言模型项目，旨在提供强大的图像理解和生成能力，同时确保模型可以在各种环境下高效运行。该项目在GitHub上托管，拥有简洁的代码库和丰富的文档资源，为开发者提供了便捷的使用和定制体验。项目的核心是一个视觉语言模型，该模型能够接收图像作为输入，并基于图像内容生成相应的文本描述或回答相关...

2024-12-10 AI,软件 6913 12

AI#开源图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 图片增强 # 整合包

Clarity-Refiners-UI 一个专注于图像增强的开源项目一键整合包

Pinokiofactory/Clarity-Refiners-UI 是一个专注于图像增强的开源项目，它基于 Pinokio UI 框架，并融合了多项先进的图像处理技术。该项目旨在为用户提供一种高效、易用且功能强大的图像增强解决方案。项目背景与目的Pinokiofactory/Clarity-Refiners-UI 是 Pinokio 工厂团...

2024-11-30 AI,开源 2547 2

AI#开源图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 效率工具 # 整合包

RMBG-2-Studio AI人工智能抠图神器一键整合包

RMBG-2-Studio是一个基于BRIA-RMBG-2.0模型构建的增强型Pinokio应用程序，它不仅包含了安装文件，还提供了一系列强大的图像处理功能。以下是对该开源项目的详细介绍：项目背景与目的：RMBG-2-Studio旨在为用户提供一种高效、便捷的图像背景移除和图像合成工具。它利用了BRIA AI公司开发的RMBG v2.0背景移...

2024-11-29 AI,开源 4106 2

AI#软件#开源开源 # 图片处理 # 抠图 # AI # 免费 # 教程 # 整合包

开源AI 免费抠图工具，可以批量抠图rembg v2.0.60 抠图速度超快附教程+视频效果演示一键整合包

我基于rembg 开源项目打包制作，部分运行代码参考了一些网友的代码。下面是截图下面是放一些抠图的对比图片这是我批量抠图的演示，因为选的都是一个模型，所以效果确实一般，但是实际上还可以更精细，我已经把所有模型都下载下来了看截图不同的模型可以针对不同类型的图片，不是一个模型就能走天下的。这是官方的说明可以参考下u2net : 用于一般用例的预...

2024-11-26 AI,软件,开源 1.1万 30

AI#开源图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 整合包

InstantIR 一键整合包 AI智能高清修复图片工具超分辨率工具

这个项目群里的小伙伴推荐了好多次了，之前我也试过做整合包，做完后发现BUG太多了，我就删了，看到作者最近又更新了，所以抽空把这个整合包做出来了。效果嘛你们自己看。先来一张官方的示例图下面是我跑完的效果下面继续看我用其他图片跑的出来的效果跑一张图片大概需要3-4分钟。下面是界面截图下面是这个项目的AI介绍nstantIR 是一个在 GitH...

2024-11-15 AI,开源 4583 0

AI#开源工具 # 开源 # 人工智能 # AI # 免费 # 数字人 # 整合包

复旦、百度联手推出全新AI模型Hallo2 AI数字人一键整合包，可生成高清4K数字人视频

Hallo是一个由复旦大学、百度公司、苏黎世联邦理工学院和南京大学共同开发的AI对口型肖像图像动画技术，该技术能够基于语音音频输入生成逼真且动态的肖像图像视频。以下是该项目的详细介绍：项目背景：肖像图像动画技术：该技术旨在从单个静态图像和相应的语音音频中生成一个说话的人像，在视频游戏和虚拟现实、电影和电视制作、社交媒体和数字营销等领域具有巨大...

2024-10-19 AI,开源 7281 23

AI#开源图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 人工智能 # AI # 整合包

diffusers-image-outpaint 超强AI人工智能扩图工具一键整合包

Diffusers Image Outpaint 是一个在 Hugging Face 上的开源项目，它为图像外绘（image outpainting）提供了强大的工具和解决方案。一、项目背景与目标在图像处理领域，有时我们需要对图像进行扩展或修复，尤其是在图像的边缘部分进行外绘，以创造出更完整或更具创意的图像效果。Diffusers Image...

2024-10-7 AI,开源 1.1万 16

AI#软件语音 # 工具 # 文本 # 神器 # 音频处理 # 开源 # 免费 # 整合包

EzAudio: High-quality Text-to-Audio Generator AI文本生成音乐音效一键整合包 20240929修改增强

超级实用的一个AI开源工具，可以输入文本来生成各种声音，感觉这个很有实用场景啊，群里小伙伴推荐的一个项目。我花了点时间做成了整合包。腾讯AI实验室与约翰霍普金斯大学强强联手，共同推出了EzAudio这一革命性的文本到音频生成模型。EzAudio以其前所未有的高效能与卓越音质，为人工智能与音频技术的融合树立了新的里程碑。EzAudio之所以能在...

2024-9-29 AI,软件 3609 0

AI#开源语音 # 神器 # 人工智能 # AI # 文字 # 字幕 # 识别 # 利器 # 整合包

开源免费 AI语音识别转文字工具，制作视频字幕的利器 stt v0.94 整合包附全部模型

下面文字是作者原话这是一个离线运行的本地语音识别转文字工具，基于 fast-whipser 开源模型，可将视频/音频中的人类声音识别并转为文字，可输出json格式、srt字幕带时间戳格式、纯文字格式。可用于自行部署后替代 openai 的语音识别接口或百度语音识别等，准确率基本等同openai官方api接口。部署或下载后，双击 start.e...

2024-9-24 AI,开源 4532 6

AI#开源开源 # 人工智能 # AI # 免费 # 整合包

PuLID-flux模型 AI整合包字节开源的图像生成ID定制化项目，通过对比对齐技术引领纯净高效新纪元

PuLID是一个由ByteDance Inc.开发的开源项目，专注于通过对比对齐技术实现纯净且高效的图像生成ID定制化。该项目由Zinan Guo、Yanze Wu、Zhuowei Chen、Lang Chen和Qian He等研究人员共同贡献，其中Zinan Guo和Yanze Wu为等量贡献者，Yanze Wu为通讯作者。PuLID项目的...

2024-9-19 AI,开源 5868 13

AI#开源开源 # 人工智能 # AI # 模型 # 整合包

Flux 文生图模型一键整合包解压即可食用出图效果超级惊艳附图片演示

Flux文生图模型是由Black Forest Labs（黑森林实验室）开发的一款高质量文本到图像生成模型。该模型在多个维度上展现了卓越性能，特别是在文本引导的图像生成、多主体场景构建以及精细的手部细节生成等方面，实现了显著的提升，为文生图领域设定了新的技术标杆。Flux模型的核心特点包括：高性能与高质量：Flux模型采用了先进的混合架构，融...

2024-9-18 AI,开源 1万 59

AI#开源工具 # 视频处理 # 神器 # 开源 # 人工智能 # AI # 整合包

开源 CogVideoX 文字生成视频整合包

CogVideoX是智谱AI推出的一款开源视频生成模型，该项目在视频生成领域引起了广泛关注。以下是对CogVideoX开源项目的详细介绍：一、项目背景与简介CogVideoX作为智谱AI的创新成果，旨在通过深度学习技术将文本或图像转换为高质量的视频内容。该项目不仅推动了视频生成技术的边界，还为创作者提供了全新的创作工具和平台。CogVideo...

2024-9-6 AI,开源 4291 3

AI#开源工具 # 绿色软件 # 开源 # 人工智能 # AI # 换脸 # 整合包

开源 ReHiFace-S 一款集高保真、实时性、易用性于一身的换脸神器附视频演示整合包

这个项目我已经做好了几天了，在群里也是分享了，经过几天的运行测试后，现在已经非常稳定了，所以今天抽空整理下分享出来。换脸的效果还是很不错的，你们可以下面的视频演示就知道了。虽然我之前也已经分享了几个换脸的工具了，但是谁又会在意多一个呢？多一个选择总是好的。这个操作是极其简单的。选择人脸，选择视频点下提交就可以换脸了。特别适合那些电脑基础差的小...

2024-9-4 AI,开源 9479 35

AI#开源工具 # 网络工具 # 神器 # 下载工具 # 绿色软件 # 图形图像 # 开源 # 免费 # 整合包

神器 Civitai-Web-Scraper C站图片下载工具整合包

Civitai-Web-Scraper是一款专为挖掘CivitAI平台上丰富的人工智能生成图像及其灵感提示而设计的开源工具。该项目由ScreamingHawk在GitHub上开源，旨在帮助艺术家、设计师、AI研究人员以及普通爱好者轻松访问和获取CivitAI网站上的AI创作内容。主要功能与特点：一键式抓取：Civitai-Web-Scrape...

2024-8-25 AI,开源 3492 4

AI#软件图像处理 # 工具 # 日常应用 # 思维导图 # 绿色软件 # 图形图像 # 开源 # 人工智能 # AI # 图片放大 # 免费 # 整合包

腾讯开源GFPGAN图片无损放大，一键懒人包

GFPGAN是一个由腾讯PCG应用研究中心（ARC）开发的开源项目，专注于现实世界中的人脸修复算法。它利用预训练的人脸生成对抗网络（GAN）中的丰富先验信息来进行盲脸修复，尤其擅长处理低分辨率或损坏的人脸图像。GFPGAN主要特点：实用性：旨在为实际应用中的人脸恢复提供实用算法。先验信息：利用GAN（如StyleGAN2）中的丰富和多样先验信...

2024-8-25 AI,软件 4067 10

AI#开源绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 教程 # 整合包

PhotoMaker v2 整合包高效地定制化生成任意风格的逼真人类照片！附视频教程

PhotoMaker是一个由腾讯ARC实验室和南开大学MCG-NKU联合开发的前沿图像生成工具，该项目在CVPR 2024会议上进行了展示。PhotoMaker旨在通过堆叠的ID嵌入技术，实现对真实人类照片的定制化编辑与生成。其核心功能在于能够迅速根据用户提供的参考图像（ID图像），结合文本提示，生成具有高度身份一致性（ID fidelity...

2024-8-11 AI,开源 5601 6

AI#开源开源 # 人工智能 # AI # 动漫 # 整合包

Diffutoon AI视频转动漫整合包附视频演示

这个项目对显卡要求有点高，我大概10秒的视频转成动漫风格8G的4060大概需要1小时左右。所以你如果显存低于8G 就不要试了。CPU也会占用不少。整合包我已经做好了，解压后记得先安装好cuda就可以使用了。下面是视频演示

2024-8-4 AI,开源 4211 8

AI#软件语音 # 工具 # 神器 # 绿色软件 # 开源 # 人工智能 # AI # 整合包

开源 AI EmotiVoice 易魔声文本生成语音一款功能强大且现代的开源文本转语音（TTS）引擎

EmotiVoice（易魔声）是一款功能强大且现代的开源文本转语音（TTS）引擎，由网易有道开源并维护。该软件以其中英文双语支持和超过2000种不同的音色而闻名，为用户提供了极为丰富的声音选择。以下是对EmotiVoice（易魔声）的详细介绍：一、核心功能双语言支持：EmotiVoice支持中英文两种语言的文本转语音，满足了不同用户的语言需求...

2024-7-31 AI,软件 4936 6

AI#开源开源 # 人工智能 # AI # 免费 # 整合包

LivePortrait 整合包 AI表情同步(表情迁移)，支持N卡。附视频演示

LivePortrait是一款由快手科技与中国科学技术大学和复旦大学合作开发的先进AI驱动的肖像动画框架，其项目地址位于https://github.com/KwaiVGI/LivePortrait。该软件旨在通过创新的图像处理技术，将静态的照片转化为栩栩如生的动态视频，为用户带来更加生动有趣的视觉体验。核心特点高效性：LivePortrai...

2024-7-30 AI,开源 4077 2

站长推荐