开源 免费 ChatTTS 一个用于日常对话的生成式语音模型 自带情感 文字转语音工具,

超爽自制Comfyui工作流一键批量读取海量提示词，生成海量不同图片。挂机生图专用 flux+xl模型

这个工作流算是我的第二步构想，第一步就是批量生成提示词，这个工具已经分享出来了moondream v1.2 开源 AI人工智能图片反推提示词神器，可批量处理图片提示词一键整合包升级比较大。然后生成的提示词用现在的这个工作流来生成对应的图片，效果是相当劲爆了现在这个截图就是我下午一直在挂机生图的这个工作流，具体有多少行提示词我也没数。我...

2024-12-12 素材 7766 6

AI#软件工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 整合包

moondream v1.2 开源 AI人工智能图片反推提示词神器，可批量处理图片提示词一键整合包

vikhyat/moondream是一个开源的、轻量级的视觉语言模型项目，旨在提供强大的图像理解和生成能力，同时确保模型可以在各种环境下高效运行。该项目在GitHub上托管，拥有简洁的代码库和丰富的文档资源，为开发者提供了便捷的使用和定制体验。项目的核心是一个视觉语言模型，该模型能够接收图像作为输入，并基于图像内容生成相应的文本描述或回答相关...

2024-12-10 AI,软件 8724 11

AI#开源图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 图片增强 # 整合包

Clarity-Refiners-UI 一个专注于图像增强的开源项目一键整合包

Pinokiofactory/Clarity-Refiners-UI 是一个专注于图像增强的开源项目，它基于 Pinokio UI 框架，并融合了多项先进的图像处理技术。该项目旨在为用户提供一种高效、易用且功能强大的图像增强解决方案。项目背景与目的Pinokiofactory/Clarity-Refiners-UI 是 Pinokio 工厂团...

2024-11-30 AI,开源 3164 2

AI#开源图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 效率工具 # 整合包

RMBG-2-Studio AI人工智能抠图神器一键整合包

RMBG-2-Studio是一个基于BRIA-RMBG-2.0模型构建的增强型Pinokio应用程序，它不仅包含了安装文件，还提供了一系列强大的图像处理功能。以下是对该开源项目的详细介绍：项目背景与目的：RMBG-2-Studio旨在为用户提供一种高效、便捷的图像背景移除和图像合成工具。它利用了BRIA AI公司开发的RMBG v2.0背景移...

2024-11-29 AI,开源 5085 2

AI#软件#开源开源 # 图片处理 # 抠图 # AI # 免费 # 教程 # 整合包

开源AI 免费抠图工具，可以批量抠图rembg v2.0.60 抠图速度超快附教程+视频效果演示一键整合包

我基于rembg 开源项目打包制作，部分运行代码参考了一些网友的代码。下面是截图下面是放一些抠图的对比图片这是我批量抠图的演示，因为选的都是一个模型，所以效果确实一般，但是实际上还可以更精细，我已经把所有模型都下载下来了看截图不同的模型可以针对不同类型的图片，不是一个模型就能走天下的。这是官方的说明可以参考下u2net : 用于一般用例的预...

2024-11-26 AI,软件,开源 1.3万 30

AI#开源图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 整合包

InstantIR 一键整合包 AI智能高清修复图片工具超分辨率工具

这个项目群里的小伙伴推荐了好多次了，之前我也试过做整合包，做完后发现BUG太多了，我就删了，看到作者最近又更新了，所以抽空把这个整合包做出来了。效果嘛你们自己看。先来一张官方的示例图下面是我跑完的效果下面继续看我用其他图片跑的出来的效果跑一张图片大概需要3-4分钟。下面是界面截图下面是这个项目的AI介绍nstantIR 是一个在 GitH...

2024-11-15 AI,开源 5113 0

软件图像处理 # 工具 # 绿色软件 # 人工智能 # AI # 免费 # 效率工具

不会写提示词？没有灵感？分享给你一个大杀器，一键搞定。效果超惊艳 c-pic v1.0 附视频演示

今天分享的这个工具，是我自己用了很久的一个款工具，一段时间以来，我的视频和文章的封面都是这个工具生成的，可能过于惊艳，就导致了不少的人盗用图片了。现在我把工具和方法都放出来。先随便截图几张你们看看这些图片都是写提示词的灵感来源啊。我在视频里面有讲到方法，那里没有讲那么清楚，这里文字再说明一次。首先开启你的科学上网工具，因为下载的图片来自C站，...

2024-11-7 软件 4208 11

AI#开源工具 # 开源 # 人工智能 # AI # 免费 # 数字人 # 整合包

复旦、百度联手推出全新AI模型Hallo2 AI数字人一键整合包，可生成高清4K数字人视频

Hallo是一个由复旦大学、百度公司、苏黎世联邦理工学院和南京大学共同开发的AI对口型肖像图像动画技术，该技术能够基于语音音频输入生成逼真且动态的肖像图像视频。以下是该项目的详细介绍：项目背景：肖像图像动画技术：该技术旨在从单个静态图像和相应的语音音频中生成一个说话的人像，在视频游戏和虚拟现实、电影和电视制作、社交媒体和数字营销等领域具有巨大...

2024-10-19 AI,开源 8869 23

AI#开源图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 人工智能 # AI # 整合包

diffusers-image-outpaint 超强AI人工智能扩图工具一键整合包

Diffusers Image Outpaint 是一个在 Hugging Face 上的开源项目，它为图像外绘（image outpainting）提供了强大的工具和解决方案。一、项目背景与目标在图像处理领域，有时我们需要对图像进行扩展或修复，尤其是在图像的边缘部分进行外绘，以创造出更完整或更具创意的图像效果。Diffusers Image...

2024-10-7 AI,开源 1.3万 17

软件工具 # 视频处理 # 开源 # 人工智能 # AI # 视频剪辑 # 多图预览

开源 Tailor v0.1.5 一款功能强大的视频智能裁剪、生成及优化工具

Tailor 是一款功能强大的视频智能裁剪、生成及优化工具。这款软件集成了最先进的人工智能技术，为用户提供了前所未有的视频处理体验。Tailor涵盖了视频剪辑、视频生成和视频优化三大核心功能，共包含10种不同的处理方法。在视频剪辑方面，Tailor拥有精准的人脸识别技术，能够自动捕捉视频中的精彩人脸瞬间，并允许用户轻松选择关注的人脸进行裁剪，...

2024-9-20 软件 5488 12

AI#开源开源 # 人工智能 # AI # 免费 # 整合包

PuLID-flux模型 AI整合包字节开源的图像生成ID定制化项目，通过对比对齐技术引领纯净高效新纪元

PuLID是一个由ByteDance Inc.开发的开源项目，专注于通过对比对齐技术实现纯净且高效的图像生成ID定制化。该项目由Zinan Guo、Yanze Wu、Zhuowei Chen、Lang Chen和Qian He等研究人员共同贡献，其中Zinan Guo和Yanze Wu为等量贡献者，Yanze Wu为通讯作者。PuLID项目的...

2024-9-19 AI,开源 7237 13

AI#开源开源 # 人工智能 # AI # 模型 # 整合包

Flux 文生图模型一键整合包解压即可食用出图效果超级惊艳附图片演示

Flux文生图模型是由Black Forest Labs（黑森林实验室）开发的一款高质量文本到图像生成模型。该模型在多个维度上展现了卓越性能，特别是在文本引导的图像生成、多主体场景构建以及精细的手部细节生成等方面，实现了显著的提升，为文生图领域设定了新的技术标杆。Flux模型的核心特点包括：高性能与高质量：Flux模型采用了先进的混合架构，融...

2024-9-18 AI,开源 1.2万 53

软件开源 # 人工智能 # AI # 换脸

应群友要求，我把开源 AI人脸替换工具离线版之前发布的一些版本整理一下再分享出来

群里一些小伙伴老在讲什么之前的老版本如何如何好用，如何得心应手。说实话我自己没有什么感觉。估计他们这些都是幻觉。但是你们要是喜欢之前的版本，我也是可以再分享出来，时间也是过得好快啊。截图如下版本如下估计差不多了吧，应该没什么遗漏了。喜欢老版本的可以去下载试试。如果全部收藏的话大概有170多G。。。你们看截图写在最后的最后，如果对这个工具使...

2024-9-15 软件 1.4万 17

素材人工智能 # AI # 模型

本群第一个自练 flux lora模型苗疆倩影

群内大牛icolor 自练了一个lora模型，首发在里布上。我也觉得非常牛X了本LORA由近300张苗族服饰、头饰等高清美图，经36000步近12小时炼制而成，经过本人测试后精选其一分享给大家使用。本人算力有限，在本地forge中使用dve Q8以及dve NF4模型进行测试，本LORA对人物服饰、脸型、肤色、整体色调色彩均有加强，可使用原版...

2024-9-11 素材 3791 2

AI#开源工具 # 视频处理 # 神器 # 开源 # 人工智能 # AI # 整合包

开源 CogVideoX 文字生成视频整合包

CogVideoX是智谱AI推出的一款开源视频生成模型，该项目在视频生成领域引起了广泛关注。以下是对CogVideoX开源项目的详细介绍：一、项目背景与简介CogVideoX作为智谱AI的创新成果，旨在通过深度学习技术将文本或图像转换为高质量的视频内容。该项目不仅推动了视频生成技术的边界，还为创作者提供了全新的创作工具和平台。CogVideo...

2024-9-6 AI,开源 4914 3

AI#开源工具 # 绿色软件 # 开源 # 人工智能 # AI # 换脸 # 整合包

开源 ReHiFace-S 一款集高保真、实时性、易用性于一身的换脸神器附视频演示整合包

这个项目我已经做好了几天了，在群里也是分享了，经过几天的运行测试后，现在已经非常稳定了，所以今天抽空整理下分享出来。换脸的效果还是很不错的，你们可以下面的视频演示就知道了。虽然我之前也已经分享了几个换脸的工具了，但是谁又会在意多一个呢？多一个选择总是好的。这个操作是极其简单的。选择人脸，选择视频点下提交就可以换脸了。特别适合那些电脑基础差的小...

2024-9-4 AI,开源 1.1万 31

软件工具 # 视频处理 # 神器 # 绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 视频修复 # 高清修复 # 免费

神器开源 CodeFormer v20240114 图片+视频+人脸高清修复解压即用

CodeFormer是一个基于AI技术的深度学习项目，由南洋理工大学和商汤科技联合研究中心共同开发。该项目专注于人脸复原领域，通过深度学习模型提升模糊或受损人脸图像的质量。CodeFormer结合了VQGAN和Transformer两种先进的神经网络架构，其中VQGAN利用向量量化技术将图像编码为一系列离散的向量，并通过解码器恢复成图像，而T...

2024-9-2 软件 5877 4

AI#软件图像处理 # 工具 # 日常应用 # 思维导图 # 绿色软件 # 图形图像 # 开源 # 人工智能 # AI # 图片放大 # 免费 # 整合包

腾讯开源GFPGAN图片无损放大，一键懒人包

GFPGAN是一个由腾讯PCG应用研究中心（ARC）开发的开源项目，专注于现实世界中的人脸修复算法。它利用预训练的人脸生成对抗网络（GAN）中的丰富先验信息来进行盲脸修复，尤其擅长处理低分辨率或损坏的人脸图像。GFPGAN主要特点：实用性：旨在为实际应用中的人脸恢复提供实用算法。先验信息：利用GAN（如StyleGAN2）中的丰富和多样先验信...

2024-8-25 AI,软件 5034 10

AI#开源绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 教程 # 整合包

PhotoMaker v2 整合包高效地定制化生成任意风格的逼真人类照片！附视频教程

PhotoMaker是一个由腾讯ARC实验室和南开大学MCG-NKU联合开发的前沿图像生成工具，该项目在CVPR 2024会议上进行了展示。PhotoMaker旨在通过堆叠的ID嵌入技术，实现对真实人类照片的定制化编辑与生成。其核心功能在于能够迅速根据用户提供的参考图像（ID图像），结合文本提示，生成具有高度身份一致性（ID fidelity...

2024-8-11 AI,开源 6656 6

AI#开源开源 # 人工智能 # AI # 动漫 # 整合包

Diffutoon AI视频转动漫整合包附视频演示

这个项目对显卡要求有点高，我大概10秒的视频转成动漫风格8G的4060大概需要1小时左右。所以你如果显存低于8G 就不要试了。CPU也会占用不少。整合包我已经做好了，解压后记得先安装好cuda就可以使用了。下面是视频演示

2024-8-4 AI,开源 5115 8

开源工具 # 绿色软件 # 音频处理 # 人工智能 # AI # 免费 # 人声分离

开源 MDX23 v1.0.1 一款超强AI背景音人声分离工具

MVSEP-MDX23-music-separation-model 是一个专为2023年音乐分离挑战赛（MDX'23）设计的音频分离模型，它能够将音乐分解为四个独立的音轨：“低音”、“鼓声”、“人声”和“其他”。该模型在挑战赛中取得了第三名的好成绩（Leaderboard C），证明了其在音乐分离领域的强大实力。此模型基于Demuc...

2024-8-4 开源 3249 0

开源绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 图片放大 # 免费

开源 Waifu2x Caffe v1.2.0.4 一个功能强大且效果优秀的图像无损放大处理工具

waifu2x-caffe 是一个开源软件项目，旨在通过使用深度学习技术来提高图像的分辨率和质量。这个项目最初是由日本工程师lltcggie开发的，基于 Caffe 深度学习框架实现。waifu2x-caffe 的主要功能是将低分辨率的图像放大至高分辨率，并提升图像的视觉质量，尤其在处理动漫风格的图像方面表现出色。这个软件的强大之处在于其通过...

2024-8-1 开源 8079 0

AI#软件语音 # 工具 # 神器 # 绿色软件 # 开源 # 人工智能 # AI # 整合包

开源 AI EmotiVoice 易魔声文本生成语音一款功能强大且现代的开源文本转语音（TTS）引擎

EmotiVoice（易魔声）是一款功能强大且现代的开源文本转语音（TTS）引擎，由网易有道开源并维护。该软件以其中英文双语支持和超过2000种不同的音色而闻名，为用户提供了极为丰富的声音选择。以下是对EmotiVoice（易魔声）的详细介绍：一、核心功能双语言支持：EmotiVoice支持中英文两种语言的文本转语音，满足了不同用户的语言需求...

2024-7-31 AI,软件 5715 6

AI#开源开源 # 人工智能 # AI # 免费 # 整合包

LivePortrait 整合包 AI表情同步(表情迁移)，支持N卡。附视频演示

LivePortrait是一款由快手科技与中国科学技术大学和复旦大学合作开发的先进AI驱动的肖像动画框架，其项目地址位于https://github.com/KwaiVGI/LivePortrait。该软件旨在通过创新的图像处理技术，将静态的照片转化为栩栩如生的动态视频，为用户带来更加生动有趣的视觉体验。核心特点高效性：LivePortrai...

2024-7-30 AI,开源 4788 2

开源绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 修图

开源 MimicBrush 一款创新性AI图像编辑工具图片局部自动重绘一键整合包附模型

MimicBrush是一款由阿里巴巴、中国香港大学和蚂蚁集团共同研发的创新性AI图像编辑工具，该软件通过先进的AI技术，实现了零样本图像编辑，为用户带来了前所未有的图像编辑体验。核心特点模仿式编辑：MimicBrush能够自动识别并模仿参考图像中的视觉元素，将其应用到源图像中指定的编辑区域，实现精准且自然的图像融合。自动化编辑：用户只需简单指...

2024-7-25 开源 5223 3

软件工具 # 视频处理 # 绿色软件 # 人工智能 # AI

开源 DiffSynth-Studio 视频风格转绘，视频转动漫一键整合包附模型附官方视频演示

写在最前面，这个开源项目我早就关注了，但是一直没有合适的硬件来折腾，但是不折腾又不甘心。这不群里傻木小伙伴提供了一台机器暂时折腾一下，我就用这个机器昨天抽空弄了这个的开源整合包，模型是真的多啊。下载了我半夜。。。虽然整合包是做好了可惜很遗憾，这个视频重绘还是太耗显卡。我估计最低都需要12G 显存，否则一点运行就直接爆了显存。不信的可以看后面的...

2024-7-25 软件 6716 5

开源音频处理 # 开源 # 人工智能 # AI # 免费 # 人声分离

UltimateVocalRemoverGUI 5.6 开源人声分离软件适配A卡

转换速度还可以，我玩了一上午，大概10多秒就可以转一次1分钟左右的音频。效果还是不错的，分离出来的人声很干净，如果搭配其他字幕软件是很容易被识别出来的。关键是这个软件安装好就可以用了，不需要去设置一些复杂的参数什么的。UltimateVocalRemoverGUI是一款开源的人声分离软件，采用了最先进的音源分离模型，以去除音频文件中的人声。该...

2024-7-24 开源 4771 6

开源开源 # 图片处理 # 人工智能 # AI

开源 AI重现人类绘图过程，并生成视频 Paints-UNDO 一键整合包附视频演示

Paints-Undo是一个专注于数字绘画行为的创新AI模型项目，其目标是为人类艺术家和研究者提供一个基础模型，以更好地理解和模拟人类绘画的过程。Paints-Undo的核心功能在于它能够通过输入图像，反向推导出绘制该图像的一系列步骤。这一功能不仅限于简单的素描、着色等过程，还能模拟复杂的阴影处理、图层变换、颜色曲线调整等人类艺术家在创作过程...

2024-7-23 开源 4405 1

开源绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 图片放大 # 免费

开源免费 AI无损图片放大工具 v3.1.0 绿色免安装

本程序使用了来自腾讯ARC Lab提供的Real-ESRGAN模型，目前模型主要来自于人像，能对人像进行一个较快的处理，特别是动漫图片，进行一个很好的放大。功能说明支持多线程处理支持批量图片处理支持设置选项支持自定义输出格式和自定义输出路径支持AI引擎选择支持批量清理任务系统要求:系统: Windows 7+ 运行时: .net framew...

2024-7-14 开源 3221 7

开源视频处理 # 绿色软件 # 开源 # AI # 免费 # 补帧

开源免费 AI工具视频补帧速度超快让视频更丝滑附视频演示附下载地址

首先先说明一下，这个工具不是提升视频高清质量的工具，而是补帧工具。我这里简单说下什么补帧，比如有些运动画面。看起来会有点一卡一卡的。播放不是很丝滑流畅，就可以用这个补帧工具来补帧，这样处理好后的视频就会更丝滑了。这个工具没有N卡也可以跑，我用cpu跑速度也不错。解压即可食用，简单方便。下面是详细介绍你们看看随着高清和超高清视频的普及，对于视...

2024-6-29 开源 6099 14

AI#开源工具 # 开源 # 人工智能 # AI # 语音工具 # 整合包

Bark UI Enhanced v0.7.4 整合包一款开源的具有 Gradio 网络用户界面的文本触发的生成音频模型

最近都在留意这个文字转语音工具，无意发现了这个开源项目，效果相当不错，所以顺手就做成了整合包，本身这个项目是支持N卡的，但是因为我没有N卡，所以就只能做成了用CPU跑。。。如果你有N卡，想高效率去生成语音的话可以去开源项目那里看看。群里有小伙伴说这个能否做小说推文，我自己测试了下完全可以，而且我感觉比某音某手上面的小说推文的语音好多了，文末会...

2024-6-23 AI,开源 4115 6

开源开源 # 人工智能 # AI # 免费 # 语音工具

开源免费 ChatTTS 一个用于日常对话的生成式语音模型自带情感文字转语音工具

ChatTTS是一个开源的基于PyTorch的文本到语音（TTS）转换项目，旨在为开发者提供一个简便、高效的方式来将文本转换为自然 sounding 的语音。尽管项目的文档表明它还在开发完成阶段，这个项目具有实验和开发潜力，特别是在人工智能和机器学习领域的应用中。功能与使用方式：ChatTTS 项目的主要功能是将文本输入转换为语音输出。项目内...

2024-6-9 开源 7806 43