复旦、百度联手推出全新AI模型Hallo2 AI数字人 一键整合包,可生成高清4K数字人视频

复旦、百度联手推出全新AI模型Hallo2 AI数字人 一键整合包,可生成高清4K数字人视频

Hallo是一个由复旦大学、百度公司、苏黎世联邦理工学院和南京大学共同开发的AI对口型肖像图像动画技术,该技术能够基于语音音频输入生成逼真且动态的肖像图像视频。以下是该项目的详细介绍:项目背景:肖像图像动画技术:该技术旨在从单个静态图像和相应的语音音频中生成一个说话的人像,在视频游戏和虚拟现实、电影和电视制作、社交媒体和数字营销等领域具有巨大...
AI,开源 8439 23
diffusers-image-outpaint  超强AI人工智能扩图工具 一键整合包

diffusers-image-outpaint 超强AI人工智能扩图工具 一键整合包

Diffusers Image Outpaint 是一个在 Hugging Face 上的开源项目,它为图像外绘(image outpainting)提供了强大的工具和解决方案。一、项目背景与目标在图像处理领域,有时我们需要对图像进行扩展或修复,尤其是在图像的边缘部分进行外绘,以创造出更完整或更具创意的图像效果。Diffusers Image...
AI,开源 1.2万 17
开源 Tailor v0.1.5  一款功能强大的视频智能裁剪、生成及优化工具

开源 Tailor v0.1.5 一款功能强大的视频智能裁剪、生成及优化工具

Tailor 是一款功能强大的视频智能裁剪、生成及优化工具。这款软件集成了最先进的人工智能技术,为用户提供了前所未有的视频处理体验。Tailor涵盖了视频剪辑、视频生成和视频优化三大核心功能,共包含10种不同的处理方法。在视频剪辑方面,Tailor拥有精准的人脸识别技术,能够自动捕捉视频中的精彩人脸瞬间,并允许用户轻松选择关注的人脸进行裁剪,...
软件 5220 13
PuLID-flux模型 AI整合包 字节 开源的图像生成ID定制化项目,通过对比对齐技术引领纯净高效新纪元

PuLID-flux模型 AI整合包 字节 开源的图像生成ID定制化项目,通过对比对齐技术引领纯净高效新纪元

PuLID是一个由ByteDance Inc.开发的开源项目,专注于通过对比对齐技术实现纯净且高效的图像生成ID定制化。该项目由Zinan Guo、Yanze Wu、Zhuowei Chen、Lang Chen和Qian He等研究人员共同贡献,其中Zinan Guo和Yanze Wu为等量贡献者,Yanze Wu为通讯作者。PuLID项目的...
AI,开源 6827 13
Flux 文生图模型 一键整合包 解压即可食用 出图效果超级惊艳 附图片演示

Flux 文生图模型 一键整合包 解压即可食用 出图效果超级惊艳 附图片演示

Flux文生图模型是由Black Forest Labs(黑森林实验室)开发的一款高质量文本到图像生成模型。该模型在多个维度上展现了卓越性能,特别是在文本引导的图像生成、多主体场景构建以及精细的手部细节生成等方面,实现了显著的提升,为文生图领域设定了新的技术标杆。Flux模型的核心特点包括:高性能与高质量:Flux模型采用了先进的混合架构,融...
AI,开源 1.2万 59
应群友要求,我把开源 AI人脸替换工具离线版之前发布的一些版本整理一下再分享出来

应群友要求,我把开源 AI人脸替换工具离线版之前发布的一些版本整理一下再分享出来

群里一些小伙伴老在讲什么之前的老版本如何如何好用,如何得心应手。说实话我自己没有什么感觉。估计他们这些都是幻觉。但是你们要是喜欢之前的版本,我也是可以再分享出来,时间也是过得好快啊。截图如下 版本如下估计差不多了吧,应该没什么遗漏了。喜欢老版本的可以去下载试试。如果全部收藏的话 大概有170多G。。。你们看截图写在最后的最后,如果对这个工具使...
软件 1.3万 17
本群第一个自练 flux lora模型 苗疆倩影

本群第一个自练 flux lora模型 苗疆倩影

群内大牛icolor 自练了一个lora模型,首发在里布上。我也觉得非常牛X了本LORA由近300张苗族服饰、头饰等高清美图,经36000步近12小时炼制而成,经过本人测试后精选其一分享给大家使用。本人算力有限,在本地forge中使用dve Q8以及dve NF4模型进行测试,本LORA对人物服饰、脸型、肤色、整体色调色彩均有加强,可使用原版...
素材 3610 2
开源 CogVideoX 文字生成视频 整合包

开源 CogVideoX 文字生成视频 整合包

CogVideoX是智谱AI推出的一款开源视频生成模型,该项目在视频生成领域引起了广泛关注。以下是对CogVideoX开源项目的详细介绍:一、项目背景与简介CogVideoX作为智谱AI的创新成果,旨在通过深度学习技术将文本或图像转换为高质量的视频内容。该项目不仅推动了视频生成技术的边界,还为创作者提供了全新的创作工具和平台。CogVideo...
AI,开源 4743 3
开源 ReHiFace-S 一款集高保真、实时性、易用性于一身的换脸神器 附视频演示 整合包

开源 ReHiFace-S 一款集高保真、实时性、易用性于一身的换脸神器 附视频演示 整合包

这个项目我已经做好了几天了,在群里也是分享了,经过几天的运行测试后,现在已经非常稳定了,所以今天抽空整理下分享出来。换脸的效果还是很不错的,你们可以下面的视频演示就知道了。虽然我之前也已经分享了几个换脸的工具了,但是谁又会在意多一个呢?多一个选择总是好的。这个操作是极其简单的。选择人脸,选择视频点下提交就可以换脸了。特别适合那些电脑基础差的小...
AI,开源 1.1万 35
神器 开源 CodeFormer v20240114 图片+视频+人脸高清修复 解压即用

神器 开源 CodeFormer v20240114 图片+视频+人脸高清修复 解压即用

CodeFormer是一个基于AI技术的深度学习项目,由南洋理工大学和商汤科技联合研究中心共同开发。该项目专注于人脸复原领域,通过深度学习模型提升模糊或受损人脸图像的质量。CodeFormer结合了VQGAN和Transformer两种先进的神经网络架构,其中VQGAN利用向量量化技术将图像编码为一系列离散的向量,并通过解码器恢复成图像,而T...
软件 5672 4
腾讯开源GFPGAN图片无损放大,一键懒人包

腾讯开源GFPGAN图片无损放大,一键懒人包

GFPGAN是一个由腾讯PCG应用研究中心(ARC)开发的开源项目,专注于现实世界中的人脸修复算法。它利用预训练的人脸生成对抗网络(GAN)中的丰富先验信息来进行盲脸修复,尤其擅长处理低分辨率或损坏的人脸图像。GFPGAN主要特点:实用性:旨在为实际应用中的人脸恢复提供实用算法。先验信息:利用GAN(如StyleGAN2)中的丰富和多样先验信...
AI,软件 4735 10
PhotoMaker v2 整合包 高效地定制化生成任意风格的逼真人类照片!附视频教程

PhotoMaker v2 整合包 高效地定制化生成任意风格的逼真人类照片!附视频教程

PhotoMaker是一个由腾讯ARC实验室和南开大学MCG-NKU联合开发的前沿图像生成工具,该项目在CVPR 2024会议上进行了展示。PhotoMaker旨在通过堆叠的ID嵌入技术,实现对真实人类照片的定制化编辑与生成。其核心功能在于能够迅速根据用户提供的参考图像(ID图像),结合文本提示,生成具有高度身份一致性(ID fidelity...
AI,开源 6397 6
开源 MDX23  v1.0.1 一款超强AI背景音人声分离工具

开源 MDX23 v1.0.1 一款超强AI背景音人声分离工具

MVSEP-MDX23-music-separation-model 是一个专为2023年音乐分离挑战赛(MDX'23)设计的音频分离模型,它能够将音乐分解为四个独立的音轨:“低音”、“鼓声”、“人声”和“其他”。该模型在挑战赛中取得了第三名的好成绩(Leaderboard C),证明了其在音乐分离领域的强大实力。此模型基于Demuc...
开源 3074 0
开源 Waifu2x Caffe v1.2.0.4 一个功能强大且效果优秀的图像无损放大处理工具

开源 Waifu2x Caffe v1.2.0.4 一个功能强大且效果优秀的图像无损放大处理工具

waifu2x-caffe 是一个开源软件项目,旨在通过使用深度学习技术来提高图像的分辨率和质量。这个项目最初是由日本工程师lltcggie开发的,基于 Caffe 深度学习框架实现。waifu2x-caffe 的主要功能是将低分辨率的图像放大至高分辨率,并提升图像的视觉质量,尤其在处理动漫风格的图像方面表现出色。这个软件的强大之处在于其通过...
开源 7992 0
开源 AI EmotiVoice 易魔声 文本生成语音  一款功能强大且现代的开源文本转语音(TTS)引擎

开源 AI EmotiVoice 易魔声 文本生成语音 一款功能强大且现代的开源文本转语音(TTS)引擎

EmotiVoice(易魔声)是一款功能强大且现代的开源文本转语音(TTS)引擎,由网易有道开源并维护。该软件以其中英文双语支持和超过2000种不同的音色而闻名,为用户提供了极为丰富的声音选择。以下是对EmotiVoice(易魔声)的详细介绍:一、核心功能双语言支持:EmotiVoice支持中英文两种语言的文本转语音,满足了不同用户的语言需求...
AI,软件 5513 6
LivePortrait 整合包 AI表情同步(表情迁移),支持N卡。附视频演示

LivePortrait 整合包 AI表情同步(表情迁移),支持N卡。附视频演示

LivePortrait是一款由快手科技与中国科学技术大学和复旦大学合作开发的先进AI驱动的肖像动画框架,其项目地址位于https://github.com/KwaiVGI/LivePortrait。该软件旨在通过创新的图像处理技术,将静态的照片转化为栩栩如生的动态视频,为用户带来更加生动有趣的视觉体验。核心特点高效性:LivePortrai...
AI,开源 4608 2
开源 MimicBrush 一款创新性AI图像编辑工具 图片局部自动重绘 一键整合包 附模型

开源 MimicBrush 一款创新性AI图像编辑工具 图片局部自动重绘 一键整合包 附模型

MimicBrush是一款由阿里巴巴、中国香港大学和蚂蚁集团共同研发的创新性AI图像编辑工具,该软件通过先进的AI技术,实现了零样本图像编辑,为用户带来了前所未有的图像编辑体验。核心特点模仿式编辑:MimicBrush能够自动识别并模仿参考图像中的视觉元素,将其应用到源图像中指定的编辑区域,实现精准且自然的图像融合。自动化编辑:用户只需简单指...
开源 4974 3
开源 DiffSynth-Studio 视频风格转绘,视频转动漫 一键整合包 附模型 附官方视频演示

开源 DiffSynth-Studio 视频风格转绘,视频转动漫 一键整合包 附模型 附官方视频演示

写在最前面,这个开源项目我早就关注了,但是一直没有合适的硬件来折腾,但是不折腾又不甘心。这不群里傻木小伙伴提供了一台机器暂时折腾一下,我就用这个机器昨天抽空弄了这个的开源整合包,模型是真的多啊。下载了我半夜。。。虽然整合包是做好了可惜很遗憾,这个视频重绘还是太耗显卡。我估计最低都需要12G 显存,否则一点运行就直接爆了显存。不信的可以看后面的...
软件 6392 5
UltimateVocalRemoverGUI 5.6 开源人声分离软件 适配A卡

UltimateVocalRemoverGUI 5.6 开源人声分离软件 适配A卡

转换速度还可以,我玩了一上午,大概10多秒就可以转一次1分钟左右的音频。效果还是不错的,分离出来的人声很干净,如果搭配其他字幕软件是很容易被识别出来的。关键是这个软件安装好就可以用了,不需要去设置一些复杂的参数什么的。UltimateVocalRemoverGUI是一款开源的人声分离软件,采用了最先进的音源分离模型,以去除音频文件中的人声。该...
开源 4623 6
开源 AI重现人类绘图过程,并生成视频 Paints-UNDO 一键整合包 附视频演示

开源 AI重现人类绘图过程,并生成视频 Paints-UNDO 一键整合包 附视频演示

Paints-Undo是一个专注于数字绘画行为的创新AI模型项目,其目标是为人类艺术家和研究者提供一个基础模型,以更好地理解和模拟人类绘画的过程。Paints-Undo的核心功能在于它能够通过输入图像,反向推导出绘制该图像的一系列步骤。这一功能不仅限于简单的素描、着色等过程,还能模拟复杂的阴影处理、图层变换、颜色曲线调整等人类艺术家在创作过程...
开源 4217 1
开源 免费 AI无损图片放大工具 v3.1.0 绿色免安装

开源 免费 AI无损图片放大工具 v3.1.0 绿色免安装

本程序使用了来自腾讯ARC Lab提供的Real-ESRGAN模型,目前模型主要来自于人像,能对人像进行一个较快的处理,特别是动漫图片,进行一个很好的放大。功能说明支持多线程处理支持批量图片处理支持设置选项支持自定义输出格式和自定义输出路径支持AI引擎选择支持批量清理任务系统要求:系统: Windows 7+ 运行时: .net framew...
开源 3058 7
开源 免费 AI工具 视频补帧 速度超快 让视频更丝滑 附视频演示 附下载地址

开源 免费 AI工具 视频补帧 速度超快 让视频更丝滑 附视频演示 附下载地址

首先先说明一下,这个工具不是提升视频高清质量的工具,而是补帧工具。我这里简单说下什么补帧,比如有些运动画面。看起来会有点一卡一卡的。播放不是很丝滑流畅,就可以用这个补帧工具来补帧,这样处理好后的视频就会更丝滑了。这个工具没有N卡也可以跑,我用cpu跑速度也不错。解压即可食用,简单方便。下面是详细介绍 你们看看随着高清和超高清视频的普及,对于视...
开源 5855 14
Bark UI Enhanced v0.7.4 整合包 一款开源的具有 Gradio 网络用户界面的文本触发的生成音频模型

Bark UI Enhanced v0.7.4 整合包 一款开源的具有 Gradio 网络用户界面的文本触发的生成音频模型

最近都在留意这个文字转语音工具,无意发现了这个开源项目,效果相当不错,所以顺手就做成了整合包,本身这个项目是支持N卡的,但是因为我没有N卡,所以就只能做成了用CPU跑。。。如果你有N卡,想高效率去生成语音的话可以去开源项目那里看看。群里有小伙伴说这个能否做小说推文,我自己测试了下完全可以,而且我感觉比某音某手上面的小说推文的语音好多了,文末会...
AI,开源 3898 6
开源 免费 ChatTTS 一个用于日常对话的生成式语音模型 自带情感 文字转语音工具

开源 免费 ChatTTS 一个用于日常对话的生成式语音模型 自带情感 文字转语音工具

ChatTTS是一个开源的基于PyTorch的文本到语音(TTS)转换项目,旨在为开发者提供一个简便、高效的方式来将文本转换为自然 sounding 的语音。尽管项目的文档表明它还在开发完成阶段,这个项目具有实验和开发潜力,特别是在人工智能和机器学习领域的应用中。功能与使用方式:ChatTTS 项目的主要功能是将文本输入转换为语音输出。项目内...
开源 7479 44
开源 免费 AI图片换色工具 color_transfer 速度超级快 不限显卡。。效果超惊艳。不是AI上色那种可比

开源 免费 AI图片换色工具 color_transfer 速度超级快 不限显卡。。效果超惊艳。不是AI上色那种可比

今天无意发现个好东西啊,可以图片替换颜色。给出一张目标图片,然后就可以把原图处理成目标图片相似的风格颜色了。这话说的有拗口。我给一张演示你们知道了比如 我需要把下面的图片以下面图片做参考我为了对比明显给你们看得更明白一点,所以选择这个风格颜色过于鲜明的图片了处理后就是下面这样了是不是跟参考图片是差不多风格和颜色了?演示继续当然你们玩的时候不需...
软件,开源 6300 13
开源 免费 AI图片放大提升质量工具  Real-ESRGAN-GUI-1.2.0-windows 可批量处理 绿色免安装

开源 免费 AI图片放大提升质量工具 Real-ESRGAN-GUI-1.2.0-windows 可批量处理 绿色免安装

今天无意中发现一个来自日本的开源项目。感觉还不错就分享出来,我很喜欢这个软件界面,操作也简单。可以批量处理图片。效果也不错。虽说是英文版的,但是这些英文也是超级简单。本来不想发到公众号了,这么晚了,就发到群里,只是个小工具 有时候简单用下比较顺手,但是群里有大聪明说要我发效果演示。。。其实效果都差不多,因为都是一个基于Real-ESRGAN这...
软件,开源 4956 2
SpleeterGUI 2.95 开源 免费 人声背景音乐分离工具 无需联网 内附模型 附视频教程

SpleeterGUI 2.95 开源 免费 人声背景音乐分离工具 无需联网 内附模型 附视频教程

我之前在微信公众号上有分享这个工具的视频演示。点这里进去看看可以实现人声和背景音乐分类,也可以歌曲人声分类,我已经把所有的模型都下载好,解压即可使用。这个算是上次分享的那个人声背景音乐分离工具的后续吧,之前分享的时候是免费的,后来收费了,喜欢白嫖的人还是很多啊,这次补上这个工具吧 免费开源 无需联网即可操作SpleeterGUI是一款功能强大...
软件,开源 5736 9
AI 开源 视频高清修复 放大工具 特点就是速度快 效果好 操作简单 Anime4KCPP GUI v1.12.0-2.5.0-Win64-msvc

AI 开源 视频高清修复 放大工具 特点就是速度快 效果好 操作简单 Anime4KCPP GUI v1.12.0-2.5.0-Win64-msvc

今天在逛github的时候,想找一款视频高清修复放大之类的工具,找了不少,但是感觉操作都是有点小复杂,不是需要搭建各种环境就是各种复杂参数或者是各种模型,看的我头晕目眩。太复杂的工具已经不适合我这样的老年人了,我就喜欢那种解压就能用而且还不要复杂操作。还真让我找到一个。现分享出来下面看图片演示这是原始视频从上面的参数 可以看出来 原始视频的大...
开源 1.9万 85
2023122 吃个早餐生成100+张小姐姐AI图片,今天分享出来,并说下AI图片生成心得

2023122 吃个早餐生成100+张小姐姐AI图片,今天分享出来,并说下AI图片生成心得

今天心血来潮感觉很久没有分享AI图片了,然后趁早今天太阳不错,很暖和的样子,准备出门去嗦个粉,好久没出去了。。。出门前准备生成一些AI图片。然后看看效果怎么样,这玩意效果就像抽奖一样,不是每张都效果很好的。但是今天我的手气还不错,出图率很高。打开Stable Diffusion 输入关键词,自我感觉应该差不多了然后把批次数直接拉到1...
AI 5790 10
在线AI生成图片倒了一大批?我来推荐几个还能玩的 附网站地址

在线AI生成图片倒了一大批?我来推荐几个还能玩的 附网站地址

我们都知道AI生成图片,是很吃电脑配置的,特别是显卡。没有一个好的显卡,就靠CPU来烧,那效率太残忍了。所以很多时候我都是在网上找一些在线AI生成图片的网站。一直都用的挺好的,但是不知道为什么这几天我用的大部分都倒闭了。真是太残忍了,没地方白票了好痛苦啊。这不就有小伙伴给我留言说 没得用了,很烦躁啊。我也烦躁啊。昨天还特别做了个视频还给你们展...
AI 6757 18
Stable-diffusion下载量超过100万的大模型表现会如何的?附大模型下载地址

Stable-diffusion下载量超过100万的大模型表现会如何的?附大模型下载地址

C站上有一款大模型下载量已经过了100万了,而且展示的图片也看起来很普通的。为什么这个下载量会远超其他模型。下载量居然是恐怖的100万+。先看截图你们就知道了我们平时很熟悉的麦橘都是屈居第二,看截图之前也没接触过这个排名第一的大模型,先看看它给出的演示图片。这么一天,这个大模型其实表现一般般嘛,没有想象中的那么惊艳,亲自测试一下,模仿下它的提...
软件 5266 5