AI#开源 图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 整合包 InstantIR 一键整合包 AI智能高清修复图片工具 超分辨率工具 这个项目群里的小伙伴 推荐了好多次了,之前我也试过做整合包,做完后发现BUG太多了,我就删了,看到作者最近又更新了,所以抽空把这个整合包做出来了。效果嘛 你们自己看。先来一张官方的示例图下面是我跑完的效果下面继续看我用其他图片跑的出来的效果跑一张图片大概需要3-4分钟。下面是界面截图下面是这个项目的AI介绍nstantIR 是一个在 GitH... 2024-11-15 AI,开源 4583 0
AI#开源 工具 # 开源 # 人工智能 # AI # 免费 # 数字人 # 整合包 复旦、百度联手推出全新AI模型Hallo2 AI数字人 一键整合包,可生成高清4K数字人视频 Hallo是一个由复旦大学、百度公司、苏黎世联邦理工学院和南京大学共同开发的AI对口型肖像图像动画技术,该技术能够基于语音音频输入生成逼真且动态的肖像图像视频。以下是该项目的详细介绍:项目背景:肖像图像动画技术:该技术旨在从单个静态图像和相应的语音音频中生成一个说话的人像,在视频游戏和虚拟现实、电影和电视制作、社交媒体和数字营销等领域具有巨大... 2024-10-19 AI,开源 7281 23
AI#开源 图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 人工智能 # AI # 整合包 diffusers-image-outpaint 超强AI人工智能扩图工具 一键整合包 Diffusers Image Outpaint 是一个在 Hugging Face 上的开源项目,它为图像外绘(image outpainting)提供了强大的工具和解决方案。一、项目背景与目标在图像处理领域,有时我们需要对图像进行扩展或修复,尤其是在图像的边缘部分进行外绘,以创造出更完整或更具创意的图像效果。Diffusers Image... 2024-10-7 AI,开源 1.1万 16
AI#软件 语音 # 工具 # 文本 # 神器 # 音频处理 # 开源 # 免费 # 整合包 EzAudio: High-quality Text-to-Audio Generator AI文本生成音乐 音效 一键整合包 20240929修改增强 超级实用的一个AI开源工具,可以输入文本来生成各种声音,感觉这个很有实用场景啊,群里小伙伴推荐的一个项目。我花了点时间做成了整合包。腾讯AI实验室与约翰霍普金斯大学强强联手,共同推出了EzAudio这一革命性的文本到音频生成模型。EzAudio以其前所未有的高效能与卓越音质,为人工智能与音频技术的融合树立了新的里程碑。EzAudio之所以能在... 2024-9-29 AI,软件 3611 0
AI#开源 语音 # 神器 # 人工智能 # AI # 文字 # 字幕 # 识别 # 利器 # 整合包 开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v0.94 整合包 附全部模型 下面文字是作者原话这是一个离线运行的本地语音识别转文字工具,基于 fast-whipser 开源模型,可将视频/音频中的人类声音识别并转为文字,可输出json格式、srt字幕带时间戳格式、纯文字格式。可用于自行部署后替代 openai 的语音识别接口或百度语音识别等,准确率基本等同openai官方api接口。部署或下载后,双击 start.e... 2024-9-24 AI,开源 4535 6
AI#开源 开源 # 人工智能 # AI # 免费 # 整合包 PuLID-flux模型 AI整合包 字节 开源的图像生成ID定制化项目,通过对比对齐技术引领纯净高效新纪元 PuLID是一个由ByteDance Inc.开发的开源项目,专注于通过对比对齐技术实现纯净且高效的图像生成ID定制化。该项目由Zinan Guo、Yanze Wu、Zhuowei Chen、Lang Chen和Qian He等研究人员共同贡献,其中Zinan Guo和Yanze Wu为等量贡献者,Yanze Wu为通讯作者。PuLID项目的... 2024-9-19 AI,开源 5871 13
AI#开源 开源 # 人工智能 # AI # 模型 # 整合包 Flux 文生图模型 一键整合包 解压即可食用 出图效果超级惊艳 附图片演示 Flux文生图模型是由Black Forest Labs(黑森林实验室)开发的一款高质量文本到图像生成模型。该模型在多个维度上展现了卓越性能,特别是在文本引导的图像生成、多主体场景构建以及精细的手部细节生成等方面,实现了显著的提升,为文生图领域设定了新的技术标杆。Flux模型的核心特点包括:高性能与高质量:Flux模型采用了先进的混合架构,融... 2024-9-18 AI,开源 1万 59
AI#开源 工具 # 视频处理 # 神器 # 开源 # 人工智能 # AI # 整合包 开源 CogVideoX 文字生成视频 整合包 CogVideoX是智谱AI推出的一款开源视频生成模型,该项目在视频生成领域引起了广泛关注。以下是对CogVideoX开源项目的详细介绍:一、项目背景与简介CogVideoX作为智谱AI的创新成果,旨在通过深度学习技术将文本或图像转换为高质量的视频内容。该项目不仅推动了视频生成技术的边界,还为创作者提供了全新的创作工具和平台。CogVideo... 2024-9-6 AI,开源 4291 3
AI#开源 工具 # 绿色软件 # 开源 # 人工智能 # AI # 换脸 # 整合包 开源 ReHiFace-S 一款集高保真、实时性、易用性于一身的换脸神器 附视频演示 整合包 这个项目我已经做好了几天了,在群里也是分享了,经过几天的运行测试后,现在已经非常稳定了,所以今天抽空整理下分享出来。换脸的效果还是很不错的,你们可以下面的视频演示就知道了。虽然我之前也已经分享了几个换脸的工具了,但是谁又会在意多一个呢?多一个选择总是好的。这个操作是极其简单的。选择人脸,选择视频点下提交就可以换脸了。特别适合那些电脑基础差的小... 2024-9-4 AI,开源 9479 35
AI#开源 工具 # 网络工具 # 神器 # 下载工具 # 绿色软件 # 图形图像 # 开源 # 免费 # 整合包 神器 Civitai-Web-Scraper C站图片下载工具 整合包 Civitai-Web-Scraper是一款专为挖掘CivitAI平台上丰富的人工智能生成图像及其灵感提示而设计的开源工具。该项目由ScreamingHawk在GitHub上开源,旨在帮助艺术家、设计师、AI研究人员以及普通爱好者轻松访问和获取CivitAI网站上的AI创作内容。主要功能与特点:一键式抓取:Civitai-Web-Scrape... 2024-8-25 AI,开源 3495 4
AI#软件 图像处理 # 工具 # 日常应用 # 思维导图 # 绿色软件 # 图形图像 # 开源 # 人工智能 # AI # 图片放大 # 免费 # 整合包 腾讯开源GFPGAN图片无损放大,一键懒人包 GFPGAN是一个由腾讯PCG应用研究中心(ARC)开发的开源项目,专注于现实世界中的人脸修复算法。它利用预训练的人脸生成对抗网络(GAN)中的丰富先验信息来进行盲脸修复,尤其擅长处理低分辨率或损坏的人脸图像。GFPGAN主要特点:实用性:旨在为实际应用中的人脸恢复提供实用算法。先验信息:利用GAN(如StyleGAN2)中的丰富和多样先验信... 2024-8-25 AI,软件 4069 10
AI#开源 绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 教程 # 整合包 PhotoMaker v2 整合包 高效地定制化生成任意风格的逼真人类照片!附视频教程 PhotoMaker是一个由腾讯ARC实验室和南开大学MCG-NKU联合开发的前沿图像生成工具,该项目在CVPR 2024会议上进行了展示。PhotoMaker旨在通过堆叠的ID嵌入技术,实现对真实人类照片的定制化编辑与生成。其核心功能在于能够迅速根据用户提供的参考图像(ID图像),结合文本提示,生成具有高度身份一致性(ID fidelity... 2024-8-11 AI,开源 5603 6
AI#开源 开源 # 人工智能 # AI # 动漫 # 整合包 Diffutoon AI视频转动漫 整合包 附视频演示 这个项目对显卡要求有点高,我大概10秒的视频 转成动漫风格8G的4060大概需要1小时左右。所以你如果显存低于8G 就不要试了。CPU也会占用不少。整合包我已经做好了,解压后记得先安装好cuda就可以使用了。下面是视频演示 2024-8-4 AI,开源 4213 8
AI#软件 语音 # 工具 # 神器 # 绿色软件 # 开源 # 人工智能 # AI # 整合包 开源 AI EmotiVoice 易魔声 文本生成语音 一款功能强大且现代的开源文本转语音(TTS)引擎 EmotiVoice(易魔声)是一款功能强大且现代的开源文本转语音(TTS)引擎,由网易有道开源并维护。该软件以其中英文双语支持和超过2000种不同的音色而闻名,为用户提供了极为丰富的声音选择。以下是对EmotiVoice(易魔声)的详细介绍:一、核心功能双语言支持:EmotiVoice支持中英文两种语言的文本转语音,满足了不同用户的语言需求... 2024-7-31 AI,软件 4937 6
AI#开源 开源 # 人工智能 # AI # 免费 # 整合包 LivePortrait 整合包 AI表情同步(表情迁移),支持N卡。附视频演示 LivePortrait是一款由快手科技与中国科学技术大学和复旦大学合作开发的先进AI驱动的肖像动画框架,其项目地址位于https://github.com/KwaiVGI/LivePortrait。该软件旨在通过创新的图像处理技术,将静态的照片转化为栩栩如生的动态视频,为用户带来更加生动有趣的视觉体验。核心特点高效性:LivePortrai... 2024-7-30 AI,开源 4079 2
AI#开源 工具 # 开源 # 人工智能 # AI # 语音工具 # 整合包 Bark UI Enhanced v0.7.4 整合包 一款开源的具有 Gradio 网络用户界面的文本触发的生成音频模型 最近都在留意这个文字转语音工具,无意发现了这个开源项目,效果相当不错,所以顺手就做成了整合包,本身这个项目是支持N卡的,但是因为我没有N卡,所以就只能做成了用CPU跑。。。如果你有N卡,想高效率去生成语音的话可以去开源项目那里看看。群里有小伙伴说这个能否做小说推文,我自己测试了下完全可以,而且我感觉比某音某手上面的小说推文的语音好多了,文末会... 2024-6-23 AI,开源 3368 6