AI人工智能 图片高清修复放大Tile-Upscaler v1.0  一键汉化整合包

AI人工智能 图片高清修复放大Tile-Upscaler v1.0 一键汉化整合包

本工具基于Tile-Upscaler二次开发,简单直接,操作点2下即可,图片高清修复效果还不错,处理速度我的4070tisuper一张1080x1920的图片大概8秒就可以完成高清修复。效果演示原图我个人觉得高清修复效果还可以。所以就花了点时间整合了一下,另外修改了部分代码1 修正一些小bug2 删除没用的演示例子3&nb...
AI,开源 4951 2
万象生图 v2025.0125 一款利用先进人工智能技术打造的图像生成与增强软件

万象生图 v2025.0125 一款利用先进人工智能技术打造的图像生成与增强软件

万象生图是一款利用先进人工智能技术打造的图像生成与增强软件,旨在为用户提供高质量的图像处理解决方案。无论是日常应用还是专业设计,这款软件都能满足用户的多样化需求。以下是对万象生图的详细介绍。功能概述1. 图像生成万象生图的图像生成功能利用深度学习和神经网络技术,能够根据用户输入的文本描述生成高度逼真的图像。用户只需输入简单的关键词或描述性文字...
软件 3778 2
MatAnyone v1.0.0 人工智能AI 自定义视频抠图 一键汉化整合包 附视频演示

MatAnyone v1.0.0 人工智能AI 自定义视频抠图 一键汉化整合包 附视频演示

MatAnyone是一个专注于人类视频抠图(Matting)的实用框架,其独特之处在于支持目标分配功能,并能在核心区域语义和精细边界细节上表现出稳定的性能。该项目由Peiqing Yang等人在2025年提出,并在CVPR(Conference on Computer Vision and Pattern Recognition)这一顶级计算...
AI,开源 8130 12
InspireMusic AI人工智能音乐、歌曲和音频生成的开源一键中文整合包

InspireMusic AI人工智能音乐、歌曲和音频生成的开源一键中文整合包

InspireMusic是一个专注于音乐、歌曲和音频生成的开源项目,它提供了一个统一的框架来实现这些生成任务。以下是对该项目的详细介绍:主要功能音乐生成:支持文本提示、音乐类型、音乐结构等多种控制方式,可生成高质量的音乐作品。歌曲生成:能够根据用户的文本描述或音乐结构生成完整的歌曲。音频生成:可以生成各种类型的音频,包括但不限于背景音乐、音效...
AI,开源 3385 0
Spark-TTS 一款开源 功能强大、高效且灵活的文本转语音工具 一键整合包

Spark-TTS 一款开源 功能强大、高效且灵活的文本转语音工具 一键整合包

Spark-TTS是一款先进的文本转语音(Text-to-Speech,TTS)系统,它利用大型语言模型(Large Language Model,LLM)的强大功能,实现了高度准确且自然流畅的语音合成。该系统旨在为研究和生产使用提供高效、灵活且强大的解决方案。Spark-TTS的核心优势在于其简洁性和效率。它完全基于Qwen2.5构建,无需...
安卓 7158 14
CogView4 一键整合包 一个功能强大且易于使用的文本到图像生成模型 支持中文提示词

CogView4 一键整合包 一个功能强大且易于使用的文本到图像生成模型 支持中文提示词

该项目由群里傻木推荐,我测试了下 说实话 效果真是一般,对中文的支持还是不够好,下面有截图。我目前这个整合包只能算是半成品,目前只做到了可以运行,但是效率性能什么的都没有去做优化。以后看心血来潮了再动动。CogView4是一个前沿的文本到图像生成模型,由THUDM(清华大学计算机系自然语言处理与人机交互实验室)开发并开源在...
开源 2842 0
开源 CosyVoice v20250229整合包 一款AI人工智能 多语言语音生成模型 文字生成语音工具 附效果演示

开源 CosyVoice v20250229整合包 一款AI人工智能 多语言语音生成模型 文字生成语音工具 附效果演示

CosyVoice是由阿里通义实验室开源的一款多语言语音生成模型,旨在提升人类与大型语言模型(LLMs)之间的自然语音交互体验。该项目作为FunAudioLLM框架中的核心模型之一,专注于高质量的语音合成,能够生成自然且逼真的语音。以下是对CosyVoice开源项目的详细介绍:一、项目背景与目的随着人工智能技术的不断发展,语音交互已成为人机交...
软件 1.1万 30
MMAudio  v0.1 AI视频生成背景声音  文生生成声音 一键整合包 8G英伟达显卡可用,无需安装环境,解压即可使用

MMAudio v0.1 AI视频生成背景声音 文生生成声音 一键整合包 8G英伟达显卡可用,无需安装环境,解压即可使用

MMAudio是一个开源项目,旨在通过多模态联合训练生成高质量的同步音频。以下是关于这个项目的详细介绍:项目概述MMAudio由香港中文大学的程浩基(Ho Kei Cheng)等人开发,主要功能是根据视频和/或文本输入生成同步音频。其核心创新在于多模态联合训练方法,能够在广泛的音视频和音文本数据集上进行训练。此外,同步模块可以将生成的音频与视...
AI,开源 5076 0
超强挂机AI生图comfyui工作流,提示词自动生成,一键操作,出图效果好,效率高 挂机流20250210更新

超强挂机AI生图comfyui工作流,提示词自动生成,一键操作,出图效果好,效率高 挂机流20250210更新

上次虽然我也分享了一个工作流,但是感觉还是不够完美,因为还是需要自己去提交提示词,感觉有点麻烦,然后又研究了下,做了现在的这个工作流。无需自己提交提示词,一键生成。适合我这样的喜欢挂机来生图的人。白天电脑生图的话 其他事就干不了了。因为显卡占用实在太高了,连打个网页版传奇都不行了。有了这个工作流就不一样了,晚上睡觉后开始挂机,早上起来就有几百...
素材 9531 23
开源 Video2X v6.4.0 一个基于 Python 编写的视频、GIF 和图像放大及帧插值软件

开源 Video2X v6.4.0 一个基于 Python 编写的视频、GIF 和图像放大及帧插值软件

这个软件主要用于提升视频的质量,通过升频和提高分辨率来实现。对于那些希望改善老旧或低分辨率视频视觉效果的用户来说,它提供了一个强大的解决方案。video2x 的主要功能是将视频升频到更高的分辨率。它运用先进的算法来分析和处理视频的每一帧,增加像素数量,从而提升整体的清晰度和细节。这对于提升旧的 VHS 录像带、DVD 转制视频或其他低质量视频...
软件 3464 0
永中Office2024 个人版 v9.0.5847.101一款非常优秀的国产办公软件

永中Office2024 个人版 v9.0.5847.101一款非常优秀的国产办公软件

介绍永中Office(Yozo Office)是一款由永中软件股份有限公司自主研发的全面办公软件,面向企业、政府机构以及个人用户。它集成了文字处理、电子表格、简报制作和PDF阅读四大核心应用,同时支持桌面办公和移动办公,旨在为用户提供高效、稳定、安全的办公解决方案。以下是对永中Office的详细介绍。基本功能文字处理:永中Office的文字处...
软件 2782 1
HivisionIDPhotos v1.3.1 一个专注于证件照智能制作的开源项目 一键整合包 支持批量处理 附视频演示

HivisionIDPhotos v1.3.1 一个专注于证件照智能制作的开源项目 一键整合包 支持批量处理 附视频演示

HivisionIDPhotos 是一个专注于证件照智能制作的开源项目,由Zeyi-Lin开发并维护。该项目旨在通过先进的图像处理和机器学习技术,为用户提供一种高效、便捷的证件照制作解决方案。项目结合了轻量级抠图、多尺寸规格生成、智能换底等多种功能,让用户能够轻松制作出符合标准的证件照。核心功能轻量级抠图:HivisionIDPhotos采用...
AI,开源 6200 19
开源 DCT-Net_Webui v20250116 修改增强版 一款将图片/视频转绘漫画效果工具 支持批量处理 附三倍快乐演示

开源 DCT-Net_Webui v20250116 修改增强版 一款将图片/视频转绘漫画效果工具 支持批量处理 附三倍快乐演示

视频转动漫的工具貌似有不少,之前我也分享了,但是今天分享的这个,操作是极其简单,我顺手还做了个批量处理。这样就更方便了。Q群一个小伙伴提供了一台远程4060显卡的机器给我远程测试,所以也顺手把N卡包也整合好了。N卡的效率确实是超级高啊,我用CPU跑10秒的视频大概要3-5分钟,但是N卡的话 一分钟不到就搞定了。确实是爽。下面是截图一下给你们看...
AI,开源 8420 10
鲜艺AI抠图v3.1.0 免费且无需联网的 AI 抠图 可以批量处理

鲜艺AI抠图v3.1.0 免费且无需联网的 AI 抠图 可以批量处理

鲜艺AI抠图是一款功能强大的免费AI抠图工具,它以其高效、精准和便捷的特点受到了广大用户的喜爱。以下是对该软件的详细介绍:基本信息软件名称:鲜艺AI抠图软件类型:AI抠图工具平台支持:Windows、macOS特点:免费、离线运行、不登录、不联网核心功能毫秒级抠图:鲜艺AI抠图内嵌了先进的AI模型,能够实现快至毫秒级的精准抠图,大大提高了抠图...
软件 5139 4
开源 Fish Speech v1.5.0 优化版 文字转语音 可以克隆声音 一键整合包 附效果演示

开源 Fish Speech v1.5.0 优化版 文字转语音 可以克隆声音 一键整合包 附效果演示

Fish Speech是一个由Fish Audio团队开发的全新文本转语音(TTS)解决方案,旨在通过先进的机器学习和深度学习技术,将文本转换成高质量、逼真的语音输出。该项目基于CC-BY-NC-SA-4.0许可证发布,意味着任何人都可以在遵守许可证规定的前提下自由使用、改进和分享代码和模型。技术亮点Fish Speech项目采用了一系列前沿...
开源 1.2万 23
开源 FasterWhisperGUI(音频处理工具) v0.8.5 人声分离 人声识别 字幕处理 附模型下载

开源 FasterWhisperGUI(音频处理工具) v0.8.5 人声分离 人声识别 字幕处理 附模型下载

Faster Whisper GUI 是一个基于 Faster Whisper 引擎构建的图形用户界面(GUI)项目。这个开源项目旨在提供一个用户友好且功能强大的语音识别解决方案,使用 Python 语言开发,并借助 Faster Whisper 引擎的高效语音处理能力,来实现快速、准确的语音识别功能。以下是对这个开源项目的详细介绍。项目背景...
软件,开源 7454 7
超爽自制Comfyui工作流 一键批量读取海量提示词,生成海量不同图片。挂机生图专用 flux+xl模型

超爽自制Comfyui工作流 一键批量读取海量提示词,生成海量不同图片。挂机生图专用 flux+xl模型

这个工作流算是我的第二步构想,第一步就是批量生成提示词,这个工具已经分享出来了moondream v1.2 开源 AI人工智能 图片反推提示词神器,可批量处理图片提示词 一键整合包 升级比较大。然后生成的提示词用现在的这个工作流来生成对应的图片,效果是相当劲爆了现在这个截图 就是我下午一直在挂机生图的这个工作流,具体有多少行提示词我也没数。我...
素材 7033 6
moondream v1.2 开源 AI人工智能 图片反推提示词神器,可批量处理图片提示词 一键整合包

moondream v1.2 开源 AI人工智能 图片反推提示词神器,可批量处理图片提示词 一键整合包

vikhyat/moondream是一个开源的、轻量级的视觉语言模型项目,旨在提供强大的图像理解和生成能力,同时确保模型可以在各种环境下高效运行。该项目在GitHub上托管,拥有简洁的代码库和丰富的文档资源,为开发者提供了便捷的使用和定制体验。项目的核心是一个视觉语言模型,该模型能够接收图像作为输入,并基于图像内容生成相应的文本描述或回答相关...
AI,软件 7846 12
Clarity-Refiners-UI  一个专注于图像增强的开源项目 一键整合包

Clarity-Refiners-UI 一个专注于图像增强的开源项目 一键整合包

Pinokiofactory/Clarity-Refiners-UI 是一个专注于图像增强的开源项目,它基于 Pinokio UI 框架,并融合了多项先进的图像处理技术。该项目旨在为用户提供一种高效、易用且功能强大的图像增强解决方案。项目背景与目的Pinokiofactory/Clarity-Refiners-UI 是 Pinokio 工厂团...
AI,开源 2755 2
RMBG-2-Studio AI人工智能 抠图神器 一键整合包

RMBG-2-Studio AI人工智能 抠图神器 一键整合包

RMBG-2-Studio是一个基于BRIA-RMBG-2.0模型构建的增强型Pinokio应用程序,它不仅包含了安装文件,还提供了一系列强大的图像处理功能。以下是对该开源项目的详细介绍:项目背景与目的:RMBG-2-Studio旨在为用户提供一种高效、便捷的图像背景移除和图像合成工具。它利用了BRIA AI公司开发的RMBG v2.0背景移...
AI,开源 4474 2
InstantIR 一键整合包 AI智能高清修复图片工具 超分辨率工具

InstantIR 一键整合包 AI智能高清修复图片工具 超分辨率工具

这个项目群里的小伙伴 推荐了好多次了,之前我也试过做整合包,做完后发现BUG太多了,我就删了,看到作者最近又更新了,所以抽空把这个整合包做出来了。效果嘛 你们自己看。先来一张官方的示例图下面是我跑完的效果下面继续看我用其他图片跑的出来的效果跑一张图片大概需要3-4分钟。下面是界面截图下面是这个项目的AI介绍nstantIR 是一个在 GitH...
AI,开源 4747 0
不会写提示词?没有灵感?分享给你一个大杀器,一键搞定。效果超惊艳 c-pic v1.0 附视频演示

不会写提示词?没有灵感?分享给你一个大杀器,一键搞定。效果超惊艳 c-pic v1.0 附视频演示

今天分享的这个工具,是我自己用了很久的一个款工具,一段时间以来,我的视频和文章的封面都是这个工具生成的,可能过于惊艳,就导致了不少的人盗用图片了。现在我把工具和方法都放出来。先随便截图几张你们看看这些图片都是写提示词的灵感来源啊。我在视频里面有讲到方法,那里没有讲那么清楚,这里文字再说明一次。首先开启你的科学上网工具,因为下载的图片来自C站,...
软件 3630 12
播放量13万+短视频的制作 comfyui 视频重绘转绘工作流 附全部节点和插件 解压即可使用 附视频教程

播放量13万+短视频的制作 comfyui 视频重绘转绘工作流 附全部节点和插件 解压即可使用 附视频教程

这也是我的一个尝试,研究了一段时间然后用这个工作流来重绘视频,感觉还可以,也玩了一段时间了,所以抽空把这个工作流分享出来,我是把整个ComfyUI打包的,所以你们下载后,只要下载好你们喜欢的大模型就可以直接使用了,不要再费那么大劲去安装各种插件和lora模型 已经稀奇古怪的节点了大模型我只放了一个麦橘,模型下载的话 可以去liblib或者下面...
开源 4988 7
开源 免费 RVC WebUI v2.2.231006支持AMD+N卡+I卡 (AI歌曲翻唱工具)  附视频教程和200+语音模型

开源 免费 RVC WebUI v2.2.231006支持AMD+N卡+I卡 (AI歌曲翻唱工具) 附视频教程和200+语音模型

RVC 是一款前沿的音色替换项目,可以进行歌曲的翻唱和实时的变声,具有低延迟、优秀的变声效果、声音模型扩展性、个性化和先进的深度学习技术等特点。该项目的核心功能之一是有更高的自由性和声音模型扩展性,可以对任意动漫角色和人物进行实时的声音转换,前提是进行训练声音模型。这为用户提供了极大的自由度和创新空间。,这种声音模型的转换是通过深度学习实现的...
开源 8050 11
复旦、百度联手推出全新AI模型Hallo2 AI数字人 一键整合包,可生成高清4K数字人视频

复旦、百度联手推出全新AI模型Hallo2 AI数字人 一键整合包,可生成高清4K数字人视频

Hallo是一个由复旦大学、百度公司、苏黎世联邦理工学院和南京大学共同开发的AI对口型肖像图像动画技术,该技术能够基于语音音频输入生成逼真且动态的肖像图像视频。以下是该项目的详细介绍:项目背景:肖像图像动画技术:该技术旨在从单个静态图像和相应的语音音频中生成一个说话的人像,在视频游戏和虚拟现实、电影和电视制作、社交媒体和数字营销等领域具有巨大...
AI,开源 7867 23
diffusers-image-outpaint  超强AI人工智能扩图工具 一键整合包

diffusers-image-outpaint 超强AI人工智能扩图工具 一键整合包

Diffusers Image Outpaint 是一个在 Hugging Face 上的开源项目,它为图像外绘(image outpainting)提供了强大的工具和解决方案。一、项目背景与目标在图像处理领域,有时我们需要对图像进行扩展或修复,尤其是在图像的边缘部分进行外绘,以创造出更完整或更具创意的图像效果。Diffusers Image...
AI,开源 1.1万 16
免费 开源 AI视频换脸工具,换脸离线包 RoopGPU v1.3.2 支持AMD显卡 附视频演示

免费 开源 AI视频换脸工具,换脸离线包 RoopGPU v1.3.2 支持AMD显卡 附视频演示

roop 这个项目,原作者已经放弃了,转去做facefusion了。我这2天在整理我的网站上的一些开源项目,然后想更新下这个项目的最终版本。原来分享的不是最终版,估计想最终版也许值得珍藏。就去研究了下。发现这个版本居然是支持A卡来跑的。速度还不错,就花了点时间做成了整合包。今天分享出来,整合包代码全部开源,我没有加密任何文件,有很多人喜欢把启...
软件,开源 4.8万 155
开源 Tailor v0.1.5  一款功能强大的视频智能裁剪、生成及优化工具

开源 Tailor v0.1.5 一款功能强大的视频智能裁剪、生成及优化工具

Tailor 是一款功能强大的视频智能裁剪、生成及优化工具。这款软件集成了最先进的人工智能技术,为用户提供了前所未有的视频处理体验。Tailor涵盖了视频剪辑、视频生成和视频优化三大核心功能,共包含10种不同的处理方法。在视频剪辑方面,Tailor拥有精准的人脸识别技术,能够自动捕捉视频中的精彩人脸瞬间,并允许用户轻松选择关注的人脸进行裁剪,...
软件 4889 13
PuLID-flux模型 AI整合包 字节 开源的图像生成ID定制化项目,通过对比对齐技术引领纯净高效新纪元

PuLID-flux模型 AI整合包 字节 开源的图像生成ID定制化项目,通过对比对齐技术引领纯净高效新纪元

PuLID是一个由ByteDance Inc.开发的开源项目,专注于通过对比对齐技术实现纯净且高效的图像生成ID定制化。该项目由Zinan Guo、Yanze Wu、Zhuowei Chen、Lang Chen和Qian He等研究人员共同贡献,其中Zinan Guo和Yanze Wu为等量贡献者,Yanze Wu为通讯作者。PuLID项目的...
AI,开源 6424 13
Flux 文生图模型 一键整合包 解压即可食用 出图效果超级惊艳 附图片演示

Flux 文生图模型 一键整合包 解压即可食用 出图效果超级惊艳 附图片演示

Flux文生图模型是由Black Forest Labs(黑森林实验室)开发的一款高质量文本到图像生成模型。该模型在多个维度上展现了卓越性能,特别是在文本引导的图像生成、多主体场景构建以及精细的手部细节生成等方面,实现了显著的提升,为文生图领域设定了新的技术标杆。Flux模型的核心特点包括:高性能与高质量:Flux模型采用了先进的混合架构,融...
AI,开源 1.1万 59
应群友要求,我把开源 AI人脸替换工具离线版之前发布的一些版本整理一下再分享出来

应群友要求,我把开源 AI人脸替换工具离线版之前发布的一些版本整理一下再分享出来

群里一些小伙伴老在讲什么之前的老版本如何如何好用,如何得心应手。说实话我自己没有什么感觉。估计他们这些都是幻觉。但是你们要是喜欢之前的版本,我也是可以再分享出来,时间也是过得好快啊。截图如下 版本如下估计差不多了吧,应该没什么遗漏了。喜欢老版本的可以去下载试试。如果全部收藏的话 大概有170多G。。。你们看截图写在最后的最后,如果对这个工具使...
软件 1.3万 17
本群第一个自练 flux lora模型 苗疆倩影

本群第一个自练 flux lora模型 苗疆倩影

群内大牛icolor 自练了一个lora模型,首发在里布上。我也觉得非常牛X了本LORA由近300张苗族服饰、头饰等高清美图,经36000步近12小时炼制而成,经过本人测试后精选其一分享给大家使用。本人算力有限,在本地forge中使用dve Q8以及dve NF4模型进行测试,本LORA对人物服饰、脸型、肤色、整体色调色彩均有加强,可使用原版...
素材 3364 2