Ovis2图片反推提示词工具v5.0 基于AI大模型反推图片+视频批量生成提示词 英伟达6G显卡即可愉快玩耍

Ovis2图片反推提示词工具v5.0 基于AI大模型反推图片+视频批量生成提示词 英伟达6G显卡即可愉快玩耍

本工具基于Ovis2-4B和Ovis2-2B 这2个大模型制作而成。其实早之前我就有分享过反推提示词工具 moondream,但是我昨天遇到了这个大模型,发现功能更加强大,反推出来的提示更加丰富,更多细节描述。这个工具要求显卡比较低,英伟达显卡6g及以上就可以愉快玩耍了我用同一张图片反推提示词下面是Ovis2-4B生成的提示词The...
AI,开源 1.5万 52
开源·高速·高质:Shuttle Jaguar 生成电影级图像 剑二十七二次开发 20秒出图 最低6G英伟达显卡 支持50系 v20250818

开源·高速·高质:Shuttle Jaguar 生成电影级图像 剑二十七二次开发 20秒出图 最低6G英伟达显卡 支持50系 v20250818

我在网上瞎逛的时候,发现了这个模型还不错,就花点时间做了二次开发。Shuttle Jaguar 是一款由 ShuttleAI 开发的文本生成图像(Text-to-Image)人工智能模型,专注于生成具有高度审美感、电影级质感和逼真视觉效果的图像。该模型能够在仅需 四步推理 的极短时间内,将自然语言描述的文本提示(prompt)转化为高质量的图...
AI,开源 5108 9
AI 一键换衣,想穿哪件试哪件!AI-Clothes-Changer 一键整合包 支持50系显卡 v20250818

AI 一键换衣,想穿哪件试哪件!AI-Clothes-Changer 一键整合包 支持50系显卡 v20250818

AI-Clothes-Changer 是一个基于深度学习的交互式图像生成项目,旨在实现“虚拟试衣”功能 —— 用户上传一张人物穿着衣服的照片,再上传一件想要试穿的服装图像,系统即可将目标服装自然地“穿”在人物身上,生成逼真的换装效果图像。🔍 核心功能虚拟换衣(Virtual Try-On)输入:一张人物全身照 + 一件衣服的正面图像(如 T ...
AI 4834 5
EchoMimic 一个由阿里巴巴推出的开源AI数字人项目 支持50系显卡 一键整合包 v3 20250815更新

EchoMimic 一个由阿里巴巴推出的开源AI数字人项目 支持50系显卡 一键整合包 v3 20250815更新

EchoMimic是一个由阿里巴巴推出的开源AI数字人项目,该项目在数字人技术领域内实现了显著的创新与突破。以下是对EchoMimic的详细介绍:一、项目背景与意义随着人工智能、深度学习、计算机视觉以及自然语言处理技术的飞速发展,数字人技术逐渐成为连接现实世界与虚拟世界的重要桥梁。EchoMimic项目的诞生,旨在通过先进的技术手段,将静态图...
AI,开源 5276 8
lmstudio 一款强大而灵活的本地大模型部署工具 我的rx580 都能流畅运行 附模型文件 支持DeepSeek v0.3.23

lmstudio 一款强大而灵活的本地大模型部署工具 我的rx580 都能流畅运行 附模型文件 支持DeepSeek v0.3.23

LM Studio是由lmstudio.ai提供的一款强大而灵活的本地大模型部署工具。它不仅降低了机器学习的使用门槛,还为用户提供了一个安全、高效、隐私保护的环境,以便在本地运行各种大型语言模型。首先,LM Studio具备强大的离线使用能力。这意味着用户无需互联网连接即可运行模型,极大地提升了使用的便捷性和灵活性。对于那些需要保护数据隐私或...
AI,开源 8078 20
不用会设计!用 FLUX.1-Krea-dev,打几个字就能出高质量图片 剑二十七二次开发整合包 v2.0

不用会设计!用 FLUX.1-Krea-dev,打几个字就能出高质量图片 剑二十七二次开发整合包 v2.0

FLUX.1 [Krea-dev] —— 是 Black Forest Labs 推出的 FLUX.1 系列文本到图像生成模型的一个变体,专为设计类应用优化。一、模型背景1. 开发者:Black Forest Labs由前 Stability AI 核心团队成员(包括部分 Stable Diffusion 开发者)创立。2024 年推出 FL...
AI,开源 3806 11
GiliSoft AI Toolkit v10.5  一款功能丰富的AI工具综合软件包

GiliSoft AI Toolkit v10.5 一款功能丰富的AI工具综合软件包

GiliSoft AI Toolkit 是一款功能丰富的综合软件包,专为希望将AI技术集成到其工作流程中的企业和个人设计。该软件包集成了多种AI工具,包括但不限于聊天机器人、OCR(光学字符识别)、TTS(文本到语音)和ASR(自动语音识别)等功能,为用户提供了全方位、高效便捷的AI解决方案。在OCR方面,GiliSoft AI Toolki...
软件 4225 2
让每一张旧照重获新生,从模糊老照片到高清重现:HYPIR 高清修复图片 一键整合包 v20250801

让每一张旧照重获新生,从模糊老照片到高清重现:HYPIR 高清修复图片 一键整合包 v20250801

HYPIR 是由 XPixel Group(一个专注于图像恢复与底层视觉研究的学术团队)提出的一种基于混合先验的图像恢复模型。该项目的核心目标是解决图像在退化过程中(如模糊、噪声、压缩等)丢失的细节信息,通过引入数据驱动先验与模型驱动先验的融合机制,实现高质量的图像复原。HYPIR 的名称来源于其核心思想:Hybrid Prior(混合先验)...
AI,开源 1万 32
E2/F5-TTS AI人工智能 文字转语音工具,可克隆声音,可训练,一键中文整合包 已支持最新50系显卡 v1.1.7

E2/F5-TTS AI人工智能 文字转语音工具,可克隆声音,可训练,一键中文整合包 已支持最新50系显卡 v1.1.7

SWivid/F5-TTS 是一个开源项目,旨在提供一个基于 Diffusion Transformer 和 ConvNeXt V2 架构的文本到语音(TTS)系统,该系统名为 F5-TTS。F5-TTS 的全称是“A Fairytaler that Fakes Fluent and Faithful Speech with Flow Mat...
AI,开源 1.1万 42
一键克隆你的声音:Higgs-Audio 高质量的文本转语音生成 开源语音生成工具 中文一键整合包 v20250728

一键克隆你的声音:Higgs-Audio 高质量的文本转语音生成 开源语音生成工具 中文一键整合包 v20250728

HiggsAudio 是由 Boson AI 开发的开源文本转语音(TTS)系统,基于先进的深度学习技术,能够生成高质量、自然的人声。该项目在 GitHub 上开源,提供了强大的语音合成能力。🌟 项目亮点🎵 高质量语音生成生成接近真人发音的语音支持多种语言和口音能够处理情感表达和语调变化🏗️ 先进的模型架构基于 Transformer 的端到...
AI,开源 3458 10
字节出品 MegaTTS3 - AI智能语音合成系统,文字秒变自然语音,支持多语言高质量输出 v20250725

字节出品 MegaTTS3 - AI智能语音合成系统,文字秒变自然语音,支持多语言高质量输出 v20250725

MegaTTS3 是字节跳动开源的一个先进的文本到语音(TTS)合成系统,具有以下特点:🌟 核心特性1. 高质量语音合成基于扩散模型的语音生成技术支持高保真度的语音合成生成自然、流畅的语音输出2. 强大的语音克隆能力能够克隆特定人的声音特征只需少量参考音频即可实现声音复制保持原始音色的同时合成新内容3. 多语言支持支持中文、英文等多种语言跨语...
AI,开源 5352 0
人工智能AI相关工具软件 合集整理

人工智能AI相关工具软件 合集整理

MOSS-TTSD:一个高质量的开源中文文本到语音合成系统 一键整合包 支持免费商业使用LoRA 千面 AI图片编辑 超N多风格转换 Kontext-Style-LoRAs光影魔法来了!AI一键切换日光/夜景/霓虹灯效果 relighting-kontext 0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版&...
AI,软件 3.8万 17
阿里出品 Ovis-U1-3b 多模态理解、文本到图像生成+图像编辑。 一键整合包

阿里出品 Ovis-U1-3b 多模态理解、文本到图像生成+图像编辑。 一键整合包

Ovis-U1 是由阿里巴巴AIDC-AI团队开发的一个先进的多模态大语言模型项目。这个项目专注于构建能够同时处理文本和图像信息的AI系统。核心特点多模态融合能力能够同时理解和处理文本与图像数据实现跨模态的信息理解和生成支持图文混合的输入输出场景统一架构设计采用统一的模型架构处理不同类型的模态数据简化了传统多模态系统中复杂的模块组合提高了模型...
AI,开源 3716 0
LoRA 千面 AI图片编辑 超N多风格转换 Kontext-Style-LoRAs v20250722

LoRA 千面 AI图片编辑 超N多风格转换 Kontext-Style-LoRAs v20250722

在huggingface瞎逛的时候,无意中发现了这个开源的模型,真的超级强,聚集了N多风格lora模型,操作也是极其简单,感觉可能有小伙伴能用的上,就花了时间做了整合,并进行了小小的二次开发,自我感觉还行。整合包说明1 支持50系显卡,最低英伟达8G显卡可以运行,如果你的显卡刚好是8G的话,可能内存要超过30G,安装好你显卡能支持的最高版本c...
AI,开源 3525 6
光影魔法来了!AI一键切换日光/夜景/霓虹灯效果 relighting-kontext v20250720

光影魔法来了!AI一键切换日光/夜景/霓虹灯效果 relighting-kontext v20250720

在网上瞎逛的时候,发现了这个模型,很不错,光影效果做出来很逼真,虽然我以前也做过一个类似的整合包,但是跟这个没法比,所以抽空进行了二次开发。🌟 Relighting Kontext [dev] LoRA v3 模型介绍Relighting Kontext [dev] LoRA v3是一个针对 FLUX.1-Kontext-dev模型优化的低秩...
AI,开源 4296 10
Topaz Video AI破解版(人工智能视频修复,视频增强软件) v7.1.0 绿色版 集成OFX插件

Topaz Video AI破解版(人工智能视频修复,视频增强软件) v7.1.0 绿色版 集成OFX插件

这个软件更新频率实在是太快了,关键是又很大,上传好慢的说。。。这个工具修复视频还是要N卡,如果你没有n卡的话,用cpu跑会让你怀疑人生的,就算10多秒的视频都要半小时以上了。老有人问要什么设备才能好使,我这么说吧,你的显卡是N卡,越贵越好。如果你有N卡,那么这个软件还是很不错的,修复的效果还是很明显。试试吧. 另外我手头还有个开源免费的高清视...
软件 7.7万 340
开源 Deep-Live-Cam v2.1 AI人工智能 图片视频换脸+直播换脸 整合包 支持AMD+英伟达N卡50系

开源 Deep-Live-Cam v2.1 AI人工智能 图片视频换脸+直播换脸 整合包 支持AMD+英伟达N卡50系

Deep-Live-Cam是一款由hacksider开发并维护的创新性软件,旨在为快速发展的AI生成媒体行业贡献一份力量。该软件的主要功能是通过深度学习技术,实现实时的人脸替换与增强,为艺术家、设计师以及内容创作者提供了一个强大的工具,帮助他们以全新的方式创作和表达。项目概述Deep-Live-Cam的核心价值在于其广泛的应用场景。艺术家可以...
AI,开源 1.4万 14
开源 UltraPixel 文生图 超高分辨率出图 细节非常丰富 远超Stable-diffusion等 一键整合包 附视频演示 v20250717 增强版 支持50系显卡

开源 UltraPixel 文生图 超高分辨率出图 细节非常丰富 远超Stable-diffusion等 一键整合包 附视频演示 v20250717 增强版 支持50系显卡

UltraPixel是一个由华为诺亚方舟实验室联合香港科技大学共同开发的开源项目,旨在生成具有丰富细节的高质量图像,其分辨率范围可以从1K一直延伸至6K。该项目不仅优化了细节处理,还显著提升了整体图像效果,将超高清图像合成推向了新的高峰。项目背景与目的随着人工智能技术的不断发展,生成高分辨率图像成为了一个研究热点。然而,现有的图像生成模型在生...
AI,开源 5898 6
AI 视频生成新突破:FramePack 开源项目引领视频扩散技术变革 一键汉化整合包 FramePack-F1 20250716更新 支持magcache加速 支持50系显卡

AI 视频生成新突破:FramePack 开源项目引领视频扩散技术变革 一键汉化整合包 FramePack-F1 20250716更新 支持magcache加速 支持50系显卡

FramePack 是一个开源项目,旨在通过创新的神经网络结构实现高效的视频生成。以下是对其的详细介绍:项目概述FramePack 是 “Packing Input Frame Contexts in Next - Frame Prediction Models for Video Generation” 论文的官方实现和桌面软件。它采用逐帧...
AI,开源 1.5万 48
FLUX.1-Kontext-dev:图文协同,让AI图像编辑更可控,支持局部重绘与图文控制,英伟达12G可运行 v20250716

FLUX.1-Kontext-dev:图文协同,让AI图像编辑更可控,支持局部重绘与图文控制,英伟达12G可运行 v20250716

前段时间一直死劲在更新的nunchaku-flux.1-kontext-dev,还算受到大伙的欢迎,主要是显卡要求很低。运行速度快,但是有些好显卡的小伙伴说能否出一个出图质量更好的版本?量化不要这么强的,对出图有一定要求的小伙伴。所以我今天就分享了这个FLUX.1-Kontext-dev,虽然也是nunchaku量化下的,但是相对来讲这个出图...
AI,开源 2598 6
开源 免费 视频AI自动抠像 速度快 操作简单 效果很是惊艳 值得珍藏 RobustVideoMattingGUI  v1.1.0

开源 免费 视频AI自动抠像 速度快 操作简单 效果很是惊艳 值得珍藏 RobustVideoMattingGUI v1.1.0

之前分享的图片抠像,有些小伙伴在问是否有视频抠像的,那必须要有啊。这个工具我也是放在我的收藏夹里面好久了,今天就分享出来。我的好东西多的是就怕你们硬盘空间不够。这个软件解压后近8G。先看视频演示 这个开源项目真的是很良心了,抠像真的是不错,我个人觉得已经很媲美剪映那个抠像了。目前不支持N卡,我只能用cpu来跑,但是效率还可以,我10多秒的视频...
软件,开源 5770 12
LiYing v3.1.1 一款专为自动化完成一般照相馆后期流程而设计的照片自动处理软件 已附模板文件

LiYing v3.1.1 一款专为自动化完成一般照相馆后期流程而设计的照片自动处理软件 已附模板文件

LiYing 是一款专为自动化完成一般照相馆后期流程而设计的照片自动处理软件。它能够实现一系列复杂的图像处理任务,包括人体与人脸的自动识别、照片角度的自动纠正、背景色的自动更换、以及根据需求自动裁切并排版任意尺寸的证件照。这些功能使得LiYing成为摄影工作室、证件照拍摄点以及个人用户处理证件照的强大工具。该软件的独特之处在于其完全离线运行的...
软件 3727 1
AIStarter启动器:AI Starter v4.1.0 实现一键AI下载使用,实现开箱即用 完整包包含项目文件

AIStarter启动器:AI Starter v4.1.0 实现一键AI下载使用,实现开箱即用 完整包包含项目文件

分享给喜欢玩AI的朋友,我下载测试体验了,基本热门的ai项目都可以下载本地部署,全自动。您的AI项目管理专家,AIStarter实现一键下载使用,实现开箱即用我分享的是完整包 里面已经包含AI的项目文件下面简单说下完整包使用方法。先装好AIStarter Setup 2.0.1.exe。然后启动这个工具设置好目录,硬盘少于1T的千万不要来自取...
开源 1.1万 42
轻量 高效 AI生图工具 基于 Stable Diffusion XL 模型二次开发,6G英伟达显卡就可以愉快玩耍 Diaomo v6.0 六秒出图 支持更换模型+图片超分+图生图

轻量 高效 AI生图工具 基于 Stable Diffusion XL 模型二次开发,6G英伟达显卡就可以愉快玩耍 Diaomo v6.0 六秒出图 支持更换模型+图片超分+图生图

CyberIllustrious是一个基于 Stable Diffusion模型架构的二次创作(LoRA 或 Dreambooth)模型,主要专注于生成具有“未来感”、“赛博朋克”和“华丽视觉风格”的高质量插画内容。它通常被用于图像生成平台如 NovelAI、Stable Diffusion WebUI或 ComfyUI中。🧠 模型简介项目内...
AI,开源 1.1万 31
 开源免费无限制 RWKV Runner v1.9.6 开箱即用的AI软件-聊天 写作 作曲一键完成 附模型文件

开源免费无限制 RWKV Runner v1.9.6 开箱即用的AI软件-聊天 写作 作曲一键完成 附模型文件

今天在网上到处瞎逛的时候,发现个好东西,能让普通人也用上AI,无需复杂的配置,更神奇的是居然可以用我的AMD RX580跑起来。让你们先看下截图这是这个工具的全部截图。操作极其简单,如果要运行什么,会提示你去下载模型,下载模型会自动下载,为了节约大伙的时间,我已经把模型全部放在压缩包里面了。基本就实现了解压即可使用,下面看下我随便问几个问题。...
开源 7738 13
开源 免费 pyVideoTrans v3.72 视频翻译开源软件 自动识别并生成字幕后,翻译 + 配音 绿色免安装

开源 免费 pyVideoTrans v3.72 视频翻译开源软件 自动识别并生成字幕后,翻译 + 配音 绿色免安装

这个工具我用来很长一段时间了,只是我居然一直忘记给大伙分享出来,直到昨天群里有人在问这样的工具。我才想起来把这个分享出来给大伙。虽然这个工具的标题叫视频翻译,实际上远远不只这些功能,我一直用这个工具来做字幕识别,比如我以前的教程那些字幕很多都是这个工具帮我做的。识别率也很高,超级方便。本来想今天一早就分享出来,但是事情比较多,又是瞎折腾的一天...
AI,开源 1.3万 29
FishAudio 推出 OpenAudio-S1-Mini:革新语音合成技术, 一键整合包 v20250627

FishAudio 推出 OpenAudio-S1-Mini:革新语音合成技术, 一键整合包 v20250627

openaudio-s1-mini 是一个开源的音频生成模型,主要特点是能够将文本高效地转换为自然流畅的语音。下面是对该模型的详细介绍:基本信息模型名称:openaudio-s1-mini开源平台:ModelScope.cn开发者:FishAudio 团队主要特点高效的文本转语音能力:该模型经过大量数据训练,能够将输入的文本快速转换为自然流畅...
AI,开源 4133 13
GPT-SoVITS 20250606v2pro一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包

GPT-SoVITS 20250606v2pro一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包

GPT-SoVITS是一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成。该工具由RVC-Boss团队开发,并在GitHub上公开分享,为用户提供了一个灵活且功能丰富的平台,以满足语音合成的多样化需求。核心功能GPT-SoVITS的核心功能包括零样本和少样本TTS。零样本TTS允许用户仅通过输入一个5秒的语音样本,就能即时体...
AI,开源 9295 4
MiniMax-Remover:基于 Minimax 优化的高效视频物体移除工具 v20250621 一键整合包

MiniMax-Remover:基于 Minimax 优化的高效视频物体移除工具 v20250621 一键整合包

MiniMax-Remover是一个基于 minimax 优化的视频物体移除工具,旨在高效、高质量地从视频中移除指定对象,并生成视觉上无缝的修复结果。该项目由 Bojia Zi 等人开发,核心目标是实现 快速(Fast)、有效(Effective)和鲁棒(Robust)的视频内容编辑。核心特性两阶段训练策略第一阶段:使用简化版的 DiT(Di...
AI,开源 4292 0
 让模糊照片变清晰 —— AI 图像增强器 GSASR v20250620 一键整合包

让模糊照片变清晰 —— AI 图像增强器 GSASR v20250620 一键整合包

GSASR(Generalized and Efficient 2D Gaussian Splatting for Arbitrary-scale Super-Resolution),是由研究人员开发的一种新型的图像超分辨率技术。它的核心目标是:让图片“变清晰”,而且可以按任意倍数放大,不会失真或模糊。🌟 什么是图像超分辨率?简单来说,图像超...
AI,开源 5532 11
绿色 免安装 人工智能增强图片 Perfectly Clear WorkBench 图像清晰处理 v4.7.0.2807 绿色版 已集成插件

绿色 免安装 人工智能增强图片 Perfectly Clear WorkBench 图像清晰处理 v4.7.0.2807 绿色版 已集成插件

Perfectly Clear WorkBench 是一款优秀的图像处理软件,它能够自动修正图片中的色彩、白平衡、对比度、清晰度、暗部细节等问题,让您的照片高质量、高清晰度,达到专业摄影师的水平。首先,Perfectly Clear WorkBench 有一个非常直观和简洁的用户界面,使用非常方便。当您打开照片时,您会看到直观的缩略图和编辑选...
软件 2万 96
人工智能图像放大工具 Topaz Gigapixel AI破解版v8.4.2 绿色便携版 附模型

人工智能图像放大工具 Topaz Gigapixel AI破解版v8.4.2 绿色便携版 附模型

Topaz Gigapixel AI是一款强大的图像放大软件,利用人工智能技术和先进的图像处理算法,能够将图像进行高质量放大而保持细节清晰度,从而帮助用户实现图像的无损放大和增强。这款软件在数字图像处理领域具有重要意义,为摄影师、设计师和艺术家提供了强大的工具,让他们能够处理和改进各种类型的图像,包括照片、插图和艺术作品等。技术原理Topaz...
软件 1.3万 32