Ovis2图片反推提示词工具v5.0 基于AI大模型反推图片+视频批量生成提示词 英伟达6G显卡即可愉快玩耍

Ovis2图片反推提示词工具v5.0 基于AI大模型反推图片+视频批量生成提示词 英伟达6G显卡即可愉快玩耍

本工具基于Ovis2-4B和Ovis2-2B 这2个大模型制作而成。其实早之前我就有分享过反推提示词工具 moondream,但是我昨天遇到了这个大模型,发现功能更加强大,反推出来的提示更加丰富,更多细节描述。这个工具要求显卡比较低,英伟达显卡6g及以上就可以愉快玩耍了我用同一张图片反推提示词下面是Ovis2-4B生成的提示词The...
AI,开源 1.9万 52
开源·高速·高质:Shuttle Jaguar 生成电影级图像 剑二十七二次开发 20秒出图 最低6G英伟达显卡 支持50系 v20250818

开源·高速·高质:Shuttle Jaguar 生成电影级图像 剑二十七二次开发 20秒出图 最低6G英伟达显卡 支持50系 v20250818

我在网上瞎逛的时候,发现了这个模型还不错,就花点时间做了二次开发。Shuttle Jaguar 是一款由 ShuttleAI 开发的文本生成图像(Text-to-Image)人工智能模型,专注于生成具有高度审美感、电影级质感和逼真视觉效果的图像。该模型能够在仅需 四步推理 的极短时间内,将自然语言描述的文本提示(prompt)转化为高质量的图...
AI,开源 6099 9
AI 一键换衣,想穿哪件试哪件!AI-Clothes-Changer 一键整合包 支持50系显卡 v20250818

AI 一键换衣,想穿哪件试哪件!AI-Clothes-Changer 一键整合包 支持50系显卡 v20250818

AI-Clothes-Changer 是一个基于深度学习的交互式图像生成项目,旨在实现“虚拟试衣”功能 —— 用户上传一张人物穿着衣服的照片,再上传一件想要试穿的服装图像,系统即可将目标服装自然地“穿”在人物身上,生成逼真的换装效果图像。🔍 核心功能虚拟换衣(Virtual Try-On)输入:一张人物全身照 + 一件衣服的正面图像(如 T ...
AI 6014 5
EchoMimic 一个由阿里巴巴推出的开源AI数字人项目 支持50系显卡 一键整合包 v3 20250815更新

EchoMimic 一个由阿里巴巴推出的开源AI数字人项目 支持50系显卡 一键整合包 v3 20250815更新

EchoMimic是一个由阿里巴巴推出的开源AI数字人项目,该项目在数字人技术领域内实现了显著的创新与突破。以下是对EchoMimic的详细介绍:一、项目背景与意义随着人工智能、深度学习、计算机视觉以及自然语言处理技术的飞速发展,数字人技术逐渐成为连接现实世界与虚拟世界的重要桥梁。EchoMimic项目的诞生,旨在通过先进的技术手段,将静态图...
AI,开源 6290 8
手机软件 安卓app Etar-Calendar 一款基于开源理念设计的日历app  v1.0.51

手机软件 安卓app Etar-Calendar 一款基于开源理念设计的日历app v1.0.51

Etar Calendar是一款基于开源理念设计的日历应用,旨在为用户提供一个简单、直观且功能丰富的日程管理解决方案。这款软件不仅继承了Material Design的美学理念,更在实用性上做出了诸多创新,使其成为了众多开源爱好者心中的优选。Etar Calendar的核心优势在于其简洁而不失强大的功能设计。软件提供了月视图、周视图、日视图以...
安卓 2570 0
不用会设计!用 FLUX.1-Krea-dev,打几个字就能出高质量图片 剑二十七二次开发整合包 v2.0

不用会设计!用 FLUX.1-Krea-dev,打几个字就能出高质量图片 剑二十七二次开发整合包 v2.0

FLUX.1 [Krea-dev] —— 是 Black Forest Labs 推出的 FLUX.1 系列文本到图像生成模型的一个变体,专为设计类应用优化。一、模型背景1. 开发者:Black Forest Labs由前 Stability AI 核心团队成员(包括部分 Stable Diffusion 开发者)创立。2024 年推出 FL...
AI,开源 4721 11
NewPipe 一个专为Android平台设计的自由、轻量级在线流媒体播放APP v0.28.0

NewPipe 一个专为Android平台设计的自由、轻量级在线流媒体播放APP v0.28.0

NewPipe是一个专为Android平台设计的自由、轻量级流媒体前端应用程序。它以其开源、无广告、无需用户登录即可享受多种流媒体服务的特性而广受好评。以下是对NewPipe的详细介绍:一、软件概述NewPipe是一个功能强大的流媒体播放器,它支持多种视频和音频服务,包括但不限于YouTube。该软件通过从用户正在使用的服务的官方API(如P...
安卓 2656 0
手机软件 安卓app mpv-android 一个专为Android平台设计的开源视频播放器 v2025-07-27

手机软件 安卓app mpv-android 一个专为Android平台设计的开源视频播放器 v2025-07-27

mpv-android是一个专为Android平台设计的视频播放器,它基于libmpv库构建,为用户提供了强大且灵活的视频播放体验。mpv-android的核心特性之一是其支持硬件和软件视频解码。这意味着无论用户的设备性能如何,都能获得流畅的视频播放体验。硬件解码能够利用设备的GPU加速功能,减轻CPU的负担,从而在处理高清甚至4K视频时表现...
安卓 3100 0
让每一张旧照重获新生,从模糊老照片到高清重现:HYPIR 高清修复图片 一键整合包 v20250801

让每一张旧照重获新生,从模糊老照片到高清重现:HYPIR 高清修复图片 一键整合包 v20250801

HYPIR 是由 XPixel Group(一个专注于图像恢复与底层视觉研究的学术团队)提出的一种基于混合先验的图像恢复模型。该项目的核心目标是解决图像在退化过程中(如模糊、噪声、压缩等)丢失的细节信息,通过引入数据驱动先验与模型驱动先验的融合机制,实现高质量的图像复原。HYPIR 的名称来源于其核心思想:Hybrid Prior(混合先验)...
AI,开源 1.3万 34
E2/F5-TTS AI人工智能 文字转语音工具,可克隆声音,可训练,一键中文整合包 已支持最新50系显卡 v1.1.7

E2/F5-TTS AI人工智能 文字转语音工具,可克隆声音,可训练,一键中文整合包 已支持最新50系显卡 v1.1.7

SWivid/F5-TTS 是一个开源项目,旨在提供一个基于 Diffusion Transformer 和 ConvNeXt V2 架构的文本到语音(TTS)系统,该系统名为 F5-TTS。F5-TTS 的全称是“A Fairytaler that Fakes Fluent and Faithful Speech with Flow Mat...
AI,开源 1.3万 42
开源免费 qView 多平台简约图片查看器 绿色免安装 v7.1

开源免费 qView 多平台简约图片查看器 绿色免安装 v7.1

一款开源免费的简约图片查看器,支持多平台,支持简体中文支持bmp、gif、jpg、png、 TIFF、 WEBP等等格式qView是一款功能全面、界面简洁、体积小巧的图片查看软件,它为用户提供了非常方便和高效的图片浏览体验。首先,qView支持众多图片格式,包括常见的bmp、gif、jpg、png、tiff和webp等,用户无需担心图片格式的...
软件 2839 0
字节出品 MegaTTS3 - AI智能语音合成系统,文字秒变自然语音,支持多语言高质量输出 v20250725

字节出品 MegaTTS3 - AI智能语音合成系统,文字秒变自然语音,支持多语言高质量输出 v20250725

MegaTTS3 是字节跳动开源的一个先进的文本到语音(TTS)合成系统,具有以下特点:🌟 核心特性1. 高质量语音合成基于扩散模型的语音生成技术支持高保真度的语音合成生成自然、流畅的语音输出2. 强大的语音克隆能力能够克隆特定人的声音特征只需少量参考音频即可实现声音复制保持原始音色的同时合成新内容3. 多语言支持支持中文、英文等多种语言跨语...
AI,开源 5931 0
阿里出品 Ovis-U1-3b 多模态理解、文本到图像生成+图像编辑。 一键整合包

阿里出品 Ovis-U1-3b 多模态理解、文本到图像生成+图像编辑。 一键整合包

Ovis-U1 是由阿里巴巴AIDC-AI团队开发的一个先进的多模态大语言模型项目。这个项目专注于构建能够同时处理文本和图像信息的AI系统。核心特点多模态融合能力能够同时理解和处理文本与图像数据实现跨模态的信息理解和生成支持图文混合的输入输出场景统一架构设计采用统一的模型架构处理不同类型的模态数据简化了传统多模态系统中复杂的模块组合提高了模型...
AI,开源 4193 0
LoRA 千面 AI图片编辑 超N多风格转换 Kontext-Style-LoRAs v20250722

LoRA 千面 AI图片编辑 超N多风格转换 Kontext-Style-LoRAs v20250722

在huggingface瞎逛的时候,无意中发现了这个开源的模型,真的超级强,聚集了N多风格lora模型,操作也是极其简单,感觉可能有小伙伴能用的上,就花了时间做了整合,并进行了小小的二次开发,自我感觉还行。整合包说明1 支持50系显卡,最低英伟达8G显卡可以运行,如果你的显卡刚好是8G的话,可能内存要超过30G,安装好你显卡能支持的最高版本c...
AI,开源 4343 6
开源 UltraPixel 文生图 超高分辨率出图 细节非常丰富 远超Stable-diffusion等 一键整合包 附视频演示 v20250717 增强版 支持50系显卡

开源 UltraPixel 文生图 超高分辨率出图 细节非常丰富 远超Stable-diffusion等 一键整合包 附视频演示 v20250717 增强版 支持50系显卡

UltraPixel是一个由华为诺亚方舟实验室联合香港科技大学共同开发的开源项目,旨在生成具有丰富细节的高质量图像,其分辨率范围可以从1K一直延伸至6K。该项目不仅优化了细节处理,还显著提升了整体图像效果,将超高清图像合成推向了新的高峰。项目背景与目的随着人工智能技术的不断发展,生成高分辨率图像成为了一个研究热点。然而,现有的图像生成模型在生...
AI,开源 6884 6
AI 视频生成新突破:FramePack 开源项目引领视频扩散技术变革 一键汉化整合包 FramePack-F1 20250716更新 支持magcache加速 支持50系显卡

AI 视频生成新突破:FramePack 开源项目引领视频扩散技术变革 一键汉化整合包 FramePack-F1 20250716更新 支持magcache加速 支持50系显卡

FramePack 是一个开源项目,旨在通过创新的神经网络结构实现高效的视频生成。以下是对其的详细介绍:项目概述FramePack 是 “Packing Input Frame Contexts in Next - Frame Prediction Models for Video Generation” 论文的官方实现和桌面软件。它采用逐帧...
AI,开源 1.8万 48
FLUX.1-Kontext-dev:图文协同,让AI图像编辑更可控,支持局部重绘与图文控制,英伟达12G可运行 v20250716

FLUX.1-Kontext-dev:图文协同,让AI图像编辑更可控,支持局部重绘与图文控制,英伟达12G可运行 v20250716

前段时间一直死劲在更新的nunchaku-flux.1-kontext-dev,还算受到大伙的欢迎,主要是显卡要求很低。运行速度快,但是有些好显卡的小伙伴说能否出一个出图质量更好的版本?量化不要这么强的,对出图有一定要求的小伙伴。所以我今天就分享了这个FLUX.1-Kontext-dev,虽然也是nunchaku量化下的,但是相对来讲这个出图...
AI,开源 3166 6
手机软件 安卓app tasks v14.7.3 一款开源功能强大、易于使用且注重隐私的任务管理APP

手机软件 安卓app tasks v14.7.3 一款开源功能强大、易于使用且注重隐私的任务管理APP

Tasks是一款基于Astrid(一款在2013年被收购并停止服务的流行跨平台生产力服务)的开源Android应用源代码发展而来的任务管理应用。它继承了Astrid的核心功能,并在此基础上进行了优化和扩展,为用户提供了一个强大而灵活的任务管理解决方案。核心功能与特性Tasks的核心功能在于其强大的任务管理能力。用户可以轻松地创建、编辑、删除和...
安卓 2740 0
FishAudio 推出 OpenAudio-S1-Mini:革新语音合成技术, 一键整合包 v20250627

FishAudio 推出 OpenAudio-S1-Mini:革新语音合成技术, 一键整合包 v20250627

openaudio-s1-mini 是一个开源的音频生成模型,主要特点是能够将文本高效地转换为自然流畅的语音。下面是对该模型的详细介绍:基本信息模型名称:openaudio-s1-mini开源平台:ModelScope.cn开发者:FishAudio 团队主要特点高效的文本转语音能力:该模型经过大量数据训练,能够将输入的文本快速转换为自然流畅...
AI,开源 5109 13
开源 PasteBar v0.7.0 一款功能全面、易于使用的剪贴板管理器

开源 PasteBar v0.7.0 一款功能全面、易于使用的剪贴板管理器

PasteBarApp 是一款功能强大且免费的剪贴板管理器,专为Mac和Windows用户设计。这款开源软件致力于让用户能够轻松管理他们复制和粘贴的所有内容,无论是文本、图片、文件、链接还是代码片段。PasteBarApp提供了无限的剪贴板历史记录,用户可以随时回溯并找回之前复制的任何内容,这对于经常需要处理大量信息的用户来说极为便利。软件的...
软件 2909 0
手机软件 安卓APP F-Droid v1.21.1 一个致力于提供自由、开源安卓应用程序的应用商店

手机软件 安卓APP F-Droid v1.21.1 一个致力于提供自由、开源安卓应用程序的应用商店

F-Droid是一个致力于提供自由、开源安卓应用程序的客户端工具。以下是关于它的详细介绍:项目概述名称 :F-Droid Client平台 :主要基于安卓系统托管平台 :该项目托管在 GitLab 上,GitLab 是一个用于仓库托管和代码管理的平台,方便开发者进行版本控制、协作开发等操作。通过 GitLab,F-Droid 的开发团队可以有...
安卓 2768 0
Nuclear v0.6.48 一款免费、开源且功能强大的音乐播放器

Nuclear v0.6.48 一款免费、开源且功能强大的音乐播放器

Nuclear是一款开源且免费的桌面音乐播放器,专为音乐爱好者设计,提供了从多个在线音乐平台如YouTube、Jamendo、Audius和SoundCloud等搜索并播放音乐的便捷功能。这款软件以其跨平台的兼容性和丰富的音乐资源而备受推崇,能够在Windows、macOS和Linux等操作系统上运行,确保用户在不同设备上都能享受到一致的音乐...
软件 4205 1
MiniMax-Remover:基于 Minimax 优化的高效视频物体移除工具 v20250621 一键整合包

MiniMax-Remover:基于 Minimax 优化的高效视频物体移除工具 v20250621 一键整合包

MiniMax-Remover是一个基于 minimax 优化的视频物体移除工具,旨在高效、高质量地从视频中移除指定对象,并生成视觉上无缝的修复结果。该项目由 Bojia Zi 等人开发,核心目标是实现 快速(Fast)、有效(Effective)和鲁棒(Robust)的视频内容编辑。核心特性两阶段训练策略第一阶段:使用简化版的 DiT(Di...
AI,开源 5301 0
 让模糊照片变清晰 —— AI 图像增强器 GSASR v20250620 一键整合包

让模糊照片变清晰 —— AI 图像增强器 GSASR v20250620 一键整合包

GSASR(Generalized and Efficient 2D Gaussian Splatting for Arbitrary-scale Super-Resolution),是由研究人员开发的一种新型的图像超分辨率技术。它的核心目标是:让图片“变清晰”,而且可以按任意倍数放大,不会失真或模糊。🌟 什么是图像超分辨率?简单来说,图像超...
AI,开源 6473 11
AI 人工智能 一键高清修复模糊照片(支持批量处理),还原清晰细节 Finegrain Image Enhancer  v20250617 一键汉化整合包

AI 人工智能 一键高清修复模糊照片(支持批量处理),还原清晰细节 Finegrain Image Enhancer v20250617 一键汉化整合包

Finegrain Image Enhancer开源图像增强工具通过人工智能技术将低分辨率图像转化为高分辨率版本,智能生成细节以提升画质 。核心功能超分辨率放大支持模糊或低分辨率图像放大(最高可达4倍),增强细节的清晰度和真实感 。细粒度参数控制提供增强强度、风格一致性等参数调节,允许用户进行精细化编辑 。结果可重复性通过种子管理保存特定增强...
AI,开源 7886 11
Meissonic 开源高性能文生图模型 一键整合包 v20250619

Meissonic 开源高性能文生图模型 一键整合包 v20250619

Meissonic 是一个基于 Masked Generative Transformer的高效高分辨率文本到图像生成模型,旨在通过消费级显卡实现高质量的图像生成任务。该项目在 ICLR 2025 上发表,其核心目标是重新激发 Masked Generative Transformers 在图像合成中的潜力,并提供一种高效的推理方案。核心特性...
AI,开源 2819 0
字节开源BAGEL:70亿参数多模态大模型,图像生成+理解全新突破 v20250613 一键整合包

字节开源BAGEL:70亿参数多模态大模型,图像生成+理解全新突破 v20250613 一键整合包

BAGEL 是一个由 ByteDance-Seed团队开发的开源多模态基础模型,具有 70 亿(7B)活跃参数(总参数为 140 亿),并在大规模交错的多模态数据(包括语言、图像、视频和网页数据)上进行了训练。该项目的目标是通过统一的架构来实现强大的多模态理解和生成能力,并进一步扩展到复杂的视觉操作任务。核心特点1. 先进的模型架构BAGEL...
AI,开源 4393 0
它把AI画画的天花板又抬高了一截 又一国产AI绘画模型 Chroma v20250609 一键整合包

它把AI画画的天花板又抬高了一截 又一国产AI绘画模型 Chroma v20250609 一键整合包

1. 模型概述Chroma 是一个开源、无审查且面向社区构建的大模型。参数规模:Chroma 是一个拥有 89 亿(8.9B)参数的模型,基于 FLUX.1-schnell架构开发(技术报告即将发布)。它完全采用 Apache 2.0 许可证,这意味着任何人都可以自由使用、修改和在该模型基础上进行二次开发,无需企业或机构控制。训练状态:该模型...
AI,开源 5744 11
smplayer v25.6.0 一款开源的全能多媒体播放器

smplayer v25.6.0 一款开源的全能多媒体播放器

SMPlayer是一款开源的多媒体播放器,专为那些追求高质量视频和音频播放体验的用户设计。它不仅支持几乎所有格式的视频和音频文件,还集成了强大的解码器,确保流畅无阻的播放体验。以下是对SMPlayer的详细介绍:一、丰富的功能特性广泛的格式支持:SMPlayer几乎可以播放任何类型的视频和音频文件,无需额外安装任何解码器或插件。这得益于其内置...
软件 3498 0
Mozilla Firefox 火狐浏览器 v140.0b6 简体中文官方

Mozilla Firefox 火狐浏览器 v140.0b6 简体中文官方

火狐浏览器这个没什么讲的,太有名了。软件简介:Mozilla Firefox是一款由Mozilla基金会开发的免费开源的网络浏览器。它于2002年首次发布,经过多年的发展和改进,已成为全球最受欢迎的网络浏览器之一。Firefox以其速度、安全性、稳定性和可定制性而闻名,并且提供了丰富的功能和扩展,以满足用户的各种需求。首先,Firefox注重...
软件 3816 0
开源 PlayStation 3 模拟器 RPCS3 v0.0.37-18001  PlayStation 3 游戏模拟器

开源 PlayStation 3 模拟器 RPCS3 v0.0.37-18001 PlayStation 3 游戏模拟器

RPCS3 是一个在 GNU通用公共许可证v2下发布的自由且开源的游戏机模拟器,允许用户在个人计算机上玩索尼 PlayStation 3(PS3)游戏。该项目始于2011年,持续不断地得到改进和更新,致力于提供高质量的PS3模拟体验。以下是关于 RPCS3 的详细介绍:主要特点:PS3 游戏模拟:RPCS3 允许用户在PC上模拟PS3游戏,并...
软件 3504 1
 想自己生成图片但怕侵权?试试这个新AI模型!f-lite v20250607 一键整合包 支持40系+50系显卡

想自己生成图片但怕侵权?试试这个新AI模型!f-lite v20250607 一键整合包 支持40系+50系显卡

F Lite是由 Fal AI与 Freepik联合开发的一个基于扩散模型的图像生成工具。它提供了一个轻量但功能强大的模型架构,并在数据合规性方面做出了显著努力。📌 核心特点✅ 合法合规的数据集训练模型仅使用了 8000 万张版权安全(copyright-safe)和 SFW(适合所有年龄层,Safe For Work)内容进行训练。数据来源...
AI,开源 4068 3