FLUX.1-Kontext-dev:图文协同,让AI图像编辑更可控,支持局部重绘与图文控制,英伟达12G可运行 v20250716

FLUX.1-Kontext-dev:图文协同,让AI图像编辑更可控,支持局部重绘与图文控制,英伟达12G可运行 v20250716

前段时间一直死劲在更新的nunchaku-flux.1-kontext-dev,还算受到大伙的欢迎,主要是显卡要求很低。运行速度快,但是有些好显卡的小伙伴说能否出一个出图质量更好的版本?量化不要这么强的,对出图有一定要求的小伙伴。所以我今天就分享了这个FLUX.1-Kontext-dev,虽然也是nunchaku量化下的,但是相对来讲这个出图...
AI,开源 2898 6
LiYing v3.1.1 一款专为自动化完成一般照相馆后期流程而设计的照片自动处理软件 已附模板文件

LiYing v3.1.1 一款专为自动化完成一般照相馆后期流程而设计的照片自动处理软件 已附模板文件

LiYing 是一款专为自动化完成一般照相馆后期流程而设计的照片自动处理软件。它能够实现一系列复杂的图像处理任务,包括人体与人脸的自动识别、照片角度的自动纠正、背景色的自动更换、以及根据需求自动裁切并排版任意尺寸的证件照。这些功能使得LiYing成为摄影工作室、证件照拍摄点以及个人用户处理证件照的强大工具。该软件的独特之处在于其完全离线运行的...
软件 4001 1
FishAudio 推出 OpenAudio-S1-Mini:革新语音合成技术, 一键整合包 v20250627

FishAudio 推出 OpenAudio-S1-Mini:革新语音合成技术, 一键整合包 v20250627

openaudio-s1-mini 是一个开源的音频生成模型,主要特点是能够将文本高效地转换为自然流畅的语音。下面是对该模型的详细介绍:基本信息模型名称:openaudio-s1-mini开源平台:ModelScope.cn开发者:FishAudio 团队主要特点高效的文本转语音能力:该模型经过大量数据训练,能够将输入的文本快速转换为自然流畅...
AI,开源 4674 13
MiniMax-Remover:基于 Minimax 优化的高效视频物体移除工具 v20250621 一键整合包

MiniMax-Remover:基于 Minimax 优化的高效视频物体移除工具 v20250621 一键整合包

MiniMax-Remover是一个基于 minimax 优化的视频物体移除工具,旨在高效、高质量地从视频中移除指定对象,并生成视觉上无缝的修复结果。该项目由 Bojia Zi 等人开发,核心目标是实现 快速(Fast)、有效(Effective)和鲁棒(Robust)的视频内容编辑。核心特性两阶段训练策略第一阶段:使用简化版的 DiT(Di...
AI,开源 4850 0
 让模糊照片变清晰 —— AI 图像增强器 GSASR v20250620 一键整合包

让模糊照片变清晰 —— AI 图像增强器 GSASR v20250620 一键整合包

GSASR(Generalized and Efficient 2D Gaussian Splatting for Arbitrary-scale Super-Resolution),是由研究人员开发的一种新型的图像超分辨率技术。它的核心目标是:让图片“变清晰”,而且可以按任意倍数放大,不会失真或模糊。🌟 什么是图像超分辨率?简单来说,图像超...
AI,开源 6057 11
人工智能图像放大工具 Topaz Gigapixel AI破解版v8.4.2 绿色便携版 附模型

人工智能图像放大工具 Topaz Gigapixel AI破解版v8.4.2 绿色便携版 附模型

Topaz Gigapixel AI是一款强大的图像放大软件,利用人工智能技术和先进的图像处理算法,能够将图像进行高质量放大而保持细节清晰度,从而帮助用户实现图像的无损放大和增强。这款软件在数字图像处理领域具有重要意义,为摄影师、设计师和艺术家提供了强大的工具,让他们能够处理和改进各种类型的图像,包括照片、插图和艺术作品等。技术原理Topaz...
软件 1.5万 32
AI 人工智能 一键高清修复模糊照片(支持批量处理),还原清晰细节 Finegrain Image Enhancer  v20250617 一键汉化整合包

AI 人工智能 一键高清修复模糊照片(支持批量处理),还原清晰细节 Finegrain Image Enhancer v20250617 一键汉化整合包

Finegrain Image Enhancer开源图像增强工具通过人工智能技术将低分辨率图像转化为高分辨率版本,智能生成细节以提升画质 。核心功能超分辨率放大支持模糊或低分辨率图像放大(最高可达4倍),增强细节的清晰度和真实感 。细粒度参数控制提供增强强度、风格一致性等参数调节,允许用户进行精细化编辑 。结果可重复性通过种子管理保存特定增强...
AI,开源 7123 11
Meissonic 开源高性能文生图模型 一键整合包 v20250619

Meissonic 开源高性能文生图模型 一键整合包 v20250619

Meissonic 是一个基于 Masked Generative Transformer的高效高分辨率文本到图像生成模型,旨在通过消费级显卡实现高质量的图像生成任务。该项目在 ICLR 2025 上发表,其核心目标是重新激发 Masked Generative Transformers 在图像合成中的潜力,并提供一种高效的推理方案。核心特性...
AI,开源 2607 0
字节开源BAGEL:70亿参数多模态大模型,图像生成+理解全新突破 v20250613 一键整合包

字节开源BAGEL:70亿参数多模态大模型,图像生成+理解全新突破 v20250613 一键整合包

BAGEL 是一个由 ByteDance-Seed团队开发的开源多模态基础模型,具有 70 亿(7B)活跃参数(总参数为 140 亿),并在大规模交错的多模态数据(包括语言、图像、视频和网页数据)上进行了训练。该项目的目标是通过统一的架构来实现强大的多模态理解和生成能力,并进一步扩展到复杂的视觉操作任务。核心特点1. 先进的模型架构BAGEL...
AI,开源 4150 0
AnythingLLM v1.8.2 多模型兼容+私有化部署+智能检索一站式搞定

AnythingLLM v1.8.2 多模型兼容+私有化部署+智能检索一站式搞定

AnythingLLM是由Mintplex Labs开发的一款全栈AI应用程序,其核心定位是搭建本地文档与人工智能模型之间的桥梁,旨在解决企业级知识管理、数据安全与模型定制化的需求。该工具通过检索增强生成(RAG)技术,将用户上传的文档、网页、音视频等内容转化为结构化知识库,并结合本地运行的大语言模型(LLM),实现基于私有数据的智能问答、信...
软件 2660 0
它把AI画画的天花板又抬高了一截 又一国产AI绘画模型 Chroma v20250609 一键整合包

它把AI画画的天花板又抬高了一截 又一国产AI绘画模型 Chroma v20250609 一键整合包

1. 模型概述Chroma 是一个开源、无审查且面向社区构建的大模型。参数规模:Chroma 是一个拥有 89 亿(8.9B)参数的模型,基于 FLUX.1-schnell架构开发(技术报告即将发布)。它完全采用 Apache 2.0 许可证,这意味着任何人都可以自由使用、修改和在该模型基础上进行二次开发,无需企业或机构控制。训练状态:该模型...
AI,开源 5393 11
 想自己生成图片但怕侵权?试试这个新AI模型!f-lite v20250607 一键整合包 支持40系+50系显卡

想自己生成图片但怕侵权?试试这个新AI模型!f-lite v20250607 一键整合包 支持40系+50系显卡

F Lite是由 Fal AI与 Freepik联合开发的一个基于扩散模型的图像生成工具。它提供了一个轻量但功能强大的模型架构,并在数据合规性方面做出了显著努力。📌 核心特点✅ 合法合规的数据集训练模型仅使用了 8000 万张版权安全(copyright-safe)和 SFW(适合所有年龄层,Safe For Work)内容进行训练。数据来源...
AI,开源 3791 3
手机软件 安卓app 学生党/上班族必备:一个帮你掌控时间的小软件 chrono v0.6.0

手机软件 安卓app 学生党/上班族必备:一个帮你掌控时间的小软件 chrono v0.6.0

Chrono 是一个由开发者 vicolo-dev创建的开源桌面应用,专为 macOS 和 Linux 系统设计。它是一个极简风格的时间跟踪与任务管理工具,帮助用户记录每天的工作时间、追踪项目进度,并以简洁直观的方式呈现时间使用情况。该项目采用 Rust + Tauri 构建,具有高性能和低资源占用的特点,适合注重隐私、追求轻量级工具的用户使...
开源 2552 1
开源神器来袭!HelloMeme 让你秒变表情包制造机 v20250601 一键整合包

开源神器来袭!HelloMeme 让你秒变表情包制造机 v20250601 一键整合包

一个专注于 AI 自动生成表情包(meme)的开源项目。它结合了人工智能技术,特别是图像生成和自然语言理解的能力,来自动创建有趣、符合网络文化风格的表情包。💡 主要功能:利用 AI 技术自动生成表情包(meme)支持根据用户输入的文字内容或模板生成带有幽默感的图片可能集成了图像生成模型(如 Stable Diffusion)、文本理解和模因风...
AI,开源 3230 0
Topaz Photo AI(图片增强工具)破解版  v4.0.1 绿色便携版  附模型文件

Topaz Photo AI(图片增强工具)破解版 v4.0.1 绿色便携版 附模型文件

这个软件是恨不得天天更新啊。。。无语了,这个软件又又开始更新了,但是图片增强的软件我分享了很多了,这个并不是第一选择。但是既然更新了我也更新吧。但是我要吐糟的时候完整离线包实在是大啊。上传要好久。今天又又更新了,我一看 我晕死了 11G多。。。Topaz Photo AI是一款基于人工智能技术的图片处理软件,它提供了一系列强大的智能工具,能够...
软件 8.7万 352
打造你的专属AI助手:AingDesk,零门槛部署的未来工具 v1.2.4

打造你的专属AI助手:AingDesk,零门槛部署的未来工具 v1.2.4

AingDesk 是一个开源的 AI 助手工具,旨在为个人和企业提供简单易用的 AI 解决方案。它支持多种 AI 模型和知识库的搭建,允许用户根据自己的需求灵活配置和部署。AingDesk 的核心特点是免费、开源,并且支持本地模型部署和第三方 API 集成,这使得它在隐私保护和性能优化方面具有显著优势。功能特点支持多种 AI 模型AingDe...
开源 3724 1
视频创作者的新宠:这个开源工具正在悄悄改变内容生产方式 一键整合包 MoneyPrinterPlus v1.2.6

视频创作者的新宠:这个开源工具正在悄悄改变内容生产方式 一键整合包 MoneyPrinterPlus v1.2.6

你可以把它想象成一个 “AI全自动视频工厂”。它最大的特点就是:输入一段文字,就能自动生成一个完整的高清视频。是不是有点像你写一篇作文,然后机器帮你拍成了短视频?没错,就是这个意思!🧠 它是怎么工作的?简单来说,它的流程是这样的:你告诉它要说什么内容(文字)比如:“今天教你怎么在家做蛋糕”它会自动找合适的画面素材比如网上免费的高清视频片段:打...
AI,开源 7402 4
AI 自动生成短剧解说视频 输入一段话就能生成短剧解说视频  一键整合包 NarratoAI v0.6.1

AI 自动生成短剧解说视频 输入一段话就能生成短剧解说视频 一键整合包 NarratoAI v0.6.1

这个工具是做什么的?你可以把 NarratoAI 理解成一个“AI自动剪辑视频的神器”,它最大的特点就是:输入一段文字或口播内容,就能自动生成一部短剧解说视频。是不是听起来像你写了个剧本,AI 就帮你拍成了短视频?没错,就是这样!🧠 它是怎么工作的?它的流程大概是这样的:你提供一段文字内容(比如口播文案、剧情简介)比如:“今天给大家讲一个爱情...
AI,开源 7457 3
一键提取伴奏/人声!轻松搞定音乐音轨分离 支持批量处理 开源一键整合包 6G N卡就可以愉快玩耍 UVR5 UI v1.8.4

一键提取伴奏/人声!轻松搞定音乐音轨分离 支持批量处理 开源一键整合包 6G N卡就可以愉快玩耍 UVR5 UI v1.8.4

UVR5-UI是基于 python-audio-separator(即 UVR5 的命令行版本)开发的,提供了友好的可视化界面,使得用户无需掌握编程知识或命令行操作即可使用强大的音频处理功能。它支持多种模型和功能,包括:所有主流音源分离模型:VR Arch 模型MDX-NET 模型Demucs v4 模型Mel-Band Roformer 和...
AI,开源 5314 3
你负责写文字(支持中文),画画交给 AI!Kolors 让想象秒变现实 一键整合包 v20250523

你负责写文字(支持中文),画画交给 AI!Kolors 让想象秒变现实 一键整合包 v20250523

Kolors 是一个“文字生成图片”的人工智能工具,你可以输入一段中文或英文的文字描述,它就能根据你的描述自动生成一张对应的图像。比如你写:“一只穿着西装的熊猫,在山顶上喝咖啡,背景是日出,风格是写实高清”它就能根据这段话,画出这样的一张图!🧠 它是怎么工作的?简单来说,这个 AI 模型已经学习了非常多的文字和图片之间的对应关系。所以当你输入...
AI,开源 7572 3
小巧实用效率高AI生成动漫图片整合包,12G英伟达显卡即可愉快玩耍 v20250520

小巧实用效率高AI生成动漫图片整合包,12G英伟达显卡即可愉快玩耍 v20250520

   今天在网上逛的时候,无意发现这个模型,一个动漫图片生成的模型,感觉还不错,生成的动漫效果也还可以,所以就花了几分钟写了个界面,然后又汉化了下,感觉还可以,就随手发到群里,各位小伙伴要求分享出来,所以就打包上传上来了。这个模型是支持NSFW ,所以请勿用于任何非法途径,所造成的任何后果请自行承担,本人只做AI图片生成技...
AI 4623 6
开源AI图像描述:JoyCaption ,图片AI反推提示词 支持批量操作 v20250515 一键整合包

开源AI图像描述:JoyCaption ,图片AI反推提示词 支持批量操作 v20250515 一键整合包

JoyCaption 是一个开源的图像描述生成视觉语言模型(VLM),旨在为社区提供一个免费、开放且无审查的工具,用于训练扩散模型。以下是该项目的主要特点和相关信息:项目特点免费与开放:JoyCaption 以免费、开放的权重发布,没有使用限制,并且提供训练脚本及详细的构建细节。无审查:平等覆盖适合工作场合(SFW)和不适合工作场合(NSFW...
AI,开源 8999 11
穿越千年的文字魔法:AI助力现代文变古文 ancient_text_generation_LLM v20250514一键整合包

穿越千年的文字魔法:AI助力现代文变古文 ancient_text_generation_LLM v20250514一键整合包

一个专注于将现代汉语句子转换为古汉语风格句子的创新项目。以下是对该项目的详细介绍:项目概述:该项目旨在通过先进的自然语言处理技术,实现现代汉语到古汉语风格的自动转换,为文化传承、文学创作等领域提供有力支持。技术背景:项目基于荀子基座大模型,该模型作为起点,为项目提供了强大的语言理解和生成能力。通过采用LoRA(Low-Rank Adaptat...
AI,开源 4722 0
想换脸、换衣服还是换风格?DreamO图像定制,一键搞定!v20250513 AI生成图片 一键整合包

想换脸、换衣服还是换风格?DreamO图像定制,一键搞定!v20250513 AI生成图片 一键整合包

DreamO是一个由字节跳动开源的统一图像定制化框架(A Unified Framework for Image Customization),旨在通过先进的算法和技术,为用户提供高度灵活和高质量的图像定制化服务。以下是该项目的详细介绍说明:核心功能:图像定制化:DreamO允许用户根据需求定制图像,支持多种定制化任务,包括但不限于人物形象定...
AI,开源 5191 11
超强挂机AI生图comfyui工作流,提示词自动生成,一键操作,出图效果好,效率高 挂机流20250429更新

超强挂机AI生图comfyui工作流,提示词自动生成,一键操作,出图效果好,效率高 挂机流20250429更新

距离上一次的分享的挂机工作流已经过去了几个月了,感觉是时候分享更强大的了。这个工作流早几天就发到Q群给大伙玩了,经过多人测试 没有什么问题后,我今天才分享出来。如果拖到comfyui后,提示大量的红色,缺失节点,可以点管理器进去自行安装好缺失的节点。如果安装老是失败,可以开启科学上网工具进行安装随便上传几张工作流说明1 生成的提示词更加丰富2...
素材 8235 3
 KaKaDa AI答题辅助工具V1.0.0.3

KaKaDa AI答题辅助工具V1.0.0.3

KaKaDa是一款创新的答题辅助工具,它借助了阿里云开源的72B大模型进行问题推断,旨在为用户提供快速、准确的答题推荐。与传统的答题工具不同,KaKaDa直接显示推荐的选项,而不是先解释后展示文字答案,从而大大节省了用户的时间。一、主要功能OCR识别与推送:KaKaDa支持在问题界面使用Alt+Q快捷键截取完整的题目和选项,然后利用OCR技术...
AI 3169 0
文本转语音,如此简单真实:Nari Labs开源Dia,一轮处理生成高度逼真的对话音频

文本转语音,如此简单真实:Nari Labs开源Dia,一轮处理生成高度逼真的对话音频

Dia是一个由Nari Labs创建的文本转语音(TTS)模型,它拥有16亿(1.6B)参数,能够在一轮处理中生成超逼真的对话。这个项目的核心特点是其高度真实的语音生成能力,可以直接从文本中生成高度逼真的对话,同时支持通过音频条件来控制输出,实现情感和语调的调整。主要功能高度逼真的对话生成:Dia能够直接从文本中生成高质量的对话,无需多轮处理...
AI 3305 0
OmniGen:统一框架,高效灵活,图像生成从未如此简单  基于最新模型一键整合包 已经汉化

OmniGen:统一框架,高效灵活,图像生成从未如此简单 基于最新模型一键整合包 已经汉化

OmniGen 是一个由 VectorSpaceLab 开发的开源项目,旨在提供一个统一的图像生成模型,能够处理多种图像生成任务,而无需依赖额外的插件或复杂的预处理步骤。该项目的核心目标是简化图像生成流程,使其像 GPT 在语言生成中的应用一样灵活和高效。OmniGen 支持多种任务,包括文本到图像生成、图像编辑、主题驱动生成和经典计算机视觉...
AI 6377 7
多图预览 VideoProc Converter AI  v8.0.0 视频处理转换软件特别版

多图预览 VideoProc Converter AI v8.0.0 视频处理转换软件特别版

在我没有接触ffmpeg之前,我用过一段时间这个工具,那时候还没有带上AI字样,操作简单功能强大。确实是很不错的一个工具,还带有个简单的视频下载工具VideoProc Converter 是一个功能强大的视频处理和转换软件,它具有多种视频处理功能,包括视频转换、视频压缩、视频编辑、屏幕录制和音频提取等。VideoProc Converter ...
软件 8233 17
一款功能强大、操作简便的视频字幕处理工具 卡卡字幕助手 VideoCaptioner v1.3.3

一款功能强大、操作简便的视频字幕处理工具 卡卡字幕助手 VideoCaptioner v1.3.3

VideoCaptioner是一款基于大语言模型(LLM)的视频字幕处理助手,它集成了语音识别、字幕断句、优化、翻译等全流程处理功能,为视频制作者提供了极大的便利。这款工具操作简单,无需高配置电脑,支持网络调用和本地离线(包括GPU调用)两种模式进行语音识别,灵活性极高。在功能方面,VideoCaptioner表现出色。它支持从国内外主流视频...
开源 2484 0
字节开源 UNO:电商图片生成的高效利器,一键汉化整合包 ,支持文生图和图生图

字节开源 UNO:电商图片生成的高效利器,一键汉化整合包 ,支持文生图和图生图

UNO(Universal Customization)是由字节跳动公司开发并开源的一个通用自定义方法的项目,旨在解决单主体和多主体条件下的图像生成问题,具有很强的可控性和通用性。该项目通过提出一种高度一致的数据合成流程,利用扩散变换器的内在上下文生成能力,生成高一致性的多主体配对数据。UNO模型包含渐进式跨模态对齐和通用旋转位置嵌入,是从文...
AI,开源 3906 4
SenseVoice:解锁语音理解新高度,多语言情感识别与事件检测全攻略 语音转文本 一键汉化整合包 v1.0

SenseVoice:解锁语音理解新高度,多语言情感识别与事件检测全攻略 语音转文本 一键汉化整合包 v1.0

FunAudioLLM/SenseVoice: Multilingual Voice Understanding Model 是一个专注于语音理解的开源项目,旨在提供高精度的多语言语音识别、语音情感识别和音频事件检测功能。这个项目由 FunAudioLLM 团队开发和维护,基于 FunASR 工具包构建,支持多种语言和方言,包括中文、英语、粤...
AI,开源 4045 2