造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图+人物一致性图片+自定义lora 一键整合包 20260208 v12

造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图+人物一致性图片+自定义lora 一键整合包 20260208 v12

Z-Image-Turbo Generator 是一个基于 Tongyi-MAI/Z-Image-Turbo 模型的高性能AI图像生成应用。通过简洁直观的Gradio界面,用户可以轻松生成高质量的1024x1024分辨率图像,特别擅长生成具有中国传统文化元素与现代风格融合的艺术作品。✨ 核心特性⚡ 极致性能优化8步极速生成:仅需8个推理步骤即...
AI,开源 0
语音识别 + 声音克隆 + 模型训练,一个工具全搞定!Easy-Voice-Toolkit v1.3.4

语音识别 + 声音克隆 + 模型训练,一个工具全搞定!Easy-Voice-Toolkit v1.3.4

Easy-Voice-Toolkit 是由 Spr-Aachen开发的一款开源、用户友好的 AI 语音工具箱,旨在为开发者、研究人员和爱好者提供一站式、本地化部署的语音处理解决方案。项目设计注重易用性与功能性,支持多种主流语音任务,适用于科研实验、产品原型开发、语音助手构建等多种应用场景。🌟 核心特性本地部署:所有功能均可在本地运行,保障数据...
AI,开源 0
多模型支持 + 工具调用 + 搜索增强,DeepChat 全能解析 v0.5.8

模型支持 + 工具调用 + 搜索增强,DeepChat 全能解析 v0.5.8

DeepChat 是一个功能丰富的开源 AI 聊天平台,支持多种云端和本地大型语言模型(LLM),并具备强大的搜索增强和工具调用能力。它为用户提供了一个统一的界面来交互各种主流 AI 模型,无论是使用 OpenAI、Gemini、Anthropic 等云服务,还是本地部署的 Ollama 模型。作为一款跨平台的 AI 助手应用,DeepCha...
开源 0
别再瞎试了!用这个神器,一键优化你的大模型提示词 Prompt Optimizer v2.5.3

别再瞎试了!用这个神器,一键优化你的大模型提示词 Prompt Optimizer v2.5.3

该项目聚焦于提升大语言模型(LLM)在实际应用中对提示语的理解与响应质量,旨在通过系统化的方法改进原始提示语的表达结构、清晰度和有效性,从而获得更准确、更稳定、更符合预期的模型输出。核心理念随着大模型在各类场景中的广泛应用,提示工程(Prompt Engineering)成为影响输出质量的关键因素。prompt-optimizer 的设计初衷...
AI,开源 0
LobeChat:打造属于你的全能 AI 助手,支持 40+ 大模型平台 开源  v2.1.19

LobeChat:打造属于你的全能 AI 助手,支持 40+ 大模型平台 开源 v2.1.19

lobehub/lobe-chat 是一个开源的、现代设计风格的 ChatGPT/大语言模型 (LLMs) 用户界面 (UI) 和框架。它旨在为用户提供高度灵活和可扩展的 AI 对话体验,支持多种大型语言模型(如 OpenAI GPT、Anthropic Claude、Google Gemini 等),并具备丰富的功能,使其适用于个人用户、开...
开源 0
ollama 一款功能强大、易于使用的大型语言模型部署工具 附deepseek-r1+web 安装教程 v0.15.5

ollama 一款功能强大、易于使用的大型语言模型部署工具 附deepseek-r1+web 安装教程 v0.15.5

Ollama是一款功能强大的开源工具,旨在帮助用户轻松地在本地部署和运行大型语言模型(LLM)。这款软件的出现,极大地降低了普通开发者使用大语言模型的门槛,使得本地部署和体验大模型变得简单易行。无论是对于想要搭建自己AI应用的开发者,还是希望针对特定任务调优模型的科研人员,Ollama都是一个不可或缺的工具。首先,Ollama具备跨平台的能力...
开源 0
一个能运行各种AI大模型的本地聊天工具:ChatWise v0.9.80

一个能运行各种AI大模型的本地聊天工具:ChatWise v0.9.80

ChatWise是一款专为桌面设计的多功能、高性能 AI 聊天工具。它支持多种主流大语言模型(LLM),具备多模态交互能力,并强调隐私保护与本地化使用体验。✨ 主要功能与特点1. 支持任意语言模型(Any LLM)兼容市面上主流的语言模型服务,包括:OpenAI 的 GPT-4、GPT-4oAnthropic 的 Claude(包括 Clau...
开源 0
神器 人脸自动识别 图像后期处理调色 Perfectly Clear WorkBench Portable 附模型 v5.0.1.3052

神器 人脸自动识别 图像后期处理调色 Perfectly Clear WorkBench Portable 附模型 v5.0.1.3052

Perfectly Clear WorkBench是一款非常好用的图像后期处理调色软件,功能非常强大,包括所有校正功能,预设,创建自定义预设,批量处理无限数量的照片等等,利用人工智能识别技术,让你的照片和图片达到最高质量效果,是一款既可以在PS当中作为插件使用,也可以作为一款独立的软件使用的滤镜。软件使用旨在为用户提供最简单最快速的方式来改善...
软件 0
 开源 免费 Koboldcpp 人人可玩的本地大模型 不管啥显卡,cpu也能跑 附视频演示 支持deepseek v1.107.1

开源 免费 Koboldcpp 人人可玩的本地大模型 不管啥显卡,cpu也能跑 附视频演示 支持deepseek v1.107.1

KoboldCpp是一款易于使用的人工智能文本生成软件,适用于GGML和GGUF模型。这是一个可从Concedo分发的单一自包含版本,它建立在llama.cpp的基础上,并添加了一个多功能的Kobold API端点、额外的格式支持、稳定的扩散图像生成、向后兼容性以及一个具有持久故事、编辑工具、保存格式、内存、世界信息、作者注释、人物、场景和K...
开源 0
 开源免费无限制 RWKV Runner 开箱即用的AI软件-聊天 写作 作曲一键完成 附模型文件 v1.9.10

开源免费无限制 RWKV Runner 开箱即用的AI软件-聊天 写作 作曲一键完成 附模型文件 v1.9.10

今天在网上到处瞎逛的时候,发现个好东西,能让普通人也用上AI,无需复杂的配置,更神奇的是居然可以用我的AMD RX580跑起来。让你们先看下截图这是这个工具的全部截图。操作极其简单,如果要运行什么,会提示你去下载模型,下载模型会自动下载,为了节约大伙的时间,我已经把模型全部放在压缩包里面了。基本就实现了解压即可使用,下面看下我随便问几个问题。...
开源 0
开源 Cherry Studio 一个支持多模型服务的桌面客户端工具 支持deepseek v1.7.15

开源 Cherry Studio 一个支持多模型服务的桌面客户端工具 支持deepseek v1.7.15

Cherry Studio是一款专为专业用户打造的桌面客户端,它支持多模型服务,集成了超过300多个大语言模型,涵盖了30多个行业,旨在帮助用户在多种场景下提升工作效率。这款软件的设计初衷是满足各行各业对GPT技术的需求,无论是开发者、设计师还是作家,都能从中受益。对于开发者而言,Cherry Studio是一个强大的代码伙伴。它可以进行代码...
开源 0
轻量 高效 AI生图工具 基于 Stable Diffusion XL 模型二次开发,6G英伟达显卡就可以愉快玩耍 Diaomo v8.0 六秒出图 支持更换模型+图片超分+图生图

轻量 高效 AI生图工具 基于 Stable Diffusion XL 模型二次开发,6G英伟达显卡就可以愉快玩耍 Diaomo v8.0 六秒出图 支持更换模型+图片超分+图生图

CyberIllustrious是一个基于 Stable Diffusion模型架构的二次创作(LoRA 或 Dreambooth)模型,主要专注于生成具有“未来感”、“赛博朋克”和“华丽视觉风格”的高质量插画内容。它通常被用于图像生成平台如 NovelAI、Stable Diffusion WebUI或 ComfyUI中。🧠 模型简介项目内...
AI,开源 0
开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v20250805 整合包 附全部模型

开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v20250805 整合包 附全部模型

下面文字是作者原话这是一个离线运行的本地语音识别转文字工具,基于 fast-whipser 开源模型,可将视频/音频中的人类声音识别并转为文字,可输出json格式、srt字幕带时间戳格式、纯文字格式。可用于自行部署后替代 openai 的语音识别接口或百度语音识别等,准确率基本等同openai官方api接口。部署或下载后,双击 start.e...
AI,开源 0
青梧字幕 —跨平台AI视频字幕智能提取翻译工具 附全部模型 v1.3.6

青梧字幕 —跨平台AI视频字幕智能提取翻译工具 附全部模型 v1.3.6

青梧字幕是一款免费简单易用的AI字幕智能提取+翻译工具,原理是利用模型自动识别5音视频文件当中的音频并生成为对应的语种字幕,实现提取及翻译后续处理操作。目前暂支持windows及mac(M及intel系例处理器)系统环境,支持识别中文、英语、日语、韩语等99种语言。毕竟市面上已有众多类似的字幕软件2或在线网页版,无非要么限制提取时长要么各种套...
软件 0
视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包 v20251231

视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包 v20251231

🎥 FlashVSR 是什么?FlashVSR 是一个能让模糊、低清视频“秒变高清”的智能工具。它专门用来做一件事:把低分辨率的视频,快速、高质量地放大成 4 倍清晰度的高清视频。比如:把 480p 的老视频 → 变成接近 4K 的清晰视频让手机拍的模糊视频 → 变得锐利、细节丰富⚡ 它有什么厉害的地方?过去很多“视频超分”(放大变清晰)工具...
AI,开源 0
GLM-TTS 大语言模型重塑语音合成 3秒克隆人声?GLM-TTS 做到了!声音克隆相似度极高 一键整合包 v20251212

GLM-TTS 大语言模型重塑语音合成 3秒克隆人声?GLM-TTS 做到了!声音克隆相似度极高 一键整合包 v20251212

GLM-TTS是由ZAI 组织开发并开源的高质量文本转语音(Text-to-Speech, TTS)系统。它基于大语言模型(LLM),专注于实现可控、富有情感表达的零样本语音克隆,并通过多奖励强化学习框架显著提升传统 TTS 系统的自然度与表现力。核心特性🗣️ 零样本语音克隆仅需3–10 秒的目标说话人提示音频,即可克隆任意声音,无需微调或说...
AI,开源 0
一键克隆任意人声!VoxCPM 1.5 开源语音大模型,无需训练,3秒搞定声音复刻!最低6G英伟达即可运行 剑二十七二开汉化整合包 v20251207

一键克隆任意人声!VoxCPM 1.5 开源语音大模型,无需训练,3秒搞定声音复刻!最低6G英伟达即可运行 剑二十七二开汉化整合包 v20251207

VoxCPM 是一个支持中英文、零样本语音克隆、情感可控、音素/公式输入的统一端到端语音合成大模型。它不依赖传统 TTS 流水线(如文本分析 → 音素对齐 → 声码器),而是直接从文本生成高质量语音波形。🎯 目标:打造一个像大语言模型一样“通用、灵活、强大”的语音生成基础模型。🔧 核心特性(技术亮点)1. ✅ 端到端架构(End-to-End...
AI,开源 0
开源 免费 离线 gtp4 语音大模型搭建极其简单无需GPU 聊天机器人 gpt4all v3.10.0 附最新模型 支持deepseek

开源 免费 离线 gtp4 语音大模型搭建极其简单无需GPU 聊天机器人 gpt4all v3.10.0 附最新模型 支持deepseek

上面是教程开源 免费 离线 gtp4 语音大模型搭建极其简单无需GPU安装极其简单,基本就是点几下,然后倒入模型后就可以使用,无须联网。免费,无任何限制。我玩了好多天了,很稳定。效率也不错,才分享出来的。GPT4All是一款引人注目的软件,它为用户提供了一个在本地设备上运行大型语言模型(LLM)的平台。无需昂贵的硬件或持续的网络连接,GPT...
开源 0
中文错别字检测与修正工具(基于 MacBERT模型)jiucuo v1.0 一键整合包,有英伟达显卡就能运行 不限字数

中文错别字检测与修正工具(基于 MacBERT模型)jiucuo v1.0 一键整合包,有英伟达显卡就能运行 不限字数

剑二十七 · 基于 ModelScope 模型 Macadam/macbert4mdcspell_v2 二次开发本系统采用先进的 MacBERT 预训练语言模型,专为中文文本拼写与语法错误检测与修正设计,支持任意长度文本、智能分段处理,并严格保留原始格式(包括换行、空行、标点等),适用于论文、公文、OCR 识别结果、手写转录等多种场景。✅ 核...
AI 0
DeepSeek 本地部署一键运行 DeepSeek-tool v17,解压即可使用 最低支持2G显卡 支持99%的语言大模型 支持联网搜索+知识库

DeepSeek 本地部署一键运行 DeepSeek-tool v17,解压即可使用 最低支持2G显卡 支持99%的语言大模型 支持联网搜索+知识库

琢磨了一天,把DeepSeek的本地部署彻底完成了,并测试了一下午基本完美运行了。当然AI环境你们必须要先安装好。然后下载这个这个本地部署压缩,解压即可完美运行。我的4070ti spuer 运行32b已经是极限了,所以我也只能把模型下载到32b了,如果你们有更牛的显卡,可以继续下载模型。这是我运行14b的截图 你们看看显...
AI,开源 0
AI 提示词智能增强工具 基于 Qwen3 大模型,可直接用于图像生成的专业级提示词,专为AI图像生成创作者打造 27PromptEnhancer v1.1

AI 提示词智能增强工具 基于 Qwen3 大模型,可直接用于图像生成的专业级提示词,专为AI图像生成创作者打造 27PromptEnhancer v1.1

本工具基于 Qwen3 系列轻量化大模型(Qwen3-0.6B 与 Qwen3-1.7B,GPTQ Int8 量化版本),专为图像生成(如 Stable Diffusion、Midjourney 等)用户设计,帮助你将简单粗糙的提示词自动优化为高细节、高表现力、风格明确的专业级描述。🔧 核心功能双模型可选Qwen3-0.6B:轻量快速,适合日...
AI 0
开源 绿色 免安装 离线 Final2x  – 开源图片放大工具,支持 9 款模型,可提高图像分辨率与质量 v4.0.0 Proi Proi

开源 绿色 免安装 离线 Final2x – 开源图片放大工具,支持 9 款模型,可提高图像分辨率与质量 v4.0.0 Proi Proi

这是一个强大的工具,允许使用多个模型将图像超分辨率到任意尺寸,旨在增强图像的分辨率和质量,使图像更清晰、更详细。目前支持RealCUGAN、RealESRGAN、Waifu2x、SRMD等多种模型。Final2x 是一款开源、跨平台的图片放大工具,支持 9 款模型,支持 CPU、GPU,有中文界面。它让可以你使用多个模型将图像放大,得到更清晰...
开源 0
不止AI抠图,更懂细节,应该是最强的AI抠图了,集合了15种抠图模型:BiRefNet 覆盖多场景图像抠除处理需求 一键整合包 v20250920

不止AI抠图,更懂细节,应该是最强的AI抠图了,集合了15种抠图模型:BiRefNet 覆盖多场景图像抠除处理需求 一键整合包 v20250920

BiRefNet 是一个专注于 高分辨率二值图像分割(Dichotomous Image Segmentation, DIS) 的开源深度学习模型。它在背景移除、前景提取、掩码生成等任务中表现出卓越性能,广泛应用于:图像编辑与合成视觉特效处理自动抠图(无需 Trimap)数字内容创作(如 Blender 插件、AI 绘画工具集成)🚀 核心特性...
AI,开源 0
一键生成视频内容:Wan2.2让AI创作变得简单  基于官方开源模型二次开发 6分钟出视频 v20250913

一键生成视频内容:Wan2.2让AI创作变得简单 基于官方开源模型二次开发 6分钟出视频 v20250913

Wan2.2-TI2V-5B 是一个基于 Transformer 架构的文本到视频(Text-to-Video)生成模型,具有以下特点:🔧 核心特性50亿参数规模:大型 Transformer 模型,具备强大的视频生成能力文本生成视频(T2V):直接根据文本描述生成视频内容图像生成视频(I2V):基于参考图像生成相关视频内容高分辨率支持:支持...
AI,开源 0
nunchaku-flux.1-kontext-dev AI生图一键整合包 最低4G显卡可运行 30秒出图 v20250830 支持无限生图+批量图片编辑+lora模型+超分

nunchaku-flux.1-kontext-dev AI生图一键整合包 最低4G显卡可运行 30秒出图 v20250830 支持无限生图+批量图片编辑+lora模型+超分

心血来潮,想试试FLUX.1-Kontext-dev 这个新出的模型,但是奈何显卡不是很牛X,生图效率不够高,所以找了下,发现nunchaku 双截棍 这个量化模型还不错,就花了点时间学习下。然后又花点时间写了个界面,方便大伙来玩玩这个。 我的4070ti spuer 16G 30步 出1024x1024 大概30秒,显卡占用不到4G,这个效...
AI,开源 0
Ovis2图片反推提示词工具v5.0 基于AI大模型反推图片+视频批量生成提示词 英伟达6G显卡即可愉快玩耍

Ovis2图片反推提示词工具v5.0 基于AI大模型反推图片+视频批量生成提示词 英伟达6G显卡即可愉快玩耍

本工具基于Ovis2-4B和Ovis2-2B 这2个大模型制作而成。其实早之前我就有分享过反推提示词工具 moondream,但是我昨天遇到了这个大模型,发现功能更加强大,反推出来的提示更加丰富,更多细节描述。这个工具要求显卡比较低,英伟达显卡6g及以上就可以愉快玩耍了我用同一张图片反推提示词下面是Ovis2-4B生成的提示词The...
AI,开源 0
lmstudio 一款强大而灵活的本地大模型部署工具 我的rx580 都能流畅运行 附模型文件 支持DeepSeek v0.3.23

lmstudio 一款强大而灵活的本地大模型部署工具 我的rx580 都能流畅运行 附模型文件 支持DeepSeek v0.3.23

LM Studio是由lmstudio.ai提供的一款强大而灵活的本地大模型部署工具。它不仅降低了机器学习的使用门槛,还为用户提供了一个安全、高效、隐私保护的环境,以便在本地运行各种大型语言模型。首先,LM Studio具备强大的离线使用能力。这意味着用户无需互联网连接即可运行模型,极大地提升了使用的便捷性和灵活性。对于那些需要保护数据隐私或...
AI,开源 0
人工智能图像放大工具 Topaz Gigapixel AI破解版v8.4.2 绿色便携版 附模型

人工智能图像放大工具 Topaz Gigapixel AI破解版v8.4.2 绿色便携版 附模型

Topaz Gigapixel AI是一款强大的图像放大软件,利用人工智能技术和先进的图像处理算法,能够将图像进行高质量放大而保持细节清晰度,从而帮助用户实现图像的无损放大和增强。这款软件在数字图像处理领域具有重要意义,为摄影师、设计师和艺术家提供了强大的工具,让他们能够处理和改进各种类型的图像,包括照片、插图和艺术作品等。技术原理Topaz...
软件 0
Meissonic 开源高性能文生图模型 一键整合包 v20250619

Meissonic 开源高性能文生图模型 一键整合包 v20250619

Meissonic 是一个基于 Masked Generative Transformer的高效高分辨率文本到图像生成模型,旨在通过消费级显卡实现高质量的图像生成任务。该项目在 ICLR 2025 上发表,其核心目标是重新激发 Masked Generative Transformers 在图像合成中的潜力,并提供一种高效的推理方案。核心特性...
AI,开源 0
字节开源BAGEL:70亿参数多模态大模型,图像生成+理解全新突破 v20250613 一键整合包

字节开源BAGEL:70亿参数多模态大模型,图像生成+理解全新突破 v20250613 一键整合包

BAGEL 是一个由 ByteDance-Seed团队开发的开源多模态基础模型,具有 70 亿(7B)活跃参数(总参数为 140 亿),并在大规模交错的多模态数据(包括语言、图像、视频和网页数据)上进行了训练。该项目的目标是通过统一的架构来实现强大的多模态理解和生成能力,并进一步扩展到复杂的视觉操作任务。核心特点1. 先进的模型架构BAGEL...
AI,开源 0
AnythingLLM v1.8.2 多模型兼容+私有化部署+智能检索一站式搞定

AnythingLLM v1.8.2 多模型兼容+私有化部署+智能检索一站式搞定

AnythingLLM是由Mintplex Labs开发的一款全栈AI应用程序,其核心定位是搭建本地文档与人工智能模型之间的桥梁,旨在解决企业级知识管理、数据安全与模型定制化的需求。该工具通过检索增强生成(RAG)技术,将用户上传的文档、网页、音视频等内容转化为结构化知识库,并结合本地运行的大语言模型(LLM),实现基于私有数据的智能问答、信...
软件 0
它把AI画画的天花板又抬高了一截 又一国产AI绘画模型 Chroma v20250609 一键整合包

它把AI画画的天花板又抬高了一截 又一国产AI绘画模型 Chroma v20250609 一键整合包

1. 模型概述Chroma 是一个开源、无审查且面向社区构建的大模型。参数规模:Chroma 是一个拥有 89 亿(8.9B)参数的模型,基于 FLUX.1-schnell架构开发(技术报告即将发布)。它完全采用 Apache 2.0 许可证,这意味着任何人都可以自由使用、修改和在该模型基础上进行二次开发,无需企业或机构控制。训练状态:该模型...
AI,开源 0