一键生成AI绘画提示词:让你的图片秒变顶级写真描述 跟之前的图片反推工具不同的是这个会思考 thinkpic-1.0-20251113

一键生成AI绘画提示词:让你的图片秒变顶级写真描述 跟之前的图片反推工具不同的是这个会思考 thinkpic-1.0-20251113

这个工具是做什么的?这个程序可以自动为你的人物照片生成一段“AI绘画提示词”。简单来说:你放一张人物照片进去,它就能写出一段详细、生动、充满吸引力的文字描述,这段文字可以直接用在 AI 绘画工具(比如 Stable Diffusion)中,让 AI 画出类似风格或效果的图片。例如,它会描述:人物有多美、眼睛多勾人、嘴唇多诱人;身材曲线多么火辣...
AI 6316 1
开源 AI人脸替换工具离线版V8.7 兼容50系列显卡 CPU、显存占用优化,速度更快 一张图实现视频或者图片换脸,完全免费!附演示和教程视频

开源 AI人脸替换工具离线版V8.7 兼容50系列显卡 CPU、显存占用优化,速度更快 一张图实现视频或者图片换脸,完全免费!附演示和教程视频

这是热心网友万能君做的一个整合包,整合包里面已经包含了几个换脸项目和一些高清修复功能等,具体可以看下图截图所示。要顺利使用这个工具,必须做好以下几点第一个 这个工具只支持CPU+N卡。如果需要使用N卡,一定要先安装好驱动和CUDA。第二个 一定要安装好运行库。https://www.jian27.com/html/2290.html第三个 所...
AI 500.2万 10220
开源 免费 离线 gtp4 语音大模型搭建极其简单无需GPU 聊天机器人 gpt4all v3.10.0 附最新模型 支持deepseek

开源 免费 离线 gtp4 语音大模型搭建极其简单无需GPU 聊天机器人 gpt4all v3.10.0 附最新模型 支持deepseek

上面是教程开源 免费 离线 gtp4 语音大模型搭建极其简单无需GPU安装极其简单,基本就是点几下,然后倒入模型后就可以使用,无须联网。免费,无任何限制。我玩了好多天了,很稳定。效率也不错,才分享出来的。GPT4All是一款引人注目的软件,它为用户提供了一个在本地设备上运行大型语言模型(LLM)的平台。无需昂贵的硬件或持续的网络连接,GPT...
开源 1.1万 32
一键整合包 Step-Audio-EditX  v20251112 解压即用,支持情绪/方言/语气词!让AI说话像真人一样“有血有肉”

一键整合包 Step-Audio-EditX v20251112 解压即用,支持情绪/方言/语气词!让AI说话像真人一样“有血有肉”

🧠 什么是 Step-Audio-EditX?Step-Audio-EditX 是由 StepFun AI 团队开源的一款 30 亿参数(3B)的大语言模型(LLM)驱动的先进音频编辑系统,专注于 高表现力、可迭代、细粒度的语音编辑与零样本语音合成(TTS)。它不仅能高质量克隆任意人声,还能对语音的情绪、说话风格、副语言特征(如笑声、叹息等)...
AI,开源 3233 2
0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v9.41 支持wan2.2 Animate 数字人 Multitalk +InfiniteTalk +文生视频+图生视频+批量生成+首尾帧 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了

0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v9.41 支持wan2.2 Animate 数字人 Multitalk +InfiniteTalk +文生视频+图生视频+批量生成+首尾帧 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了

Wan2GP 是专为“显卡资源有限”的用户打造的**开源视频生成工具箱**。它把目前最先进的文生视频、图生视频、视频编辑模型(Wan 2.1、Hunyuan Video、LTX Video 等)做了重度优化和封装,让只有 6-8 GB 显存的旧显卡也能跑得动、跑得快,并提供了一整套 Web 界面与周边工具,做到“开箱即玩”。一句话总结:**把...
AI,开源 2万 102
新一代开源 免费 AI换脸神器 FaceFusion v3.5.0 中文版 支持AMD显卡+N卡 速度更快 支持50系显卡+批量换脸,效果更惊艳 操作更简单 附视频演示 20251106 更新

新一代开源 免费 AI换脸神器 FaceFusion v3.5.0 中文版 支持AMD显卡+N卡 速度更快 支持50系显卡+批量换脸,效果更惊艳 操作更简单 附视频演示 20251106 更新

FaceFusion这个AI换脸的项目已经太久没有更新了。作者终于在昨天更新了3.0,更新幅度大得惊人。这么久不更新,原来是一直在憋大招,这个CD冷却也太久了。。。我第一次时间就去做整合包了。本以为这还不是有手就行的事,但是有点难度。因为3.0更新太大了,所以之前版本的模型还有一些东西根本用不上了,我只能慢慢去研究了。搞半天最后把我的系统的c...
AI,开源 45.5万 3558
输入一段歌词,AI 自动生成带人声+伴奏的歌(支持中文) 腾讯开源“AI 作曲” SongGeneration v20251109 一键整合包

输入一段歌词,AI 自动生成带人声+伴奏的歌(支持中文) 腾讯开源“AI 作曲” SongGeneration v20251109 一键整合包

腾讯 AI Lab 推出的一个 “AI 自动生成完整歌曲” 的免费工具。你只需要提供一段歌词,它就能帮你自动配上人声 + 伴奏,生成一首像模像样的歌,支持中文和英文!🎤 它能做什么?你写歌词,AI 唱出来:你只要写下带结构的歌词(比如“[主歌]……[副歌]……”),AI 会自动配上旋律、人声和背景音乐。支持风格定制:你可以指定歌曲风格(比如“...
AI,开源 5204 17
NovaMSS(音乐源分离工具) v2.1.0 社区版 轻松地批量提取伴奏、人声、贝斯、鼓点等音轨

NovaMSS(音乐源分离工具) v2.1.0 社区版 轻松地批量提取伴奏、人声、贝斯、鼓点等音轨

NovaMSS是一个基于MSS领域最顶级的人工智能算法模型调优后的新一代音乐源分离工具。它的诞生,旨在解决音频处理中复杂且繁琐的音轨分离问题,为用户带来前所未有的便捷体验。NovaMSS拥有强大的功能,可以一键提取伴奏、人声、贝斯、鼓点等音轨。无论是翻唱、K歌还是扒带等场景,用户只需通过简单的操作,即可轻松获得所需的音频素材。其分离的伴奏质量...
软件 4811 0
告别视频手动分类!AI 自动识别视频人物、场景与行为 AI 智能视频分析与自动分类 27sift v1.0

告别视频手动分类!AI 自动识别视频人物、场景与行为 AI 智能视频分析与自动分类 27sift v1.0

基于 Ovis2.5-2B 多模态大模型 · 中文支持 · 批量处理 · 智能检索✨ 核心功能🔍 智能视频内容理解自动分析视频内容,生成结构化中文描述,包括:人物性别、年龄段(儿童/少年/青年/中年/老年)发型发色、服装款式与颜色动作行为(如跳水、游泳、站立、互动)场景环境(户外/室内、植被、天气、水域类型)3等等⚡ 高效批量处理递归扫描整个...
AI 2055 0
中文错别字检测与修正工具(基于 MacBERT模型)jiucuo v1.0 一键整合包,有英伟达显卡就能运行 不限字数

中文错别字检测与修正工具(基于 MacBERT模型)jiucuo v1.0 一键整合包,有英伟达显卡就能运行 不限字数

剑二十七 · 基于 ModelScope 模型 Macadam/macbert4mdcspell_v2 二次开发本系统采用先进的 MacBERT 预训练语言模型,专为中文文本拼写与语法错误检测与修正设计,支持任意长度文本、智能分段处理,并严格保留原始格式(包括换行、空行、标点等),适用于论文、公文、OCR 识别结果、手写转录等多种场景。✅ 核...
AI 2.2万 94
开源人工智能的代码编辑器 Cursor 快速构建软件代码 v2.0.34

开源人工智能的代码编辑器 Cursor 快速构建软件代码 v2.0.34

Cursor是一款接入了人工智能的代码编辑器,支持windows,linux,mac平台,使用它能够帮助你快速构建构建代码。Cursor是一种快速构建软件代码的工具。它基于模板,可以帮助开发者快速生成代码。它可以在几秒钟内为程序员生成代码,从而帮助他们提高效率,节省时间和精力。Cursor具有许多功能和优点,使得它成为开发者们构建软件的首选工...
开源 5233 1
超实用!这款轻量级开源笔记工具,用 AI 让记录与写作效率翻倍 NoteGen v0.22.3

超实用!这款轻量级开源笔记工具,用 AI 让记录与写作效率翻倍 NoteGen v0.22.3

NoteGen 是一个专注于记录 和写作 的跨平台 AI 笔记应用,它基于 Tauri 开发,目前支持 Mac、Windows 和 Linux 平台,并计划在未来支持 iOS 和 Android 。该项目旨在通过结合人工智能技术,提升用户的记录效率与内容整理能力,同时提供强大的 Markdown 写作功能。以下是 NoteGen 的主要特点和...
开源 3553 0
一个能运行各种AI大模型的本地聊天工具:ChatWise v0.9.45

一个能运行各种AI大模型的本地聊天工具:ChatWise v0.9.45

ChatWise是一款专为桌面设计的多功能、高性能 AI 聊天工具。它支持多种主流大语言模型(LLM),具备多模态交互能力,并强调隐私保护与本地化使用体验。✨ 主要功能与特点1. 支持任意语言模型(Any LLM)兼容市面上主流的语言模型服务,包括:OpenAI 的 GPT-4、GPT-4oAnthropic 的 Claude(包括 Clau...
开源 6060 7
ollama 一款功能强大、易于使用的大型语言模型部署工具 附deepseek-r1+web 安装教程 v0.12.9

ollama 一款功能强大、易于使用的大型语言模型部署工具 附deepseek-r1+web 安装教程 v0.12.9

Ollama是一款功能强大的开源工具,旨在帮助用户轻松地在本地部署和运行大型语言模型(LLM)。这款软件的出现,极大地降低了普通开发者使用大语言模型的门槛,使得本地部署和体验大模型变得简单易行。无论是对于想要搭建自己AI应用的开发者,还是希望针对特定任务调优模型的科研人员,Ollama都是一个不可或缺的工具。首先,Ollama具备跨平台的能力...
开源 5240 2
Snow Shot:开源一键截图,文字识别+翻译+AI对话全搞定 snow-shot v0.7.5-beta

Snow Shot:开源一键截图,文字识别+翻译+AI对话全搞定 snow-shot v0.7.5-beta

介绍说明:项目概述:名称:Snow Shot设计理念:以简洁优雅作为设计理念类型:工具软件功能特点:截图功能:Snow Shot 是一款功能强大的截图工具,支持快速截图。文字识别:集成了文字识别功能,用户可以通过快捷键在截图后自动进行文字识别。翻译功能:支持快速翻译,用户在选中需要翻译的文本后按下翻译快捷键即可查看翻译结果。AI 对话:还集成...
开源 3727 0
图像生成神器:用AI画图,零代码也能玩,拖拽操作就能生成精美图片ComfyUI 官方英伟达显卡版 v0.3.66

图像生成神器:用AI画图,零代码也能玩,拖拽操作就能生成精美图片ComfyUI 官方英伟达显卡版 v0.3.66

ComfyUI 是一个基于节点(Node-based)的图形界面工具,专为使用 Stable Diffusion及其衍生模型进行图像生成而设计。它通过可视化的流程图方式,让用户无需编写代码即可构建复杂的生成工作流。🧩 1. 可视化流程图系统节点式编辑器:将每一个操作(如加载模型、输入提示词、图像采样等)封装为独立节点,用户可以通过拖拽连接这些...
AI,开源 6349 3
MOSS-TTSD:一个高质量的开源中文文本到语音合成系统 一键整合包 v20251104 支持免费商业使用

MOSS-TTSD:一个高质量的开源中文文本到语音合成系统 一键整合包 v20251104 支持免费商业使用

MOSS-TTSD 是由 OpenMOSS 社区开发的一个开源项目,主要聚焦于 文本到语音合成(Text-to-Speech, TTS)领域。该项目是 MOSS 系列模型生态的一部分,旨在提供高质量、低延迟的语音合成能力,适用于多种语言和场景。以下是对该项目的核心功能与技术特点的介绍说明:🎯 项目定位MOSS-TTSD 是一个专注于中文及多语...
AI,开源 5401 11
DeepSeek 本地部署一键运行 DeepSeek-tool v17,解压即可使用 最低支持2G显卡 支持99%的语言大模型 支持联网搜索+知识库

DeepSeek 本地部署一键运行 DeepSeek-tool v17,解压即可使用 最低支持2G显卡 支持99%的语言大模型 支持联网搜索+知识库

琢磨了一天,把DeepSeek的本地部署彻底完成了,并测试了一下午基本完美运行了。当然AI环境你们必须要先安装好。然后下载这个这个本地部署压缩,解压即可完美运行。我的4070ti spuer 运行32b已经是极限了,所以我也只能把模型下载到32b了,如果你们有更牛的显卡,可以继续下载模型。这是我运行14b的截图 你们看看显...
AI,开源 1.2万 34
 AI 播客 :一键生成多角色对话音频 SoulX-Podcast 剑二十七二次开发 一键整合包 v20251103

AI 播客 :一键生成多角色对话音频 SoulX-Podcast 剑二十七二次开发 一键整合包 v20251103

SoulX-Podcast是由 Soul AI Lab 开源的一个面向播客场景的高质量、长篇、多说话人对话式语音合成(TTS)系统,专为生成自然、富有表现力、支持方言与副语言特征的播客音频而设计。🔍 项目核心特点1. 长篇多轮多说话人对话生成支持生成多人交替对话的播客内容(如主持人 + 嘉宾);能处理长文本输入,保持语音连贯性和角色一致性;适...
AI,开源 3430 0
音乐卡点视频 一键生成 支持图片+视频素材 支持A卡和N卡 剑二十七原创作品 KA v20251028

音乐卡点视频 一键生成 支持图片+视频素材 支持A卡和N卡 剑二十七原创作品 KA v20251028

卡点视频生成器是一款基于 AI大模型 智能视频自动生成工具,专为音乐爱好者、短视频创作者、自媒体运营者设计。它能根据你上传的音乐节拍/鼓点,自动从指定图片或视频素材中智能选取片段,生成节奏精准、视觉流畅的“卡点”视频,适用于抖音、快手、B站、Instagram 等平台。无需剪辑经验,一键生成专业级卡点视频!🎯 核心功能1. 🖼️ 图片卡点模式...
AI 5207 0
VisoMaster v1.0 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持50系英伟达显卡运行 一键整合包

VisoMaster v1.0 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持50系英伟达显卡运行 一键整合包

VisoMaster 还不错的一个换脸工具,界面也是简洁的很,花了一天的时间做了整合包+汉化。VisoMaster是一款功能强大且易于使用的面部替换与编辑工具,专为图像和视频设计。它利用先进的人工智能技术,能够以最少的努力产生自然逼真的效果,因此无论是普通用户还是专业人士都能轻松上手。这款软件以其独特的魅力和实用性,在图像与视频编辑领域脱颖而...
AI,开源 2.5万 74
AI 提示词智能增强工具 基于 Qwen3 大模型,可直接用于图像生成的专业级提示词,专为AI图像生成创作者打造 27PromptEnhancer v1.1

AI 提示词智能增强工具 基于 Qwen3 大模型,可直接用于图像生成的专业级提示词,专为AI图像生成创作者打造 27PromptEnhancer v1.1

本工具基于 Qwen3 系列轻量化大模型(Qwen3-0.6B 与 Qwen3-1.7B,GPTQ Int8 量化版本),专为图像生成(如 Stable Diffusion、Midjourney 等)用户设计,帮助你将简单粗糙的提示词自动优化为高细节、高表现力、风格明确的专业级描述。🔧 核心功能双模型可选Qwen3-0.6B:轻量快速,适合日...
AI 2152 0
开源 绿色 免安装 离线 Final2x  – 开源图片放大工具,支持 9 款模型,可提高图像分辨率与质量 v4.0.0 Proi Proi

开源 绿色 免安装 离线 Final2x – 开源图片放大工具,支持 9 款模型,可提高图像分辨率与质量 v4.0.0 Proi Proi

这是一个强大的工具,允许使用多个模型将图像超分辨率到任意尺寸,旨在增强图像的分辨率和质量,使图像更清晰、更详细。目前支持RealCUGAN、RealESRGAN、Waifu2x、SRMD等多种模型。Final2x 是一款开源、跨平台的图片放大工具,支持 9 款模型,支持 CPU、GPU,有中文界面。它让可以你使用多个模型将图像放大,得到更清晰...
开源 1.2万 46
语音识别 + 声音克隆 + 模型训练,一个工具全搞定!Easy-Voice-Toolkit v1.3.1

语音识别 + 声音克隆 + 模型训练,一个工具全搞定!Easy-Voice-Toolkit v1.3.1

Easy-Voice-Toolkit 是由 Spr-Aachen开发的一款开源、用户友好的 AI 语音工具箱,旨在为开发者、研究人员和爱好者提供一站式、本地化部署的语音处理解决方案。项目设计注重易用性与功能性,支持多种主流语音任务,适用于科研实验、产品原型开发、语音助手构建等多种应用场景。🌟 核心特性本地部署:所有功能均可在本地运行,保障数据...
AI,开源 2751 0
LobeChat:打造属于你的全能 AI 助手,支持 40+ 大模型平台 开源  v1.142.0

LobeChat:打造属于你的全能 AI 助手,支持 40+ 大模型平台 开源 v1.142.0

lobehub/lobe-chat 是一个开源的、现代设计风格的 ChatGPT/大语言模型 (LLMs) 用户界面 (UI) 和框架。它旨在为用户提供高度灵活和可扩展的 AI 对话体验,支持多种大型语言模型(如 OpenAI GPT、Anthropic Claude、Google Gemini 等),并具备丰富的功能,使其适用于个人用户、开...
开源 3662 0
支持图像、动图、短视频、PDF:AI逐页/逐帧分析,AI不仅能看懂,还能回答你的问题  Qwen3-VL 一键整合包 v20251024

支持图像、动图、短视频、PDF:AI逐页/逐帧分析,AI不仅能看懂,还能回答你的问题 Qwen3-VL 一键整合包 v20251024

基于 Qwen3-VL-4B-Instruct 的多模态智能交互平台📌 简介本应用是一个基于 通义千问 Qwen3-VL-4B-Instruct 大模型的多模态推理系统,支持对 图像、视频、PDF 文档、GIF 动图 等多种媒体内容进行智能理解与分析,并能自动生成精准描述、解答问题或提取关键信息。借助 Gradio 构建的直观 Web 界面,...
AI,开源 3010 0
DeepSeek-OCR 可视化工具:支持自由OCR、Markdown转换、图表解析与目标定位 一键整合包 v20251023

DeepSeek-OCR 可视化工具:支持自由OCR、Markdown转换、图表解析与目标定位 一键整合包 v20251023

🐳 DeepSeek-OCR 智能图像文字识别工具 — 使用说明🌟 这是什么?这是一个智能图像处理工具,可以自动从你上传的图片中:识别文字内容把文档转成 Markdown 格式(适合写博客、笔记)解析图表数据(比如柱状图、折线图里的数字)定位图片中的特定内容(比如“找出老师在哪里”)它基于先进的 AI 模型(DeepSeek-OCR),由剑二...
AI,开源 2611 0
多模型支持 + 工具调用 + 搜索增强,DeepChat 全能解析 v0.3.6

多模型支持 + 工具调用 + 搜索增强,DeepChat 全能解析 v0.3.6

DeepChat 是一个功能丰富的开源 AI 聊天平台,支持多种云端和本地大型语言模型(LLM),并具备强大的搜索增强和工具调用能力。它为用户提供了一个统一的界面来交互各种主流 AI 模型,无论是使用 OpenAI、Gemini、Anthropic 等云服务,还是本地部署的 Ollama 模型。作为一款跨平台的 AI 助手应用,DeepCha...
开源 2357 0
一键修复老照片、智能上色、超清还原,去除水印 ——全能AI图像编辑神器来了!beterpic v20251020

一键修复老照片、智能上色、超清还原,去除水印 ——全能AI图像编辑神器来了!beterpic v20251020

—— 高清图像修复、增强与风格化处理工具本系统基于先进的 FLUX.1-Kontext 模型 与 Nunchaku 量化技术 构建,结合 LoRA 微调模型支持,提供强大且高效的图像编辑能力。无论是老照片修复、人像增强、风景优化,还是黑白图上色,都能一键实现高质量输出。🔧 核心功能✅ 高清图像修复与增强支持上传任意分辨率图像(最小边自动放大至...
AI 7298 6
视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包 v20251019

视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包 v20251019

🎥 FlashVSR 是什么?FlashVSR 是一个能让模糊、低清视频“秒变高清”的智能工具。它专门用来做一件事:把低分辨率的视频,快速、高质量地放大成 4 倍清晰度的高清视频。比如:把 480p 的老视频 → 变成接近 4K 的清晰视频让手机拍的模糊视频 → 变得锐利、细节丰富⚡ 它有什么厉害的地方?过去很多“视频超分”(放大变清晰)工具...
AI,开源 2897 0
Jan 一个功能强大的开源ChatGPT替代品 支持deepseek v0.7.2

Jan 一个功能强大的开源ChatGPT替代品 支持deepseek v0.7.2

Jan:开源的ChatGPT替代品项目概述:Jan是一个开源的ChatGPT替代品,允许用户在其计算机上100%离线运行。这意味着用户无需网络连接即可使用AI功能。项目托管在GitHub上,由janhq团队维护,遵循AGPL-3.0许可证。功能特点:离线运行:Jan支持在任何硬件上运行,从个人电脑到多GPU集群,无需外部服务器或网络连接。多平...
软件 5044 0
一句话改图,两张图参考——DreamOmni2 让 AI 理解你的编辑意图 一键整合包优化版 v20251014 支持风格迁移、物体替换、光照调整等全能图像编辑

一句话改图,两张图参考——DreamOmni2 让 AI 理解你的编辑意图 一键整合包优化版 v20251014 支持风格迁移、物体替换、光照调整等全能图像编辑

DreamOmni2 是一个“万能图像编辑器” —— 你给它两张图 + 一句指令,它就能智能地把第一张图“改”成你想要的样子,参考第二张图的风格、内容、细节等。🖼️ 它能做什么?(举几个例子)你想做什么DREAMOMNI2 能做到把照片里的衣服换成另一件✅ 上传原图 + 新衣服图 + 指令:“把第一张图的衣服换成第二张的”让人物发型和参考图一...
AI,开源 3084 0