这不是换脸,这是换头! 效果炸裂 AI 图片换头 HeadFusion v3.0 一键整合包 v20260601

这不是换脸,这是换头! 效果炸裂 AI 图片换头 HeadFusion v3.0 一键整合包 v20260601

本项目是一个基于 FLUX.2 Klein 模型开发的 AI 智能换头工具。通过集成 SDNQ (Spatial Dynamic Neural Quantization) 4-bit 动态量化技术,在显著降低显存占用的同时,保持了卓越的图像生成质量。配合 BFS (Best Face Swap) LoRA 模型,能够精准地实现人头替换,并完美...
AI,开源 1.7万 49
小红书 开源配音神器 dots.tts 只需3秒音频,完美复刻你的声音! 一键整合包 v20260617 解压即可使用

小红书 开源配音神器 dots.tts 只需3秒音频,完美复刻你的声音! 一键整合包 v20260617 解压即可使用

dots.tts是由小红书人工智能实验室(RedNote Hilab)研发并免费开源的一款新一代 AI 语音合成(配音)系统。抛开复杂的技术术语,你可以把它简单理解为一个“拥有录音棚级音质的超级 AI 配音员”。你只需要输入一段文字,它就能用极其逼真、富有感情的声音把文字读出来,甚至能完美模仿任何人的声音。以下是它最核心的几个“超能力”,也是...
AI 1.1万 30
Stretchly 一个由Jan Hovancik开发的开源休息提醒工具 v1.21.0

Stretchly 一个由Jan Hovancik开发的开源休息提醒工具 v1.21.0

Stretchly是一个由Jan Hovancik开发的开源休息提醒工具,旨在帮助用户在长时间使用电脑工作时定期休息,以减轻眼睛疲劳和身体压力。该项目基于Electron框架开发,支持跨平台使用,包括macOS、Windows和Linux系统。Stretchly通过定时提醒用户进行短暂的“迷你休息”和较长的“长时间休息”,帮助用户保持工作效率...
软件 3761 0
开源 PDFsam Basic 一款专业且免费的开源PDF处理软件 v6.0.1

开源 PDFsam Basic 一款专业且免费的开源PDF处理软件 v6.0.1

PDFsam Basic是一款专业且免费的开源PDF处理软件,它提供了多种强大的功能,旨在帮助用户轻松地进行PDF文件的编辑和管理。以下是关于PDFsam Basic的详细介绍:一、软件概述PDFsam Basic是一款跨平台的PDF编辑器,支持在Windows、Mac OS及Linux等多个操作系统上运行。它以其免费、开源的特点,以及丰富的...
软件 4261 0
0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v12.20 支持JoyAI-Echo Bernini LTX-2.3 wan2.2 HunyuanVideo-1.5等 数字人文生视频+图生视频+批量生成 英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了

0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v12.20 支持JoyAI-Echo Bernini LTX-2.3 wan2.2 HunyuanVideo-1.5等 数字人文生视频+图生视频+批量生成 英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了

Wan2GP 是专为“显卡资源有限”的用户打造的**开源视频生成工具箱**。它把目前最先进的文生视频、图生视频、视频编辑模型(Wan 2.1、Hunyuan Video、LTX Video 等)做了重度优化和封装,让只有 6-8 GB 显存的旧显卡也能跑得动、跑得快,并提供了一整套 Web 界面与周边工具,做到“开箱即玩”。一句话总结:**把...
AI,开源 4.2万 165
视频反推提示词生成器 分镜处理+镜头设定 + 场景描述 + 主体动作 + 角色细节 + 运镜方式 + 风格美学+去水印+高清修复 thinkvideo v4.0

视频反推提示词生成器 分镜处理+镜头设定 + 场景描述 + 主体动作 + 角色细节 + 运镜方式 + 风格美学+去水印+高清修复 thinkvideo v4.0

🎬 剑二十七|视频反推提示词生成器让每一帧画面,都转化为可复用的创作语言🔮 核心定位这是一款面向专业内容创作者的智能视频理解工具。它不满足于简单的画面识别,而是以「镜头语言」为最小单元,深度解析视频内容,自动生成符合影视工业标准的中文提示词描述。不是「看图说话」,而是「读镜写意」。✨ 六大核心能力🎯 智能镜头分割精准识别场景切换点自适应阈值调...
AI 4504 8
一键克隆你的声音:higgs-audio-v3-tts AI语音生成工具 支持情绪标签,支持停顿,支持音速调整 中文一键整合包 v20260609

一键克隆你的声音:higgs-audio-v3-tts AI语音生成工具 支持情绪标签,支持停顿,支持音速调整 中文一键整合包 v20260609

HiggsAudio 是由 Boson AI 开发的开源文本转语音(TTS)系统,基于先进的深度学习技术,能够生成高质量、自然的人声。该项目在 GitHub 上开源,提供了强大的语音合成能力。🌟 项目亮点🎵 高质量语音生成生成接近真人发音的语音支持多种语言和口音能够处理情感表达和语调变化🏗️ 先进的模型架构基于 Transformer 的端到...
AI 5015 10
图生图新的选择 AI 重绘 支持批量图生图 新增动作和姿态控制+滤镜+自动关机+自动去水印 剑二十七洗图专用  z-image-turbo-xitu v12

图生图新的选择 AI 重绘 支持批量图生图 新增动作和姿态控制+滤镜+自动关机+自动去水印 剑二十七洗图专用 z-image-turbo-xitu v12

🎨 Z-Image-Turbo 剑二十七·洗图专用版—— 神似而形不似,AI 重绘的终极答案"目前市面上能做到神似而形不似的类似图生图,在我面前一个能打的都没有"🔍 产品定位本工具专为「高质量图像重绘」场景打造,聚焦「洗图」核心需求:在保留原图构图、光影、神态的前提下,通过 AI 进行艺术化重绘,实现「神似而形不似」的进阶...
AI 1万 23
MOSS-TTS-v1.5+MOSS-TTSD+ MOSS-TTS-Nano 支持CPU运行,一个高质量的开源中文文本到语音合成系统 一键整合包 v20260604 支持免费商业使用 支持暂停

MOSS-TTS-v1.5+MOSS-TTSD+ MOSS-TTS-Nano 支持CPU运行,一个高质量的开源中文文本到语音合成系统 一键整合包 v20260604 支持免费商业使用 支持暂停

🎙️ MOSS-TTS:让文字拥有“千人千面”的超级嗓音一句话看懂:这是一个由复旦大学和模思智能联合开发的开源人工智能项目。它的核心本领就是把文字变成极其逼真、带有感情的真人声音。✨ 为什么它比传统的“机器朗读”更厉害?传统的配音软件听起来往往像没有感情的机器人,而 MOSS-TTS 拥有以下 5 大“超能力”:1. 🎭 神奇的“声音克隆”魔...
AI 8990 20
高德开源项目 PilotTTS - 让AI学会"说话"的语音生成开源项目,支持11种情绪+14种方言 一键整合包 v20260530 解压即可使用

高德开源项目 PilotTTS - 让AI学会"说话"的语音生成开源项目,支持11种情绪+14种方言 一键整合包 v20260530 解压即可使用

这是高德地图语音团队开发的一个AI语音合成工具,可以让电脑用自然的声音朗读文字,还能模仿不同人的声音、表达不同情绪。✨ 它能做什么?1️⃣模仿任何人说话只需录一段5-15秒的音频,AI就能学会这个人的声音比如:用你朋友的声音读你写的文字2️⃣带感情地朗读支持11种情绪:😊 开心、😢 悲伤、😠 生气😲 惊讶、😨 害怕、🤢 厌恶😐 严肃、🥺 关切...
AI 2259 0
自媒体人的AI音乐工坊:打字描述,自动生成专属BGM stable-audio-3 AI音乐自动生成一键整合包 v20260524

自媒体人的AI音乐工坊:打字描述,自动生成专属BGM stable-audio-3 AI音乐自动生成一键整合包 v20260524

Stable Audio 3 是 Stability AI(就是出 Stable Diffusion 那家公司)做的一款AI 音乐/音效生成工具。你只需要打字描述,它就能帮你生成一段音频——可以是一段背景音乐、一个音效、甚至是一首完整的歌。这个增强版把原来的英文界面全部翻译成了中文,还加了一些方便国内用户使用的功能。它能做什么?举几个例子你想...
AI 4541 0
造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图+人物一致性图片+自定义lora 一键整合包 20260519 v19

造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图+人物一致性图片+自定义lora 一键整合包 20260519 v19

Z-Image-Turbo Generator 是一个基于 Tongyi-MAI/Z-Image-Turbo 模型的高性能AI图像生成应用。通过简洁直观的Gradio界面,用户可以轻松生成高质量的图像,特别擅长生成具有中国传统文化元素与现代风格融合的艺术作品。✨ 核心特性⚡ 极致性能优化8步极速生成:仅需8个推理步骤即可完成高质量图像生成零指...
AI,开源 2.3万 64
一句话画出动漫世界!支持中文的AI绘画神器来了 Anima文生动漫图片AI大模型 ,8G英伟达显卡即可愉快玩耍

一句话画出动漫世界!支持中文的AI绘画神器来了 Anima文生动漫图片AI大模型 ,8G英伟达显卡即可愉快玩耍

Anima 动漫文生图基于 circlestone-labs/Anima 模型的图像生成工具。支持中文提示词自动翻译,生成结果自动保存至本地 output 目录。✨ 主要特性🎨 高质量动漫风格生成 – 专精二次元、动漫、CG 渲染。🌐 中文提示词自动翻译 – 使用...
AI 4万 129
百度开源图片大模型 文生图 ERNIE-Image-Turbo 一键整合包 8G英伟达 16秒出图 文字理解能力超强 v20260416

百度开源图片大模型 文生图 ERNIE-Image-Turbo 一键整合包 8G英伟达 16秒出图 文字理解能力超强 v20260416

🎨 ERNIE-Image-Turbo 模型介绍【核心定位】• 极速生成:基于单流 Diffusion Transformer 架构,仅需 8 步推理即可完成高质量图像生成,速度提升 6 倍以上• 精准可控:强调对复杂指令的准确还原,适合需要内容精确落地的实用型创作任务• 轻量化部署:经蒸馏优化,可在 消费级显卡上流畅运行,大幅降低商用门槛【...
AI 3771 8
输入歌词,AI自动作曲:你的音乐创作助手 HeartMuLa 一键中文整合包 v20260507

输入歌词,AI自动作曲:你的音乐创作助手 HeartMuLa 一键中文整合包 v20260507

HeartMuLa/heartlib:开源音乐基础模型家族深度解析项目定位与愿景HeartMuLa是一个全面的开源音乐基础模型家族,旨在推动跨任务与多模态的大规模音乐理解与生成技术发展。该项目不仅仅是一个单一的模型,而是一个完整的生态系统,涵盖了从音乐理解到完整曲目生成的全链条能力。其核心目标是为研究社区和开发者提供可复现、可扩展的音乐AI工...
AI,开源 8677 11
京东开源 图片编辑AI大模型 JoyAI-Image-Edit v20260422 二次开发一键整合包 附演示和操作教程

京东开源 图片编辑AI大模型 JoyAI-Image-Edit v20260422 二次开发一键整合包 附演示和操作教程

JoyAI-Image-Edit 是京东开源的多模态基础模型,专注于指令引导的图像编辑任务。它基于 JoyAI-Image 多模态底座构建,通过自然语言指令实现对图像的精确、可控编辑。🔹 核心技术特点1. 强大的空间理解能力场景解析:自动识别图像中的物体、区域及空间关系关系定位:精准理解"物体A在物体B左侧"等空间描述指令...
AI 5337 1
音乐卡点视频 一键生成 支持图片+视频素材  新增镜头分镜切割+人声分离+ MTV 模式+音频编辑 无显卡要求 剑二十七原创作品 KA v20260328

音乐卡点视频 一键生成 支持图片+视频素材 新增镜头分镜切割+人声分离+ MTV 模式+音频编辑 无显卡要求 剑二十七原创作品 KA v20260328

卡点视频生成器是一款基于 AI大模型 智能视频自动生成工具,专为音乐爱好者、短视频创作者、自媒体运营者设计。它能根据你上传的音乐节拍/鼓点,自动从指定图片或视频素材中智能选取片段,生成节奏精准、视觉流畅的“卡点”视频,适用于抖音、快手、B站、Instagram 等平台。无需剪辑经验,一键生成专业级卡点视频!🎯 核心功能1. 🖼️ 图片卡点模式...
AI 1.2万 0
一键生成AI绘画提示词:让你的图片秒变顶级写真描述 跟之前的图片反推工具不同的是这个会思考 thinkpic-6.0-20260420

一键生成AI绘画提示词:让你的图片秒变顶级写真描述 跟之前的图片反推工具不同的是这个会思考 thinkpic-6.0-20260420

这个工具是做什么的?这个程序可以自动为你的人物照片生成一段“AI绘画提示词”。简单来说:你放一张人物照片进去,它就能写出一段详细、生动、充满吸引力的文字描述,这段文字可以直接用在 AI 绘画工具(比如 Stable Diffusion)中,让 AI 画出类似风格或效果的图片。例如,它会描述:人物有多美、眼睛多勾人、嘴唇多诱人;身材曲线多么火辣...
AI 1.3万 8
本地部署 一键整合包FLUX.2-klein-9B-KV-LoRA-Studio 图像编辑大模型 海量lora支持 v3.0

本地部署 一键整合包FLUX.2-klein-9B-KV-LoRA-Studio 图像编辑大模型 海量lora支持 v3.0

FLUX.2-Klein-LoRA-Studio是一款基于 Gradio 构建的本地化图像编辑工作台,集成 Black Forest Labs 最新发布的FLUX.2-klein-9B多模态生成模型,支持通过 LoRA 适配器实现多样化图像编辑任务。⚡ 核心功能🔹 多图像输入编辑支持上传 1~2 张参考图:Picture 1(Base):作为...
AI 4117 8
你想怎么改图?它就怎么改 Qwen-Image-Edit-2511 实现真正可控的 AI 图片编辑 支持海量lora v20260413 一键整合包

你想怎么改图?它就怎么改 Qwen-Image-Edit-2511 实现真正可控的 AI 图片编辑 支持海量lora v20260413 一键整合包

Qwen-Image-Edit-2511 是由阿里云推出的新一代多模态图像编辑大模型,属于 Qwen 系列在视觉生成与编辑方向的重要迭代。该模型基于 Qwen-Image-Edit 系列的持续演进(如 2509、2511 版本),在保留原始图像语义结构和细节的前提下,支持高保真、高可控性的图像编辑任务。该模型主要特点包括:高保真图像编辑:在执...
AI 7032 16
小米开源大模型AI语音合成,600种语言+声音克隆,生成速度提升40倍 不限字数 支持自动语气标签 OmniVoice v20260407 一键整合包

小米开源大模型AI语音合成,600种语言+声音克隆,生成速度提升40倍 不限字数 支持自动语气标签 OmniVoice v20260407 一键整合包

OmniVoice:600+语种的语音合成新纪元剑二十七 · 技术前沿🔹一句话了解由小米下一代 Kaldi 团队(k2-fsa)打造的超大规模多语言零样本 TTS 模型,支持600+ 语种,以卓越音质与极速推理,重新定义语音合成体验。✨ 核心能力一览🗣️全球语种覆盖支持 600+ 语言与方言,从英语、中文到低资源语种,一模型通全球。🔁声音克隆...
AI 3950 0
DeepSeek 本地部署一键运行 DeepSeek-tool v18,解压即可使用 最低支持2G显卡 支持99%的语言大模型 支持联网搜索+知识库

DeepSeek 本地部署一键运行 DeepSeek-tool v18,解压即可使用 最低支持2G显卡 支持99%的语言大模型 支持联网搜索+知识库

琢磨了一天,把DeepSeek的本地部署彻底完成了,并测试了一下午基本完美运行了。当然AI环境你们必须要先安装好。然后下载这个这个本地部署压缩,解压即可完美运行。我的4070ti spuer 运行32b已经是极限了,所以我也只能把模型下载到32b了,如果你们有更牛的显卡,可以继续下载模型。这是我运行14b的截图 你们看看显...
AI,开源 1.7万 37
 一键克隆任意音色,生成自然口语级语音  1B/3.5B 双模型自由切换,还原你最真实的声音  LongCat-AudioDiT v1.0 20260402 更新 一键整合包

一键克隆任意音色,生成自然口语级语音 1B/3.5B 双模型自由切换,还原你最真实的声音 LongCat-AudioDiT v1.0 20260402 更新 一键整合包

LongCat-AudioDiT 语音合成工具 - 功能说明🎯 主要功能本工具基于美团开源的 LongCat-AudioDiT 扩散模型,提供高质量的文本到语音合成,并支持零样本语音克隆(只需几秒参考音频即可克隆音色)。界面采用 Gradio 构建,操作直观,适用于中文和英文混合文本。📌 核心功能模块1. 模型选择支持 1B&nbs...
AI 3008 2
FastGestures 鼠标/触控板/屏手势 绿色免安装 v2.2.67

FastGestures 鼠标/触控板/屏手势 绿色免安装 v2.2.67

FastGestures 是一款鼠标手势软件,借助它,用户可以通过自定义简明的鼠标动作来控制和管理电脑的操作,极大地提高了效率和工作流程的速度。主要特性自定义鼠标手势:FastGestures允许用户自定义鼠标手势,以控制各种常见的电脑操作,如打开文件,关闭窗口,翻页,前后浏览等。操作简便:使用FastGestures进行鼠标手势操作非常简单...
软件 5761 2
语音识别 + 声音克隆 + 模型训练,一个工具全搞定!Easy-Voice-Toolkit v1.3.5

语音识别 + 声音克隆 + 模型训练,一个工具全搞定!Easy-Voice-Toolkit v1.3.5

Easy-Voice-Toolkit 是由 Spr-Aachen开发的一款开源、用户友好的 AI 语音工具箱,旨在为开发者、研究人员和爱好者提供一站式、本地化部署的语音处理解决方案。项目设计注重易用性与功能性,支持多种主流语音任务,适用于科研实验、产品原型开发、语音助手构建等多种应用场景。🌟 核心特性本地部署:所有功能均可在本地运行,保障数据...
AI,开源 5069 0
EditMGT 用文字"指挥"AI修图,想改哪里改哪里 5秒即可完成编辑 一键整合包 v20260219

EditMGT 用文字"指挥"AI修图,想改哪里改哪里 5秒即可完成编辑 一键整合包 v20260219

EditMGT(Masked Generative Transformer for Image Editing)是一个基于掩码生成式变压器的先进图像编辑框架,由字节跳动(ByteDance)主导研发,联合上海交通大学、新加坡国立大学、香港科技大学(广州)等高校共同完成。✨ 核心特点1. 技术创新采用**掩码生成式变压器(Masked Gene...
AI 3375 3
电商降本增效神器:FASHN VTON v1.5 模特图自动生成 新一代开源虚拟试衣黑科技 一键整合包 v20260210

电商降本增效神器:FASHN VTON v1.5 模特图自动生成 新一代开源虚拟试衣黑科技 一键整合包 v20260210

FASHN VTON v1.5 是由 Fashn AI 推出的开源虚拟试衣项目。该项目基于先进的扩散模型技术,旨在解决电商、时尚设计和图像生成领域中“模特换装”的核心需求。它能够将任意一张服装图片逼真地“穿”在指定人物身上,同时保持人物的面部、姿态和背景环境高度一致。以下是该项目的详细介绍:1. 项目概述FASHN VTON v1.5 是一个...
AI,开源 4801 7
SoulX-Singer:一键克隆任意声音,让AI替你唱歌 无需训练,秒变歌手 一键整合包 v20260208

SoulX-Singer:一键克隆任意声音,让AI替你唱歌 无需训练,秒变歌手 一键整合包 v20260208

SoulX-Singer 是一个由 Soul-AI Lab 开发的零样本歌声合成(Zero-Shot Singing Voice Synthesis)开源项目。该项目旨在通过先进的深度学习技术,让用户能够在无需大量训练数据的情况下,克隆任意人的声音并用于歌声合成。核心功能1. 零样本音色克隆SoulX-Singer 的核心能力是零样本音色迁移...
AI,开源 6425 4
"让AI有‘灵魂’的神器:开源项目免费下载,语音聊天不尬聊,打游戏能当军师,关键数据不传云端!" airi v0.8.4

"让AI有‘灵魂’的神器:开源项目免费下载,语音聊天不尬聊,打游戏能当军师,关键数据不传云端!" airi v0.8.4

Project AIRI 是一个基于大语言模型驱动的AI虚拟伴侣系统,旨在创建AI"女仆"(waifu)/虚拟角色的灵魂容器,将这些虚拟角色带入现实世界。该项目致力于重现Neuro-sama(一个知名的AI虚拟角色)的功能高度,完全由LLM和AI驱动。核心功能🎙️ 实时语音聊天支持与AI进行自然流畅的语音对话交互实现低延迟...
AI,开源 6886 11
微软常用运行库合集(Microsoft Visual C++ Redistributable) Windows电脑系统必装软件 2026.01.17 再次更新

微软常用运行库合集(Microsoft Visual C++ Redistributable) Windows电脑系统必装软件 2026.01.17 再次更新

经常关注我的小伙伴肯定可以看到我经常分享这个更新的什么运行库,有些不明真相的老问我,这个玩意有什么用?看你经常发布这个,又没有什么特别说明,感觉这玩意是多余的,我这里简单说下,这个东西很有用,比如你玩一些单机游戏特别是一些单机游戏的学习版之类,如果没有安装这个运行库,打开游戏就会提示缺少什么dll组件之类,你搜遍全网会有无数种答案来告诉你怎么...
软件 9.9万 460
影像重获新生 SeedVR2 图片+视频批量超分神器 一键整合包 AI 超分,让每一帧都惊艳 v20260205

影像重获新生 SeedVR2 图片+视频批量超分神器 一键整合包 AI 超分,让每一帧都惊艳 v20260205

SeedVR2 图像/视频超分工具这是一款基于 ComfyUI-SeedVR2_VideoUpscaler 官方推理 CLI 开发的图形化 Web 封装工具。它提供了一个现代化、汉化且高度可配置的网页界面,使用户无需编写命令行代码即可轻松对图片和视频进行高质量的 AI 超分辨率处理。核心功能1. 多模态与批量处理图片超分:支持单张图片或批量上...
AI,开源 3546 0
开源 res-downloader 一款免费开源网络资源嗅探下载器 v3.1.3

开源 res-downloader 一款免费开源网络资源嗅探下载器 v3.1.3

Res-Downloader是一款基于electron-vite-vue开发的免费开源网络资源嗅探下载器,它以其强大的功能和易用性在众多网络资源下载工具中脱颖而出。以下是对该软件的详细介绍:基本信息名称:Res-Downloader(爱享素材下载器)开发技术:基于electron-vite-vue框架性质:免费开源功能:支持视频、音频、图片、...
软件 8867 11