一键克隆任意音色,生成自然口语级语音  1B/3.5B 双模型自由切换,还原你最真实的声音  LongCat-AudioDiT v1.0 20260402 更新 一键整合包

一键克隆任意音色,生成自然口语级语音 1B/3.5B 双模型自由切换,还原你最真实的声音 LongCat-AudioDiT v1.0 20260402 更新 一键整合包

LongCat-AudioDiT 语音合成工具 - 功能说明🎯 主要功能本工具基于美团开源的 LongCat-AudioDiT 扩散模型,提供高质量的文本到语音合成,并支持零样本语音克隆(只需几秒参考音频即可克隆音色)。界面采用 Gradio 构建,操作直观,适用于中文和英文混合文本。📌 核心功能模块1. 模型选择支持 1B&nbs...
AI 0
这不是换脸,这是换头! 效果炸裂 AI 图片换头 Flux2-Klein-Face-Swap 一键整合包 v20260401

这不是换脸,这是换头! 效果炸裂 AI 图片换头 Flux2-Klein-Face-Swap 一键整合包 v20260401

本项目是一个基于 FLUX.2 Klein 模型开发的 AI 智能换头工具。通过集成 SDNQ (Spatial Dynamic Neural Quantization) 4-bit 动态量化技术,在显著降低显存占用的同时,保持了卓越的图像生成质量。配合 BFS (Best Face Swap) LoRA 模型,能够精准地实现人头替换,并完美...
AI,开源 0
 VisoMaster +VisoMaster-Fusion v1.0  基于rope的二次开发 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持50系英伟达显卡运行 一键整合包

VisoMaster +VisoMaster-Fusion v1.0 基于rope的二次开发 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持50系英伟达显卡运行 一键整合包

VisoMaster 还不错的一个换脸工具,界面也是简洁的很,花了一天的时间做了整合包+汉化。VisoMaster是一款功能强大且易于使用的面部替换与编辑工具,专为图像和视频设计。它利用先进的人工智能技术,能够以最少的努力产生自然逼真的效果,因此无论是普通用户还是专业人士都能轻松上手。这款软件以其独特的魅力和实用性,在图像与视频编辑领域脱颖而...
AI,开源 0
音乐卡点视频 一键生成 支持图片+视频素材  新增镜头分镜切割+人声分离+ MTV 模式+音频编辑 无显卡要求 剑二十七原创作品 KA v20260328

音乐卡点视频 一键生成 支持图片+视频素材 新增镜头分镜切割+人声分离+ MTV 模式+音频编辑 无显卡要求 剑二十七原创作品 KA v20260328

卡点视频生成器是一款基于 AI大模型 智能视频自动生成工具,专为音乐爱好者、短视频创作者、自媒体运营者设计。它能根据你上传的音乐节拍/鼓点,自动从指定图片或视频素材中智能选取片段,生成节奏精准、视觉流畅的“卡点”视频,适用于抖音、快手、B站、Instagram 等平台。无需剪辑经验,一键生成专业级卡点视频!🎯 核心功能1. 🖼️ 图片卡点模式...
AI 0
开源 AiNiee:一键通杀全场景 AI 翻译!游戏 / 字幕 / 书籍 / 文档,高效搞定不费力 v7.1.2

开源 AiNiee:一键通杀全场景 AI 翻译!游戏 / 字幕 / 书籍 / 文档,高效搞定不费力 v7.1.2

AiNiee 是一款专注于 AI 翻译的工具,主打一键自动翻译复杂长文本内容,涵盖游戏、书籍、字幕、文档等多种场景。其核心目标是通过智能化技术提升翻译效率与质量,同时支持广泛的文件格式和使用场景。核心功能格式全能,覆盖广泛深度支持游戏文本翻译,兼容 Mtool、Renpy、Translator++ 等游戏文本导出工具。轻松处理多种文件类型:I...
开源 0
TTS开源新王炸!Ming-omni-tts:一个模型搞定语音/音乐/音效,还能听懂你的情绪指令 新增支持长文本 一键整合包 v20260327

TTS开源新王炸!Ming-omni-tts:一个模型搞定语音/音乐/音效,还能听懂你的情绪指令 新增支持长文本 一键整合包 v20260327

Ming-omni-tts是一款高性能的统一音频生成模型,能够在单通道中实现语音、环境音和音乐的协同合成,并支持对语音属性的精细化控制。其核心创新在于将多种音频模态统一建模,同时保持高效的推理速度与专业的文本处理能力。🚀 核心能力1️⃣ 精细化语音控制支持通过简单指令精确调控语速、音量、音高、情绪、方言等属性粤语方言控制准确率达93%,情绪控...
AI 0
造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图+人物一致性图片+自定义lora 一键整合包 20260326 v17

造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图+人物一致性图片+自定义lora 一键整合包 20260326 v17

Z-Image-Turbo Generator 是一个基于 Tongyi-MAI/Z-Image-Turbo 模型的高性能AI图像生成应用。通过简洁直观的Gradio界面,用户可以轻松生成高质量的1024x1024分辨率图像,特别擅长生成具有中国传统文化元素与现代风格融合的艺术作品。✨ 核心特性⚡ 极致性能优化8步极速生成:仅需8个推理步骤即...
AI,开源 0
本地部署 一键整合包FLUX.2-klein-9B-KV-LoRA-Studio 图像编辑大模型 海量lora支持 v2.0

本地部署 一键整合包FLUX.2-klein-9B-KV-LoRA-Studio 图像编辑大模型 海量lora支持 v2.0

FLUX.2-Klein-LoRA-Studio是一款基于 Gradio 构建的本地化图像编辑工作台,集成 Black Forest Labs 最新发布的FLUX.2-klein-9B多模态生成模型,支持通过 LoRA 适配器实现多样化图像编辑任务。⚡ 核心功能🔹 多图像输入编辑支持上传 1~2 张参考图:Picture 1(Base):作为...
AI 0
一键式效率倍增器 定时/热键自动化任务工具 zTasker v2.3.7 免费  绿色免安装

一键式效率倍增器 定时/热键自动化任务工具 zTasker v2.3.7 免费 绿色免安装

zTasker是一个定时/热键自动化任务工具,可以采用定时或热键的方式执行多种自动化任务,支持50+种任务类型,20+种定时/条件执行方法,任务列表随意编辑、排列、移动、更改类型,支持任务执行日志,支持任务列表等数据的备份,支持任务日志,支持数据备份,支持自动更新。使用技巧★ 可以在托盘菜单或者主界面下拉菜单,或者用热键,进入快速提醒、快速定...
软件 0
抖音资源一键批量下载神器!支持去水印 / 图集 / 音乐 / 视频,免费开源还能断点续传!douyin-downloader v20260311

抖音资源一键批量下载神器!支持去水印 / 图集 / 音乐 / 视频,免费开源还能断点续传!douyin-downloader v20260311

douyin-downloader 开源项目介绍这是一个功能强大的抖音内容批量下载工具,支持视频、图集、音乐、直播等多种内容类型的下载。基于最新抖音 API 实现,提供命令行和配置文件两种使用方式,且完全免费。核心特性全面的内容支持视频下载:支持去水印高清视频下载。图集下载:批量下载图片集合。音乐下载:提取视频背景音乐。封面与头像:下载视频封...
开源 0
一键修复老照片、智能上色、超清还原,去除水印 ,转动漫 ——全能AI图像编辑神器来了!beterpic v20260114

一键修复老照片、智能上色、超清还原,去除水印 ,转动漫 ——全能AI图像编辑神器来了!beterpic v20260114

—— 高清图像修复、增强与风格化处理工具本系统基于先进的 qwen 图片编辑模型 与 Nunchaku 量化技术 构建,结合 LoRA 微调模型支持,提供强大且高效的图像编辑能力。无论是老照片修复、人像增强、风景优化,还是黑白图上色,都能一键实现高质量输出。🔧 核心功能✅ 高清图像修复与增强支持上传任意分辨率图像(最小边自动放大至 1024p...
AI 0
从迅雷到 GoogleDrive 30+网盘 一键预览+极速下载:OpenList 全开源方案 v4.1.10

从迅雷到 GoogleDrive 30+网盘 一键预览+极速下载:OpenList 全开源方案 v4.1.10

项目背景起源:OpenList 是 AList 的一个分支版本,由 OpenList 团队独立维护,旨在对抗基于信任的危机,保护开源项目免受此类攻击。开源理念:遵循 AGPL-3.0 许可证,致力于保持代码的完全开放性和修改的透明性。项目特点丰富的存储支持:支持多种存储方式,包括本地存储、阿里云盘、OneDrive/Sharepoint(全球...
开源 0
EditMGT 用文字"指挥"AI修图,想改哪里改哪里 5秒即可完成编辑 一键整合包 v20260219

EditMGT 用文字"指挥"AI修图,想改哪里改哪里 5秒即可完成编辑 一键整合包 v20260219

EditMGT(Masked Generative Transformer for Image Editing)是一个基于掩码生成式变压器的先进图像编辑框架,由字节跳动(ByteDance)主导研发,联合上海交通大学、新加坡国立大学、香港科技大学(广州)等高校共同完成。✨ 核心特点1. 技术创新采用**掩码生成式变压器(Masked Gene...
AI 0
神器 支持近百种格式的一键转换 格式转换工具 FileConverter v2.2 汉化版

神器 支持近百种格式的一键转换 格式转换工具 FileConverter v2.2 汉化版

介绍FileConverter文件转换器是一个非常简单的工具,允许您使用Windows资源管理器中的上文单转换和压缩一个或多个文件。它支持近百种格式的一键转换,而且转换速度很快。像音频、视频、图片、文档等文件之间的格式互转。比如,常用的mkv转mp4、flac转mp3、webp转png、pdf转doc等。软件截图如上图设置成中文软件特点Fil...
开源 0
电商降本增效神器:FASHN VTON v1.5 模特图自动生成 新一代开源虚拟试衣黑科技 一键整合包 v20260210

电商降本增效神器:FASHN VTON v1.5 模特图自动生成 新一代开源虚拟试衣黑科技 一键整合包 v20260210

FASHN VTON v1.5 是由 Fashn AI 推出的开源虚拟试衣项目。该项目基于先进的扩散模型技术,旨在解决电商、时尚设计和图像生成领域中“模特换装”的核心需求。它能够将任意一张服装图片逼真地“穿”在指定人物身上,同时保持人物的面部、姿态和背景环境高度一致。以下是该项目的详细介绍:1. 项目概述FASHN VTON v1.5 是一个...
AI,开源 0
别再瞎试了!用这个神器,一键优化你的大模型提示词 Prompt Optimizer v2.5.3

别再瞎试了!用这个神器,一键优化你的大模型提示词 Prompt Optimizer v2.5.3

该项目聚焦于提升大语言模型(LLM)在实际应用中对提示语的理解与响应质量,旨在通过系统化的方法改进原始提示语的表达结构、清晰度和有效性,从而获得更准确、更稳定、更符合预期的模型输出。核心理念随着大模型在各类场景中的广泛应用,提示工程(Prompt Engineering)成为影响输出质量的关键因素。prompt-optimizer 的设计初衷...
AI,开源 0
SoulX-Singer:一键克隆任意声音,让AI替你唱歌 无需训练,秒变歌手 一键整合包 v20260208

SoulX-Singer:一键克隆任意声音,让AI替你唱歌 无需训练,秒变歌手 一键整合包 v20260208

SoulX-Singer 是一个由 Soul-AI Lab 开发的零样本歌声合成(Zero-Shot Singing Voice Synthesis)开源项目。该项目旨在通过先进的深度学习技术,让用户能够在无需大量训练数据的情况下,克隆任意人的声音并用于歌声合成。核心功能1. 零样本音色克隆SoulX-Singer 的核心能力是零样本音色迁移...
AI,开源 0
全能复古游戏模拟器:MAME,让经典游戏一键复活 v0.285

全能复古游戏模拟器:MAME,让经典游戏一键复活 v0.285

MAME,全称Multiple Arcade Machine Emulator,不过它现在可不只是街机模拟器那么简单啦!它更像是一个多功能的模拟框架,专门用来保存那些可能随着时间流逝而被遗忘的“复古”软件。想象一下,如果没有MAME,我们可能再也玩不到那些经典的老游戏了,多可惜呀!为啥MAME这么牛?守护历史:电子技术发展得太快,很多老游戏、...
开源 0
轻如羽,快如电 LuxTTS 语音克隆 一键整合包 CPU也能跑,30秒音频 1秒生成 v20260206

轻如羽,快如电 LuxTTS 语音克隆 一键整合包 CPU也能跑,30秒音频 1秒生成 v20260206

LuxTTS 项目介绍LuxTTS 是由开发者 Yatharth Sharma 创建的开源轻量级文本转语音(TTS)系统,专注于高质量零样本语音克隆与超高速推理。项目在保持卓越音质的同时,显著降低了计算资源需求,适用于资源受限环境下的语音合成任务。核心特性1. 零样本语音克隆仅需 3–5 秒参考音频即可克隆任意人声,无需针对目标说话人进行额外...
AI,开源 0
影像重获新生 SeedVR2 图片+视频批量超分神器 一键整合包 AI 超分,让每一帧都惊艳 v20260205

影像重获新生 SeedVR2 图片+视频批量超分神器 一键整合包 AI 超分,让每一帧都惊艳 v20260205

SeedVR2 图像/视频超分工具这是一款基于 ComfyUI-SeedVR2_VideoUpscaler 官方推理 CLI 开发的图形化 Web 封装工具。它提供了一个现代化、汉化且高度可配置的网页界面,使用户无需编写命令行代码即可轻松对图片和视频进行高质量的 AI 超分辨率处理。核心功能1. 多模态与批量处理图片超分:支持单张图片或批量上...
AI,开源 0
 开源免费无限制 RWKV Runner 开箱即用的AI软件-聊天 写作 作曲一键完成 附模型文件 v1.9.10

开源免费无限制 RWKV Runner 开箱即用的AI软件-聊天 写作 作曲一键完成 附模型文件 v1.9.10

今天在网上到处瞎逛的时候,发现个好东西,能让普通人也用上AI,无需复杂的配置,更神奇的是居然可以用我的AMD RX580跑起来。让你们先看下截图这是这个工具的全部截图。操作极其简单,如果要运行什么,会提示你去下载模型,下载模型会自动下载,为了节约大伙的时间,我已经把模型全部放在压缩包里面了。基本就实现了解压即可使用,下面看下我随便问几个问题。...
开源 0
Qwen3-TTS:让文字拥有灵魂的声音艺术家 文字生成语音 语音克隆 新增多人对话 一键整合包 v20260130

Qwen3-TTS:让文字拥有灵魂的声音艺术家 文字生成语音 语音克隆 新增多人对话 一键整合包 v20260130

Qwen3-TTS 开源项目介绍Qwen3-TTS 是由 Qwen 团队开发的一系列强大语音生成模型,于 2026 年 1 月 22 日正式发布。该项目提供全面的语音生成能力,包括语音克隆、语音设计、超高质量类人语音生成和基于自然语言的语音控制,为开发者和用户提供了目前最广泛的语音生成功能集。核心特性1. 多语言支持Qwen3-TTS 覆盖 ...
AI 0
神器 开源 一键安装!Pinokio 支持目前主流的大部分AI项目,操作极其简单  v6.0.10

神器 开源 一键安装!Pinokio 支持目前主流的大部分AI项目,操作极其简单 v6.0.10

这个工具全部都是免费的。我记得之前有个叫什么白的工具貌似还收费,这个基本上你听说过的AI开源项目 它都有,而且还是一键安装。一个工具整合AI绘画、AI视频、AI语音,还有AI数字人的工具:AI 绘画,又能 AI 对话、AI 视频生成、AI语音生成,还能 AI 数字人支持 W...
软件 0
Z-Image(造相)AI文生图  v20260128 一键整合包,支持批量生成图片,可直接用于生产的一键整合包

Z-Image(造相)AI文生图 v20260128 一键整合包,支持批量生成图片,可直接用于生产的一键整合包

Z-Image(造相)是阿里巴巴通义实验室(Tongyi MAI)推出的高效图像生成基础模型家族,以"小参数、高质量、极速推理"为核心设计理念,在开源图像生成领域树立了新的性能标杆。核心技术特点参数规模与架构:采用 60 亿参数(6B)的轻量级设计,基于创新的可扩展单流扩散 Transformer(S3-DiT)架构,将文...
AI 0
Qwen-Image-Edit-Object-Manipulator 一个工具搞定加物、去杂、缩放与服装设计 一键整合包 v20260128

Qwen-Image-Edit-Object-Manipulator 一个工具搞定加物、去杂、缩放与服装设计 一键整合包 v20260128

欢迎使用基于 Qwen-Image-Edit 模型的全功能 AI 图像编辑工具。本项目集成了先进的 SDNQ 量化技术,将庞大的大语言模型与扩散模型压缩至极致,在保持高质量输出效果的同时,大幅降低了显存占用并提升了推理速度。这不是一个简单的图像滤镜工具,而是一个能够理解复杂自然语言指令的“数字修图师”。通过动态加载专用的 LoRA 适配器,它...
AI 0
输入歌词,AI自动作曲:你的音乐创作助手 HeartMuLa 一键中文整合包 v20260126

输入歌词,AI自动作曲:你的音乐创作助手 HeartMuLa 一键中文整合包 v20260126

HeartMuLa/heartlib:开源音乐基础模型家族深度解析项目定位与愿景HeartMuLa是一个全面的开源音乐基础模型家族,旨在推动跨任务与多模态的大规模音乐理解与生成技术发展。该项目不仅仅是一个单一的模型,而是一个完整的生态系统,涵盖了从音乐理解到完整曲目生成的全链条能力。其核心目标是为研究社区和开发者提供可复现、可扩展的音乐AI工...
AI,开源 0
深度整合 FLUX.2-klein-base-9B:一款为内容创作者打造的本地化 AI 绘图+多图片编辑工具 一键整合包 v20260123

深度整合 FLUX.2-klein-base-9B:一款为内容创作者打造的本地化 AI 绘图+多图片编辑工具 一键整合包 v20260123

🎨 FLUX.2 Klein 本地图像生成与编辑工具 —— 功能详解这是一款基于FLUX.2 Klein 模型的本地化 AI 图像生成与编辑工具,专为内容创作者、自媒体运营者和设计师打造。无需联网,完全离线运行,支持文生图与图生图编辑,界面简洁直观,开箱即用。🖼️ 功能一:文生图(Text-to-Image)输入一段中文或英文提示词,即可生成...
AI 0
Qwen3-TTS 通义千问推出的高质量文本转语音工具,API调用,无字数限制,批量生成,小巧,轻量,无需显卡即可快速生成语音,剑二十七二次开发 一键整合包 v2060119 4.0

Qwen3-TTS 通义千问推出的高质量文本转语音工具,API调用,无字数限制,批量生成,小巧,轻量,无需显卡即可快速生成语音,剑二十七二次开发 一键整合包 v2060119 4.0

一、什么是 TTS?TTS(Text-To-Speech)是一种将文字转换为自然语音的技术,广泛应用于语音助手、有声书、导航播报、智能客服等场景。二、Qwen-TTS功能简介该项目提供了一个简单的 Web 界面(基于 Gradio),用户可以输入任意文本,并通过 Qwen 的 TTS 模型生成对应的语音文件。该工具支持中文和英文的语音合成。🔧...
AI 0
轻量、快速、免费、无需显卡 EasyTTS 重新定义本地 TTS 体验 一键整合包 v20260117

轻量、快速、免费、无需显卡 EasyTTS 重新定义本地 TTS 体验 一键整合包 v20260117

EasyTTS(由 GitHub 用户 yunchenqwq 开发)是一个专注于中文语音合成的开源文本转语音(Text-to-Speech, TTS)系统,其核心目标是提供一个无需复杂依赖、无需训练、本地运行、开箱即用的高质量 TTS 解决方案。该项目特别针对中文用户在实际使用中常见的痛点(如多音字错误、语调生硬、部署困难等)进行了优化,强调...
AI,开源 0
 VoiceSculptor:基于指令驱动的下一代语音合成开源框架——让AI语音拥有精准的情感与音色控制能力 v20260108 一键整合包

VoiceSculptor:基于指令驱动的下一代语音合成开源框架——让AI语音拥有精准的情感与音色控制能力 v20260108 一键整合包

🎵 VoiceSculptor - 指令驱动的语音合成模型📌 项目概述VoiceSculptor是由ASLP实验室(Audio, Speech and Language Processing Laboratory)开发的一款先进的指令式文本到语音(instruct text-to-speech)开源模型。2该项目代表了语音合成技术的前沿发展方...
开源 0
AI 绘万象,细节见真章:Qwen-Image-2512 专业AI图像生成 支持批量生成图片 一键整合包 v20260105

AI 绘万象,细节见真章:Qwen-Image-2512 专业AI图像生成 支持批量生成图片 一键整合包 v20260105

Qwen-Image-2512 图像生成器 一键整合包基于 Qwen3 大模型的专业级 AI 图像生成工具采用 BNB-NF4 4-bit 量化优化技术,在保障超高图像质量的同时显著降低硬件资源消耗,为创作者提供流畅、高效、稳定的 AI 绘图体验。搭载直观的 Gradio Web 界面,告别命令行,一键生成专业级图像。⚙️ 系统要求显卡:NV...
AI 0
GPT-SoVITS2507+SAVA46 一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包

GPT-SoVITS2507+SAVA46 一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包

GPT-SoVITS是一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成。该工具由RVC-Boss团队开发,并在GitHub上公开分享,为用户提供了一个灵活且功能丰富的平台,以满足语音合成的多样化需求。核心功能GPT-SoVITS的核心功能包括零样本和少样本TTS。零样本TTS允许用户仅通过输入一个5秒的语音样本,就能即时体...
AI,开源 0