造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图+人物一致性图片 一键整合包 20260130 v10.0

造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图+人物一致性图片 一键整合包 20260130 v10.0

Z-Image-Turbo Generator 是一个基于 Tongyi-MAI/Z-Image-Turbo 模型的高性能AI图像生成应用。通过简洁直观的Gradio界面,用户可以轻松生成高质量的1024x1024分辨率图像,特别擅长生成具有中国传统文化元素与现代风格融合的艺术作品。✨ 核心特性⚡ 极致性能优化8步极速生成:仅需8个推理步骤即...
AI,开源 1.1万 47
Qwen3-TTS:让文字拥有灵魂的声音艺术家 文字生成语音 语音克隆 新增多人对话 一键整合包 v20260130

Qwen3-TTS:让文字拥有灵魂的声音艺术家 文字生成语音 语音克隆 新增多人对话 一键整合包 v20260130

Qwen3-TTS 开源项目介绍Qwen3-TTS 是由 Qwen 团队开发的一系列强大语音生成模型,于 2026 年 1 月 22 日正式发布。该项目提供全面的语音生成能力,包括语音克隆、语音设计、超高质量类人语音生成和基于自然语言的语音控制,为开发者和用户提供了目前最广泛的语音生成功能集。核心特性1. 多语言支持Qwen3-TTS 覆盖 ...
AI 5558 6
神器 开源 一键安装!Pinokio 支持目前主流的大部分AI项目,操作极其简单  v6.0.10

神器 开源 一键安装!Pinokio 支持目前主流的大部分AI项目,操作极其简单 v6.0.10

这个工具全部都是免费的。我记得之前有个叫什么白的工具貌似还收费,这个基本上你听说过的AI开源项目 它都有,而且还是一键安装。一个工具整合AI绘画、AI视频、AI语音,还有AI数字人的工具:AI 绘画,又能 AI 对话、AI 视频生成、AI语音生成,还能 AI 数字人支持 W...
软件 5998 7
ollama 一款功能强大、易于使用的大型语言模型部署工具 附deepseek-r1+web 安装教程 v0.15.2

ollama 一款功能强大、易于使用的大型语言模型部署工具 附deepseek-r1+web 安装教程 v0.15.2

Ollama是一款功能强大的开源工具,旨在帮助用户轻松地在本地部署和运行大型语言模型(LLM)。这款软件的出现,极大地降低了普通开发者使用大语言模型的门槛,使得本地部署和体验大模型变得简单易行。无论是对于想要搭建自己AI应用的开发者,还是希望针对特定任务调优模型的科研人员,Ollama都是一个不可或缺的工具。首先,Ollama具备跨平台的能力...
开源 5799 2
Z-Image(造相)AI文生图  v20260128 一键整合包,支持批量生成图片,可直接用于生产的一键整合包

Z-Image(造相)AI文生图 v20260128 一键整合包,支持批量生成图片,可直接用于生产的一键整合包

Z-Image(造相)是阿里巴巴通义实验室(Tongyi MAI)推出的高效图像生成基础模型家族,以"小参数、高质量、极速推理"为核心设计理念,在开源图像生成领域树立了新的性能标杆。核心技术特点参数规模与架构:采用 60 亿参数(6B)的轻量级设计,基于创新的可扩展单流扩散 Transformer(S3-DiT)架构,将文...
AI 4180 9
音乐卡点视频 一键生成 支持图片+视频素材  新增镜头分镜切割+人声分离+ MTV 模式 支持A卡和N卡 剑二十七原创作品 KA v20260128

音乐卡点视频 一键生成 支持图片+视频素材 新增镜头分镜切割+人声分离+ MTV 模式 支持A卡和N卡 剑二十七原创作品 KA v20260128

卡点视频生成器是一款基于 AI大模型 智能视频自动生成工具,专为音乐爱好者、短视频创作者、自媒体运营者设计。它能根据你上传的音乐节拍/鼓点,自动从指定图片或视频素材中智能选取片段,生成节奏精准、视觉流畅的“卡点”视频,适用于抖音、快手、B站、Instagram 等平台。无需剪辑经验,一键生成专业级卡点视频!🎯 核心功能1. 🖼️ 图片卡点模式...
AI 8316 2
Qwen-Image-Edit-Object-Manipulator 一个工具搞定加物、去杂、缩放与服装设计 一键整合包 v20260128

Qwen-Image-Edit-Object-Manipulator 一个工具搞定加物、去杂、缩放与服装设计 一键整合包 v20260128

欢迎使用基于 Qwen-Image-Edit 模型的全功能 AI 图像编辑工具。本项目集成了先进的 SDNQ 量化技术,将庞大的大语言模型与扩散模型压缩至极致,在保持高质量输出效果的同时,大幅降低了显存占用并提升了推理速度。这不是一个简单的图像滤镜工具,而是一个能够理解复杂自然语言指令的“数字修图师”。通过动态加载专用的 LoRA 适配器,它...
AI 4706 0
开源人工智能的代码编辑器 Cursor 快速构建软件代码 v2.4.21

开源人工智能的代码编辑器 Cursor 快速构建软件代码 v2.4.21

Cursor是一款接入了人工智能的代码编辑器,支持windows,linux,mac平台,使用它能够帮助你快速构建构建代码。Cursor是一种快速构建软件代码的工具。它基于模板,可以帮助开发者快速生成代码。它可以在几秒钟内为程序员生成代码,从而帮助他们提高效率,节省时间和精力。Cursor具有许多功能和优点,使得它成为开发者们构建软件的首选工...
开源 5587 1
Jan 一个功能强大的开源ChatGPT替代品 支持deepseek v0.7.5

Jan 一个功能强大的开源ChatGPT替代品 支持deepseek v0.7.5

Jan:开源的ChatGPT替代品项目概述:Jan是一个开源的ChatGPT替代品,允许用户在其计算机上100%离线运行。这意味着用户无需网络连接即可使用AI功能。项目托管在GitHub上,由janhq团队维护,遵循AGPL-3.0许可证。功能特点:离线运行:Jan支持在任何硬件上运行,从个人电脑到多GPU集群,无需外部服务器或网络连接。多平...
软件 5476 0
开源 神器 Stability Matrix  一款功能强大、易于使用的Stable Diffusion管理工具 v2.15.5

开源 神器 Stability Matrix 一款功能强大、易于使用的Stable Diffusion管理工具 v2.15.5

Stability Matrix是由Lykos AI开发的一款革命性工具,专为简化Stable Diffusion的使用和管理而设计。作为一款多平台包管理器和推理用户界面,它极大地提升了Stable Diffusion的易用性和用户体验。核心功能多平台支持:Stability Matrix支持macOS、Windows和Linux系统,确保用...
AI,开源 5497 1
开源 简易语音工具包 用于语音识别、语音转录、语音转换等。Easy-Voice-Toolkit  v1.3.4

开源 简易语音工具包 用于语音识别、语音转录、语音转换等。Easy-Voice-Toolkit v1.3.4

🎙️ Easy-Voice-Toolkit —— 一体化开源语音处理工具箱将复杂的语音 AI 技术封装为直观易用的自动化工作流,零门槛构建从音频输入到语音合成的完整 pipeline。🔍 项目定位Easy-Voice-Toolkit 是一个模块化、全流程的语音处理平台,整合 Whisper、GPT-SoVITS 等主流开源技术,通过图形化界面...
开源 4864 7
输入歌词,AI自动作曲:你的音乐创作助手 HeartMuLa 一键中文整合包 v20260126

输入歌词,AI自动作曲:你的音乐创作助手 HeartMuLa 一键中文整合包 v20260126

HeartMuLa/heartlib:开源音乐基础模型家族深度解析项目定位与愿景HeartMuLa是一个全面的开源音乐基础模型家族,旨在推动跨任务与多模态的大规模音乐理解与生成技术发展。该项目不仅仅是一个单一的模型,而是一个完整的生态系统,涵盖了从音乐理解到完整曲目生成的全链条能力。其核心目标是为研究社区和开发者提供可复现、可扩展的音乐AI工...
AI,开源 6472 7
0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v10.51 支持LTX-2 Z-Image wan2.2 HunyuanVideo-1.5 数字人文生视频+图生视频+批量生成 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了

0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v10.51 支持LTX-2 Z-Image wan2.2 HunyuanVideo-1.5 数字人文生视频+图生视频+批量生成 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了

Wan2GP 是专为“显卡资源有限”的用户打造的**开源视频生成工具箱**。它把目前最先进的文生视频、图生视频、视频编辑模型(Wan 2.1、Hunyuan Video、LTX Video 等)做了重度优化和封装,让只有 6-8 GB 显存的旧显卡也能跑得动、跑得快,并提供了一整套 Web 界面与周边工具,做到“开箱即玩”。一句话总结:**把...
AI,开源 3万 138
"让AI有‘灵魂’的神器:开源项目免费下载,语音聊天不尬聊,打游戏能当军师,关键数据不传云端!" airi v0.8.1

"让AI有‘灵魂’的神器:开源项目免费下载,语音聊天不尬聊,打游戏能当军师,关键数据不传云端!" airi v0.8.1

Project AIRI 是一个基于大语言模型驱动的AI虚拟伴侣系统,旨在创建AI"女仆"(waifu)/虚拟角色的灵魂容器,将这些虚拟角色带入现实世界。该项目致力于重现Neuro-sama(一个知名的AI虚拟角色)的功能高度,完全由LLM和AI驱动。核心功能🎙️ 实时语音聊天支持与AI进行自然流畅的语音对话交互实现低延迟...
AI,开源 5469 12
开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v20250805 整合包 附全部模型

开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v20250805 整合包 附全部模型

下面文字是作者原话这是一个离线运行的本地语音识别转文字工具,基于 fast-whipser 开源模型,可将视频/音频中的人类声音识别并转为文字,可输出json格式、srt字幕带时间戳格式、纯文字格式。可用于自行部署后替代 openai 的语音识别接口或百度语音识别等,准确率基本等同openai官方api接口。部署或下载后,双击 start.e...
AI,开源 4951 6
深度整合 FLUX.2-klein-base-9B:一款为内容创作者打造的本地化 AI 绘图+多图片编辑工具 一键整合包 v20260123

深度整合 FLUX.2-klein-base-9B:一款为内容创作者打造的本地化 AI 绘图+多图片编辑工具 一键整合包 v20260123

🎨 FLUX.2 Klein 本地图像生成与编辑工具 —— 功能详解这是一款基于FLUX.2 Klein 模型的本地化 AI 图像生成与编辑工具,专为内容创作者、自媒体运营者和设计师打造。无需联网,完全离线运行,支持文生图与图生图编辑,界面简洁直观,开箱即用。🖼️ 功能一:文生图(Text-to-Image)输入一段中文或英文提示词,即可生成...
AI 3406 22
开源离线语音识别输入工具CapsWriter ——支持无限时长语音+音视频文件转录字幕 v2.2

开源离线语音识别输入工具CapsWriter ——支持无限时长语音+音视频文件转录字幕 v2.2

CapsWriter 是一款免费开源且可完全离线识别的语音输入工具,无需担心因在线版本识别带来的各种隐私泄露问题。支持win7及以上的系统,已经更新融合了语音输入以及音视频文件实现字幕转录的功能。相比某些必须在线识别又或者需要付费又有时长限制的app、软件或网站而言,此款良心多了,基本能满足大部分场合需求如会议记录或键盘失灵等。有需自取~~~...
开源 4718 7
Winxvideo AI 强大的AI视频转换处理软件 绿色便携版 v4.6.0105

Winxvideo AI 强大的AI视频转换处理软件 绿色便携版 v4.6.0105

Winxvideo-AI由 AI 驱动的视频工具包。 增强、转换、录制和编辑视频AI 驱动的顶级视频工具包。 不论是老旧、低质、噪声或模糊的影片/图像,都能升级至 4K,稳定抖动的影片,提升帧率至 120/240fps,并能以全面 GPU 加速进行转换、压缩、录制和编辑 4K/8K/HDR 影片,实现每一帧都具备影院级视觉效果。使用CineA...
软件 4638 8
Echo(回声)  文字合成语音 声音克隆AI工具 v1.1.0

Echo(回声) 文字合成语音 声音克隆AI工具 v1.1.0

B站UP主凯凯-你好 开发的一款文字合成语音 声音克隆工具,免费使用,操作简单“灵声妙语”是一款集创新、高效、个性化于一体的智能声音工具软件,它以其极简的设计风格、卓越的性能表现以及全球多平台覆盖的能力,赢得了广大用户的青睐。该软件以“让创意更简单,让艺术走进生活”为核心理念,致力于为用户提供极致的用户体验。从下载安装的那一刻起,用户就能感受...
软件 4579 4
LobeChat:打造属于你的全能 AI 助手,支持 40+ 大模型平台 开源  v1.143.2

LobeChat:打造属于你的全能 AI 助手,支持 40+ 大模型平台 开源 v1.143.2

lobehub/lobe-chat 是一个开源的、现代设计风格的 ChatGPT/大语言模型 (LLMs) 用户界面 (UI) 和框架。它旨在为用户提供高度灵活和可扩展的 AI 对话体验,支持多种大型语言模型(如 OpenAI GPT、Anthropic Claude、Google Gemini 等),并具备丰富的功能,使其适用于个人用户、开...
开源 4065 0
青梧字幕 —跨平台AI视频字幕智能提取翻译工具 附全部模型 v1.3.6

青梧字幕 —跨平台AI视频字幕智能提取翻译工具 附全部模型 v1.3.6

青梧字幕是一款免费简单易用的AI字幕智能提取+翻译工具,原理是利用模型自动识别5音视频文件当中的音频并生成为对应的语种字幕,实现提取及翻译后续处理操作。目前暂支持windows及mac(M及intel系例处理器)系统环境,支持识别中文、英语、日语、韩语等99种语言。毕竟市面上已有众多类似的字幕软件2或在线网页版,无非要么限制提取时长要么各种套...
软件 3967 7
Qwen3-TTS 通义千问推出的高质量文本转语音工具,API调用,无字数限制,批量生成,小巧,轻量,无需显卡即可快速生成语音,剑二十七二次开发 一键整合包 v2060119 4.0

Qwen3-TTS 通义千问推出的高质量文本转语音工具,API调用,无字数限制,批量生成,小巧,轻量,无需显卡即可快速生成语音,剑二十七二次开发 一键整合包 v2060119 4.0

一、什么是 TTS?TTS(Text-To-Speech)是一种将文字转换为自然语音的技术,广泛应用于语音助手、有声书、导航播报、智能客服等场景。二、Qwen-TTS功能简介该项目提供了一个简单的 Web 界面(基于 Gradio),用户可以输入任意文本,并通过 Qwen 的 TTS 模型生成对应的语音文件。该工具支持中文和英文的语音合成。🔧...
AI 7873 9
轻量、快速、免费、无需显卡 EasyTTS 重新定义本地 TTS 体验 一键整合包 v20260117

轻量、快速、免费、无需显卡 EasyTTS 重新定义本地 TTS 体验 一键整合包 v20260117

EasyTTS(由 GitHub 用户 yunchenqwq 开发)是一个专注于中文语音合成的开源文本转语音(Text-to-Speech, TTS)系统,其核心目标是提供一个无需复杂依赖、无需训练、本地运行、开箱即用的高质量 TTS 解决方案。该项目特别针对中文用户在实际使用中常见的痛点(如多音字错误、语调生硬、部署困难等)进行了优化,强调...
AI,开源 2529 0
新一代开源 免费 AI换脸神器 FaceFusion v3.5.2 中文版 支持AMD显卡+N卡 速度更快 支持50系显卡+批量换脸,效果更惊艳 操作更简单 附视频演示 20260116 更新

新一代开源 免费 AI换脸神器 FaceFusion v3.5.2 中文版 支持AMD显卡+N卡 速度更快 支持50系显卡+批量换脸,效果更惊艳 操作更简单 附视频演示 20260116 更新

FaceFusion这个AI换脸的项目已经太久没有更新了。作者终于在昨天更新了3.0,更新幅度大得惊人。这么久不更新,原来是一直在憋大招,这个CD冷却也太久了。。。我第一次时间就去做整合包了。本以为这还不是有手就行的事,但是有点难度。因为3.0更新太大了,所以之前版本的模型还有一些东西根本用不上了,我只能慢慢去研究了。搞半天最后把我的系统的c...
AI,开源 48.1万 3587
别再瞎试了!用这个神器,一键优化你的大模型提示词 Prompt Optimizer v2.4.0

别再瞎试了!用这个神器,一键优化你的大模型提示词 Prompt Optimizer v2.4.0

该项目聚焦于提升大语言模型(LLM)在实际应用中对提示语的理解与响应质量,旨在通过系统化的方法改进原始提示语的表达结构、清晰度和有效性,从而获得更准确、更稳定、更符合预期的模型输出。核心理念随着大模型在各类场景中的广泛应用,提示工程(Prompt Engineering)成为影响输出质量的关键因素。prompt-optimizer 的设计初衷...
AI,开源 2.8万 148
ChatLab:本地化聊天记录分析平台,AI 与 SQL 驱动的隐私优先方案 ChatLab v0.5.1

ChatLab:本地化聊天记录分析平台,AI 与 SQL 驱动的隐私优先方案 ChatLab v0.5.1

ChatLab 是一个免费、开源、专注于本地化聊天记录分析的桌面应用,致力于在保护用户隐私的前提下,利用 AI 与 SQL 引擎对社交数据进行深度挖掘与可视化。项目核心理念是“把分析能力留在本地,不上传你的聊天记录”。核心特点:本地优先,隐私保障所有聊天记录和用户配置均存储于本地 SQLite 数据库,分析过程完全在本地完成(AI 功能除外)...
开源 1990 0
一键修复老照片、智能上色、超清还原,去除水印 ,转动漫 ——全能AI图像编辑神器来了!beterpic v20260114

一键修复老照片、智能上色、超清还原,去除水印 ,转动漫 ——全能AI图像编辑神器来了!beterpic v20260114

—— 高清图像修复、增强与风格化处理工具本系统基于先进的 qwen 图片编辑模型 与 Nunchaku 量化技术 构建,结合 LoRA 微调模型支持,提供强大且高效的图像编辑能力。无论是老照片修复、人像增强、风景优化,还是黑白图上色,都能一键实现高质量输出。🔧 核心功能✅ 高清图像修复与增强支持上传任意分辨率图像(最小边自动放大至 1024p...
AI 1.2万 11
AI 图像魔法: 图片超分辨率 无损放大 x2x4 v1.0

AI 图像魔法: 图片超分辨率 无损放大 x2x4 v1.0

基于 image_gen_aux 和 Gradio 开发的通用图像增强工具。本项目集成了大量由 Phips 训练的高性能 AI 模型,支持图像去噪、去 JPEG 压缩痕迹、无损/有损放大以及动漫风格化处理。✨ 核心功能🤖 多模型支持:内置 60+ 种精选模型,涵盖 1x(修复)、2x(双倍放大)、4x(四倍放大)等多种分辨率增强需求。📱 移动...
AI 2165 0
不止于笔记:WitNote开启本地AI创作新时代 开源 v1.3.2

不止于笔记:WitNote开启本地AI创作新时代 开源 v1.3.2

WitNote(智简笔记本)是一款本地优先的AI写作伴侣,专为macOS和Windows平台设计。3项目秉承"大智若简,落笔生花"的核心理念,致力于为用户提供极简而强大的写作体验。1作为一款专注于隐私保护的写作工具,WitNote采用本地优先架构,确保用户数据安全,同时提供智能化的写作辅助功能。核心特性🔄 多引擎自由切换W...
开源 2973 0
 VoiceSculptor:基于指令驱动的下一代语音合成开源框架——让AI语音拥有精准的情感与音色控制能力 v20260108 一键整合包

VoiceSculptor:基于指令驱动的下一代语音合成开源框架——让AI语音拥有精准的情感与音色控制能力 v20260108 一键整合包

🎵 VoiceSculptor - 指令驱动的语音合成模型📌 项目概述VoiceSculptor是由ASLP实验室(Audio, Speech and Language Processing Laboratory)开发的一款先进的指令式文本到语音(instruct text-to-speech)开源模型。2该项目代表了语音合成技术的前沿发展方...
开源 2323 0
开源 Deep-Live-Cam v2.4 AI人工智能 图片视频换脸+直播换脸 汉化整合包 支持AMD+英伟达N卡50系

开源 Deep-Live-Cam v2.4 AI人工智能 图片视频换脸+直播换脸 汉化整合包 支持AMD+英伟达N卡50系

Deep-Live-Cam是一款由hacksider开发并维护的创新性软件,旨在为快速发展的AI生成媒体行业贡献一份力量。该软件的主要功能是通过深度学习技术,实现实时的人脸替换与增强,为艺术家、设计师以及内容创作者提供了一个强大的工具,帮助他们以全新的方式创作和表达。项目概述Deep-Live-Cam的核心价值在于其广泛的应用场景。艺术家可以...
AI,开源 1.6万 17
AI 绘万象,细节见真章:Qwen-Image-2512 专业AI图像生成 支持批量生成图片 一键整合包 v20260105

AI 绘万象,细节见真章:Qwen-Image-2512 专业AI图像生成 支持批量生成图片 一键整合包 v20260105

Qwen-Image-2512 图像生成器 一键整合包基于 Qwen3 大模型的专业级 AI 图像生成工具采用 BNB-NF4 4-bit 量化优化技术,在保障超高图像质量的同时显著降低硬件资源消耗,为创作者提供流畅、高效、稳定的 AI 绘图体验。搭载直观的 Gradio Web 界面,告别命令行,一键生成专业级图像。⚙️ 系统要求显卡:NV...
AI 3403 5