0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v11.26 支持Magi Human LTX-2.3 wan2.2 HunyuanVideo-1.5等 数字人文生视频+图生视频+批量生成 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了

0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v11.26 支持Magi Human LTX-2.3 wan2.2 HunyuanVideo-1.5等 数字文生视频+图生视频+批量生成 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了

Wan2GP 是专为“显卡资源有限”的用户打造的**开源视频生成工具箱**。它把目前最先进的文生视频、图生视频、视频编辑模型(Wan 2.1、Hunyuan Video、LTX Video 等)做了重度优化和封装,让只有 6-8 GB 显存的旧显卡也能跑得动、跑得快,并提供了一整套 Web 界面与周边工具,做到“开箱即玩”。一句话总结:**把...
AI,开源 0
一键克隆任意人声!VoxCPM 2.02 开源语音大模型,无需训练,3秒搞定声音复刻!支持30种语言,9种方言,支持情绪表达+语气标签。最低8G英伟达即可运行 剑二十七二开汉化整合包 v20260410

一键克隆任意声!VoxCPM 2.02 开源语音大模型,无需训练,3秒搞定声音复刻!支持30种语言,9种方言,支持情绪表达+语气标签。最低8G英伟达即可运行 剑二十七二开汉化整合包 v20260410

VoxCPM 是一个支持中英文、零样本语音克隆、情感可控、音素/公式输入的统一端到端语音合成大模型。它不依赖传统 TTS 流水线(如文本分析 → 音素对齐 → 声码器),而是直接从文本生成高质量语音波形。🎯 目标:打造一个像大语言模型一样“通用、灵活、强大”的语音生成基础模型。🔧 核心特性(技术亮点)1. ✅ 端到端架构(End-to-End...
AI,开源 0
音乐卡点视频 一键生成 支持图片+视频素材  新增镜头分镜切割+人声分离+ MTV 模式+音频编辑 无显卡要求 剑二十七原创作品 KA v20260328

音乐卡点视频 一键生成 支持图片+视频素材 新增镜头分镜切割+声分离+ MTV 模式+音频编辑 无显卡要求 剑二十七原创作品 KA v20260328

卡点视频生成器是一款基于 AI大模型 智能视频自动生成工具,专为音乐爱好者、短视频创作者、自媒体运营者设计。它能根据你上传的音乐节拍/鼓点,自动从指定图片或视频素材中智能选取片段,生成节奏精准、视觉流畅的“卡点”视频,适用于抖音、快手、B站、Instagram 等平台。无需剪辑经验,一键生成专业级卡点视频!🎯 核心功能1. 🖼️ 图片卡点模式...
AI 0
造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图+人物一致性图片+自定义lora 一键整合包 20260326 v17

造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图+物一致性图片+自定义lora 一键整合包 20260326 v17

Z-Image-Turbo Generator 是一个基于 Tongyi-MAI/Z-Image-Turbo 模型的高性能AI图像生成应用。通过简洁直观的Gradio界面,用户可以轻松生成高质量的1024x1024分辨率图像,特别擅长生成具有中国传统文化元素与现代风格融合的艺术作品。✨ 核心特性⚡ 极致性能优化8步极速生成:仅需8个推理步骤即...
AI,开源 0
开源 Deep-Live-Cam v2.7 beta AI人工智能 图片视频换脸+直播换脸 汉化整合包 支持AMD+英伟达N卡50系

开源 Deep-Live-Cam v2.7 beta AI工智能 图片视频换脸+直播换脸 汉化整合包 支持AMD+英伟达N卡50系

Deep-Live-Cam是一款由hacksider开发并维护的创新性软件,旨在为快速发展的AI生成媒体行业贡献一份力量。该软件的主要功能是通过深度学习技术,实现实时的人脸替换与增强,为艺术家、设计师以及内容创作者提供了一个强大的工具,帮助他们以全新的方式创作和表达。项目概述Deep-Live-Cam的核心价值在于其广泛的应用场景。艺术家可以...
AI,开源 0
 开源 免费 Koboldcpp 人人可玩的本地大模型 不管啥显卡,cpu也能跑 附视频演示 支持deepseek v1.109.2

开源 免费 Koboldcpp 可玩的本地大模型 不管啥显卡,cpu也能跑 附视频演示 支持deepseek v1.109.2

KoboldCpp是一款易于使用的人工智能文本生成软件,适用于GGML和GGUF模型。这是一个可从Concedo分发的单一自包含版本,它建立在llama.cpp的基础上,并添加了一个多功能的Kobold API端点、额外的格式支持、稳定的扩散图像生成、向后兼容性以及一个具有持久故事、编辑工具、保存格式、内存、世界信息、作者注释、人物、场景和K...
开源 0
多图预览 思源笔记 优秀的个人知识库管理软件  v3.5.4

多图预览 思源笔记 优秀的个知识库管理软件 v3.5.4

思源笔记是一款本地优先的开源免费个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。你可以使用官方提供了云服务进行笔记存储,云服务是需要付费使用的,其他的功能完全免费,另外它支持私有化部署,你可以使用docker镜像在自己的服务器上进行部署,用来同步知识库。思源笔记提供了全平台支持,你可以在任意设备上使用,SiYuan 也提供了「网...
开源 0
filebrowser 你的私人云盘:一个网页就能管理所有文件 附使用教程 v1.1.2-stable

filebrowser 你的私云盘:一个网页就能管理所有文件 附使用教程 v1.1.2-stable

FileBrowser Quantum 是一款革命性的开源文件管理工具,它让您可以轻松通过网页界面访问和管理文件系统。这个项目的目标是成为最好的开源自托管文件浏览应用,而且完全免费。核心价值这个被称为"Quantum"(量子)的版本,将大量高级功能压缩到一个轻量级、易于运行的程序中。与市场上其他同类工具相比,FileBro...
开源 0
免费 AI 人声 替换AI 唱歌 伴奏分离软件 Replay 附视频演示和教程 v8.7.0

免费 AI 声 替换AI 唱歌 伴奏分离软件 Replay 附视频演示和教程 v8.7.0

上面是这个工具的视频演示和教程。基本上是有手就行了。早几天分享的文字转语音工具,有小伙伴在问是否有人声替换工具?今天分享这个的工具 不仅是人声替换,还可以分离人声,AI唱歌就太简单了。像网上流传很广的孙燕姿唱周杰伦的歌这类的视频和教程已经很多了。我之前也不是没有研究过,但是一直没有分享是因为这类教程对于普通的小伙伴来讲入门的门槛有点高,操作...
软件 0
Qwen3-TTS:让文字拥有灵魂的声音艺术家 文字生成语音 语音克隆 新增多人对话 一键整合包 v20260130

Qwen3-TTS:让文字拥有灵魂的声音艺术家 文字生成语音 语音克隆 新增多对话 一键整合包 v20260130

Qwen3-TTS 开源项目介绍Qwen3-TTS 是由 Qwen 团队开发的一系列强大语音生成模型,于 2026 年 1 月 22 日正式发布。该项目提供全面的语音生成能力,包括语音克隆、语音设计、超高质量类人语音生成和基于自然语言的语音控制,为开发者和用户提供了目前最广泛的语音生成功能集。核心特性1. 多语言支持Qwen3-TTS 覆盖 ...
AI 0
开源人工智能的代码编辑器 Cursor 快速构建软件代码 v2.4.21

开源工智能的代码编辑器 Cursor 快速构建软件代码 v2.4.21

Cursor是一款接入了人工智能的代码编辑器,支持windows,linux,mac平台,使用它能够帮助你快速构建构建代码。Cursor是一种快速构建软件代码的工具。它基于模板,可以帮助开发者快速生成代码。它可以在几秒钟内为程序员生成代码,从而帮助他们提高效率,节省时间和精力。Cursor具有许多功能和优点,使得它成为开发者们构建软件的首选工...
开源 0
FFmpeg小白助手 音视频批量处理工具 【小白救星、懒人福音】

FFmpeg小白助手 音视频批量处理工具 【小白救星、懒福音】

这个软件适合不想去学ffmpeg命令的小伙伴了。直接拿来就可以用了,如果想进一步了解学习 可以去看看我之前发布的ffmpeg教程 FFmpeg】FFmpeg是一款开源软件,可以处理多种多媒体媒体数据程序。是目前最受欢迎的视频和图像处理软件。FFmpeg小白助手】在FFmpeg基础上开发的一款自动化处理软件,以最简单的方式快速批量处理...
软件 0
人工智能AI相关工具软件 合集整理

工智能AI相关工具软件 合集整理

一键修复老照片、智能上色、超清还原,去除水印 ,转动漫 ——全能AI图像编辑神器来了!beterpic造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图 一键整合包一键生成AI绘画提示词:让你的图片秒变顶级写真描述 跟之前的图片反推工具不同的是这个会思考 thinkpic视频4倍高清修复,一键...
AI,软件 0
俄罗斯牛人开发 窗口系统菜单、功能扩展插件 SmartSystemMenu v2.32.1

俄罗斯牛开发 窗口系统菜单、功能扩展插件 SmartSystemMenu v2.32.1

介绍SmartSystemMenu 是一个轻量级的 Windows 工具,它通过在窗口标题栏中添加一个隐藏菜单(点击鼠标左键或右键唤出),提供了一系列实用的窗口管理和系统操作功能。这个菜单默认是隐藏的,不会干扰正常操作,只有在需要时才会出现。🚀 主要功能亮点1. 🖱️ 鼠标手势菜单在任意窗口标题栏点击鼠标左键或右键即可呼出菜单菜单内容简洁明了...
开源 0
NextChat 一键免费部署私人 ChatGPT 服务开源工具 v2.16.1

NextChat 一键免费部署私 ChatGPT 服务开源工具 v2.16.1

NextChat 是一款基于现代 Web 技术栈构建的全栈开源聊天应用模板,旨在帮助开发者快速搭建高性能、可扩展的实时通信平台。该项目由社区驱动,采用前沿技术组合,为初创企业、开发者及教育机构提供了开箱即用的聊天解决方案。核心技术栈NextChat 以 Next.js 13 为核心框架,结合 TypeScript...
开源 0
一款轻量化开源跨平台文本笔记工具,支持多终端免费同步,多人协作 simplenote-electron v2.24.0

一款轻量化开源跨平台文本笔记工具,支持多终端免费同步,多协作 simplenote-electron v2.24.0

Simplenote-electron 的核心功能是为用户提供更多平台上的笔记记录和同步体验。它支持以下主要功能:跨平台支持:通过 Electron 框架,Simplenote-electron 可以在 Windows 和 Linux 上运行,确保用户在不同操作系统上都能使用 Simplenote 的核心功能。简洁的 UI:项目基于 Reac...
开源 0
GLM-TTS 大语言模型重塑语音合成 3秒克隆人声?GLM-TTS 做到了!声音克隆相似度极高 一键整合包 v20251212

GLM-TTS 大语言模型重塑语音合成 3秒克隆声?GLM-TTS 做到了!声音克隆相似度极高 一键整合包 v20251212

GLM-TTS是由ZAI 组织开发并开源的高质量文本转语音(Text-to-Speech, TTS)系统。它基于大语言模型(LLM),专注于实现可控、富有情感表达的零样本语音克隆,并通过多奖励强化学习框架显著提升传统 TTS 系统的自然度与表现力。核心特性🗣️ 零样本语音克隆仅需3–10 秒的目标说话人提示音频,即可克隆任意声音,无需微调或说...
AI,开源 0
开源 AI人脸替换工具离线版V8.7 兼容50系列显卡 CPU、显存占用优化,速度更快 一张图实现视频或者图片换脸,完全免费!附演示和教程视频

开源 AI脸替换工具离线版V8.7 兼容50系列显卡 CPU、显存占用优化,速度更快 一张图实现视频或者图片换脸,完全免费!附演示和教程视频

这是热心网友万能君做的一个整合包,整合包里面已经包含了几个换脸项目和一些高清修复功能等,具体可以看下图截图所示。要顺利使用这个工具,必须做好以下几点第一个 这个工具只支持CPU+N卡。如果需要使用N卡,一定要先安装好驱动和CUDA。第二个 一定要安装好运行库。https://www.jian27.com/html/2290.html第三个 所...
AI 0
开源 免费 离线 gtp4 语音大模型搭建极其简单无需GPU 聊天机器人 gpt4all v3.10.0 附最新模型 支持deepseek

开源 免费 离线 gtp4 语音大模型搭建极其简单无需GPU 聊天机器 gpt4all v3.10.0 附最新模型 支持deepseek

上面是教程开源 免费 离线 gtp4 语音大模型搭建极其简单无需GPU安装极其简单,基本就是点几下,然后倒入模型后就可以使用,无须联网。免费,无任何限制。我玩了好多天了,很稳定。效率也不错,才分享出来的。GPT4All是一款引人注目的软件,它为用户提供了一个在本地设备上运行大型语言模型(LLM)的平台。无需昂贵的硬件或持续的网络连接,GPT...
开源 0
一键整合包 Step-Audio-EditX  v20251112 解压即用,支持情绪/方言/语气词!让AI说话像真人一样“有血有肉”

一键整合包 Step-Audio-EditX v20251112 解压即用,支持情绪/方言/语气词!让AI说话像真一样“有血有肉”

🧠 什么是 Step-Audio-EditX?Step-Audio-EditX 是由 StepFun AI 团队开源的一款 30 亿参数(3B)的大语言模型(LLM)驱动的先进音频编辑系统,专注于 高表现力、可迭代、细粒度的语音编辑与零样本语音合成(TTS)。它不仅能高质量克隆任意人声,还能对语音的情绪、说话风格、副语言特征(如笑声、叹息等)...
AI,开源 0
输入一段歌词,AI 自动生成带人声+伴奏的歌(支持中文) 腾讯开源“AI 作曲” SongGeneration v20251109 一键整合包

输入一段歌词,AI 自动生成带声+伴奏的歌(支持中文) 腾讯开源“AI 作曲” SongGeneration v20251109 一键整合包

腾讯 AI Lab 推出的一个 “AI 自动生成完整歌曲” 的免费工具。你只需要提供一段歌词,它就能帮你自动配上人声 + 伴奏,生成一首像模像样的歌,支持中文和英文!🎤 它能做什么?你写歌词,AI 唱出来:你只要写下带结构的歌词(比如“[主歌]……[副歌]……”),AI 会自动配上旋律、人声和背景音乐。支持风格定制:你可以指定歌曲风格(比如“...
AI,开源 0
告别视频手动分类!AI 自动识别视频人物、场景与行为 AI 智能视频分析与自动分类 27sift v1.0

告别视频手动分类!AI 自动识别视频物、场景与行为 AI 智能视频分析与自动分类 27sift v1.0

基于 Ovis2.5-2B 多模态大模型 · 中文支持 · 批量处理 · 智能检索✨ 核心功能🔍 智能视频内容理解自动分析视频内容,生成结构化中文描述,包括:人物性别、年龄段(儿童/少年/青年/中年/老年)发型发色、服装款式与颜色动作行为(如跳水、游泳、站立、互动)场景环境(户外/室内、植被、天气、水域类型)3等等⚡ 高效批量处理递归扫描整个...
AI 0
Kani TTS:轻量、流式、类人 — 开源AI语音合成系统一键整合包  v20251008

Kani TTS:轻量、流式、类 — 开源AI语音合成系统一键整合包 v20251008

🎙️ Kani TTS — 高质量、模块化、类人语音合成开源项目Kani TTS 是一个由 nineninesix-ai维护的开源文本到语音(TTS)系统,致力于从文本输入生成高质量、自然流畅的语音。项目支持本地独立运行与Web 流式服务,适用于开发、研究及个性化 TTS 场景。GitHub 仓库地址:https://github.com/n...
AI,开源 0
IndexTTS  v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS v2.0 重新定义中文语音合成,让AI发音比真更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS是由B站推出的一款基于XTTS和Tortoise的GPT风格文本转语音(TTS)模型。该项目在中文文本转语音领域展现出显著的技术优势和应用,以下从项目背景、技术架构、应用场景、社区支持及未来挑战五个维度进行详细介绍。一、项目背景:重新定义中文TTS技术标杆IndexTTS的诞生旨在解决传统TTS系统在中文语音合成中的两大核心痛...
AI,软件 0
开源免费+无广告+自己掌控数据——这才是真正的私人记账工具 ezbookkeeping v1.0.1

开源免费+无广告+自己掌控数据——这才是真正的私记账工具 ezbookkeeping v1.0.1

一个由开发者 mayswind 创建的开源个人记账工具,名为 EZBookkeeping(简易记账)。该项目旨在为个人用户提供一个轻量、简洁、自托管、无广告、注重隐私的记账解决方案,支持多平台使用(如 Web、移动端适配),并可部署在本地或私有服务器上。🧾 项目核心特性1. 自托管 & 隐私优先所有数据存储在用户自己的服务器或本地设备...
开源 0
"字节跳动放大招:AI绘画终于能'换装不换人'了!" 能保持主体一致性 USO v20250903 一键整合包

"字节跳动放大招:AI绘画终于能'换装不换'了!" 能保持主体一致性 USO v20250903 一键整合包

🌟 USO:字节跳动开源的内容与风格解耦统一框架🔍 项目简介USO (Unified Style-Subject Optimized) 是字节跳动UXO团队推出的创新性开源项目,全称为"内容与风格解耦与重组统一框架"。该项目旨在解决图像生成领域中长期存在的风格与内容难以平衡的技术难题,为AI图像创作提供更灵活、更高质量的解...
AI,开源 0
开源免费、无时间限制 数字人 图片+音频一键生成视频 InfiniteTalk v20250825

开源免费、无时间限制 数字 图片+音频一键生成视频 InfiniteTalk v20250825

InfiniteTalk 是由 MeiGen-AI 团队开发的先进开源项目,专注于解决长视频生成中的关键挑战——实现无限长度的高质量会说话视频生成。该项目突破了传统数字人技术的时长限制,能够生成任意长度的自然流畅的"会说话"视频内容。核心功能与特点1. 无限长度视频生成突破性技术:解决了传统TTS(文本转语音)和数字人视频...
AI,开源 0
赛博算命上线!让人工智能为你抽一支未来签 赛博算命师 一键整合包 v20250823

赛博算命上线!让工智能为你抽一支未来签 赛博算命师 一键整合包 v20250823

🔮 什么是 CyberFortune_Telling?这是一个基于人工智能模型驱动的虚拟占卜系统。它可能结合了自然语言处理、生成模型与命理知识库,能够根据用户输入的信息(如生辰、问题、关键词等),生成个性化的运势解读、塔罗牌占卜、星座分析或签文预测等内容。界面充满赛博朋克美学,科技感与神秘主义交织,带来前所未有的互动体验。🤖 技术亮点:基于M...
AI 0
EchoMimic 一个由阿里巴巴推出的开源AI数字人项目 支持50系显卡 一键整合包 v3 20250815更新

EchoMimic 一个由阿里巴巴推出的开源AI数字项目 支持50系显卡 一键整合包 v3 20250815更新

EchoMimic是一个由阿里巴巴推出的开源AI数字人项目,该项目在数字人技术领域内实现了显著的创新与突破。以下是对EchoMimic的详细介绍:一、项目背景与意义随着人工智能、深度学习、计算机视觉以及自然语言处理技术的飞速发展,数字人技术逐渐成为连接现实世界与虚拟世界的重要桥梁。EchoMimic项目的诞生,旨在通过先进的技术手段,将静态图...
AI,开源 0
E2/F5-TTS AI人工智能 文字转语音工具,可克隆声音,可训练,一键中文整合包 已支持最新50系显卡 v1.1.7

E2/F5-TTS AI工智能 文字转语音工具,可克隆声音,可训练,一键中文整合包 已支持最新50系显卡 v1.1.7

SWivid/F5-TTS 是一个开源项目,旨在提供一个基于 Diffusion Transformer 和 ConvNeXt V2 架构的文本到语音(TTS)系统,该系统名为 F5-TTS。F5-TTS 的全称是“A Fairytaler that Fakes Fluent and Faithful Speech with Flow Mat...
AI,开源 0
多图预览 免费开源个人财务管理工具 HomeBank v5.9.4

多图预览 免费开源个财务管理工具 HomeBank v5.9.4

介绍HomeBank 是一款开源免费财务管理软件,可帮助您管理个人账户和开支。HomeBank 易于使用图形和自定义过滤器,旨在为您提供财务概览。如果您正在寻找一个完全免费,简单的应用程序来管理您的个人会计,预算和财务:HomeBank 应该是首选软件。软件截图软件特点导入\导出数据从多种格式导入:从 Quicken 或 Microsoft ...
开源 0