软件 工具 # 音频处理 # 人工智能 # AI 免费 AI 人声 替换AI 唱歌 伴奏分离软件 Replay 附视频演示和教程 v8.7.0 上面是这个工具的视频演示和教程。基本上是有手就行了。早几天分享的文字转语音工具,有小伙伴在问是否有人声替换工具?今天分享这个的工具 不仅是人声替换,还可以分离人声,AI唱歌就太简单了。像网上流传很广的孙燕姿唱周杰伦的歌这类的视频和教程已经很多了。我之前也不是没有研究过,但是一直没有分享是因为这类教程对于普通的小伙伴来讲入门的门槛有点高,操作... 2026-2-6 软件 2.4万 57
AI#开源 翻译 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 字幕 # 整合包 开源 免费 pyVideoTrans v3.96 视频翻译开源软件 自动识别并生成字幕后,翻译 + 配音 绿色免安装 这个工具我用来很长一段时间了,只是我居然一直忘记给大伙分享出来,直到昨天群里有人在问这样的工具。我才想起来把这个分享出来给大伙。虽然这个工具的标题叫视频翻译,实际上远远不只这些功能,我一直用这个工具来做字幕识别,比如我以前的教程那些字幕很多都是这个工具帮我做的。识别率也很高,超级方便。本来想今天一早就分享出来,但是事情比较多,又是瞎折腾的一天... 2026-2-6 AI,开源 1.5万 29
AI 语音 # 音乐 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 语音工具 # 效率工具 # 整合包 ACE-Step-1.5 解锁音乐创作无限可能,以技术革新重塑音乐生成生态,AI生成音乐 翻唱音乐 重绘音乐 支持中文 v20260206 ACE-Step是一个开源的音乐生成基础模型项目,旨在通过全面的架构设计克服现有音乐生成方法的局限性,并实现最先进的性能。以下是对该项目的详细介绍:项目背景与目标:ACE-Step项目针对当前音乐生成方法中存在的生成速度、音乐连贯性和可控性之间的权衡问题,提出了一种新的解决方案。项目的目标是建立一个快速、通用、高效且灵活的音乐AI基础模型,使... 2026-2-5 AI 4728 7
AI#开源 图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 图片放大 # 效率工具 # 整合包 影像重获新生 SeedVR2 图片+视频批量超分神器 一键整合包 AI 超分,让每一帧都惊艳 v20260205 SeedVR2 图像/视频超分工具这是一款基于 ComfyUI-SeedVR2_VideoUpscaler 官方推理 CLI 开发的图形化 Web 封装工具。它提供了一个现代化、汉化且高度可配置的网页界面,使用户无需编写命令行代码即可轻松对图片和视频进行高质量的 AI 超分辨率处理。核心功能1. 多模态与批量处理图片超分:支持单张图片或批量上... 2026-2-4 AI,开源 2848 0
开源 开源 # 人工智能 # AI # 免费 # 聊天 # 写作 开源免费无限制 RWKV Runner 开箱即用的AI软件-聊天 写作 作曲一键完成 附模型文件 v1.9.10 今天在网上到处瞎逛的时候,发现个好东西,能让普通人也用上AI,无需复杂的配置,更神奇的是居然可以用我的AMD RX580跑起来。让你们先看下截图这是这个工具的全部截图。操作极其简单,如果要运行什么,会提示你去下载模型,下载模型会自动下载,为了节约大伙的时间,我已经把模型全部放在压缩包里面了。基本就实现了解压即可使用,下面看下我随便问几个问题。... 2026-2-3 开源 8646 13
开源 工具 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 效率工具 # deepseek 开源 Cherry Studio 一个支持多模型服务的桌面客户端工具 支持deepseek v1.7.15 Cherry Studio是一款专为专业用户打造的桌面客户端,它支持多模型服务,集成了超过300多个大语言模型,涵盖了30多个行业,旨在帮助用户在多种场景下提升工作效率。这款软件的设计初衷是满足各行各业对GPT技术的需求,无论是开发者、设计师还是作家,都能从中受益。对于开发者而言,Cherry Studio是一个强大的代码伙伴。它可以进行代码... 2026-2-3 开源 7611 3
开源 工具 # 视频处理 # 图片处理 # 人工智能 # AI # 图片放大 # 无损放大 开源 Waifu2x Extension-GUI(AI图片视频放大) 一款功能强大的图像/视频增强工具 v3.134.01 Waifu2x Extension-GUI是一款功能强大的图像增强工具,基于Waifu2x库开发,提供了一个直观易用的图形界面。该工具旨在通过深度学习技术,特别是卷积神经网络(CNN),来无损放大和优化二次元风格的图像,同时也适用于普通照片。主要功能与特点:图像放大:无论是动漫还是现实生活中的照片,都可以通过该工具进行无损放大,保持原有的清晰... 2026-2-3 开源 7359 9
AI#开源 图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 效率工具 # 整合包 轻量 高效 AI生图工具 基于 Stable Diffusion XL 模型二次开发,6G英伟达显卡就可以愉快玩耍 Diaomo v8.0 六秒出图 支持更换模型+图片超分+图生图 CyberIllustrious是一个基于 Stable Diffusion模型架构的二次创作(LoRA 或 Dreambooth)模型,主要专注于生成具有“未来感”、“赛博朋克”和“华丽视觉风格”的高质量插画内容。它通常被用于图像生成平台如 NovelAI、Stable Diffusion WebUI或 ComfyUI中。🧠 模型简介项目内... 2026-2-2 AI,开源 1.3万 31
软件#开源 开源 # 抠像 # 抠图 # 人工智能 # AI # 免费 开源 免费 视频AI自动抠像 速度快 操作简单 效果很是惊艳 值得珍藏 RobustVideoMattingGUI v1.1.3 之前分享的图片抠像,有些小伙伴在问是否有视频抠像的,那必须要有啊。这个工具我也是放在我的收藏夹里面好久了,今天就分享出来。我的好东西多的是就怕你们硬盘空间不够。这个软件解压后近8G。先看视频演示 这个开源项目真的是很良心了,抠像真的是不错,我个人觉得已经很媲美剪映那个抠像了。目前不支持N卡,我只能用cpu来跑,但是效率还可以,我10多秒的视频... 2026-2-1 软件,开源 6749 12
AI 语音 # 工具 # 日常应用 # 文本 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 语音工具 # 效率工具 # 整合包 Qwen3-TTS:让文字拥有灵魂的声音艺术家 文字生成语音 语音克隆 新增多人对话 一键整合包 v20260130 Qwen3-TTS 开源项目介绍Qwen3-TTS 是由 Qwen 团队开发的一系列强大语音生成模型,于 2026 年 1 月 22 日正式发布。该项目提供全面的语音生成能力,包括语音克隆、语音设计、超高质量类人语音生成和基于自然语言的语音控制,为开发者和用户提供了目前最广泛的语音生成功能集。核心特性1. 多语言支持Qwen3-TTS 覆盖 ... 2026-1-30 AI 6195 6
软件 工具 # 神器 # 开源 # 人工智能 # AI 神器 开源 一键安装!Pinokio 支持目前主流的大部分AI项目,操作极其简单 v6.0.10 这个工具全部都是免费的。我记得之前有个叫什么白的工具貌似还收费,这个基本上你听说过的AI开源项目 它都有,而且还是一键安装。一个工具整合AI绘画、AI视频、AI语音,还有AI数字人的工具:AI 绘画,又能 AI 对话、AI 视频生成、AI语音生成,还能 AI 数字人支持 W... 2026-1-29 软件 6388 7
AI 图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包 # 文生图 Z-Image(造相)AI文生图 v20260128 一键整合包,支持批量生成图片,可直接用于生产的一键整合包 Z-Image(造相)是阿里巴巴通义实验室(Tongyi MAI)推出的高效图像生成基础模型家族,以"小参数、高质量、极速推理"为核心设计理念,在开源图像生成领域树立了新的性能标杆。核心技术特点参数规模与架构:采用 60 亿参数(6B)的轻量级设计,基于创新的可扩展单流扩散 Transformer(S3-DiT)架构,将文... 2026-1-28 AI 4760 10
AI 图像处理 # 工具 # 图像编辑 # 图形图像 # 图片处理 # 人工智能 # AI # 语音工具 # 整合包 Qwen-Image-Edit-Object-Manipulator 一个工具搞定加物、去杂、缩放与服装设计 一键整合包 v20260128 欢迎使用基于 Qwen-Image-Edit 模型的全功能 AI 图像编辑工具。本项目集成了先进的 SDNQ 量化技术,将庞大的大语言模型与扩散模型压缩至极致,在保持高质量输出效果的同时,大幅降低了显存占用并提升了推理速度。这不是一个简单的图像滤镜工具,而是一个能够理解复杂自然语言指令的“数字修图师”。通过动态加载专用的 LoRA 适配器,它... 2026-1-27 AI 5181 2
开源 编程工具 # 编程开发 # 开源 # 人工智能 # AI # 代码 # 效率工具 开源人工智能的代码编辑器 Cursor 快速构建软件代码 v2.4.21 Cursor是一款接入了人工智能的代码编辑器,支持windows,linux,mac平台,使用它能够帮助你快速构建构建代码。Cursor是一种快速构建软件代码的工具。它基于模板,可以帮助开发者快速生成代码。它可以在几秒钟内为程序员生成代码,从而帮助他们提高效率,节省时间和精力。Cursor具有许多功能和优点,使得它成为开发者们构建软件的首选工... 2026-1-27 开源 5739 1
AI#开源 工具 # 神器 # 绿色软件 # 开源 # 人工智能 # AI # 多图预览 # 效率工具 # 整合包 开源 神器 Stability Matrix 一款功能强大、易于使用的Stable Diffusion管理工具 v2.15.5 Stability Matrix是由Lykos AI开发的一款革命性工具,专为简化Stable Diffusion的使用和管理而设计。作为一款多平台包管理器和推理用户界面,它极大地提升了Stable Diffusion的易用性和用户体验。核心功能多平台支持:Stability Matrix支持macOS、Windows和Linux系统,确保用... 2026-1-27 AI,开源 5751 1
开源 工具 # 系统工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包 开源 简易语音工具包 用于语音识别、语音转录、语音转换等。Easy-Voice-Toolkit v1.3.4 🎙️ Easy-Voice-Toolkit —— 一体化开源语音处理工具箱将复杂的语音 AI 技术封装为直观易用的自动化工作流,零门槛构建从音频输入到语音合成的完整 pipeline。🔍 项目定位Easy-Voice-Toolkit 是一个模块化、全流程的语音处理平台,整合 Whisper、GPT-SoVITS 等主流开源技术,通过图形化界面... 2026-1-26 开源 5095 7
AI#开源 工具 # 日常应用 # 音乐 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包 输入歌词,AI自动作曲:你的音乐创作助手 HeartMuLa 一键中文整合包 v20260126 HeartMuLa/heartlib:开源音乐基础模型家族深度解析项目定位与愿景HeartMuLa是一个全面的开源音乐基础模型家族,旨在推动跨任务与多模态的大规模音乐理解与生成技术发展。该项目不仅仅是一个单一的模型,而是一个完整的生态系统,涵盖了从音乐理解到完整曲目生成的全链条能力。其核心目标是为研究社区和开发者提供可复现、可扩展的音乐AI工... 2026-1-26 AI,开源 7056 11
AI#开源 语音 # 神器 # 人工智能 # AI # 文字 # 字幕 # 识别 # 利器 # 整合包 开源 免费 AI语音识别转文字工具,制作视频字幕的利器 stt v20250805 整合包 附全部模型 下面文字是作者原话这是一个离线运行的本地语音识别转文字工具,基于 fast-whipser 开源模型,可将视频/音频中的人类声音识别并转为文字,可输出json格式、srt字幕带时间戳格式、纯文字格式。可用于自行部署后替代 openai 的语音识别接口或百度语音识别等,准确率基本等同openai官方api接口。部署或下载后,双击 start.e... 2026-1-23 AI,开源 5200 6
AI 图像处理 # 工具 # 日常应用 # 图像编辑 # 绿色软件 # 图形图像 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包 深度整合 FLUX.2-klein-base-9B:一款为内容创作者打造的本地化 AI 绘图+多图片编辑工具 一键整合包 v20260123 🎨 FLUX.2 Klein 本地图像生成与编辑工具 —— 功能详解这是一款基于FLUX.2 Klein 模型的本地化 AI 图像生成与编辑工具,专为内容创作者、自媒体运营者和设计师打造。无需联网,完全离线运行,支持文生图与图生图编辑,界面简洁直观,开箱即用。🖼️ 功能一:文生图(Text-to-Image)输入一段中文或英文提示词,即可生成... 2026-1-23 AI 4245 22
软件 媒体转换 # 视频处理 # 人工智能 # AI # 视频转换 # 格式转换 Winxvideo AI 强大的AI视频转换处理软件 绿色便携版 v4.6.0105 Winxvideo-AI由 AI 驱动的视频工具包。 增强、转换、录制和编辑视频AI 驱动的顶级视频工具包。 不论是老旧、低质、噪声或模糊的影片/图像,都能升级至 4K,稳定抖动的影片,提升帧率至 120/240fps,并能以全面 GPU 加速进行转换、压缩、录制和编辑 4K/8K/HDR 影片,实现每一帧都具备影院级视觉效果。使用CineA... 2026-1-22 软件 4896 8
软件 工具 # 音频 # 音频处理 # 人工智能 # AI Echo(回声) 文字合成语音 声音克隆AI工具 v1.1.0 B站UP主凯凯-你好 开发的一款文字合成语音 声音克隆工具,免费使用,操作简单“灵声妙语”是一款集创新、高效、个性化于一体的智能声音工具软件,它以其极简的设计风格、卓越的性能表现以及全球多平台覆盖的能力,赢得了广大用户的青睐。该软件以“让创意更简单,让艺术走进生活”为核心理念,致力于为用户提供极致的用户体验。从下载安装的那一刻起,用户就能感受... 2026-1-22 软件 4783 4
软件 工具 # 人工智能 # AI # 字幕 青梧字幕 —跨平台AI视频字幕智能提取翻译工具 附全部模型 v1.3.6 青梧字幕是一款免费简单易用的AI字幕智能提取+翻译工具,原理是利用模型自动识别5音视频文件当中的音频并生成为对应的语种字幕,实现提取及翻译后续处理操作。目前暂支持windows及mac(M及intel系例处理器)系统环境,支持识别中文、英语、日语、韩语等99种语言。毕竟市面上已有众多类似的字幕软件2或在线网页版,无非要么限制提取时长要么各种套... 2026-1-20 软件 4158 7
AI 语音 # 工具 # 日常应用 # 文本 # 绿色软件 # 人工智能 # AI # 免费 # 语音工具 # 效率工具 # 整合包 Qwen3-TTS 通义千问推出的高质量文本转语音工具,API调用,无字数限制,批量生成,小巧,轻量,无需显卡即可快速生成语音,剑二十七二次开发 一键整合包 v2060119 4.0 一、什么是 TTS?TTS(Text-To-Speech)是一种将文字转换为自然语音的技术,广泛应用于语音助手、有声书、导航播报、智能客服等场景。二、Qwen-TTS功能简介该项目提供了一个简单的 Web 界面(基于 Gradio),用户可以输入任意文本,并通过 Qwen 的 TTS 模型生成对应的语音文件。该工具支持中文和英文的语音合成。🔧... 2026-1-19 AI 8445 9
AI#开源 语音 # 工具 # 日常应用 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 语音工具 # 整合包 轻量、快速、免费、无需显卡 EasyTTS 重新定义本地 TTS 体验 一键整合包 v20260117 EasyTTS(由 GitHub 用户 yunchenqwq 开发)是一个专注于中文语音合成的开源文本转语音(Text-to-Speech, TTS)系统,其核心目标是提供一个无需复杂依赖、无需训练、本地运行、开箱即用的高质量 TTS 解决方案。该项目特别针对中文用户在实际使用中常见的痛点(如多音字错误、语调生硬、部署困难等)进行了优化,强调... 2026-1-17 AI,开源 2747 0
AI 图像处理 # 工具 # 日常应用 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 图片放大 # 效率工具 AI 图像魔法: 图片超分辨率 无损放大 x2x4 v1.0 基于 image_gen_aux 和 Gradio 开发的通用图像增强工具。本项目集成了大量由 Phips 训练的高性能 AI 模型,支持图像去噪、去 JPEG 压缩痕迹、无损/有损放大以及动漫风格化处理。✨ 核心功能🤖 多模型支持:内置 60+ 种精选模型,涵盖 1x(修复)、2x(双倍放大)、4x(四倍放大)等多种分辨率增强需求。📱 移动... 2026-1-9 AI 2369 0
开源 工具 # 日常应用 # 开源 # 人工智能 # AI # 免费 # 笔记 # 效率工具 不止于笔记:WitNote开启本地AI创作新时代 开源 v1.3.2 WitNote(智简笔记本)是一款本地优先的AI写作伴侣,专为macOS和Windows平台设计。3项目秉承"大智若简,落笔生花"的核心理念,致力于为用户提供极简而强大的写作体验。1作为一款专注于隐私保护的写作工具,WitNote采用本地优先架构,确保用户数据安全,同时提供智能化的写作辅助功能。核心特性🔄 多引擎自由切换W... 2026-1-8 开源 3115 0
开源 工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 效率工具 # 整合包 VoiceSculptor:基于指令驱动的下一代语音合成开源框架——让AI语音拥有精准的情感与音色控制能力 v20260108 一键整合包 🎵 VoiceSculptor - 指令驱动的语音合成模型📌 项目概述VoiceSculptor是由ASLP实验室(Audio, Speech and Language Processing Laboratory)开发的一款先进的指令式文本到语音(instruct text-to-speech)开源模型。2该项目代表了语音合成技术的前沿发展方... 2026-1-7 开源 2470 0
AI 图像处理 # 工具 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 整合包 AI 绘万象,细节见真章:Qwen-Image-2512 专业AI图像生成 支持批量生成图片 一键整合包 v20260105 Qwen-Image-2512 图像生成器 一键整合包基于 Qwen3 大模型的专业级 AI 图像生成工具采用 BNB-NF4 4-bit 量化优化技术,在保障超高图像质量的同时显著降低硬件资源消耗,为创作者提供流畅、高效、稳定的 AI 绘图体验。搭载直观的 Gradio Web 界面,告别命令行,一键生成专业级图像。⚙️ 系统要求显卡:NV... 2026-1-5 AI 3680 5
AI#开源 工具 # 神器 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包 GPT-SoVITS2507+SAVA46 一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包 GPT-SoVITS是一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成。该工具由RVC-Boss团队开发,并在GitHub上公开分享,为用户提供了一个灵活且功能丰富的平台,以满足语音合成的多样化需求。核心功能GPT-SoVITS的核心功能包括零样本和少样本TTS。零样本TTS允许用户仅通过输入一个5秒的语音样本,就能即时体... 2026-1-4 AI,开源 1万 4
AI#软件 开源 # 人工智能 # AI # 整合包 人工智能AI相关工具软件 合集整理 一键修复老照片、智能上色、超清还原,去除水印 ,转动漫 ——全能AI图像编辑神器来了!beterpic造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图 一键整合包一键生成AI绘画提示词:让你的图片秒变顶级写真描述 跟之前的图片反推工具不同的是这个会思考 thinkpic视频4倍高清修复,一键... 2026-1-1 AI,软件 4.2万 17
AI 图像处理 # 工具 # 日常应用 # 图像编辑 # 绿色软件 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 效率工具 # 整合包 你想怎么改图?它就怎么改 Qwen-Image-Edit-2511 实现真正可控的 AI 图片编辑 v20251231 一键整合包 Qwen-Image-Edit-2511 是由阿里云推出的新一代多模态图像编辑大模型,属于 Qwen 系列在视觉生成与编辑方向的重要迭代。该模型基于 Qwen-Image-Edit 系列的持续演进(如 2509、2511 版本),在保留原始图像语义结构和细节的前提下,支持高保真、高可控性的图像编辑任务。该模型主要特点包括:高保真图像编辑:在执... 2025-12-31 AI 4368 14
开源 工具 # 日常应用 # 开源 # 人工智能 # AI # 效率工具 NextChat 一键免费部署私人 ChatGPT 服务开源工具 v2.16.1 NextChat 是一款基于现代 Web 技术栈构建的全栈开源聊天应用模板,旨在帮助开发者快速搭建高性能、可扩展的实时通信平台。该项目由社区驱动,采用前沿技术组合,为初创企业、开发者及教育机构提供了开箱即用的聊天解决方案。核心技术栈NextChat 以 Next.js 13 为核心框架,结合 TypeScript... 2025-12-31 开源 2325 0