SoulX-Singer:一键克隆任意声音,让AI替你唱歌 无需训练,秒变歌手 一键整合包 v20260208

SoulX-Singer:一键克隆任意声音,让AI替你唱歌 无需训练,秒变歌手 一键整合包 v20260208

SoulX-Singer 是一个由 Soul-AI Lab 开发的零样本歌声合成(Zero-Shot Singing Voice Synthesis)开源项目。该项目旨在通过先进的深度学习技术,让用户能够在无需大量训练数据的情况下,克隆任意人的声音并用于歌声合成。核心功能1. 零样本音色克隆SoulX-Singer 的核心能力是零样本音色迁移...
AI,开源 5830 4
开源 视频播放器 Media Player Classic - Home Cinema 绿色免安装 v2.6.1

开源 视频播放器 Media Player Classic - Home Cinema 绿色免安装 v2.6.1

Media Player Classic - Home Cinema(也被称为MPC-HC),是一款基于Guliverkli项目、包含许多额外功能和软件修复功能的,免费且开源的视频和音频播放器。这个播放器为使用Windows操作系统的用户设计,但也可以用于其他的操作系统。主要特性和优势功能齐全且稳定:MPC-HC的内置播放器已经非常成熟和稳定...
软件 4979 3
"让AI有‘灵魂’的神器:开源项目免费下载,语音聊天不尬聊,打游戏能当军师,关键数据不传云端!" airi v0.8.4

"让AI有‘灵魂’的神器:开源项目免费下载,语音聊天不尬聊,打游戏能当军师,关键数据不传云端!" airi v0.8.4

Project AIRI 是一个基于大语言模型驱动的AI虚拟伴侣系统,旨在创建AI"女仆"(waifu)/虚拟角色的灵魂容器,将这些虚拟角色带入现实世界。该项目致力于重现Neuro-sama(一个知名的AI虚拟角色)的功能高度,完全由LLM和AI驱动。核心功能🎙️ 实时语音聊天支持与AI进行自然流畅的语音对话交互实现低延迟...
AI,开源 6485 12
轻如羽,快如电 LuxTTS 语音克隆 一键整合包 CPU也能跑,30秒音频 1秒生成 v20260206

轻如羽,快如电 LuxTTS 语音克隆 一键整合包 CPU也能跑,30秒音频 1秒生成 v20260206

LuxTTS 项目介绍LuxTTS 是由开发者 Yatharth Sharma 创建的开源轻量级文本转语音(TTS)系统,专注于高质量零样本语音克隆与超高速推理。项目在保持卓越音质的同时,显著降低了计算资源需求,适用于资源受限环境下的语音合成任务。核心特性1. 零样本语音克隆仅需 3–5 秒参考音频即可克隆任意人声,无需针对目标说话人进行额外...
AI,开源 4728 23
开源 免费 pyVideoTrans v3.96 视频翻译开源软件 自动识别并生成字幕后,翻译 + 配音 绿色免安装

开源 免费 pyVideoTrans v3.96 视频翻译开源软件 自动识别并生成字幕后,翻译 + 配音 绿色免安装

这个工具我用来很长一段时间了,只是我居然一直忘记给大伙分享出来,直到昨天群里有人在问这样的工具。我才想起来把这个分享出来给大伙。虽然这个工具的标题叫视频翻译,实际上远远不只这些功能,我一直用这个工具来做字幕识别,比如我以前的教程那些字幕很多都是这个工具帮我做的。识别率也很高,超级方便。本来想今天一早就分享出来,但是事情比较多,又是瞎折腾的一天...
AI,开源 1.5万 29
ACE-Step-1.5 解锁音乐创作无限可能,以技术革新重塑音乐生成生态,AI生成音乐 翻唱音乐 重绘音乐 支持中文 v20260206

ACE-Step-1.5 解锁音乐创作无限可能,以技术革新重塑音乐生成生态,AI生成音乐 翻唱音乐 重绘音乐 支持中文 v20260206

ACE-Step是一个开源的音乐生成基础模型项目,旨在通过全面的架构设计克服现有音乐生成方法的局限性,并实现最先进的性能。以下是对该项目的详细介绍:项目背景与目标:ACE-Step项目针对当前音乐生成方法中存在的生成速度、音乐连贯性和可控性之间的权衡问题,提出了一种新的解决方案。项目的目标是建立一个快速、通用、高效且灵活的音乐AI基础模型,使...
AI 5167 7
影像重获新生 SeedVR2 图片+视频批量超分神器 一键整合包 AI 超分,让每一帧都惊艳 v20260205

影像重获新生 SeedVR2 图片+视频批量超分神器 一键整合包 AI 超分,让每一帧都惊艳 v20260205

SeedVR2 图像/视频超分工具这是一款基于 ComfyUI-SeedVR2_VideoUpscaler 官方推理 CLI 开发的图形化 Web 封装工具。它提供了一个现代化、汉化且高度可配置的网页界面,使用户无需编写命令行代码即可轻松对图片和视频进行高质量的 AI 超分辨率处理。核心功能1. 多模态与批量处理图片超分:支持单张图片或批量上...
AI,开源 3193 0
轻量 高效 AI生图工具 基于 Stable Diffusion XL 模型二次开发,6G英伟达显卡就可以愉快玩耍 Diaomo v8.0 六秒出图 支持更换模型+图片超分+图生图

轻量 高效 AI生图工具 基于 Stable Diffusion XL 模型二次开发,6G英伟达显卡就可以愉快玩耍 Diaomo v8.0 六秒出图 支持更换模型+图片超分+图生图

CyberIllustrious是一个基于 Stable Diffusion模型架构的二次创作(LoRA 或 Dreambooth)模型,主要专注于生成具有“未来感”、“赛博朋克”和“华丽视觉风格”的高质量插画内容。它通常被用于图像生成平台如 NovelAI、Stable Diffusion WebUI或 ComfyUI中。🧠 模型简介项目内...
AI,开源 1.4万 31
Qwen3-TTS:让文字拥有灵魂的声音艺术家 文字生成语音 语音克隆 新增多人对话 一键整合包 v20260130

Qwen3-TTS:让文字拥有灵魂的声音艺术家 文字生成语音 语音克隆 新增多人对话 一键整合包 v20260130

Qwen3-TTS 开源项目介绍Qwen3-TTS 是由 Qwen 团队开发的一系列强大语音生成模型,于 2026 年 1 月 22 日正式发布。该项目提供全面的语音生成能力,包括语音克隆、语音设计、超高质量类人语音生成和基于自然语言的语音控制,为开发者和用户提供了目前最广泛的语音生成功能集。核心特性1. 多语言支持Qwen3-TTS 覆盖 ...
AI 6648 6
Z-Image(造相)AI文生图  v20260128 一键整合包,支持批量生成图片,可直接用于生产的一键整合包

Z-Image(造相)AI文生图 v20260128 一键整合包,支持批量生成图片,可直接用于生产的一键整合包

Z-Image(造相)是阿里巴巴通义实验室(Tongyi MAI)推出的高效图像生成基础模型家族,以"小参数、高质量、极速推理"为核心设计理念,在开源图像生成领域树立了新的性能标杆。核心技术特点参数规模与架构:采用 60 亿参数(6B)的轻量级设计,基于创新的可扩展单流扩散 Transformer(S3-DiT)架构,将文...
AI 5153 10
开源 神器 Stability Matrix  一款功能强大、易于使用的Stable Diffusion管理工具 v2.15.5

开源 神器 Stability Matrix 一款功能强大、易于使用的Stable Diffusion管理工具 v2.15.5

Stability Matrix是由Lykos AI开发的一款革命性工具,专为简化Stable Diffusion的使用和管理而设计。作为一款多平台包管理器和推理用户界面,它极大地提升了Stable Diffusion的易用性和用户体验。核心功能多平台支持:Stability Matrix支持macOS、Windows和Linux系统,确保用...
AI,开源 6018 1
输入歌词,AI自动作曲:你的音乐创作助手 HeartMuLa 一键中文整合包 v20260126

输入歌词,AI自动作曲:你的音乐创作助手 HeartMuLa 一键中文整合包 v20260126

HeartMuLa/heartlib:开源音乐基础模型家族深度解析项目定位与愿景HeartMuLa是一个全面的开源音乐基础模型家族,旨在推动跨任务与多模态的大规模音乐理解与生成技术发展。该项目不仅仅是一个单一的模型,而是一个完整的生态系统,涵盖了从音乐理解到完整曲目生成的全链条能力。其核心目标是为研究社区和开发者提供可复现、可扩展的音乐AI工...
AI,开源 7459 11
深度整合 FLUX.2-klein-base-9B:一款为内容创作者打造的本地化 AI 绘图+多图片编辑工具 一键整合包 v20260123

深度整合 FLUX.2-klein-base-9B:一款为内容创作者打造的本地化 AI 绘图+多图片编辑工具 一键整合包 v20260123

🎨 FLUX.2 Klein 本地图像生成与编辑工具 —— 功能详解这是一款基于FLUX.2 Klein 模型的本地化 AI 图像生成与编辑工具,专为内容创作者、自媒体运营者和设计师打造。无需联网,完全离线运行,支持文生图与图生图编辑,界面简洁直观,开箱即用。🖼️ 功能一:文生图(Text-to-Image)输入一段中文或英文提示词,即可生成...
AI 4785 22
甜甜圈 FurMark 电脑显卡压力测试烤机软件 绿色免安装  v2.10.2

甜甜圈 FurMark 电脑显卡压力测试烤机软件 绿色免安装 v2.10.2

这个软件有个最好用的功能就是你如果买的二手显卡,或者你怀疑是矿卡的显卡。就开启这个软件来测试下显卡。基本上跑半小时没有死机或者出错,那么就恭喜了。如果有那也恭喜了。。Geeks3D FurMark(烤机软件)是一款GPU压力测试工具及OpenGL基准测试工具的显卡测试软件,支持单卡/多卡烤机模式,可以测试NVIDIA GeForce/AMD ...
软件 5010 0
免安装 文件重命名工具 ReNamer 中文绿色便携专业版 v7.8.0.2

免安装 文件重命名工具 ReNamer 中文绿色便携专业版 v7.8.0.2

ReNamer是一款功能强大的文件重命名软件,它可以帮助用户快速方便地对文件进行批量重命名操作。无论是个人用户还是企业机构,都可以使用ReNamer来管理和优化文件结构,提高工作效率。ReNamer的功能非常丰富,可以支持多种重命名操作。用户可以使用ReNamer进行文件加前缀、加后缀、删除指定字符、替换指定字符、大小写转换、添加编号等常见重...
软件 4966 10
多图预览 跨平台音频编辑工具 ocenaudio 绿色免安装 可批量处理 v3.17.1

多图预览 跨平台音频编辑工具 ocenaudio 绿色免安装 可批量处理 v3.17.1

最近我正好需要编辑下音频,无意中居然发现我很久以前就分享了这个工具,这次截图多一点,让小伙伴能更好的看看这个强大的音频编辑工具,可以批量处理。ocenaudio 中文版是一款跨平台,易于使用,快速且功能强大的音频编辑器。对于需要编辑和分析音频文件而无需复杂的人来说,它是理想的软件。 ocenaudio 还具有强大的功能,可以满足更多高级用户的...
软件 4469 3
开源 Pineapple Pictures(菠萝看图)  绿色版 一款轻量级且功能丰富的图片查看器 v1.3.0

开源 Pineapple Pictures(菠萝看图) 绿色版 一款轻量级且功能丰富的图片查看器 v1.3.0

介绍Pineapple Pictures是一款轻量级且功能丰富的图片查看器,它以其简洁的界面、高效的性能和广泛的文件格式支持而受到用户的青睐。以下是对该软件的详细介绍:主要功能广泛支持图片格式:Pineapple Pictures支持包括JPG、PNG、GIF、SVG、PSD、KRA、XCF、TGA、AVIF等在内的多种常见及专业图片格式,满...
软件 4372 4
多图预览 老牌浏览器 傲游浏览器 便携版 v 7.5.2.4800 Beta

多图预览 老牌浏览器 傲游浏览器 便携版 v 7.5.2.4800 Beta

这个浏览器其实在多年前就经常在用那时候还叫myie 和当时的theworld。基本都是电脑里面必装的浏览器。时间过得是真快啊。现在theworld早就已经没有更新了,还好还有傲游在,偶尔也会安装回来再看看,因为里面有我的青春啊。。。为了让你们更好的了解这个浏览器,我就多截图一点。介绍傲游浏览器(Maxthon Browser)介绍傲游浏览器(...
软件 4279 1
Qwen3-TTS 通义千问推出的高质量文本转语音工具,API调用,无字数限制,批量生成,小巧,轻量,无需显卡即可快速生成语音,剑二十七二次开发 一键整合包 v2060119 4.0

Qwen3-TTS 通义千问推出的高质量文本转语音工具,API调用,无字数限制,批量生成,小巧,轻量,无需显卡即可快速生成语音,剑二十七二次开发 一键整合包 v2060119 4.0

一、什么是 TTS?TTS(Text-To-Speech)是一种将文字转换为自然语音的技术,广泛应用于语音助手、有声书、导航播报、智能客服等场景。二、Qwen-TTS功能简介该项目提供了一个简单的 Web 界面(基于 Gradio),用户可以输入任意文本,并通过 Qwen 的 TTS 模型生成对应的语音文件。该工具支持中文和英文的语音合成。🔧...
AI 8993 9
功能全面,操作便捷的免费文件改名工具 zRenamer v1.7.0 绿色免安装

功能全面,操作便捷的免费文件改名工具 zRenamer v1.7.0 绿色免安装

zRenamer是一款功能强大且操作便捷的文件批量重命名工具,它的诞生源于开发者对之前同类软件MiniRenamer的不懈追求与改进。zRenamer在界面设计上参考了老牌改名工具拖把改名,并在此基础上进行了多项优化,使得软件在加载和执行速度、右键菜单支持等方面都有了显著提升。软件追求轻巧不冗余、页面直观、功能简洁、操作便捷高效的理念,为用户...
软件 3320 0
轻量、快速、免费、无需显卡 EasyTTS 重新定义本地 TTS 体验 一键整合包 v20260117

轻量、快速、免费、无需显卡 EasyTTS 重新定义本地 TTS 体验 一键整合包 v20260117

EasyTTS(由 GitHub 用户 yunchenqwq 开发)是一个专注于中文语音合成的开源文本转语音(Text-to-Speech, TTS)系统,其核心目标是提供一个无需复杂依赖、无需训练、本地运行、开箱即用的高质量 TTS 解决方案。该项目特别针对中文用户在实际使用中常见的痛点(如多音字错误、语调生硬、部署困难等)进行了优化,强调...
AI,开源 2922 0
AI 图像魔法: 图片超分辨率 无损放大 x2x4 v1.0

AI 图像魔法: 图片超分辨率 无损放大 x2x4 v1.0

基于 image_gen_aux 和 Gradio 开发的通用图像增强工具。本项目集成了大量由 Phips 训练的高性能 AI 模型,支持图像去噪、去 JPEG 压缩痕迹、无损/有损放大以及动漫风格化处理。✨ 核心功能🤖 多模型支持:内置 60+ 种精选模型,涵盖 1x(修复)、2x(双倍放大)、4x(四倍放大)等多种分辨率增强需求。📱 移动...
AI 2543 0
 VoiceSculptor:基于指令驱动的下一代语音合成开源框架——让AI语音拥有精准的情感与音色控制能力 v20260108 一键整合包

VoiceSculptor:基于指令驱动的下一代语音合成开源框架——让AI语音拥有精准的情感与音色控制能力 v20260108 一键整合包

🎵 VoiceSculptor - 指令驱动的语音合成模型📌 项目概述VoiceSculptor是由ASLP实验室(Audio, Speech and Language Processing Laboratory)开发的一款先进的指令式文本到语音(instruct text-to-speech)开源模型。2该项目代表了语音合成技术的前沿发展方...
开源 2644 0
Win10 五笔助手 让 Win10/Win11 微软五笔更强大 wubiLex v12.1.0

Win10 五笔助手 让 Win10/Win11 微软五笔更强大 wubiLex v12.1.0

软件简介:平心而论,现在用五笔的人实在太少了,以往遍地开花的五笔输入法,现如今已经门可罗雀。好在微软还是很良心地在 Win10 里保留了这款输入法,并一直予以更新。但微软毕竟不同于第三方厂商,很多细节照顾得还是不够,于是便有了这款 wubiLex 五笔输入法增强器。该版特点:这是一个WIN10系统自带五笔的码表与短语词库安装、管理工具,并可增...
软件 2560 0
AI 绘万象,细节见真章:Qwen-Image-2512 专业AI图像生成 支持批量生成图片 一键整合包 v20260105

AI 绘万象,细节见真章:Qwen-Image-2512 专业AI图像生成 支持批量生成图片 一键整合包 v20260105

Qwen-Image-2512 图像生成器 一键整合包基于 Qwen3 大模型的专业级 AI 图像生成工具采用 BNB-NF4 4-bit 量化优化技术,在保障超高图像质量的同时显著降低硬件资源消耗,为创作者提供流畅、高效、稳定的 AI 绘图体验。搭载直观的 Gradio Web 界面,告别命令行,一键生成专业级图像。⚙️ 系统要求显卡:NV...
AI 3968 5
GPT-SoVITS2507+SAVA46 一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包

GPT-SoVITS2507+SAVA46 一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包

GPT-SoVITS是一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成。该工具由RVC-Boss团队开发,并在GitHub上公开分享,为用户提供了一个灵活且功能丰富的平台,以满足语音合成的多样化需求。核心功能GPT-SoVITS的核心功能包括零样本和少样本TTS。零样本TTS允许用户仅通过输入一个5秒的语音样本,就能即时体...
AI,开源 1.1万 4
FFmpeg小白助手 音视频批量处理工具 【小白救星、懒人福音】

FFmpeg小白助手 音视频批量处理工具 【小白救星、懒人福音】

这个软件适合不想去学ffmpeg命令的小伙伴了。直接拿来就可以用了,如果想进一步了解学习 可以去看看我之前发布的ffmpeg教程 FFmpeg】FFmpeg是一款开源软件,可以处理多种多媒体媒体数据程序。是目前最受欢迎的视频和图像处理软件。FFmpeg小白助手】在FFmpeg基础上开发的一款自动化处理软件,以最简单的方式快速批量处理...
软件 3543 2
FlorisBoard 一款适用于 Android 7.0 及以上设备的免费开源输入法APP v0.5.2

FlorisBoard 一款适用于 Android 7.0 及以上设备的免费开源输入法APP v0.5.2

FlorisBoard 是一款适用于 Android 7.0 及以上设备的免费开源键盘应用。它以现代化、用户友好、可定制以及完全尊重用户隐私为目标,目前处于早期测试阶段(early-beta)。以下是关于该软件的详细介绍:软件概述FlorisBoard 是一款专为 Android 用户设计的键盘应用,旨在提供一个既美观又实用的输入工具,同时确...
安卓 2889 0
开源 windhawk 安装版 一款专为Windows系统设计的开源定制工具 v1.7.3

开源 windhawk 安装版 一款专为Windows系统设计的开源定制工具 v1.7.3

介绍Windhawk是一款专为Windows系统设计的开源定制工具,由Ramen Software开发并推出。该工具旨在通过模块化设计简化和扩展Windows系统的定制设置,为用户提供高度个性化的使用体验。以下是对Windhawk的详细介绍:一、主要功能特点任务栏定制:Windhawk允许用户调整任务栏的高度、图标大小,禁用分组功能,并自定义...
软件 2842 0
视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包 v20251231

视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包 v20251231

🎥 FlashVSR 是什么?FlashVSR 是一个能让模糊、低清视频“秒变高清”的智能工具。它专门用来做一件事:把低分辨率的视频,快速、高质量地放大成 4 倍清晰度的高清视频。比如:把 480p 的老视频 → 变成接近 4K 的清晰视频让手机拍的模糊视频 → 变得锐利、细节丰富⚡ 它有什么厉害的地方?过去很多“视频超分”(放大变清晰)工具...
AI,开源 5312 2
入梦AI变声器RMAIVoiceChanger v5.8 免费 免安装

入梦AI变声器RMAIVoiceChanger v5.8 免费 免安装

今天因为有点事 需要去找下变声软件。早上已经分享了一款,没想到还是给我另外一款貌似更好用,设置更加简单的变声工具,也是免费使用。入梦自己开发基于RVC的AI变声器,永久免费给大家分享使用,数十种中精选音源一键切换,建议最低配置位N卡1060以上,CPU四核心以上主频大于3.0GHZ,包集成入梦虚拟声卡,AI降噪等,入梦工具箱等辅助工具,使用简...
软件 1.2万 21
开源输入法状态提示工具 ImTip v8.0 官方中文版

开源输入法状态提示工具 ImTip v8.0 官方中文版

介绍官方网站:https://imtip.aardio.com/ImTip是一款输入法状态提示工具,可以把输入法的状态显示在我们的光标附近,让你可以立即知道输入法当前的状态,而不必去看任务栏或者输入法状态栏,从而让打字更加效果。软件的用法很简单,直接运行即可生效。同时还有丰富的界面设置可以调整,你可以自定义它的显示风格,使其看起来更加养眼,另...
软件 2942 0