WhisperDesktop1.12音频转文字软件双向 免费开源 ·附模型文件,

语音 # 工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 语音工具 # 效率工具 # 整合包

小红书开源配音神器 dots.tts 只需3秒音频，完美复刻你的声音！一键整合包 v20260617 解压即可使用

dots.tts是由小红书人工智能实验室（RedNote Hilab）研发并免费开源的一款新一代 AI 语音合成（配音）系统。抛开复杂的技术术语，你可以把它简单理解为一个“拥有录音棚级音质的超级 AI 配音员”。你只需要输入一段文字，它就能用极其逼真、富有感情的声音把文字读出来，甚至能完美模仿任何人的声音。以下是它最核心的几个“超能力”，也是...

2026-6-17 AI 0

媒体转换 # 工具 # ffmpeg # 视频处理 # 神器 # 绿色软件 # 开源 # 格式转换 # 效率工具

神器开源视频音频处理神器 FFmpeg 官网最新版附安装教程 v2026-06-01

这个软件我以前做了几期教程，非常非常强大的视频音频处理工具，基本市面上绝大部分视频处理软件都是套它的壳https://www.jian27.com/html/ffmpeg.html一、ffmpeg介绍FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视...

2026-6-4 开源 0

工具 # 日常应用 # 视频处理 # 音乐 # 绿色软件 # 音频处理 # 人工智能 # AI # 效率工具 # 整合包

音乐卡点视频一键生成支持图片+视频素材新增镜头分镜切割+人声分离+ MTV 模式+音频编辑无显卡要求剑二十七原创作品 KA v20260328

卡点视频生成器是一款基于 AI大模型智能视频自动生成工具，专为音乐爱好者、短视频创作者、自媒体运营者设计。它能根据你上传的音乐节拍/鼓点，自动从指定图片或视频素材中智能选取片段，生成节奏精准、视觉流畅的“卡点”视频，适用于抖音、快手、B站、Instagram 等平台。无需剪辑经验，一键生成专业级卡点视频！🎯 核心功能1. 🖼️ 图片卡点模式...

2026-4-20 AI 0

工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 整合包

轻如羽，快如电 LuxTTS 语音克隆一键整合包 CPU也能跑，30秒音频 1秒生成 v20260206

LuxTTS 项目介绍LuxTTS 是由开发者 Yatharth Sharma 创建的开源轻量级文本转语音（TTS）系统，专注于高质量零样本语音克隆与超高速推理。项目在保持卓越音质的同时，显著降低了计算资源需求，适用于资源受限环境下的语音合成任务。核心特性1. 零样本语音克隆仅需 3–5 秒参考音频即可克隆任意人声，无需针对目标说话人进行额外...

2026-2-6 AI,开源 0

工具 # 绿色软件 # 音频处理

多图预览跨平台音频编辑工具 ocenaudio 绿色免安装可批量处理 v3.17.1

最近我正好需要编辑下音频，无意中居然发现我很久以前就分享了这个工具，这次截图多一点，让小伙伴能更好的看看这个强大的音频编辑工具，可以批量处理。ocenaudio 中文版是一款跨平台，易于使用，快速且功能强大的音频编辑器。对于需要编辑和分析音频文件而无需复杂的人来说，它是理想的软件。 ocenaudio 还具有强大的功能，可以满足更多高级用户的...

2026-1-20 软件 0

工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 效率工具 # 整合包

AI 播客：一键生成多角色对话音频 SoulX-Podcast 剑二十七二次开发一键整合包 v20251103

SoulX-Podcast是由 Soul AI Lab 开源的一个面向播客场景的高质量、长篇、多说话人对话式语音合成（TTS）系统，专为生成自然、富有表现力、支持方言与副语言特征的播客音频而设计。🔍 项目核心特点1. 长篇多轮多说话人对话生成支持生成多人交替对话的播客内容（如主持人 + 嘉宾）；能处理长文本输入，保持语音连贯性和角色一致性；适...

2025-11-3 AI,开源 0

工具 # 绿色软件 # 开源 # 人工智能 # AI # 数字人 # 整合包

开源免费、无时间限制数字人图片+音频一键生成视频 InfiniteTalk v20250825

InfiniteTalk 是由 MeiGen-AI 团队开发的先进开源项目，专注于解决长视频生成中的关键挑战——实现无限长度的高质量会说话视频生成。该项目突破了传统数字人技术的时长限制，能够生成任意长度的自然流畅的"会说话"视频内容。核心功能与特点1. 无限长度视频生成突破性技术：解决了传统TTS(文本转语音)和数字人视频...

2025-8-24 AI,开源 0

工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 语音工具 # 整合包

文本转语音，如此简单真实：Nari Labs开源Dia，一轮处理生成高度逼真的对话音频

Dia是一个由Nari Labs创建的文本转语音（TTS）模型，它拥有16亿（1.6B）参数，能够在一轮处理中生成超逼真的对话。这个项目的核心特点是其高度真实的语音生成能力，可以直接从文本中生成高度逼真的对话，同时支持通过音频条件来控制输出，实现情感和语调的调整。主要功能高度逼真的对话生成：Dia能够直接从文本中生成高质量的对话，无需多轮处理...

2025-4-25 AI 0

日常应用 # 音乐 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包

AudioX 一个极具创新性和实用性的AI开源音频和视频生成工具。一键汉化整合包

AudioX是一个创新的开源项目，专注于实现一种全新的音频与音乐生成方式。该项目由Zeyue Tian及其团队开发，并在GitHub上公开分享，为音频生成领域带来了革命性的突破。AudioX的核心是一个统一的Diffusion Transformer模型，旨在解决现有音频生成方法中的局限性，如模态隔离、高质量多模态训练数据稀缺以及多样化输入整...

2025-4-10 AI,开源 0

语音 # 工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包

InspireMusic AI人工智能音乐、歌曲和音频生成的开源一键中文整合包

InspireMusic是一个专注于音乐、歌曲和音频生成的开源项目，它提供了一个统一的框架来实现这些生成任务。以下是对该项目的详细介绍：主要功能音乐生成：支持文本提示、音乐类型、音乐结构等多种控制方式，可生成高质量的音乐作品。歌曲生成：能够根据用户的文本描述或音乐结构生成完整的歌曲。音频生成：可以生成各种类型的音频，包括但不限于背景音乐、音效...

2025-3-13 AI,开源 0

Android # 图像处理 # 工具 # 安卓 # 手机软件 # 日常应用 # ffmpeg # 视频处理 # 办公软件 # 开源 # 安卓app # 效率工具

手机软件安卓pp FFShare v1.3.3 一款功能强大图像、视频和音频文件压缩工具

FFShare是一款功能强大的Android应用程序，它专注于在分享前对图像、视频和音频文件进行压缩。这款应用利用了ffmpeg这一强大的多媒体处理工具，为用户提供了一个便捷、高效的文件压缩解决方案。首先，从用户的角度来看，FFShare的最大亮点在于其压缩功能。在日常使用中，我们经常会遇到因为文件过大而无法快速分享或上传的问题。FFShar...

2025-3-6 安卓 0

图像处理

Tenacity v1.3.4 一个功能全面、易于使用且注重隐私保护的开源音频编辑器

Tenacity是一个功能强大的开源音频编辑器，它基于C++和Qt框架开发，具有跨平台运行的特性，能够在Linux、macOS和Windows等多种操作系统上无缝工作。该项目源自于著名的Audacity音频编辑器，并在其基础上进行了改进和优化，以满足现代用户对音频处理的多样化需求。Tenacity的核心优势包括：高质量的音频处理能力：它采用了...

2025-1-7 软件 0

APP # Android # 工具 # 安卓 # 手机软件 # 下载工具 # 开源 # youtube # 安卓app # 多图预览

手机软件 Seal v1.13.1 一款功能强大、易于使用的Android视频/音频下载器

Seal是一款专为Android用户设计的视频与音频下载工具，它基于强大的yt-dlp（前身为youtube-dl）后端，支持从众多视频平台下载视频和音频文件。这款应用不仅界面友好，而且功能丰富，为用户提供了极大的便利。Seal的主要特点包括：多平台支持：用户可以通过Seal轻松下载来自YouTube、Vimeo等支持yt-dlp的视频平台的...

2024-10-22 安卓 0

工具 # 开源 # 人工智能 # AI # 语音工具 # 整合包

Bark UI Enhanced v0.7.4 整合包一款开源的具有 Gradio 网络用户界面的文本触发的生成音频模型

最近都在留意这个文字转语音工具，无意发现了这个开源项目，效果相当不错，所以顺手就做成了整合包，本身这个项目是支持N卡的，但是因为我没有N卡，所以就只能做成了用CPU跑。。。如果你有N卡，想高效率去生成语音的话可以去开源项目那里看看。群里有小伙伴说这个能否做小说推文，我自己测试了下完全可以，而且我感觉比某音某手上面的小说推文的语音好多了，文末会...

2024-6-23 AI,开源 0

开源

开源免费基于ffmpeg的视频音频转换工具 MystiQ v20.02.18 绿色版

MystiQ是一款开源的视频转码器，它可以将各种格式的视频文件转换为其他格式，以便在不同的设备上播放。MystiQ是一个跨平台的应用程序，可以在Windows、Linux和Mac OS X上运行。它是一个非常强大的工具，可以处理各种不同的视频格式，包括AVI、MP4、MKV、FLV、WMV等等。MystiQ的主要特点是它的简单易用性和高效性。...

2024-4-28 开源 0

绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 免费