小米开源大模型AI语音合成,600种语言+声音克隆,生成速度提升40倍 不限字数 支持自动语气标签 OmniVoice v20260407 一键整合包

小米开源大模型AI语音合成,600种语言+声音克隆,生成速度提升40倍 不限字数 支持自动语气标签 OmniVoice v20260407 一键整合包

OmniVoice:600+语种的语音合成新纪元剑二十七 · 技术前沿🔹一句话了解由小米下一代 Kaldi 团队(k2-fsa)打造的超大规模多语言零样本 TTS 模型,支持600+ 语种,以卓越音质与极速推理,重新定义语音合成体验。✨ 核心能力一览🗣️全球语种覆盖支持 600+ 语言与方言,从英语、中文到低资源语种,一模型通全球。🔁声音克隆...
AI 3928 0
DeepSeek 本地部署一键运行 DeepSeek-tool v18,解压即可使用 最低支持2G显卡 支持99%的语言大模型 支持联网搜索+知识库

DeepSeek 本地部署一键运行 DeepSeek-tool v18,解压即可使用 最低支持2G显卡 支持99%的语言大模型 支持联网搜索+知识库

琢磨了一天,把DeepSeek的本地部署彻底完成了,并测试了一下午基本完美运行了。当然AI环境你们必须要先安装好。然后下载这个这个本地部署压缩,解压即可完美运行。我的4070ti spuer 运行32b已经是极限了,所以我也只能把模型下载到32b了,如果你们有更牛的显卡,可以继续下载模型。这是我运行14b的截图 你们看看显...
AI,开源 1.7万 37
 一键克隆任意音色,生成自然口语级语音  1B/3.5B 双模型自由切换,还原你最真实的声音  LongCat-AudioDiT v1.0 20260402 更新 一键整合包

一键克隆任意音色,生成自然口语级语音 1B/3.5B 双模型自由切换,还原你最真实的声音 LongCat-AudioDiT v1.0 20260402 更新 一键整合包

LongCat-AudioDiT 语音合成工具 - 功能说明🎯 主要功能本工具基于美团开源的 LongCat-AudioDiT 扩散模型,提供高质量的文本到语音合成,并支持零样本语音克隆(只需几秒参考音频即可克隆音色)。界面采用 Gradio 构建,操作直观,适用于中文和英文混合文本。📌 核心功能模块1. 模型选择支持 1B&nbs...
AI 2996 2
 VisoMaster +VisoMaster-Fusion v1.0  基于rope的二次开发 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持50系英伟达显卡运行 一键整合包

VisoMaster +VisoMaster-Fusion v1.0 基于rope的二次开发 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持50系英伟达显卡运行 一键整合包

VisoMaster 还不错的一个换脸工具,界面也是简洁的很,花了一天的时间做了整合包+汉化。VisoMaster是一款功能强大且易于使用的面部替换与编辑工具,专为图像和视频设计。它利用先进的人工智能技术,能够以最少的努力产生自然逼真的效果,因此无论是普通用户还是专业人士都能轻松上手。这款软件以其独特的魅力和实用性,在图像与视频编辑领域脱颖而...
AI,开源 3.4万 74
手机软件 安卓APP 开源 Trail-Sense 野外探险生存、户外徒步旅行、地理寻宝必备的神器 v7.6.1

手机软件 安卓APP 开源 Trail-Sense 野外探险生存、户外徒步旅行、地理寻宝必备的神器 v7.6.1

Trail Sense 是一款专为户外活动设计的多功能应用程序,由开发者 Kyle Corry 打造。该应用程序旨在为徒步旅行、背包旅行、露营和地理寻宝等活动提供全面的工具支持。以下是对 Trail Sense 的详细介绍。功能特点:导航工具:Trail Sense 提供了强大的导航工具,包括数字指南针、GPS 定位和离线地图。无论你身处何地...
软件 4607 0
语音识别 + 声音克隆 + 模型训练,一个工具全搞定!Easy-Voice-Toolkit v1.3.5

语音识别 + 声音克隆 + 模型训练,一个工具全搞定!Easy-Voice-Toolkit v1.3.5

Easy-Voice-Toolkit 是由 Spr-Aachen开发的一款开源、用户友好的 AI 语音工具箱,旨在为开发者、研究人员和爱好者提供一站式、本地化部署的语音处理解决方案。项目设计注重易用性与功能性,支持多种主流语音任务,适用于科研实验、产品原型开发、语音助手构建等多种应用场景。🌟 核心特性本地部署:所有功能均可在本地运行,保障数据...
AI,开源 5054 0
lmstudio 一款强大而灵活的本地大模型部署工具 我的rx580 都能流畅运行 附模型文件 支持DeepSeek v0.4.6

lmstudio 一款强大而灵活的本地大模型部署工具 我的rx580 都能流畅运行 附模型文件 支持DeepSeek v0.4.6

LM Studio是由lmstudio.ai提供的一款强大而灵活的本地大模型部署工具。它不仅降低了机器学习的使用门槛,还为用户提供了一个安全、高效、隐私保护的环境,以便在本地运行各种大型语言模型。首先,LM Studio具备强大的离线使用能力。这意味着用户无需互联网连接即可运行模型,极大地提升了使用的便捷性和灵活性。对于那些需要保护数据隐私或...
AI,开源 9934 16
开源 免费 win系统资源编辑器 RisohEditor 绿色免安装 v5.9.5

开源 免费 win系统资源编辑器 RisohEditor 绿色免安装 v5.9.5

RisohEditor,全称为“理想资源编辑器”,是一款功能强大的资源编辑和管理工具。它专注于为Windows平台的开发者提供方便、快捷的资源编辑解决方案。以下是关于RisohEditor的详细解说:首先,RisohEditor支持对EXE、DLL、RC、RES等文件中的资源数据进行添加、编辑、导出、克隆和移除等操作。这使得开发者能够轻松地对...
软件 3556 2
京墨 ——开源古诗词文、成语等阅读查询学习助手(可离线使用)v1.16.1

京墨 ——开源古诗词文、成语等阅读查询学习助手(可离线使用)v1.16.1

京墨 是一款免费开源集上万首古诗词、名句、上万条歇后语、成语等于一身的查询阅读小工具,另外附带常用的知识卡片。简言之,可充分了解、赏析各种类型的古诗作品,包括唐诗、宋词、元曲、楚辞、歌赋等,涵盖各个朝代和流派,满足不同兴趣和需求。由于谐音成语的盛行,反而导致了原版字样的zt。另外,相比那些第三方功能有限制又弹广告又要求登录的同类app,这款可...
安卓 4341 2
EditMGT 用文字"指挥"AI修图,想改哪里改哪里 5秒即可完成编辑 一键整合包 v20260219

EditMGT 用文字"指挥"AI修图,想改哪里改哪里 5秒即可完成编辑 一键整合包 v20260219

EditMGT(Masked Generative Transformer for Image Editing)是一个基于掩码生成式变压器的先进图像编辑框架,由字节跳动(ByteDance)主导研发,联合上海交通大学、新加坡国立大学、香港科技大学(广州)等高校共同完成。✨ 核心特点1. 技术创新采用**掩码生成式变压器(Masked Gene...
AI 3348 3
多图预览 开源 Qalculate! 科学计算器 官方便携版 v5.9.0

多图预览 开源 Qalculate! 科学计算器 官方便携版 v5.9.0

介绍Qalculate! 是一款强大、多功能且用户友好的计算器软件,广泛用于科学计算、数学运算以及金融计算等多个领域。这款软件的设计目标是提供一种易于使用但功能强大的计算工具,适合于从简单的日常计算到复杂的学术和专业计算的各类用户。功能概述1. 简单易用的界面Qalculate! 具有直观的用户界面,使得无论是普通用户还是专业用户都能轻松上手...
软件 3654 0
开源 Dopamine  一款功能强大且操作简单的本地音乐管理与播放软件 v3.0.2

开源 Dopamine 一款功能强大且操作简单的本地音乐管理与播放软件 v3.0.2

介绍Dopamine 音乐播放器是一款功能强大且操作简单的本地音乐管理与播放软件,它在音乐爱好者中拥有一定的用户群体。以下是对该软件的详细介绍:一、软件概述名称:Dopamine 音乐播放器类型:本地音乐播放器平台:主要适用于Windows系统(支持Windows 7及以上版本),同时也可能提供Android等其他平台的版本语言:简体中文,支...
软件 3518 0
快速文件查看工具 QuickLook 绿色版 一款开源且免费的Windows桌面快速预览神器 v4.4.0

快速文件查看工具 QuickLook 绿色版 一款开源且免费的Windows桌面快速预览神器 v4.4.0

介绍QuickLook是一款开源且免费的Windows桌面快速预览神器,它模仿了macOS中通过空格键快速查看文件内容的便捷功能,为Windows用户带来了类似的体验。该软件由C#开发,具有流畅的设计风格,界面简洁美观,同时支持高分辨率屏幕,显示效果清晰细腻。QuickLook的主要功能在于它允许用户在不打开文件的情况下,直接在文件资源管理器...
软件 2994 0
别再瞎试了!用这个神器,一键优化你的大模型提示词 Prompt Optimizer v2.5.3

别再瞎试了!用这个神器,一键优化你的大模型提示词 Prompt Optimizer v2.5.3

该项目聚焦于提升大语言模型(LLM)在实际应用中对提示语的理解与响应质量,旨在通过系统化的方法改进原始提示语的表达结构、清晰度和有效性,从而获得更准确、更稳定、更符合预期的模型输出。核心理念随着大模型在各类场景中的广泛应用,提示工程(Prompt Engineering)成为影响输出质量的关键因素。prompt-optimizer 的设计初衷...
AI,开源 3.1万 141
"让AI有‘灵魂’的神器:开源项目免费下载,语音聊天不尬聊,打游戏能当军师,关键数据不传云端!" airi v0.8.4

"让AI有‘灵魂’的神器:开源项目免费下载,语音聊天不尬聊,打游戏能当军师,关键数据不传云端!" airi v0.8.4

Project AIRI 是一个基于大语言模型驱动的AI虚拟伴侣系统,旨在创建AI"女仆"(waifu)/虚拟角色的灵魂容器,将这些虚拟角色带入现实世界。该项目致力于重现Neuro-sama(一个知名的AI虚拟角色)的功能高度,完全由LLM和AI驱动。核心功能🎙️ 实时语音聊天支持与AI进行自然流畅的语音对话交互实现低延迟...
AI,开源 6861 11
Jan 一个功能强大的开源ChatGPT替代品 支持deepseek v0.7.6

Jan 一个功能强大的开源ChatGPT替代品 支持deepseek v0.7.6

Jan:开源的ChatGPT替代品项目概述:Jan是一个开源的ChatGPT替代品,允许用户在其计算机上100%离线运行。这意味着用户无需网络连接即可使用AI功能。项目托管在GitHub上,由janhq团队维护,遵循AGPL-3.0许可证。功能特点:离线运行:Jan支持在任何硬件上运行,从个人电脑到多GPU集群,无需外部服务器或网络连接。多平...
软件 6059 0
轻如羽,快如电 LuxTTS 语音克隆 一键整合包 CPU也能跑,30秒音频 1秒生成 v20260206

轻如羽,快如电 LuxTTS 语音克隆 一键整合包 CPU也能跑,30秒音频 1秒生成 v20260206

LuxTTS 项目介绍LuxTTS 是由开发者 Yatharth Sharma 创建的开源轻量级文本转语音(TTS)系统,专注于高质量零样本语音克隆与超高速推理。项目在保持卓越音质的同时,显著降低了计算资源需求,适用于资源受限环境下的语音合成任务。核心特性1. 零样本语音克隆仅需 3–5 秒参考音频即可克隆任意人声,无需针对目标说话人进行额外...
AI,开源 5478 22
ACE-Step-1.5 解锁音乐创作无限可能,以技术革新重塑音乐生成生态,AI生成音乐 翻唱音乐 重绘音乐 支持中文 v20260206

ACE-Step-1.5 解锁音乐创作无限可能,以技术革新重塑音乐生成生态,AI生成音乐 翻唱音乐 重绘音乐 支持中文 v20260206

ACE-Step是一个开源的音乐生成基础模型项目,旨在通过全面的架构设计克服现有音乐生成方法的局限性,并实现最先进的性能。以下是对该项目的详细介绍:项目背景与目标:ACE-Step项目针对当前音乐生成方法中存在的生成速度、音乐连贯性和可控性之间的权衡问题,提出了一种新的解决方案。项目的目标是建立一个快速、通用、高效且灵活的音乐AI基础模型,使...
AI 5670 7
影像重获新生 SeedVR2 图片+视频批量超分神器 一键整合包 AI 超分,让每一帧都惊艳 v20260205

影像重获新生 SeedVR2 图片+视频批量超分神器 一键整合包 AI 超分,让每一帧都惊艳 v20260205

SeedVR2 图像/视频超分工具这是一款基于 ComfyUI-SeedVR2_VideoUpscaler 官方推理 CLI 开发的图形化 Web 封装工具。它提供了一个现代化、汉化且高度可配置的网页界面,使用户无需编写命令行代码即可轻松对图片和视频进行高质量的 AI 超分辨率处理。核心功能1. 多模态与批量处理图片超分:支持单张图片或批量上...
AI,开源 3527 0
开源 res-downloader 一款免费开源网络资源嗅探下载器 v3.1.3

开源 res-downloader 一款免费开源网络资源嗅探下载器 v3.1.3

Res-Downloader是一款基于electron-vite-vue开发的免费开源网络资源嗅探下载器,它以其强大的功能和易用性在众多网络资源下载工具中脱颖而出。以下是对该软件的详细介绍:基本信息名称:Res-Downloader(爱享素材下载器)开发技术:基于electron-vite-vue框架性质:免费开源功能:支持视频、音频、图片、...
软件 8850 11
神器 开源 电视盒子 哔哩哔哩第三方TV+Pad版 BBLL ,支持8K+杜比视界以及弹幕播放 v1.5.2

神器 开源 电视盒子 哔哩哔哩第三方TV+Pad版 BBLL ,支持8K+杜比视界以及弹幕播放 v1.5.2

软件介绍本软件是开源软件,适合TV和平板使用,支持8K、弹幕、直播,大会员通用,弹幕可以自由开关,并且弹幕的显示区域,字号大小,字体透明度、速度快慢均可调节,支持一键三连、视频编码切换、字幕、搜索电影和番剧、历史记录、稍后观看、循环播放、自动播放热门视频等等各种功能。软件截图更新日志github.com/xiaye13579/BBLL2023...
安卓 8075 13
Qwen3-TTS:让文字拥有灵魂的声音艺术家 文字生成语音 语音克隆 新增多人对话 一键整合包 v20260130

Qwen3-TTS:让文字拥有灵魂的声音艺术家 文字生成语音 语音克隆 新增多人对话 一键整合包 v20260130

Qwen3-TTS 开源项目介绍Qwen3-TTS 是由 Qwen 团队开发的一系列强大语音生成模型,于 2026 年 1 月 22 日正式发布。该项目提供全面的语音生成能力,包括语音克隆、语音设计、超高质量类人语音生成和基于自然语言的语音控制,为开发者和用户提供了目前最广泛的语音生成功能集。核心特性1. 多语言支持Qwen3-TTS 覆盖 ...
AI 7068 6
神器 开源 一键安装!Pinokio 支持目前主流的大部分AI项目,操作极其简单  v6.0.10

神器 开源 一键安装!Pinokio 支持目前主流的大部分AI项目,操作极其简单 v6.0.10

这个工具全部都是免费的。我记得之前有个叫什么白的工具貌似还收费,这个基本上你听说过的AI开源项目 它都有,而且还是一键安装。一个工具整合AI绘画、AI视频、AI语音,还有AI数字人的工具:AI 绘画,又能 AI 对话、AI 视频生成、AI语音生成,还能 AI 数字人支持 W...
软件 7183 7
Z-Image(造相)AI文生图  v20260128 一键整合包,支持批量生成图片,可直接用于生产的一键整合包

Z-Image(造相)AI文生图 v20260128 一键整合包,支持批量生成图片,可直接用于生产的一键整合包

Z-Image(造相)是阿里巴巴通义实验室(Tongyi MAI)推出的高效图像生成基础模型家族,以"小参数、高质量、极速推理"为核心设计理念,在开源图像生成领域树立了新的性能标杆。核心技术特点参数规模与架构:采用 60 亿参数(6B)的轻量级设计,基于创新的可扩展单流扩散 Transformer(S3-DiT)架构,将文...
AI 5593 10
开源 神器 Stability Matrix  一款功能强大、易于使用的Stable Diffusion管理工具 v2.15.5

开源 神器 Stability Matrix 一款功能强大、易于使用的Stable Diffusion管理工具 v2.15.5

Stability Matrix是由Lykos AI开发的一款革命性工具,专为简化Stable Diffusion的使用和管理而设计。作为一款多平台包管理器和推理用户界面,它极大地提升了Stable Diffusion的易用性和用户体验。核心功能多平台支持:Stability Matrix支持macOS、Windows和Linux系统,确保用...
AI,开源 6300 1
开源 跨平台截图、录屏、录音、录像软件  pear-rec v1.3.17

开源 跨平台截图、录屏、录音、录像软件 pear-rec v1.3.17

功能很强大的一款软件,界面非常简洁,没有乱七八糟的东西,我很喜欢这样的软件。功能大伙看截图就明白了。我分享的是win版本。如果需要其他平台的版本可以去开源地址下载。pear-rec(pear rec)是一款跨平台的截屏、录屏、录音、录像软件。pear-rec(pear rec)是一个基于react+electron+vite+ffmpeg+v...
软件 4886 7
开源 Pineapple Pictures(菠萝看图)  绿色版 一款轻量级且功能丰富的图片查看器 v1.3.0

开源 Pineapple Pictures(菠萝看图) 绿色版 一款轻量级且功能丰富的图片查看器 v1.3.0

介绍Pineapple Pictures是一款轻量级且功能丰富的图片查看器,它以其简洁的界面、高效的性能和广泛的文件格式支持而受到用户的青睐。以下是对该软件的详细介绍:主要功能广泛支持图片格式:Pineapple Pictures支持包括JPG、PNG、GIF、SVG、PSD、KRA、XCF、TGA、AVIF等在内的多种常见及专业图片格式,满...
软件 4591 4
功能全面,操作便捷的免费文件改名工具 zRenamer v1.7.0 绿色免安装

功能全面,操作便捷的免费文件改名工具 zRenamer v1.7.0 绿色免安装

zRenamer是一款功能强大且操作便捷的文件批量重命名工具,它的诞生源于开发者对之前同类软件MiniRenamer的不懈追求与改进。zRenamer在界面设计上参考了老牌改名工具拖把改名,并在此基础上进行了多项优化,使得软件在加载和执行速度、右键菜单支持等方面都有了显著提升。软件追求轻巧不冗余、页面直观、功能简洁、操作便捷高效的理念,为用户...
软件 3510 0
轻量、快速、免费、无需显卡 EasyTTS 重新定义本地 TTS 体验 一键整合包 v20260117

轻量、快速、免费、无需显卡 EasyTTS 重新定义本地 TTS 体验 一键整合包 v20260117

EasyTTS(由 GitHub 用户 yunchenqwq 开发)是一个专注于中文语音合成的开源文本转语音(Text-to-Speech, TTS)系统,其核心目标是提供一个无需复杂依赖、无需训练、本地运行、开箱即用的高质量 TTS 解决方案。该项目特别针对中文用户在实际使用中常见的痛点(如多音字错误、语调生硬、部署困难等)进行了优化,强调...
AI,开源 3089 0
开源 CherryTree(富文本笔记软件) 官方便携版 v1.6.3

开源 CherryTree(富文本笔记软件) 官方便携版 v1.6.3

介绍CherryTree 是免费的富文本笔记软件,它支持层次结构的笔记应用程序,支持富文本和语法高亮,带有密码保护的存储格式支持单个 XML 或者 SQLite 文件,以及目录/文件。CherryTree 支持跨 Windows、Mac OS X、以及 Linux 等平台使用,可以适应不同人不同系统的操作习惯,方便用户间的切换。以下是 Che...
软件 3599 1
AI 图像魔法: 图片超分辨率 无损放大 x2x4 v1.0

AI 图像魔法: 图片超分辨率 无损放大 x2x4 v1.0

基于 image_gen_aux 和 Gradio 开发的通用图像增强工具。本项目集成了大量由 Phips 训练的高性能 AI 模型,支持图像去噪、去 JPEG 压缩痕迹、无损/有损放大以及动漫风格化处理。✨ 核心功能🤖 多模型支持:内置 60+ 种精选模型,涵盖 1x(修复)、2x(双倍放大)、4x(四倍放大)等多种分辨率增强需求。📱 移动...
AI 2759 0
 VoiceSculptor:基于指令驱动的下一代语音合成开源框架——让AI语音拥有精准的情感与音色控制能力 v20260108 一键整合包

VoiceSculptor:基于指令驱动的下一代语音合成开源框架——让AI语音拥有精准的情感与音色控制能力 v20260108 一键整合包

🎵 VoiceSculptor - 指令驱动的语音合成模型📌 项目概述VoiceSculptor是由ASLP实验室(Audio, Speech and Language Processing Laboratory)开发的一款先进的指令式文本到语音(instruct text-to-speech)开源模型。2该项目代表了语音合成技术的前沿发展方...
开源 2859 0