SenseVoice:解锁语音理解新高度,多语言情感识别与事件检测全攻略 语音转文本 一键汉化整合包 v1.0

SenseVoice:解锁语音理解新高度,多语言情感识别与事件检测全攻略 语音转文本 一键汉化整合包 v1.0

FunAudioLLM/SenseVoice: Multilingual Voice Understanding Model 是一个专注于语音理解的开源项目,旨在提供高精度的多语言语音识别、语音情感识别和音频事件检测功能。这个项目由 FunAudioLLM 团队开发和维护,基于 FunASR 工具包构建,支持多种语言和方言,包括中文、英语、粤...
AI,开源 4271 2
Free-TTS_unlimted-words v1.0 AI文字生成语音,调用Edge TTS接口运行 一键整合包 无需要显卡即可运行

Free-TTS_unlimted-words v1.0 AI文字生成语音,调用Edge TTS接口运行 一键整合包 无需要显卡即可运行

Edge TTS(Edge Text-to-Speech) 是微软推出的一款基于深度学习技术的文本转语音(TTS)工具,具有高质量语音合成、多语言支持、灵活配置和开源可扩展等特点,广泛应用于语音助手、电子书阅读、视频制作、教育及智能客服等领域。核心功能高质量语音合成Edge TTS 采用先进的深度学习技术,能够生成自然流畅、接近真人...
AI,开源 2929 0
Orpheus-TTS:AI文字合成语音,让语言更有温度 一键整合包 支持生成中文语音

Orpheus-TTS:AI文字合成语音,让语言更有温度 一键整合包 支持生成中文语音

Orpheus-TTS是一个前沿的开源文本转语音(Text-To-Speech,TTS)系统,它基于Llama-3b这一强大的大型语言模型(LLM)构建。该项目展示了在语音合成领域使用大型语言模型的新兴能力,为用户带来了前所未有的自然语音体验。Orpheus-TTS的核心优势在于其人类般的语音表现。它能够生成具有自然语调、情感和节奏的语音,这...
AI,开源 4867 6
神器 Z-Info v1.0.45.45 硬件检测4件套 一款功能强大且全面适用于Windows操作系统的硬件检测工具组合

神器 Z-Info v1.0.45.45 硬件检测4件套 一款功能强大且全面适用于Windows操作系统的硬件检测工具组合

Z-Info硬件检测4件套是一款功能强大且全面适用于Windows操作系统的硬件检测工具组合,它整合了CPU-Z、GPU-Z、PCI-Z和SSD-Z四个热门软件的所有功能,为用户提供了一个方便、快捷、全面的硬件信息分析平台。这款工具组合由独立开发者精心打造,支持Windows XP、Windows 7、Windows 8以及Windows 1...
软件 2966 0
大笨狗更名器 批量修改文件名工具4.56 正式版 绿色免安装

大笨狗更名器 批量修改文件名工具4.56 正式版 绿色免安装

大笨狗批量修改文件名工具一款功能强大且完全免费的绿色软件,由缤纷软件推出,专为解决用户批量修改文件名而设计。该软件无需安装,解压缩后即可直接使用,且不会附带安装其他软件,保证了用户使用的便捷性和安全性。以下是该软件的详细介绍:主要功能批量删除与替换:用户可以批量删除文件名中的指定字符,或从文件名中指定位置删除n个字符;同时支持批量替换文件名中...
软件 3177 0
MyFileReName v1.4.1 简单好用又强大的Windows改名助手,公式化改名

MyFileReName v1.4.1 简单好用又强大的Windows改名助手,公式化改名

功能详细介绍1. 文件和文件夹拖放功能拖放操作:用户可以将文件或文件夹拖放到软件界面中,工具会自动处理拖放的文件路径文件夹处理:工具能够递归处理文件夹中的文件,根据用户选择决定是否包括子目录2. 重命名规则设置规则添加:用户可以在规则输入框中输入自定义的重命名规则,支持多种规则格式规则保存:用户可以保存自定义的重命名规则到rules.txt文...
软件 2720 2
澎湃音乐 v1.9.2 一款既具备高颜值又功能强大的本地音乐播放器

澎湃音乐 v1.9.2 一款既具备高颜值又功能强大的本地音乐播放器

B站大神必辟系地 出品在数字音乐盛行的今天,一款既具备高颜值又功能强大的本地音乐播放软件成为了众多音乐爱好者的追求。澎湃音乐,正是这样一款集美观与实用于一身的音乐播放神器。澎湃音乐由必辟系地的大佬精心开发,它不仅拥有令人赏心悦目的界面设计,更在功能上进行了全面优化,以满足用户对于本地音乐播放的多样化需求。这款软件支持多种存储介质,包括但不限于...
软件 3579 0
BEN2 v1.1 AI人工智能 图片批量抠图+视频抠像工具 一键整合包 视频可以输出透明通道

BEN2 v1.1 AI人工智能 图片批量抠图+视频抠像工具 一键整合包 视频可以输出透明通道

虽然我已经分享了不少的抠图和视频抠像的工具,但是谁又会嫌弃好工具多呢?所以抽空做了这个BEN2的整合包,这个整合包最大的特点就是可以输出带有透明通道的webm视频格式。在图像和视频处理领域,前景分割技术一直是研究和应用的热点。无论是视频编辑、特效制作,还是人工智能驱动的内容生成,精准的前景分割都是实现高质量输出的关键。而今天我们要介绍的,是一...
AI,开源 7175 5
开源 Dev-Sidecar v2.0.1 开发者边车辅助工具 国外网站加速

开源 Dev-Sidecar v2.0.1 开发者边车辅助工具 国外网站加速

Dev-Sidecar是一款专门为开发者设计的辅助工具,它的主要功能是帮助用户更快速、更稳定地访问GitHub等学习网站。这款软件的命名取自service-mesh的service-sidecar,意为“为开发者打辅助的边车工具”,寓意着它就像一辆边车,陪伴开发者在编程的道路上驰骋。Dev-Sidecar通过本地代理的方式,将Https请求代...
软件 3537 0
免费 小巧 Windows MiniRenamer 批量文件重命名 v2.2.2 绿色版

免费 小巧 Windows MiniRenamer 批量文件重命名 v2.2.2 绿色版

MiniRenamer是一款功能强大、操作简便的文件重命名工具。它可以帮助用户快速批量重命名,节省时间和精力。MiniRenamer提供了多种重命名选规则设置,使用户能够根据自己的需求轻松地进行文件重命名操作。MiniRenamer的界简洁直观,易于使用。它主要分为三个部分:文件用户可以直接拖拽需要重命名的,也可以使用“添加文件”按钮选择需要...
软件 5493 16
WechatRealFriends V1.0.4 快速、精准筛查出微信朋友圈已删除或拉黑你的好友 开源 支持pc端

WechatRealFriends V1.0.4 快速、精准筛查出微信朋友圈已删除或拉黑你的好友 开源 支持pc端

WechatRealFriends 是一款基于微信iPad协议的Windows端开源工具,专注于解决微信生态中长期存在的单向好友检测难题。其核心价值在于快速、精准筛查出已删除或拉黑你的好友,并通过自动化标签分类功能,帮助用户高效管理社交关系。该工具通过模拟iPad设备登录微信,调用公开协议接口分析好友关系链,无需主动发送消息或转账,即可在后台...
软件 4081 0
ClearerVoice-Studio   AI语音增强、语音降噪工具,一键整合包,二开作品 支持批量操作

ClearerVoice-Studio AI语音增强、语音降噪工具,一键整合包,二开作品 支持批量操作

ClearerVoice-Studio是由阿里巴巴达摩院通义实验室开源的综合性语音处理工具包,旨在为语音技术研究和应用提供高效解决方案。其核心功能覆盖语音增强、分离、目标说话人提取及超分辨率处理,通过融合复数域深度学习算法与先进模型架构,显著提升了复杂声学场景下的语音处理效果。技术架构与核心优势该框架采用复数域深度学习技术,通过FRCRN(复...
AI,开源 5558 0
MeloTTS v0.1.2  AI文本生成语音工具,支持英伟达显卡+cpu运行,速度极快 支持六国语言,一键整合包

MeloTTS v0.1.2 AI文本生成语音工具,支持英伟达显卡+cpu运行,速度极快 支持六国语言,一键整合包

MeloTTS:高质量多语言文本到语音合成工具详解MeloTTS是由MyShell AI开发的一款开源文本到语音(TTS)合成工具,其核心目标是提供高效、自然的多语言语音合成解决方案。该工具通过深度学习技术实现了从文本到语音的流畅转换,支持包括英语、中文、日语、韩语在内的多种语言,尤其在中英混合发音场景中具有显著优势。以下从技术架构、核心功能...
AI,开源 4048 4
LatentSync v1.5 字节跳动联合北京交通大学推出AI数字人工具,汉化一键整合包

LatentSync v1.5 字节跳动联合北京交通大学推出AI数字人工具,汉化一键整合包

LatentSync是由字节跳动联合北京交通大学推出的端到端唇形同步框架,基于音频条件潜在扩散模型(Latent Diffusion Models),旨在实现语音与唇形运动的高精度同步。该项目通过结合Stable Diffusion的生成能力与音视频联合建模技术,解决了传统方法依赖中间表示(如3D模型或2D关键点)的复杂性问题,直接生成动态逼...
AI,开源 7037 17
AI人工智能 图片高清修复放大Tile-Upscaler v1.0  一键汉化整合包

AI人工智能 图片高清修复放大Tile-Upscaler v1.0 一键汉化整合包

本工具基于Tile-Upscaler二次开发,简单直接,操作点2下即可,图片高清修复效果还不错,处理速度我的4070tisuper一张1080x1920的图片大概8秒就可以完成高清修复。效果演示原图我个人觉得高清修复效果还可以。所以就花了点时间整合了一下,另外修改了部分代码1 修正一些小bug2 删除没用的演示例子3&nb...
AI,开源 5265 2
MatAnyone v1.0.0 人工智能AI 自定义视频抠图 一键汉化整合包 附视频演示

MatAnyone v1.0.0 人工智能AI 自定义视频抠图 一键汉化整合包 附视频演示

MatAnyone是一个专注于人类视频抠图(Matting)的实用框架,其独特之处在于支持目标分配功能,并能在核心区域语义和精细边界细节上表现出稳定的性能。该项目由Peiqing Yang等人在2025年提出,并在CVPR(Conference on Computer Vision and Pattern Recognition)这一顶级计算...
AI,开源 8794 12
吾爱大神的原创作品 图片批量转化工具v1.6.1 绿色免安装

吾爱大神的原创作品 图片批量转化工具v1.6.1 绿色免安装

以下是作者的原话写给老婆用的,需求简单,就是可以转换图片格式,当时主要是webp的格式转换麻烦,要一张张弄~初始版本太简单了,没发目前V1.1.0 版本发布,功能大幅增强,代码优化了下,速度也挺快了,同时把防呆和异常处理也补齐了分享给兄弟们啦! 操作还是非常简单的,目前同类型咱们这个很实用!主要功能:1. “全”图片格式支持,常见不常见的大概...
软件 2999 0
InspireMusic AI人工智能音乐、歌曲和音频生成的开源一键中文整合包

InspireMusic AI人工智能音乐、歌曲和音频生成的开源一键中文整合包

InspireMusic是一个专注于音乐、歌曲和音频生成的开源项目,它提供了一个统一的框架来实现这些生成任务。以下是对该项目的详细介绍:主要功能音乐生成:支持文本提示、音乐类型、音乐结构等多种控制方式,可生成高质量的音乐作品。歌曲生成:能够根据用户的文本描述或音乐结构生成完整的歌曲。音频生成:可以生成各种类型的音频,包括但不限于背景音乐、音效...
AI,开源 3629 0
手机软件 安卓app DiskUsage v5.0-alpha1 一款开源的Android设备空间占用扫app

手机软件 安卓app DiskUsage v5.0-alpha1 一款开源的Android设备空间占用扫app

DiskUsage是一个专为Android设备设计的开源应用程序,旨在帮助用户高效地管理和清理存储卡上的空间。DiskUsage的核心功能是提供一个直观且易用的界面,让用户能够轻松找到并识别出存储卡上占用大量空间的文件和目录。它采用了一种独特的图表显示方式,将各个目录的大小以比例形式直观地呈现出来,同时还展示了多层子目录的结构。这种可视化的方...
安卓 3008 0
手机软件 安卓pp UnitConverterUltimate v5.7.3 一款功能全面、界面美观、易于使用的开源单位转换应用

手机软件 安卓pp UnitConverterUltimate v5.7.3 一款功能全面、界面美观、易于使用的开源单位转换应用

Unit Converter Ultimate是一款由physphil开发的开源单位转换应用。这款应用以其简洁、轻量级和Material Design主题的用户界面脱颖而出,为用户提供了一种快速、便捷的单位转换体验。Unit Converter Ultimate支持多种类型的单位转换,包括但不限于货币、温度、长度、质量/重量、速度、面积、烹饪...
安卓 1672 0
星空地图Sky Map  v1.10.9 一款功能强大、易于使用的开源天文应用

星空地图Sky Map v1.10.9 一款功能强大、易于使用的开源天文应用

是一款由sky-map-team团队开发的开源天文应用,其源代码托管在GitHub上。这款应用旨在为用户提供一种便捷的方式,通过智能手机或平板电脑来探索夜空中的星星、星座和其他天文现象。Sky Map的核心功能是实时显示用户所在位置的上空天文图。用户只需打开应用,将手机指向天空,应用就会自动识别并显示出当前位置可见的星星、星座、行星等信息。此...
安卓 1930 0
手机软件 安卓app Iceraven v2.28.0 一款专为 Android 平台设计的开源浏览器

手机软件 安卓app Iceraven v2.28.0 一款专为 Android 平台设计的开源浏览器

Iceraven Browser 是一款专为 Android 平台设计的开源浏览器,其代码库托管于 GitHub,由社区开发者基于 Mozilla Firefox 的分支(Fenix 项目)进行优化和扩展。该项目旨在提供更高效、安全、高度可定制的移动浏览体验,同时支持丰富的扩展功能和隐私保护机制。以下是其核心特性与技术亮点:一、项目背景与目标...
安卓 2252 0
手机软件 安卓pp FFShare v1.3.3 一款功能强大图像、视频和音频文件压缩工具

手机软件 安卓pp FFShare v1.3.3 一款功能强大图像、视频和音频文件压缩工具

FFShare是一款功能强大的Android应用程序,它专注于在分享前对图像、视频和音频文件进行压缩。这款应用利用了ffmpeg这一强大的多媒体处理工具,为用户提供了一个便捷、高效的文件压缩解决方案。首先,从用户的角度来看,FFShare的最大亮点在于其压缩功能。在日常使用中,我们经常会遇到因为文件过大而无法快速分享或上传的问题。FFShar...
安卓 2502 0
手机软件 安卓app yetCalc v2.0.6 一个专为 Android 平台设计和开发的开源计算器应用

手机软件 安卓app yetCalc v2.0.6 一个专为 Android 平台设计和开发的开源计算器应用

yetCalc 是一个专为 Android 平台设计和开发的开源计算器应用。该项目由开发者 Yet-Zio 在 GitHub 上发起,旨在为用户提供一个功能全面、界面友好的计算工具。凭借其丰富的功能和持续更新,yetCalc 已经吸引了大量用户的关注和使用。核心功能‌多主题切换‌:yetCalc 支持多种主题切换...
安卓 2188 0
手机软件 安卓app Calculator-inator v1.3.0 一个功能强大的开源计算器app

手机软件 安卓app Calculator-inator v1.3.0 一个功能强大的开源计算器app

Calculator-inator 是一个功能强大的开源Android应用程序,旨在为用户提供一款集计算器与转换器功能于一体的实用工具。该项目由开发者 prathameshmm02 在 GitHub 上发起并维护,吸引了众多用户的关注和贡献。通过其丰富的功能和用户友好的界面设计,Calculator-inator 成为了许...
安卓 2094 0
Spark-TTS 一款开源 功能强大、高效且灵活的文本转语音工具 一键整合包

Spark-TTS 一款开源 功能强大、高效且灵活的文本转语音工具 一键整合包

Spark-TTS是一款先进的文本转语音(Text-to-Speech,TTS)系统,它利用大型语言模型(Large Language Model,LLM)的强大功能,实现了高度准确且自然流畅的语音合成。该系统旨在为研究和生产使用提供高效、灵活且强大的解决方案。Spark-TTS的核心优势在于其简洁性和效率。它完全基于Qwen2.5构建,无需...
安卓 7640 14
CogView4 一键整合包 一个功能强大且易于使用的文本到图像生成模型 支持中文提示词

CogView4 一键整合包 一个功能强大且易于使用的文本到图像生成模型 支持中文提示词

该项目由群里傻木推荐,我测试了下 说实话 效果真是一般,对中文的支持还是不够好,下面有截图。我目前这个整合包只能算是半成品,目前只做到了可以运行,但是效率性能什么的都没有去做优化。以后看心血来潮了再动动。CogView4是一个前沿的文本到图像生成模型,由THUDM(清华大学计算机系自然语言处理与人机交互实验室)开发并开源在...
开源 3021 0
手机软件 安卓app FOSS Browser 18.1 一款开源的手机浏览器 支持手势

手机软件 安卓app FOSS Browser 18.1 一款开源的手机浏览器 支持手势

FOSS Browser是一款全自由(在自由的意义上)且完全开源的浏览器,其设计理念着重强调用户的隐私保护。这款浏览器在GitHub(或类似平台,如本例中的Codeberg)上托管其源代码,允许任何用户查看、修改和分发。FOSS Browser采用了最新的Material You设计库,使得用户界面(UI)既现代又美观。它支持系统的日夜模式,...
安卓 2596 0
手机软件 安卓app AdAway 6.1.4 一款功能强大、易于使用的广告拦截工具

手机软件 安卓app AdAway 6.1.4 一款功能强大、易于使用的广告拦截工具

AdAway是一款专为Android设备设计的开源广告拦截工具,它利用hosts文件和本地VPN技术来有效屏蔽广告内容。这款软件以其高效、简洁和易用的特点,赢得了广大Android用户的青睐。AdAway提供了两种版本供用户选择:预览版和稳定版。预览版位于开发的前沿,适合测试者或喜欢尝试新功能的用户。这些版本可能包含针对新Android版本的...
安卓 2218 0
手机软件 安卓app OpenCamera v1.53.1 一款功能丰富、高度可定制且易于使用的开源相机APP

手机软件 安卓app OpenCamera v1.53.1 一款功能丰富、高度可定制且易于使用的开源相机APP

OpenCamera,作为一款广受欢迎的开源相机应用,该项目自诞生以来,便以提供高质量、高度可定制的拍照体验为目标,吸引了大量摄影爱好者和开发者的关注。OpenCamera的核心优势在于其丰富的功能和高度的可定制性。与传统相机应用相比,它提供了更为详尽的拍摄参数调整选项,如ISO、白平衡、曝光补偿等,让用户能够根据自己的拍摄需求进行精细调整。...
安卓 2587 0
开源 CosyVoice v20250229整合包 一款AI人工智能 多语言语音生成模型 文字生成语音工具 附效果演示

开源 CosyVoice v20250229整合包 一款AI人工智能 多语言语音生成模型 文字生成语音工具 附效果演示

CosyVoice是由阿里通义实验室开源的一款多语言语音生成模型,旨在提升人类与大型语言模型(LLMs)之间的自然语音交互体验。该项目作为FunAudioLLM框架中的核心模型之一,专注于高质量的语音合成,能够生成自然且逼真的语音。以下是对CosyVoice开源项目的详细介绍:一、项目背景与目的随着人工智能技术的不断发展,语音交互已成为人机交...
软件 1.1万 30