ClearerVoice-Studio   AI语音增强、语音降噪工具,一键整合包,二开作品 支持批量操作

ClearerVoice-Studio AI语音增强、语音降噪工具,一键整合包,二开作品 支持批量操作

ClearerVoice-Studio是由阿里巴巴达摩院通义实验室开源的综合性语音处理工具包,旨在为语音技术研究和应用提供高效解决方案。其核心功能覆盖语音增强、分离、目标说话人提取及超分辨率处理,通过融合复数域深度学习算法与先进模型架构,显著提升了复杂声学场景下的语音处理效果。技术架构与核心优势该框架采用复数域深度学习技术,通过FRCRN(复...
AI,开源 5556 0
MeloTTS v0.1.2  AI文本生成语音工具,支持英伟达显卡+cpu运行,速度极快 支持六国语言,一键整合包

MeloTTS v0.1.2 AI文本生成语音工具,支持英伟达显卡+cpu运行,速度极快 支持六国语言,一键整合包

MeloTTS:高质量多语言文本到语音合成工具详解MeloTTS是由MyShell AI开发的一款开源文本到语音(TTS)合成工具,其核心目标是提供高效、自然的多语言语音合成解决方案。该工具通过深度学习技术实现了从文本到语音的流畅转换,支持包括英语、中文、日语、韩语在内的多种语言,尤其在中英混合发音场景中具有显著优势。以下从技术架构、核心功能...
AI,开源 4048 4
LatentSync v1.5 字节跳动联合北京交通大学推出AI数字人工具,汉化一键整合包

LatentSync v1.5 字节跳动联合北京交通大学推出AI数字人工具,汉化一键整合包

LatentSync是由字节跳动联合北京交通大学推出的端到端唇形同步框架,基于音频条件潜在扩散模型(Latent Diffusion Models),旨在实现语音与唇形运动的高精度同步。该项目通过结合Stable Diffusion的生成能力与音视频联合建模技术,解决了传统方法依赖中间表示(如3D模型或2D关键点)的复杂性问题,直接生成动态逼...
AI,开源 7036 17
AI人工智能 图片高清修复放大Tile-Upscaler v1.0  一键汉化整合包

AI人工智能 图片高清修复放大Tile-Upscaler v1.0 一键汉化整合包

本工具基于Tile-Upscaler二次开发,简单直接,操作点2下即可,图片高清修复效果还不错,处理速度我的4070tisuper一张1080x1920的图片大概8秒就可以完成高清修复。效果演示原图我个人觉得高清修复效果还可以。所以就花了点时间整合了一下,另外修改了部分代码1 修正一些小bug2 删除没用的演示例子3&nb...
AI,开源 5264 2
MatAnyone v1.0.0 人工智能AI 自定义视频抠图 一键汉化整合包 附视频演示

MatAnyone v1.0.0 人工智能AI 自定义视频抠图 一键汉化整合包 附视频演示

MatAnyone是一个专注于人类视频抠图(Matting)的实用框架,其独特之处在于支持目标分配功能,并能在核心区域语义和精细边界细节上表现出稳定的性能。该项目由Peiqing Yang等人在2025年提出,并在CVPR(Conference on Computer Vision and Pattern Recognition)这一顶级计算...
AI,开源 8788 12
吾爱大神的原创作品 图片批量转化工具v1.6.1 绿色免安装

吾爱大神的原创作品 图片批量转化工具v1.6.1 绿色免安装

以下是作者的原话写给老婆用的,需求简单,就是可以转换图片格式,当时主要是webp的格式转换麻烦,要一张张弄~初始版本太简单了,没发目前V1.1.0 版本发布,功能大幅增强,代码优化了下,速度也挺快了,同时把防呆和异常处理也补齐了分享给兄弟们啦! 操作还是非常简单的,目前同类型咱们这个很实用!主要功能:1. “全”图片格式支持,常见不常见的大概...
软件 2999 0
InspireMusic AI人工智能音乐、歌曲和音频生成的开源一键中文整合包

InspireMusic AI人工智能音乐、歌曲和音频生成的开源一键中文整合包

InspireMusic是一个专注于音乐、歌曲和音频生成的开源项目,它提供了一个统一的框架来实现这些生成任务。以下是对该项目的详细介绍:主要功能音乐生成:支持文本提示、音乐类型、音乐结构等多种控制方式,可生成高质量的音乐作品。歌曲生成:能够根据用户的文本描述或音乐结构生成完整的歌曲。音频生成:可以生成各种类型的音频,包括但不限于背景音乐、音效...
AI,开源 3624 0
开源 CosyVoice v20250229整合包 一款AI人工智能 多语言语音生成模型 文字生成语音工具 附效果演示

开源 CosyVoice v20250229整合包 一款AI人工智能 多语言语音生成模型 文字生成语音工具 附效果演示

CosyVoice是由阿里通义实验室开源的一款多语言语音生成模型,旨在提升人类与大型语言模型(LLMs)之间的自然语音交互体验。该项目作为FunAudioLLM框架中的核心模型之一,专注于高质量的语音合成,能够生成自然且逼真的语音。以下是对CosyVoice开源项目的详细介绍:一、项目背景与目的随着人工智能技术的不断发展,语音交互已成为人机交...
软件 1.1万 30
MMAudio  v0.1 AI视频生成背景声音  文生生成声音 一键整合包 8G英伟达显卡可用,无需安装环境,解压即可使用

MMAudio v0.1 AI视频生成背景声音 文生生成声音 一键整合包 8G英伟达显卡可用,无需安装环境,解压即可使用

MMAudio是一个开源项目,旨在通过多模态联合训练生成高质量的同步音频。以下是关于这个项目的详细介绍:项目概述MMAudio由香港中文大学的程浩基(Ho Kei Cheng)等人开发,主要功能是根据视频和/或文本输入生成同步音频。其核心创新在于多模态联合训练方法,能够在广泛的音视频和音文本数据集上进行训练。此外,同步模块可以将生成的音频与视...
AI,开源 5434 0
HivisionIDPhotos v1.3.1 一个专注于证件照智能制作的开源项目 一键整合包 支持批量处理 附视频演示

HivisionIDPhotos v1.3.1 一个专注于证件照智能制作的开源项目 一键整合包 支持批量处理 附视频演示

HivisionIDPhotos 是一个专注于证件照智能制作的开源项目,由Zeyi-Lin开发并维护。该项目旨在通过先进的图像处理和机器学习技术,为用户提供一种高效、便捷的证件照制作解决方案。项目结合了轻量级抠图、多尺寸规格生成、智能换底等多种功能,让用户能够轻松制作出符合标准的证件照。核心功能轻量级抠图:HivisionIDPhotos采用...
AI,开源 6691 19
开源 MD5 校验器 v20250121一个简单易用的文件完整性校验工具

开源 MD5 校验器 v20250121一个简单易用的文件完整性校验工具

一个基于 Python 和 Tkinter 开发的图形用户界面应用——MD5 校验器。这是一个非常实用的工具,可以帮助你生成和校验文件的 MD5 哈希值,非常适合需要验证文件完整性和一致性的场景。为什么选择 MD5 校验器?在日常工作中,我们经常需要验证文件是否被篡改或损坏,MD5 校验器提供了一个简单而高效的解决方案。无论是常规文件的完整性...
软件 4021 1
开源 离线环境音 Opal v1.5 助眠放松,定时关机 多主题 40种音源 绿色免安装

开源 离线环境音 Opal v1.5 助眠放松,定时关机 多主题 40种音源 绿色免安装

在快节奏的现代生活中,找到一片宁静的空间来放松自己,或者集中注意力完成工作,有时成为了一种奢侈。而Opal环境音播放软件,正是为此类需求量身打造的一款跨平台工具。无论是Windows、macOS还是Linux用户,都能在这款软件中找到属于自己的那份宁静。Opal软件内置了约40种丰富的音源,这些音源被巧妙地分为了多个类别,如自然、办公室、观众...
软件 2936 1
开源 Monitor Brightness Adjuster  v1.4.2 显示器屏幕亮度调节小工具

开源 Monitor Brightness Adjuster v1.4.2 显示器屏幕亮度调节小工具

Monitor Brightness Adjuster是一个实用的开源工具,旨在帮助用户方便地控制其显示器的亮度。无论你是在深夜工作,还是需要微调你的显示设置,这个工具都提供了一个便捷的方式来调整亮度水平。以下是对该工具的详细介绍:主要功能:多显示器支持:Monitor Brightness Adjuster能够无缝地与多个显示器一起工作,这...
软件 3249 1
开源 Fish Speech v1.5.0 优化版 文字转语音 可以克隆声音 一键整合包 附效果演示

开源 Fish Speech v1.5.0 优化版 文字转语音 可以克隆声音 一键整合包 附效果演示

Fish Speech是一个由Fish Audio团队开发的全新文本转语音(TTS)解决方案,旨在通过先进的机器学习和深度学习技术,将文本转换成高质量、逼真的语音输出。该项目基于CC-BY-NC-SA-4.0许可证发布,意味着任何人都可以在遵守许可证规定的前提下自由使用、改进和分享代码和模型。技术亮点Fish Speech项目采用了一系列前沿...
开源 1.2万 23
zenshot v1.2.3 一款基于 Qt 框架开发的开源跨平台截图工具

zenshot v1.2.3 一款基于 Qt 框架开发的开源跨平台截图工具

ZenShot 是一款基于 Qt 框架开发的开源跨平台截图工具,由禅道团队精心打造。它以其启动即用、方便快速的特点,以及丰富的功能和多样的标注选项,赢得了广大用户的青睐。无论是Windows、macOS还是Linux(正在适配中),ZenShot都能提供流畅且稳定的截图体验。该工具的亮点之一是其易用性。用户无需复杂的设置,即可快速启动并开始截...
软件 2492 0
moondream v1.2 开源 AI人工智能 图片反推提示词神器,可批量处理图片提示词 一键整合包

moondream v1.2 开源 AI人工智能 图片反推提示词神器,可批量处理图片提示词 一键整合包

vikhyat/moondream是一个开源的、轻量级的视觉语言模型项目,旨在提供强大的图像理解和生成能力,同时确保模型可以在各种环境下高效运行。该项目在GitHub上托管,拥有简洁的代码库和丰富的文档资源,为开发者提供了便捷的使用和定制体验。项目的核心是一个视觉语言模型,该模型能够接收图像作为输入,并基于图像内容生成相应的文本描述或回答相关...
AI,软件 8338 12
Clarity-Refiners-UI  一个专注于图像增强的开源项目 一键整合包

Clarity-Refiners-UI 一个专注于图像增强的开源项目 一键整合包

Pinokiofactory/Clarity-Refiners-UI 是一个专注于图像增强的开源项目,它基于 Pinokio UI 框架,并融合了多项先进的图像处理技术。该项目旨在为用户提供一种高效、易用且功能强大的图像增强解决方案。项目背景与目的Pinokiofactory/Clarity-Refiners-UI 是 Pinokio 工厂团...
AI,开源 3014 2
RMBG-2-Studio AI人工智能 抠图神器 一键整合包

RMBG-2-Studio AI人工智能 抠图神器 一键整合包

RMBG-2-Studio是一个基于BRIA-RMBG-2.0模型构建的增强型Pinokio应用程序,它不仅包含了安装文件,还提供了一系列强大的图像处理功能。以下是对该开源项目的详细介绍:项目背景与目的:RMBG-2-Studio旨在为用户提供一种高效、便捷的图像背景移除和图像合成工具。它利用了BRIA AI公司开发的RMBG v2.0背景移...
AI,开源 4857 2
小巧图片压缩软件 Color quantizer V0.7.4.4 绿色免安装

小巧图片压缩软件 Color quantizer V0.7.4.4 绿色免安装

Color quantizer是一款功能强大且简单易用的图片压缩工具,它能够帮助用户轻松进行图片的优化处理,特别是在颜色量化方面表现出色。以下是对Color quantizer的详细介绍:一、主要功能颜色量化:Color quantizer支持将图片转换为任意数量的颜色,这一功能使得用户可以根据需要对图片进行精细的颜色调整和优化。PNG压缩:...
软件 3672 0
吾爱 出品 文本自动换行工具

吾爱 出品 文本自动换行工具

操作简单,但是真有用可设置换行长度支持自定义字体和字号字号变化时自动调整换行长度保持视觉效果一致支持所有语言文本实时预览,左侧输入即时在右侧显示换行效果文本框支持水平和垂直滚动主要用于处理需要文本换行的场景,如排版、字幕制作等。操作简单直观,所有更改都能即时预览。吾爱大神南星原创出品
软件 4209 1
文本关键词字符自动替换器v2.9吾爱版

文本关键词字符自动替换器v2.9吾爱版

软件实现一键替换文本文件里的关键词或整行内容,已经支持Word、Excel文件的字符替换(不支持整行),替换PPT不太完美,替换PPT时会自动打开PPT文件完成替换的,并且会检测PPT编辑,介意勿使用于PPT。支持拖放读取文件或对话框选择文件,并自动识别文件的编码支持启用或禁用备份原文件,建议启用备份,避免替换出错而破坏原文件数据查找到的关键...
软件 2417 0
ScrollSound v1.24 一款实用且便捷的开源音量控制工具

ScrollSound v1.24 一款实用且便捷的开源音量控制工具

ScrollSound是一个实用的开源小工具,旨在为用户提供一种便捷的方式来调节系统音量。这款软件通过监听任务栏空白处的滚轮事件,允许用户在不离开当前操作界面的情况下,轻松调整音量大小或实现静音功能。以下是对ScrollSound的详细介绍:软件功能与特点:音量控制:ScrollSound允许用户通过滚动鼠标滚轮来调节系统音量,无论是增加还是...
软件 2423 0
开源 IPAM-NOTE v1.24-Beta 一款功能纯粹、界面简洁、无广告干扰的开源IP地址管理软件

开源 IPAM-NOTE v1.24-Beta 一款功能纯粹、界面简洁、无广告干扰的开源IP地址管理软件

IPAM-NOTE是一款由yaobus团队开发的开源软件,专注于为用户提供一个本地运行的单用户IP地址分配记录功能。该软件旨在解决论坛中不少网友对于简单、纯粹的IP地址管理需求,无需复杂的多用户功能,只需一个简洁、无广告、解压即用的工具来记录和管理IP地址分配情况。一、软件特点功能纯粹:IPAM-NOTE专注于IP地址的分配记录,没有添加任何...
软件 2560 0
来自俄罗斯的简单易用免费的媒体视频播放器Light Alloy 4.11.2

来自俄罗斯的简单易用免费的媒体视频播放器Light Alloy 4.11.2

播放器最初看起来非常实用和实用。但是,如果你想要一些新的东西,甚至不寻常的 - 在网络上,你可以找到一个巨大的数目。使用新的皮肤,你可以改变你的设计,从字面上你想要的。或者建立自己的。安装Light Alloy时,您获得的最大好处是高质量和方便的视频内容观看。
软件 1926 0
小助手 Colors Lite v3.2 取色器  颜色选择器

小助手 Colors Lite v3.2 取色器 颜色选择器

颜色选择器,帮助您使用各种托盘轻松选择所需的颜色。它还能够从当前显示的屏幕内容中选择一种颜色,并支持许多不同的颜色模型,即RGB, hsv色彩模型, high-speedlaunch高速快艇, 用于印刷的四分色.软件启动的时候会提示 可个人免费使用,如果商业用途的话 要注册的。大伙都看着办就行
软件 1671 0
免费 Core Temp CPU核心温度实时监测工具 最新v1.18.1

免费 Core Temp CPU核心温度实时监测工具 最新v1.18.1

我最近老觉得我的电脑运行太慢了,不知道是不是因为最近天气热了,cpu的温度太高了导致的,安装鲁大师这类工具后,发现居然不能显示我的cpu温度,所以我就找到了这个工具。能精确显示我的cpu温度。有此需求的小伙伴可以试试Core Temp是一个免费的监控软件,通过它,你可以看到cpu每个核心的温度,和其他同类软件不同的是,Core Temp并不是...
软件 2567 0
神器 小丸工具箱 v236 一款用于处理音视频等多媒体文件的软件

神器 小丸工具箱 v236 一款用于处理音视频等多媒体文件的软件

早些年我还没学FFmpeg的时候,经常会用这个小丸工具箱确实是神器,但是我后来会了FFmpeg就没怎么用了。介绍小丸工具箱是一款用于处理音视频等多媒体文件的软件。是一款x264、ffmpeg等命令行程序的图形界面。它的目标是让视频压制变得简单、轻松。软件截图软件特点高质量的H264+AAC视频压制ASS/SRT字幕内嵌到视频AAC/WAV/F...
软件 2453 0
InstantIR 一键整合包 AI智能高清修复图片工具 超分辨率工具

InstantIR 一键整合包 AI智能高清修复图片工具 超分辨率工具

这个项目群里的小伙伴 推荐了好多次了,之前我也试过做整合包,做完后发现BUG太多了,我就删了,看到作者最近又更新了,所以抽空把这个整合包做出来了。效果嘛 你们自己看。先来一张官方的示例图下面是我跑完的效果下面继续看我用其他图片跑的出来的效果跑一张图片大概需要3-4分钟。下面是界面截图下面是这个项目的AI介绍nstantIR 是一个在 GitH...
AI,开源 4973 0
盲水印工具WaterMark.exe

盲水印工具WaterMark.exe

来自吾爱论坛s1mple0807ez的分享一、定义盲水印是一种数字水印技术,它在不影响原始载体(如图片、视频、音频等)的视觉或听觉质量的情况下,将特定的信息嵌入其中。与可见水印不同,盲水印在正常情况下难以被人眼或耳朵察觉,但可以通过特定的算法和技术进行检测和提取。二、特点隐蔽性强:盲水印的主要特点之一就是隐蔽性。它不会对原始载体的内容产生明显...
软件 2984 0
神器 磁力资源搜索助手  BTSOU v24.10.24 绿色免安装

神器 磁力资源搜索助手 BTSOU v24.10.24 绿色免安装

这是一款全网多渠道磁力资源搜索神器,最新最全的影视资源都能搜索到。软件绿色免安装,无牛氓插件,解压即用,满足不同需求用户的不同要求!搜索到链接后,支持一键复制,配合迅雷等各种下载软件即可实现免费、高速下载!搜索接口实时更新,帮您快速找到想要的磁力资源。官网:http://www.pc936.com/
安卓 7990 17
不会写提示词?没有灵感?分享给你一个大杀器,一键搞定。效果超惊艳 c-pic v1.0 附视频演示

不会写提示词?没有灵感?分享给你一个大杀器,一键搞定。效果超惊艳 c-pic v1.0 附视频演示

今天分享的这个工具,是我自己用了很久的一个款工具,一段时间以来,我的视频和文章的封面都是这个工具生成的,可能过于惊艳,就导致了不少的人盗用图片了。现在我把工具和方法都放出来。先随便截图几张你们看看这些图片都是写提示词的灵感来源啊。我在视频里面有讲到方法,那里没有讲那么清楚,这里文字再说明一次。首先开启你的科学上网工具,因为下载的图片来自C站,...
软件 3923 12