VoiceSculptor:基于指令驱动的下一代语音合成开源框架——让AI语音拥有精准的情感与音色控制能力 v20260108 一键整合包

VoiceSculptor:基于指令驱动的下一代语音合成开源框架——让AI语音拥有精准的情感与音色控制能力 v20260108 一键整合包

🎵 VoiceSculptor - 指令驱动的语音合成模型📌 项目概述VoiceSculptor是由ASLP实验室(Audio, Speech and Language Processing Laboratory)开发的一款先进的指令式文本到语音(instruct text-to-speech)开源模型。2该项目代表了语音合成技术的前沿发展方...
开源 2644 0
Win10 五笔助手 让 Win10/Win11 微软五笔更强大 wubiLex v12.1.0

Win10 五笔助手 让 Win10/Win11 微软五笔更强大 wubiLex v12.1.0

软件简介:平心而论,现在用五笔的人实在太少了,以往遍地开花的五笔输入法,现如今已经门可罗雀。好在微软还是很良心地在 Win10 里保留了这款输入法,并一直予以更新。但微软毕竟不同于第三方厂商,很多细节照顾得还是不够,于是便有了这款 wubiLex 五笔输入法增强器。该版特点:这是一个WIN10系统自带五笔的码表与短语词库安装、管理工具,并可增...
软件 2560 0
GPT-SoVITS2507+SAVA46 一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包

GPT-SoVITS2507+SAVA46 一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包

GPT-SoVITS是一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成。该工具由RVC-Boss团队开发,并在GitHub上公开分享,为用户提供了一个灵活且功能丰富的平台,以满足语音合成的多样化需求。核心功能GPT-SoVITS的核心功能包括零样本和少样本TTS。零样本TTS允许用户仅通过输入一个5秒的语音样本,就能即时体...
AI,开源 1.1万 4
FFmpeg小白助手 音视频批量处理工具 【小白救星、懒人福音】

FFmpeg小白助手 音视频批量处理工具 【小白救星、懒人福音】

这个软件适合不想去学ffmpeg命令的小伙伴了。直接拿来就可以用了,如果想进一步了解学习 可以去看看我之前发布的ffmpeg教程 FFmpeg】FFmpeg是一款开源软件,可以处理多种多媒体媒体数据程序。是目前最受欢迎的视频和图像处理软件。FFmpeg小白助手】在FFmpeg基础上开发的一款自动化处理软件,以最简单的方式快速批量处理...
软件 3543 2
视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包 v20251231

视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包 v20251231

🎥 FlashVSR 是什么?FlashVSR 是一个能让模糊、低清视频“秒变高清”的智能工具。它专门用来做一件事:把低分辨率的视频,快速、高质量地放大成 4 倍清晰度的高清视频。比如:把 480p 的老视频 → 变成接近 4K 的清晰视频让手机拍的模糊视频 → 变得锐利、细节丰富⚡ 它有什么厉害的地方?过去很多“视频超分”(放大变清晰)工具...
AI,开源 5312 2
手机软件 安卓app Compass 一款功能实用、界面简洁的Android指南针应用 v1.14.11

手机软件 安卓app Compass 一款功能实用、界面简洁的Android指南针应用 v1.14.11

Compass是一款由Kr0oked开发的简洁而美观的Android指南针应用,它基于GPL-3.0许可协议发布,旨在为用户提供一种简单、直观且没有广告干扰的导航体验。这款应用以其清晰的界面设计、实用的功能以及对用户隐私的尊重,赢得了不少用户的喜爱。核心功能与特性Compass的核心功能是指南针导航。它不仅可以准确地指向磁北,还能够显示真北,...
安卓 2478 1
手机软件 安卓app Fossify Calendar 一款功能强大且注重隐私的开源日程管理app v1.9.0

手机软件 安卓app Fossify Calendar 一款功能强大且注重隐私的开源日程管理app v1.9.0

Fossify Calendar是一款功能强大且注重隐私的开源日程管理软件,它致力于为用户提供一个干净、无广告且安全的日程规划环境。这款软件的设计初衷是为了解决传统日历应用中普遍存在的隐私问题和界面杂乱无章的问题,通过开放源代码的方式,让用户能够拥有一个真正属于自己的日程管理工具。Fossify Calendar的核心优势在于其无广告和完全私...
安卓 1994 0
手机软件 安卓app Fossify Gallery 一款专注于隐私保护和用户体验的照片与视频管理app v1.10.0

手机软件 安卓app Fossify Gallery 一款专注于隐私保护和用户体验的照片与视频管理app v1.10.0

Fossify Gallery 是一款专注于隐私保护和用户体验的照片与视频管理应用程序。这款应用旨在让用户能够不受干扰地浏览他们的记忆,同时确保用户的个人数据得到充分的保护。它适用于那些希望在享受强大功能的同时,不牺牲自己隐私的用户。首先,Fossify Gallery 提供了一个基础但强大的照片编辑工具,用户可以直接在应用中对图片进行裁剪、...
安卓 2406 0
手机软件 安卓app AnkiDroid  一款功能强大、灵活高效的记忆训练工具 v2.23.1

手机软件 安卓app AnkiDroid 一款功能强大、灵活高效的记忆训练工具 v2.23.1

AnkiDroid是一款基于Anki闪卡系统开发的Android应用程序,它将间隔重复算法应用于记忆训练中,帮助用户高效地记忆各种信息。作为一款半官方的开源项目,AnkiDroid不仅继承了Anki的强大功能,还针对Android平台进行了深度优化,使其成为广大学习者提升记忆效率的首选工具。以下是对AnkiDroid的详细介绍:一、软件概述A...
安卓 2376 0
OnionMedia 一款功能全面、操作简便、开源免费的媒体转换器和下载器 v1.2.22.0

OnionMedia 一款功能全面、操作简便、开源免费的媒体转换器和下载器 v1.2.22.0

OnionMedia是一款功能强大的开源媒体转换器和下载器,专为追求高效、便捷媒体处理体验的用户设计。以下是对该软件的详细介绍:核心功能:媒体转换:OnionMedia支持将视频和音频文件转换为多种不同的编码格式,如H.264等,满足用户在不同设备上的播放需求。硬件加速:利用硬件加速技术,OnionMedia能够大幅提升视频文件的编码速度,减...
软件 2977 0
别只截图——让AI看懂它!Snippai秒出翻译、表格、配色方案 v0.2.1

别只截图——让AI看懂它!Snippai秒出翻译、表格、配色方案 v0.2.1

Snippai 是一款开源的 AI 截图分析工具,主打“截一下,秒懂一切”。它把传统截图工具的功能边界彻底打破:截完图后,AI 会自动识别图片里的内容并给出“下一步”服务,而不是简单保存一张图片。核心能力一览公式识别:截图里的数学公式直接变成可编辑的 LaTeX。文字提取:OCR 精准抓字,支持多语言,抓完还能顺手翻译。表格识别:把图片中的表...
AI,开源 1.2万 19
洗图必备 基于 Z-Image Turbo 的多模态 ControlNet 工具:ZIT-ControlNet  v2.0 一键整合包

洗图必备 基于 Z-Image Turbo 的多模态 ControlNet 工具:ZIT-ControlNet v2.0 一键整合包

ZIT-ControlNet(Z-Image Turbo ControlNet)—— 精准可控的 AI 图像生成与编辑工具项目简介ZIT-ControlNet(全称Z-Image Turbo ControlNet)是一个基于ControlNet 技术构建的开源图像生成控制项目,致力于在生成图像时实现高精度引导与编辑,同时最大程度保留原始图像的...
开源 1.1万 18
"方言通+翻译官:一个AI,能说18种中国方言和9国语言" Fun-CosyVoice3-0.5B AI语音生成工具 一键整合包 v20251217

"方言通+翻译官:一个AI,能说18种中国方言和9国语言" Fun-CosyVoice3-0.5B AI语音生成工具 一键整合包 v20251217

CosyVoice:基于大语言模型的先进语音合成系统CosyVoice 是一个由 FunAudioLLM 团队开发的开源文本到语音(TTS)系统,目前已迭代至Fun-CosyVoice 3.0版本。该项目基于大语言模型(LLM)架构,在语音合成领域实现了多项技术突破。核心技术特点Fun-CosyVoice 3.0作为最新版本,在内容一致性、说...
AI,开源 4516 2
开源 Magpie 窗口全屏工具:提升画质,让不支持全屏化的游戏也能全屏显示 v0.12.1

开源 Magpie 窗口全屏工具:提升画质,让不支持全屏化的游戏也能全屏显示 v0.12.1

Magpie是一个轻量级的窗口缩放工具,它集成了多种高效的缩放算法和过滤器,旨在提升游戏图形质量,并使非全屏游戏能够以全屏模式显示。这款软件以其丰富的功能和用户友好的界面而脱颖而出。Magpie的核心功能包括能够将任意窗口缩放至全屏模式,同时提供了多种内置的缩放算法,如Lanczos、Anime4K、FSR、自适应锐化等,以及多种CRT着色器...
软件 1.2万 0
GLM-TTS 大语言模型重塑语音合成 3秒克隆人声?GLM-TTS 做到了!声音克隆相似度极高 一键整合包 v20251212

GLM-TTS 大语言模型重塑语音合成 3秒克隆人声?GLM-TTS 做到了!声音克隆相似度极高 一键整合包 v20251212

GLM-TTS是由ZAI 组织开发并开源的高质量文本转语音(Text-to-Speech, TTS)系统。它基于大语言模型(LLM),专注于实现可控、富有情感表达的零样本语音克隆,并通过多奖励强化学习框架显著提升传统 TTS 系统的自然度与表现力。核心特性🗣️ 零样本语音克隆仅需3–10 秒的目标说话人提示音频,即可克隆任意声音,无需微调或说...
AI,开源 4049 6
免费 绿色软件 带数标的截图工具v2 来自傻木

免费 绿色软件 带数标的截图工具v2 来自傻木

截图时常常需要那种带步骤的,例如第一步点什么,第二步选什么现在截图工具都没有打标功能,例如标注具体步骤的一怒之下写了一个带数标的默认不显示数标,点一下工具栏的数标图标即可显示1-16数标为什么只有1-16?一张图里面如果含有超过16个步骤,那就是灾难级别的步骤了,我相信你不会遇到这种已更新,没有做开机自启功能,如有需要,自己放在启动菜单内即可...
软件 2869 0
神器 云图工具箱2.5.7 一款安全方便快捷的Windows工具箱 可下载windows系统

神器 云图工具箱2.5.7 一款安全方便快捷的Windows工具箱 可下载windows系统

   云图工具箱 一款安全方便快捷的Windows工具箱一款方便,安全,快捷,的工具箱致力于让用户用最方便的方式,用上最纯净的软件云图工具箱(wintool)可以帮助Windows用户解决非常多日常遇到的问题,给用户带来更多的便利。软件包含了许多平时我们经常会用到的小功能,可以帮助用户更好地使用Windows系统,十分的方...
软件 3743 0
开源 blossom 一个功能丰富的云端双链笔记软件 v1.17.1

开源 blossom 一个功能丰富的云端双链笔记软件 v1.17.1

Blossom是一个功能丰富的云端双链笔记软件,它支持私有部署,允许用户将笔记、图片及个人计划安排安全地保存在自己的服务器中,实现跨设备的实时同步。这一特性使得Blossom不仅是一个强大的知识管理工具,还兼顾了数据隐私保护的需求。Blossom的核心特点之一是其完善的文件关系管理。它内置了图床功能,不依赖第三方存储服务,用户可以直接在应用中...
软件 3248 1
告别灵感枯竭?试试 AI-Writing 的智能创作能力 AI智能写作辅导软件 v1.2

告别灵感枯竭?试试 AI-Writing 的智能创作能力 AI智能写作辅导软件 v1.2

AI-Writing 是一个旨在利用人工智能模型来辅助文本创作的开源项目。它可以帮助用户提高写作效率,适用于文章撰写、文案生成、内容润色、创意激发等多种场景。该项目可能整合了当前主流的自然语言处理(NLP)模型,比如 GPT、ChatGLM、BERT 等,以实现以下功能:✨ 主要功能特性自动续写根据用户输入的开头段落或句子,自动生成后续内容。...
AI,开源 3553 0
一键整合包 Step-Audio-EditX  v20251112 解压即用,支持情绪/方言/语气词!让AI说话像真人一样“有血有肉”

一键整合包 Step-Audio-EditX v20251112 解压即用,支持情绪/方言/语气词!让AI说话像真人一样“有血有肉”

🧠 什么是 Step-Audio-EditX?Step-Audio-EditX 是由 StepFun AI 团队开源的一款 30 亿参数(3B)的大语言模型(LLM)驱动的先进音频编辑系统,专注于 高表现力、可迭代、细粒度的语音编辑与零样本语音合成(TTS)。它不仅能高质量克隆任意人声,还能对语音的情绪、说话风格、副语言特征(如笑声、叹息等)...
AI,开源 4372 2
输入一段歌词,AI 自动生成带人声+伴奏的歌(支持中文) 腾讯开源“AI 作曲” SongGeneration v20251109 一键整合包

输入一段歌词,AI 自动生成带人声+伴奏的歌(支持中文) 腾讯开源“AI 作曲” SongGeneration v20251109 一键整合包

腾讯 AI Lab 推出的一个 “AI 自动生成完整歌曲” 的免费工具。你只需要提供一段歌词,它就能帮你自动配上人声 + 伴奏,生成一首像模像样的歌,支持中文和英文!🎤 它能做什么?你写歌词,AI 唱出来:你只要写下带结构的歌词(比如“[主歌]……[副歌]……”),AI 会自动配上旋律、人声和背景音乐。支持风格定制:你可以指定歌曲风格(比如“...
AI,开源 6668 17
告别视频手动分类!AI 自动识别视频人物、场景与行为 AI 智能视频分析与自动分类 27sift v1.0

告别视频手动分类!AI 自动识别视频人物、场景与行为 AI 智能视频分析与自动分类 27sift v1.0

基于 Ovis2.5-2B 多模态大模型 · 中文支持 · 批量处理 · 智能检索✨ 核心功能🔍 智能视频内容理解自动分析视频内容,生成结构化中文描述,包括:人物性别、年龄段(儿童/少年/青年/中年/老年)发型发色、服装款式与颜色动作行为(如跳水、游泳、站立、互动)场景环境(户外/室内、植被、天气、水域类型)3等等⚡ 高效批量处理递归扫描整个...
AI 2845 3
中文错别字检测与修正工具(基于 MacBERT模型)jiucuo v1.0 一键整合包,有英伟达显卡就能运行 不限字数

中文错别字检测与修正工具(基于 MacBERT模型)jiucuo v1.0 一键整合包,有英伟达显卡就能运行 不限字数

剑二十七 · 基于 ModelScope 模型 Macadam/macbert4mdcspell_v2 二次开发本系统采用先进的 MacBERT 预训练语言模型,专为中文文本拼写与语法错误检测与修正设计,支持任意长度文本、智能分段处理,并严格保留原始格式(包括换行、空行、标点等),适用于论文、公文、OCR 识别结果、手写转录等多种场景。✅ 核...
AI 2.3万 94
 AI 播客 :一键生成多角色对话音频 SoulX-Podcast 剑二十七二次开发 一键整合包 v20251103

AI 播客 :一键生成多角色对话音频 SoulX-Podcast 剑二十七二次开发 一键整合包 v20251103

SoulX-Podcast是由 Soul AI Lab 开源的一个面向播客场景的高质量、长篇、多说话人对话式语音合成(TTS)系统,专为生成自然、富有表现力、支持方言与副语言特征的播客音频而设计。🔍 项目核心特点1. 长篇多轮多说话人对话生成支持生成多人交替对话的播客内容(如主持人 + 嘉宾);能处理长文本输入,保持语音连贯性和角色一致性;适...
AI,开源 4742 1
支持图像、动图、短视频、PDF:AI逐页/逐帧分析,AI不仅能看懂,还能回答你的问题  Qwen3-VL 一键整合包 v20251024

支持图像、动图、短视频、PDF:AI逐页/逐帧分析,AI不仅能看懂,还能回答你的问题 Qwen3-VL 一键整合包 v20251024

基于 Qwen3-VL-4B-Instruct 的多模态智能交互平台📌 简介本应用是一个基于 通义千问 Qwen3-VL-4B-Instruct 大模型的多模态推理系统,支持对 图像、视频、PDF 文档、GIF 动图 等多种媒体内容进行智能理解与分析,并能自动生成精准描述、解答问题或提取关键信息。借助 Gradio 构建的直观 Web 界面,...
AI,开源 3971 0
DeepSeek-OCR 可视化工具:支持自由OCR、Markdown转换、图表解析与目标定位 一键整合包 v20251023

DeepSeek-OCR 可视化工具:支持自由OCR、Markdown转换、图表解析与目标定位 一键整合包 v20251023

🐳 DeepSeek-OCR 智能图像文字识别工具 — 使用说明🌟 这是什么?这是一个智能图像处理工具,可以自动从你上传的图片中:识别文字内容把文档转成 Markdown 格式(适合写博客、笔记)解析图表数据(比如柱状图、折线图里的数字)定位图片中的特定内容(比如“找出老师在哪里”)它基于先进的 AI 模型(DeepSeek-OCR),由剑二...
AI,开源 3600 4
Kani TTS:轻量、流式、类人 — 开源AI语音合成系统一键整合包  v20251008

Kani TTS:轻量、流式、类人 — 开源AI语音合成系统一键整合包 v20251008

🎙️ Kani TTS — 高质量、模块化、类人语音合成开源项目Kani TTS 是一个由 nineninesix-ai维护的开源文本到语音(TTS)系统,致力于从文本输入生成高质量、自然流畅的语音。项目支持本地独立运行与Web 流式服务,适用于开发、研究及个性化 TTS 场景。GitHub 仓库地址:https://github.com/n...
AI,开源 5289 0
27video v3.1 超级强大AI视频抠像工具 剑二十七原创作品 附视频演示

27video v3.1 超级强大AI视频抠像工具 剑二十七原创作品 附视频演示

这个工具基于AI大模型BiRefNet文件二次开发。可以对视频进行抠像。速度快,效果也不错。对显卡占用很低,8G的英伟达显卡就可以流畅运行了。操作极其简单,无需任何基础 会点鼠标即可。下面截图几张抠像效果演示20241209 v1.1 更新记录1 保留白色和黑色背景这2种视频抠像,新增了一个自定义背景图片抠像。2...
AI,开源 1.5万 55
IndexTTS  v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS是由B站推出的一款基于XTTS和Tortoise的GPT风格文本转语音(TTS)模型。该项目在中文文本转语音领域展现出显著的技术优势和应用,以下从项目背景、技术架构、应用场景、社区支持及未来挑战五个维度进行详细介绍。一、项目背景:重新定义中文TTS技术标杆IndexTTS的诞生旨在解决传统TTS系统在中文语音合成中的两大核心痛...
AI,软件 2.1万 51
开源TTS新选择:FireRedTTS2 实现高质量 对话语音合成 一键整合包 v20250916

开源TTS新选择:FireRedTTS2 实现高质量 对话语音合成 一键整合包 v20250916

FireRedTTS 是一个开源的文本转语音(Text-to-Speech, TTS)项目,由 FireRedTeam 开发并维护。该项目致力于提供高质量、低延迟、易于集成的语音合成能力,适用于多种应用场景,如语音助手、有声读物生成、无障碍访问、智能客服等。项目基于深度学习技术,采用了先进的神经网络架构(如 Tacotron、FastSpee...
AI,开源 1.8万 16
手心输入法 一款专注于输入本质、纯净且好用的输入法软件 v3.2.6.1006

手心输入法 一款专注于输入本质、纯净且好用的输入法软件 v3.2.6.1006

手心输入法是一款专注于输入本质、纯净且好用的输入法软件。它摒弃了与输入法无关的功能,不包含任何广告和推广,确保用户在使用过程中不会受到任何干扰。这款输入法的界面简约清爽,去除了冗余功能,只保留了核心体验,让用户能够专注于输入本身。手心输入法支持多种输入方式,包括九宫格拼音、拼音全键盘、双拼全键盘、英文全键盘、手写键盘、笔画键盘和五笔键盘等,用...
软件 2361 0
视频创作者必备!KrillinAI提供从翻译到配音的全流程解决方案,智能分段与精确字幕,打造专业级视频内容 v1.4.0

视频创作者必备!KrillinAI提供从翻译到配音的全流程解决方案,智能分段与精确字幕,打造专业级视频内容 v1.4.0

KrillinAI是一个基于AI大模型的视频翻译和配音工具,它提供了专业级的翻译服务以及一键部署的全流程解决方案。这个开源工具旨在帮助用户轻松实现视频内容的本地化与增强,使其能够适配多种内容平台,如YouTube、TikTok、Bilibili、抖音(国内版)、微信视频号、快手等。KrillinAI的核心功能包括视频翻译、配音与声音克隆、字幕...
安卓 4863 4