GPT-SoVITS2507+SAVA46 一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包

GPT-SoVITS2507+SAVA46 一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包

GPT-SoVITS是一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成。该工具由RVC-Boss团队开发,并在GitHub上公开分享,为用户提供了一个灵活且功能丰富的平台,以满足语音合成的多样化需求。核心功能GPT-SoVITS的核心功能包括零样本和少样本TTS。零样本TTS允许用户仅通过输入一个5秒的语音样本,就能即时体...
AI,开源 1万 4
人工智能AI相关工具软件 合集整理

人工智能AI相关工具软件 合集整理

一键修复老照片、智能上色、超清还原,去除水印 ,转动漫 ——全能AI图像编辑神器来了!beterpic造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图 一键整合包一键生成AI绘画提示词:让你的图片秒变顶级写真描述 跟之前的图片反推工具不同的是这个会思考 thinkpic视频4倍高清修复,一键...
AI,软件 4.1万 17
你想怎么改图?它就怎么改 Qwen-Image-Edit-2511 实现真正可控的 AI 图片编辑 v20251231 一键整合包

你想怎么改图?它就怎么改 Qwen-Image-Edit-2511 实现真正可控的 AI 图片编辑 v20251231 一键整合包

Qwen-Image-Edit-2511 是由阿里云推出的新一代多模态图像编辑大模型,属于 Qwen 系列在视觉生成与编辑方向的重要迭代。该模型基于 Qwen-Image-Edit 系列的持续演进(如 2509、2511 版本),在保留原始图像语义结构和细节的前提下,支持高保真、高可控性的图像编辑任务。该模型主要特点包括:高保真图像编辑:在执...
AI 3754 14
NextChat 一键免费部署私人 ChatGPT 服务开源工具 v2.16.1

NextChat 一键免费部署私人 ChatGPT 服务开源工具 v2.16.1

NextChat 是一款基于现代 Web 技术栈构建的全栈开源聊天应用模板,旨在帮助开发者快速搭建高性能、可扩展的实时通信平台。该项目由社区驱动,采用前沿技术组合,为初创企业、开发者及教育机构提供了开箱即用的聊天解决方案。核心技术栈NextChat 以 Next.js 13 为核心框架,结合 TypeScript...
开源 2200 0
视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包 v20251231

视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包 v20251231

🎥 FlashVSR 是什么?FlashVSR 是一个能让模糊、低清视频“秒变高清”的智能工具。它专门用来做一件事:把低分辨率的视频,快速、高质量地放大成 4 倍清晰度的高清视频。比如:把 480p 的老视频 → 变成接近 4K 的清晰视频让手机拍的模糊视频 → 变得锐利、细节丰富⚡ 它有什么厉害的地方?过去很多“视频超分”(放大变清晰)工具...
AI,开源 4344 2
一键生成AI绘画提示词:让你的图片秒变顶级写真描述 跟之前的图片反推工具不同的是这个会思考 thinkpic-4.0-20251230

一键生成AI绘画提示词:让你的图片秒变顶级写真描述 跟之前的图片反推工具不同的是这个会思考 thinkpic-4.0-20251230

这个工具是做什么的?这个程序可以自动为你的人物照片生成一段“AI绘画提示词”。简单来说:你放一张人物照片进去,它就能写出一段详细、生动、充满吸引力的文字描述,这段文字可以直接用在 AI 绘画工具(比如 Stable Diffusion)中,让 AI 画出类似风格或效果的图片。例如,它会描述:人物有多美、眼睛多勾人、嘴唇多诱人;身材曲线多么火辣...
AI 9905 4
入梦AI变声器RMAIVoiceChanger v5.8 免费 免安装

入梦AI变声器RMAIVoiceChanger v5.8 免费 免安装

今天因为有点事 需要去找下变声软件。早上已经分享了一款,没想到还是给我另外一款貌似更好用,设置更加简单的变声工具,也是免费使用。入梦自己开发基于RVC的AI变声器,永久免费给大家分享使用,数十种中精选音源一键切换,建议最低配置位N卡1060以上,CPU四核心以上主频大于3.0GHZ,包集成入梦虚拟声卡,AI降噪等,入梦工具箱等辅助工具,使用简...
软件 1.1万 21
AIStarter启动器:AI Starter v5.2.0 实现一键AI下载使用,实现开箱即用 完整包包含项目文件

AIStarter启动器:AI Starter v5.2.0 实现一键AI下载使用,实现开箱即用 完整包包含项目文件

分享给喜欢玩AI的朋友,我下载测试体验了,基本热门的ai项目都可以下载本地部署,全自动。您的AI项目管理专家,AIStarter实现一键下载使用,实现开箱即用我分享的是完整包 里面已经包含AI的项目文件下面简单说下完整包使用方法。先装好AIStarter Setup 2.0.1.exe。然后启动这个工具设置好目录,硬盘少于1T的千万不要来自取...
开源 1.1万 42
手机软件 安卓app Myne 一款功能强大、开源免费的Android电子书阅读app v4.7.1

手机软件 安卓app Myne 一款功能强大、开源免费的Android电子书阅读app v4.7.1

Myne是一款专为Android平台设计的开源应用程序,其核心功能是允许用户从Project Gutenberg下载并阅读电子书。这款应用不仅为用户提供了一个便捷的阅读平台,还通过其现代化的界面设计和丰富的功能,极大地提升了阅读体验。以下是对Myne软件的详细介绍:一、软件背景与定位Myne项目诞生于对开源精神和数字阅读需求的深刻理解。作为一...
安卓 2557 0
 开源免费无限制 RWKV Runner 开箱即用的AI软件-聊天 写作 作曲一键完成 附模型文件 v1.9.7

开源免费无限制 RWKV Runner 开箱即用的AI软件-聊天 写作 作曲一键完成 附模型文件 v1.9.7

今天在网上到处瞎逛的时候,发现个好东西,能让普通人也用上AI,无需复杂的配置,更神奇的是居然可以用我的AMD RX580跑起来。让你们先看下截图这是这个工具的全部截图。操作极其简单,如果要运行什么,会提示你去下载模型,下载模型会自动下载,为了节约大伙的时间,我已经把模型全部放在压缩包里面了。基本就实现了解压即可使用,下面看下我随便问几个问题。...
开源 8275 13
免费 AI 人声 替换AI 唱歌 伴奏分离软件 Replay v8.5.3 附视频演示和教程

免费 AI 人声 替换AI 唱歌 伴奏分离软件 Replay v8.5.3 附视频演示和教程

上面是这个工具的视频演示和教程。基本上是有手就行了。早几天分享的文字转语音工具,有小伙伴在问是否有人声替换工具?今天分享这个的工具 不仅是人声替换,还可以分离人声,AI唱歌就太简单了。像网上流传很广的孙燕姿唱周杰伦的歌这类的视频和教程已经很多了。我之前也不是没有研究过,但是一直没有分享是因为这类教程对于普通的小伙伴来讲入门的门槛有点高,操作...
软件 2.3万 57
开源 免费 视频AI自动抠像 速度快 操作简单 效果很是惊艳 值得珍藏 RobustVideoMattingGUI  v1.1.2

开源 免费 视频AI自动抠像 速度快 操作简单 效果很是惊艳 值得珍藏 RobustVideoMattingGUI v1.1.2

之前分享的图片抠像,有些小伙伴在问是否有视频抠像的,那必须要有啊。这个工具我也是放在我的收藏夹里面好久了,今天就分享出来。我的好东西多的是就怕你们硬盘空间不够。这个软件解压后近8G。先看视频演示 这个开源项目真的是很良心了,抠像真的是不错,我个人觉得已经很媲美剪映那个抠像了。目前不支持N卡,我只能用cpu来跑,但是效率还可以,我10多秒的视频...
软件,开源 6408 12
别只截图——让AI看懂它!Snippai秒出翻译、表格、配色方案 v0.2.1

别只截图——让AI看懂它!Snippai秒出翻译、表格、配色方案 v0.2.1

Snippai 是一款开源的 AI 截图分析工具,主打“截一下,秒懂一切”。它把传统截图工具的功能边界彻底打破:截完图后,AI 会自动识别图片里的内容并给出“下一步”服务,而不是简单保存一张图片。核心能力一览公式识别:截图里的数学公式直接变成可编辑的 LaTeX。文字提取:OCR 精准抓字,支持多语言,抓完还能顺手翻译。表格识别:把图片中的表...
AI,开源 1.2万 19
洗图必备 基于 Z-Image Turbo 的多模态 ControlNet 工具:ZIT-ControlNet  v2.0 一键整合包

洗图必备 基于 Z-Image Turbo 的多模态 ControlNet 工具:ZIT-ControlNet v2.0 一键整合包

ZIT-ControlNet(Z-Image Turbo ControlNet)—— 精准可控的 AI 图像生成与编辑工具项目简介ZIT-ControlNet(全称Z-Image Turbo ControlNet)是一个基于ControlNet 技术构建的开源图像生成控制项目,致力于在生成图像时实现高精度引导与编辑,同时最大程度保留原始图像的...
开源 9613 18
开源 免费 pyVideoTrans v3.91 视频翻译开源软件 自动识别并生成字幕后,翻译 + 配音 绿色免安装

开源 免费 pyVideoTrans v3.91 视频翻译开源软件 自动识别并生成字幕后,翻译 + 配音 绿色免安装

这个工具我用来很长一段时间了,只是我居然一直忘记给大伙分享出来,直到昨天群里有人在问这样的工具。我才想起来把这个分享出来给大伙。虽然这个工具的标题叫视频翻译,实际上远远不只这些功能,我一直用这个工具来做字幕识别,比如我以前的教程那些字幕很多都是这个工具帮我做的。识别率也很高,超级方便。本来想今天一早就分享出来,但是事情比较多,又是瞎折腾的一天...
AI,开源 1.4万 29
"方言通+翻译官:一个AI,能说18种中国方言和9国语言" Fun-CosyVoice3-0.5B AI语音生成工具 一键整合包 v20251217

"方言通+翻译官:一个AI,能说18种中国方言和9国语言" Fun-CosyVoice3-0.5B AI语音生成工具 一键整合包 v20251217

CosyVoice:基于大语言模型的先进语音合成系统CosyVoice 是一个由 FunAudioLLM 团队开发的开源文本到语音(TTS)系统,目前已迭代至Fun-CosyVoice 3.0版本。该项目基于大语言模型(LLM)架构,在语音合成领域实现了多项技术突破。核心技术特点Fun-CosyVoice 3.0作为最新版本,在内容一致性、说...
AI,开源 3858 2
GLM-TTS 大语言模型重塑语音合成 3秒克隆人声?GLM-TTS 做到了!声音克隆相似度极高 一键整合包 v20251212

GLM-TTS 大语言模型重塑语音合成 3秒克隆人声?GLM-TTS 做到了!声音克隆相似度极高 一键整合包 v20251212

GLM-TTS是由ZAI 组织开发并开源的高质量文本转语音(Text-to-Speech, TTS)系统。它基于大语言模型(LLM),专注于实现可控、富有情感表达的零样本语音克隆,并通过多奖励强化学习框架显著提升传统 TTS 系统的自然度与表现力。核心特性🗣️ 零样本语音克隆仅需3–10 秒的目标说话人提示音频,即可克隆任意声音,无需微调或说...
AI,开源 3384 4
"90分钟不间断!微软新AI能把你的文字变成专业播客 一键整合包 VibeVoice v20251211

"90分钟不间断!微软新AI能把你的文字变成专业播客 一键整合包 VibeVoice v20251211

🎙️ VibeVoice:你的超级AI配音员"把文字变成自然对话的魔法工具"🌟 什么是VibeVoice?想象一下,有一位永不疲倦的配音员,能一口气生成90分钟不间断的语音内容,还能在对话中自如切换不同角色的声音——这就是微软开发的VibeVoice,一款革命性的AI语音生成工具!💡 它能为你做什么?(实用场景)场景用途效...
AI,开源 6549 19
开源 换脸工具 roop_unleashed v6.0 中文版 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示

开源 换脸工具 roop_unleashed v6.0 中文版 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示

昨天分享了roop的整合包支持AMD显卡来运行,今天分享的这个工具是roop的一个分支,虽然roop的作者已经弃更了,但是还有其他人继续更新。这就有产生了一个新的项目roop_unleashed。估计是这个项目出来并没有多久,所以知道的人不是很多,这2天我心血来潮就把这个项目也做了一个整合包,这个roop_unleashed是支持N卡的,但是...
AI,开源 6.8万 205
AI音乐生成工具v2.0 基于 DiffRhythm 二次开发。webui界面 不卡死,速度快 英伟达显卡6g即可运行, 一键整合包

AI音乐生成工具v2.0 基于 DiffRhythm 二次开发。webui界面 不卡死,速度快 英伟达显卡6g即可运行, 一键整合包

DiffRhythm:基于差分节奏建模的通用音乐流派分类开源项目DiffRhythm是由ASLP实验室提出的开源项目,旨在通过创新的差分节奏建模(Differential Rhythm Modeling)框架解决音乐流派分类任务。该项目结合传统信号处理与深度学习技术,从节奏这一音乐核心要素出发,构建了具有强解释性和泛化能力的分类模型。其代码已...
AI,开源 5174 6
VisoMaster +VisoMaster-Fusion v1.0  基于rope的二次开发 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持50系英伟达显卡运行 一键整合包

VisoMaster +VisoMaster-Fusion v1.0 基于rope的二次开发 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持50系英伟达显卡运行 一键整合包

VisoMaster 还不错的一个换脸工具,界面也是简洁的很,花了一天的时间做了整合包+汉化。VisoMaster是一款功能强大且易于使用的面部替换与编辑工具,专为图像和视频设计。它利用先进的人工智能技术,能够以最少的努力产生自然逼真的效果,因此无论是普通用户还是专业人士都能轻松上手。这款软件以其独特的魅力和实用性,在图像与视频编辑领域脱颖而...
AI,开源 2.9万 74
魔搭+Pollinations 批量AI文生图工具 27pic-api v10 无需显卡,无需搭建解压即可运行。支持最新Z-Image-Turbo 文生图

魔搭+Pollinations 批量AI文生图工具 27pic-api v10 无需显卡,无需搭建解压即可运行。支持最新Z-Image-Turbo 文生图

大伙都知道,我直接分享过挂机流工作流,还有批量提示词工具。但是考虑到平时电脑也还有别的用途,老是用显卡来挂机生图,也是很耽误事。所以我就想利用各大平台的API来生成图片,这样就不会占用本地的资源又可以实现批量文生图的需求。所以今天花了一点时间做出来这个 AI文生图工具 27pic-api,暂时就取这个名字吧。远程调用魔塔的API&n...
AI 1.3万 26
开源  Waifu2x Extension-GUI(AI图片视频放大) 一款功能强大的图像/视频增强工具 v3.131.01

开源 Waifu2x Extension-GUI(AI图片视频放大) 一款功能强大的图像/视频增强工具 v3.131.01

Waifu2x Extension-GUI是一款功能强大的图像增强工具,基于Waifu2x库开发,提供了一个直观易用的图形界面。该工具旨在通过深度学习技术,特别是卷积神经网络(CNN),来无损放大和优化二次元风格的图像,同时也适用于普通照片。主要功能与特点:图像放大:无论是动漫还是现实生活中的照片,都可以通过该工具进行无损放大,保持原有的清晰...
开源 6955 9
开源 Apt Full 绿色版 一个功能强大、操作便捷的AI生产力工具  v2.9.15.0

开源 Apt Full 绿色版 一个功能强大、操作便捷的AI生产力工具 v2.9.15.0

该项目集成了多种AI模型,特别是提供了私人专属的ChatGPT AI智能助理,能够处理各种文本任务,为用户提供智能辅助。此外,它还能一键批量智能处理图片和视频,包括但不限于图片无损放大、擦除水印、转换为卡通漫画风格、转制3D效果、上色修复、人脸修复等,以及视频的无损放大、擦除水印、转换为卡通漫画风格、转制3D、上色修复、插值补帧等功能。总之,...
软件 7650 7
开源 Cherry Studio 一个支持多模型服务的桌面客户端工具 支持deepseek v1.6.7

开源 Cherry Studio 一个支持多模型服务的桌面客户端工具 支持deepseek v1.6.7

Cherry Studio是一款专为专业用户打造的桌面客户端,它支持多模型服务,集成了超过300多个大语言模型,涵盖了30多个行业,旨在帮助用户在多种场景下提升工作效率。这款软件的设计初衷是满足各行各业对GPT技术的需求,无论是开发者、设计师还是作家,都能从中受益。对于开发者而言,Cherry Studio是一个强大的代码伙伴。它可以进行代码...
开源 7410 3
告别灵感枯竭?试试 AI-Writing 的智能创作能力 AI智能写作辅导软件 v1.2

告别灵感枯竭?试试 AI-Writing 的智能创作能力 AI智能写作辅导软件 v1.2

AI-Writing 是一个旨在利用人工智能模型来辅助文本创作的开源项目。它可以帮助用户提高写作效率,适用于文章撰写、文案生成、内容润色、创意激发等多种场景。该项目可能整合了当前主流的自然语言处理(NLP)模型,比如 GPT、ChatGLM、BERT 等,以实现以下功能:✨ 主要功能特性自动续写根据用户输入的开头段落或句子,自动生成后续内容。...
AI,开源 3366 0
 开源 免费 Koboldcpp 人人可玩的本地大模型 不管啥显卡,cpu也能跑 附视频演示 支持deepseek v1.101.1

开源 免费 Koboldcpp 人人可玩的本地大模型 不管啥显卡,cpu也能跑 附视频演示 支持deepseek v1.101.1

KoboldCpp是一款易于使用的人工智能文本生成软件,适用于GGML和GGUF模型。这是一个可从Concedo分发的单一自包含版本,它建立在llama.cpp的基础上,并添加了一个多功能的Kobold API端点、额外的格式支持、稳定的扩散图像生成、向后兼容性以及一个具有持久故事、编辑工具、保存格式、内存、世界信息、作者注释、人物、场景和K...
开源 1.3万 12
 AI智能去水印神器   27Watermark v2.0 一键去除视频水印,保持原画质 v20251012  针对sora和通义AI生成的视频水印去除 效果非常好

AI智能去水印神器 27Watermark v2.0 一键去除视频水印,保持原画质 v20251012 针对sora和通义AI生成的视频水印去除 效果非常好

📖 什么是27Watermark?27Watermark 是一款基于先进AI技术的智能视频和图片去水印工具。它使用最新的FLUX.1-Kontext模型,能够智能识别并移除视频和图片中的水印,同时完美保持原始内容的完整性和质量。🎯 核心功能✨ 智能去水印精准识别:AI自动识别水印位置和类型智能修复:用周围背景自然填补水印区域质量保持:保持原始...
AI 7132 0
多模型支持 + 工具调用 + 搜索增强,DeepChat 全能解析 v0.4.5

多模型支持 + 工具调用 + 搜索增强,DeepChat 全能解析 v0.4.5

DeepChat 是一个功能丰富的开源 AI 聊天平台,支持多种云端和本地大型语言模型(LLM),并具备强大的搜索增强和工具调用能力。它为用户提供了一个统一的界面来交互各种主流 AI 模型,无论是使用 OpenAI、Gemini、Anthropic 等云服务,还是本地部署的 Ollama 模型。作为一款跨平台的 AI 助手应用,DeepCha...
开源 2635 0
语音识别 + 声音克隆 + 模型训练,一个工具全搞定!Easy-Voice-Toolkit v1.3.2

语音识别 + 声音克隆 + 模型训练,一个工具全搞定!Easy-Voice-Toolkit v1.3.2

Easy-Voice-Toolkit 是由 Spr-Aachen开发的一款开源、用户友好的 AI 语音工具箱,旨在为开发者、研究人员和爱好者提供一站式、本地化部署的语音处理解决方案。项目设计注重易用性与功能性,支持多种主流语音任务,适用于科研实验、产品原型开发、语音助手构建等多种应用场景。🌟 核心特性本地部署:所有功能均可在本地运行,保障数据...
AI,开源 3532 0
图像生成神器:用AI画图,零代码也能玩,拖拽操作就能生成精美图片ComfyUI 官方英伟达显卡版 v0.3.70

图像生成神器:用AI画图,零代码也能玩,拖拽操作就能生成精美图片ComfyUI 官方英伟达显卡版 v0.3.70

ComfyUI 是一个基于节点(Node-based)的图形界面工具,专为使用 Stable Diffusion及其衍生模型进行图像生成而设计。它通过可视化的流程图方式,让用户无需编写代码即可构建复杂的生成工作流。🧩 1. 可视化流程图系统节点式编辑器:将每一个操作(如加载模型、输入提示词、图像采样等)封装为独立节点,用户可以通过拖拽连接这些...
AI,开源 7393 3
Snow Shot:开源一键截图,文字识别+翻译+AI对话全搞定 snow-shot v0.7.8-beta

Snow Shot:开源一键截图,文字识别+翻译+AI对话全搞定 snow-shot v0.7.8-beta

介绍说明:项目概述:名称:Snow Shot设计理念:以简洁优雅作为设计理念类型:工具软件功能特点:截图功能:Snow Shot 是一款功能强大的截图工具,支持快速截图。文字识别:集成了文字识别功能,用户可以通过快捷键在截图后自动进行文字识别。翻译功能:支持快速翻译,用户在选中需要翻译的文本后按下翻译快捷键即可查看翻译结果。AI 对话:还集成...
开源 4075 0