站长推荐

开源 AI人脸替换工具离线版V8.3 兼容50系列显卡 CPU、显存占用优化,速度更快 一张图实现视频或者图片换脸,完全免费!附演示和教程视频开源 AI人脸替换工具离线版V8.3 兼容50系列显卡 CPU、显存占用优化,速度更快 一张图实现视频或者图片换脸,完全免费!附演示和教程视频
新一代开源 免费 AI换脸神器 FaceFusion 3.2.0 支持AMD显卡+N卡 速度更快 支持50系显卡,效果更惊艳 操作更简单 附视频演示新一代开源 免费 AI换脸神器 FaceFusion 3.2.0 支持AMD显卡+N卡 速度更快 支持50系显卡,效果更惊艳 操作更简单 附视频演示
Stable Diffusion(AI绘画) 绘世 WebUI+comfyui+SD-Forge  自更新一键下载安装汉化版 4.9 202408更新 附A卡整合包 附我常用的大模型和ControlNet 模型Stable Diffusion(AI绘画) 绘世 WebUI+comfyui+SD-Forge 自更新一键下载安装汉化版 4.9 202408更新 附A卡整合包 附我常用的大模型和ControlNet 模型
微软常用运行库合集(Microsoft Visual C++ Redistributable) Windows电脑系统必装软件 2025.03.06 再次更新微软常用运行库合集(Microsoft Visual C++ Redistributable) Windows电脑系统必装软件 2025.03.06 再次更新
Topaz Photo AI(图片增强工具)破解版  v4.0.0 绿色便携版  附模型文件Topaz Photo AI(图片增强工具)破解版 v4.0.0 绿色便携版 附模型文件
人工智能AI相关工具软件 合集整理

人工智能AI相关工具软件 合集整理

小巧实用效率高AI生成动漫图片整合包,12G英伟达显卡即可愉快玩耍IndexTTS:重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音 附效果演示穿越千年的文字魔法:AI助力现代文变古文 ancient_text_generation_LLM开源AI图像描述:JoyCaption ,图片AI反推提示...
AI,软件 2.7万 15
小巧实用效率高AI生成动漫图片整合包,12G英伟达显卡即可愉快玩耍 v20250520

小巧实用效率高AI生成动漫图片整合包,12G英伟达显卡即可愉快玩耍 v20250520

   今天在网上逛的时候,无意发现这个模型,一个动漫图片生成的模型,感觉还不错,生成的动漫效果也还可以,所以就花了几分钟写了个界面,然后又汉化了下,感觉还可以,就随手发到群里,各位小伙伴要求分享出来,所以就打包上传上来了。这个模型是支持NSFW ,所以请勿用于任何非法途径,所造成的任何后果请自行承担,本人只做AI图片生成技...
AI 2148 0
IndexTTS:重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音 附效果演示 v1.5 20250519更新

IndexTTS:重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音 附效果演示 v1.5 20250519更新

IndexTTS是由B站推出的一款基于XTTS和Tortoise的GPT风格文本转语音(TTS)模型。该项目在中文文本转语音领域展现出显著的技术优势和应用潜力,以下从项目背景、技术架构、应用场景、社区支持及未来挑战五个维度进行详细介绍。一、项目背景:重新定义中文TTS技术标杆IndexTTS的诞生旨在解决传统TTS系统在中文语音合成中的两大核...
AI,软件 4807 22
开源 神器 Stability Matrix  v2.14.1 一款功能强大、易于使用的Stable Diffusion管理工具

开源 神器 Stability Matrix v2.14.1 一款功能强大、易于使用的Stable Diffusion管理工具

Stability Matrix是由Lykos AI开发的一款革命性工具,专为简化Stable Diffusion的使用和管理而设计。作为一款多平台包管理器和推理用户界面,它极大地提升了Stable Diffusion的易用性和用户体验。核心功能多平台支持:Stability Matrix支持macOS、Windows和Linux系统,确保用...
AI,开源 3145 1
lmstudio v0.3.15 一款强大而灵活的本地大模型部署工具 我的rx580 都能流畅运行 附模型文件 支持DeepSeek

lmstudio v0.3.15 一款强大而灵活的本地大模型部署工具 我的rx580 都能流畅运行 附模型文件 支持DeepSeek

LM Studio是由lmstudio.ai提供的一款强大而灵活的本地大模型部署工具。它不仅降低了机器学习的使用门槛,还为用户提供了一个安全、高效、隐私保护的环境,以便在本地运行各种大型语言模型。首先,LM Studio具备强大的离线使用能力。这意味着用户无需互联网连接即可运行模型,极大地提升了使用的便捷性和灵活性。对于那些需要保护数据隐私或...
AI,开源 5637 15
DeepSeek  本地部署一键运行 DeepSeek-tool v11,解压即可使用 支持2G显卡 支持99%的语言大模型 附QWEN3 8b模型

DeepSeek 本地部署一键运行 DeepSeek-tool v11,解压即可使用 支持2G显卡 支持99%的语言大模型 附QWEN3 8b模型

琢磨了一天,把DeepSeek的本地部署彻底完成了,并测试了一下午基本完美运行了。当然AI环境你们必须要先安装好。然后下载这个这个本地部署压缩,解压即可完美运行。我的4070ti spuer 运行32b已经是极限了,所以我也只能把模型下载到32b了,如果你们有更牛的显卡,可以继续下载模型。这是我运行14b的截图 你们看看显...
AI,开源 6540 29
开源AI图像描述:JoyCaption ,图片AI反推提示词 支持批量操作 v20250515 一键整合包

开源AI图像描述:JoyCaption ,图片AI反推提示词 支持批量操作 v20250515 一键整合包

JoyCaption 是一个开源的图像描述生成视觉语言模型(VLM),旨在为社区提供一个免费、开放且无审查的工具,用于训练扩散模型。以下是该项目的主要特点和相关信息:项目特点免费与开放:JoyCaption 以免费、开放的权重发布,没有使用限制,并且提供训练脚本及详细的构建细节。无审查:平等覆盖适合工作场合(SFW)和不适合工作场合(NSFW...
AI,开源 5647 2
穿越千年的文字魔法:AI助力现代文变古文 ancient_text_generation_LLM v20250514一键整合包

穿越千年的文字魔法:AI助力现代文变古文 ancient_text_generation_LLM v20250514一键整合包

一个专注于将现代汉语句子转换为古汉语风格句子的创新项目。以下是对该项目的详细介绍:项目概述:该项目旨在通过先进的自然语言处理技术,实现现代汉语到古汉语风格的自动转换,为文化传承、文学创作等领域提供有力支持。技术背景:项目基于荀子基座大模型,该模型作为起点,为项目提供了强大的语言理解和生成能力。通过采用LoRA(Low-Rank Adaptat...
AI,开源 3736 0
新一代开源 免费 AI换脸神器 FaceFusion 3.2.0 支持AMD显卡+N卡 速度更快 支持50系显卡,效果更惊艳 操作更简单 附视频演示

新一代开源 免费 AI换脸神器 FaceFusion 3.2.0 支持AMD显卡+N卡 速度更快 支持50系显卡,效果更惊艳 操作更简单 附视频演示

FaceFusion这个AI换脸的项目已经太久没有更新了。作者终于在昨天更新了3.0,更新幅度大得惊人。这么久不更新,原来是一直在憋大招,这个CD冷却也太久了。。。我第一次时间就去做整合包了。本以为这还不是有手就行的事,但是有点难度。因为3.0更新太大了,所以之前版本的模型还有一些东西根本用不上了,我只能慢慢去研究了。搞半天最后把我的系统的c...
AI,开源 37.5万 3478
想换脸、换衣服还是换风格?DreamO图像定制,一键搞定!v20250513 AI生成图片 一键整合包

想换脸、换衣服还是换风格?DreamO图像定制,一键搞定!v20250513 AI生成图片 一键整合包

DreamO是一个由字节跳动开源的统一图像定制化框架(A Unified Framework for Image Customization),旨在通过先进的算法和技术,为用户提供高度灵活和高质量的图像定制化服务。以下是该项目的详细介绍说明:核心功能:图像定制化:DreamO允许用户根据需求定制图像,支持多种定制化任务,包括但不限于人物形象定...
AI,开源 1874 3
ACE-Step:解锁音乐创作无限可能,以技术革新重塑音乐生成生态,AI生成音乐 支持中文 v20250512

ACE-Step:解锁音乐创作无限可能,以技术革新重塑音乐生成生态,AI生成音乐 支持中文 v20250512

ACE-Step是一个开源的音乐生成基础模型项目,旨在通过全面的架构设计克服现有音乐生成方法的局限性,并实现最先进的性能。以下是对该项目的详细介绍:项目背景与目标:ACE-Step项目针对当前音乐生成方法中存在的生成速度、音乐连贯性和可控性之间的权衡问题,提出了一种新的解决方案。项目的目标是建立一个快速、通用、高效且灵活的音乐AI基础模型,使...
AI 1872 5
AI 视频生成新突破:FramePack 开源项目引领视频扩散技术变革 一键汉化整合包 FramePack-F1 20250512更新 支持批量生成视频

AI 视频生成新突破:FramePack 开源项目引领视频扩散技术变革 一键汉化整合包 FramePack-F1 20250512更新 支持批量生成视频

FramePack 是一个开源项目,旨在通过创新的神经网络结构实现高效的视频生成。以下是对其的详细介绍:项目概述FramePack 是 “Packing Input Frame Contexts in Next - Frame Prediction Models for Video Generation” 论文的官方实现和桌面软件。它采用逐帧...
AI,开源 5874 39
开源 免费 pyVideoTrans v3.69 视频翻译开源软件 自动识别并生成字幕后,翻译 + 配音 绿色免安装

开源 免费 pyVideoTrans v3.69 视频翻译开源软件 自动识别并生成字幕后,翻译 + 配音 绿色免安装

这个工具我用来很长一段时间了,只是我居然一直忘记给大伙分享出来,直到昨天群里有人在问这样的工具。我才想起来把这个分享出来给大伙。虽然这个工具的标题叫视频翻译,实际上远远不只这些功能,我一直用这个工具来做字幕识别,比如我以前的教程那些字幕很多都是这个工具帮我做的。识别率也很高,超级方便。本来想今天一早就分享出来,但是事情比较多,又是瞎折腾的一天...
AI,开源 9152 29
开源 AI人脸替换工具离线版V8.3 兼容50系列显卡 CPU、显存占用优化,速度更快 一张图实现视频或者图片换脸,完全免费!附演示和教程视频

开源 AI人脸替换工具离线版V8.3 兼容50系列显卡 CPU、显存占用优化,速度更快 一张图实现视频或者图片换脸,完全免费!附演示和教程视频

这是热心网友万能君做的一个整合包,整合包里面已经包含了几个换脸项目和一些高清修复功能等,具体可以看下图截图所示。要顺利使用这个工具,必须做好以下几点第一个 这个工具只支持CPU+N卡。如果需要使用N卡,一定要先安装好驱动和CUDA。第二个 一定要安装好运行库。https://www.jian27.com/html/2290.html第三个 所...
AI,开源 477.2万 10189
 KaKaDa AI答题辅助工具V1.0.0.3

KaKaDa AI答题辅助工具V1.0.0.3

KaKaDa是一款创新的答题辅助工具,它借助了阿里云开源的72B大模型进行问题推断,旨在为用户提供快速、准确的答题推荐。与传统的答题工具不同,KaKaDa直接显示推荐的选项,而不是先解释后展示文字答案,从而大大节省了用户的时间。一、主要功能OCR识别与推送:KaKaDa支持在问题界面使用Alt+Q快捷键截取完整的题目和选项,然后利用OCR技术...
AI 1901 0
文本转语音,如此简单真实:Nari Labs开源Dia,一轮处理生成高度逼真的对话音频

文本转语音,如此简单真实:Nari Labs开源Dia,一轮处理生成高度逼真的对话音频

Dia是一个由Nari Labs创建的文本转语音(TTS)模型,它拥有16亿(1.6B)参数,能够在一轮处理中生成超逼真的对话。这个项目的核心特点是其高度真实的语音生成能力,可以直接从文本中生成高度逼真的对话,同时支持通过音频条件来控制输出,实现情感和语调的调整。主要功能高度逼真的对话生成:Dia能够直接从文本中生成高质量的对话,无需多轮处理...
AI 2363 0
GPT-SoVITS 20250422v4 一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包

GPT-SoVITS 20250422v4 一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包

GPT-SoVITS是一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成。该工具由RVC-Boss团队开发,并在GitHub上公开分享,为用户提供了一个灵活且功能丰富的平台,以满足语音合成的多样化需求。核心功能GPT-SoVITS的核心功能包括零样本和少样本TTS。零样本TTS允许用户仅通过输入一个5秒的语音样本,就能即时体...
AI,开源 6746 4
魔搭 批量AI文生图工具 27pic-api v4.0 无需显卡,无需搭建解压即可运行。

魔搭 批量AI文生图工具 27pic-api v4.0 无需显卡,无需搭建解压即可运行。

大伙都知道,我直接分享过挂机流工作流,还有批量提示词工具。但是考虑到平时电脑也还有别的用途,老是用显卡来挂机生图,也是很耽误事。所以我就想利用各大平台的API来生成图片,这样就不会占用本地的资源又可以实现批量文生图的需求。所以今天花了一点时间做出来这个 AI文生图工具 27pic-api,暂时就取这个名字吧。远程调用魔塔的API&n...
AI 3804 17
OmniGen:统一框架,高效灵活,图像生成从未如此简单  基于最新模型一键整合包 已经汉化

OmniGen:统一框架,高效灵活,图像生成从未如此简单 基于最新模型一键整合包 已经汉化

OmniGen 是一个由 VectorSpaceLab 开发的开源项目,旨在提供一个统一的图像生成模型,能够处理多种图像生成任务,而无需依赖额外的插件或复杂的预处理步骤。该项目的核心目标是简化图像生成流程,使其像 GPT 在语言生成中的应用一样灵活和高效。OmniGen 支持多种任务,包括文本到图像生成、图像编辑、主题驱动生成和经典计算机视觉...
AI 4897 7
字节开源 UNO:电商图片生成的高效利器,一键汉化整合包 ,支持文生图和图生图

字节开源 UNO:电商图片生成的高效利器,一键汉化整合包 ,支持文生图和图生图

UNO(Universal Customization)是由字节跳动公司开发并开源的一个通用自定义方法的项目,旨在解决单主体和多主体条件下的图像生成问题,具有很强的可控性和通用性。该项目通过提出一种高度一致的数据合成流程,利用扩散变换器的内在上下文生成能力,生成高一致性的多主体配对数据。UNO模型包含渐进式跨模态对齐和通用旋转位置嵌入,是从文...
AI,开源 1999 4
SenseVoice:解锁语音理解新高度,多语言情感识别与事件检测全攻略 语音转文本 一键汉化整合包 v1.0

SenseVoice:解锁语音理解新高度,多语言情感识别与事件检测全攻略 语音转文本 一键汉化整合包 v1.0

FunAudioLLM/SenseVoice: Multilingual Voice Understanding Model 是一个专注于语音理解的开源项目,旨在提供高精度的多语言语音识别、语音情感识别和音频事件检测功能。这个项目由 FunAudioLLM 团队开发和维护,基于 FunASR 工具包构建,支持多种语言和方言,包括中文、英语、粤...
AI,开源 2365 0
Free-TTS_unlimted-words v1.0 AI文字生成语音,调用Edge TTS接口运行 一键整合包 无需要显卡即可运行

Free-TTS_unlimted-words v1.0 AI文字生成语音,调用Edge TTS接口运行 一键整合包 无需要显卡即可运行

Edge TTS(Edge Text-to-Speech) 是微软推出的一款基于深度学习技术的文本转语音(TTS)工具,具有高质量语音合成、多语言支持、灵活配置和开源可扩展等特点,广泛应用于语音助手、电子书阅读、视频制作、教育及智能客服等领域。核心功能高质量语音合成Edge TTS 采用先进的深度学习技术,能够生成自然流畅、接近真人...
AI,开源 1854 0
Orpheus-TTS:AI文字合成语音,让语言更有温度 一键整合包 支持生成中文语音

Orpheus-TTS:AI文字合成语音,让语言更有温度 一键整合包 支持生成中文语音

Orpheus-TTS是一个前沿的开源文本转语音(Text-To-Speech,TTS)系统,它基于Llama-3b这一强大的大型语言模型(LLM)构建。该项目展示了在语音合成领域使用大型语言模型的新兴能力,为用户带来了前所未有的自然语音体验。Orpheus-TTS的核心优势在于其人类般的语音表现。它能够生成具有自然语调、情感和节奏的语音,这...
AI,开源 2514 2
AudioX  一个极具创新性和实用性的AI开源音频和视频生成工具。一键汉化整合包

AudioX 一个极具创新性和实用性的AI开源音频和视频生成工具。一键汉化整合包

AudioX是一个创新的开源项目,专注于实现一种全新的音频与音乐生成方式。该项目由Zeyue Tian及其团队开发,并在GitHub上公开分享,为音频生成领域带来了革命性的突破。AudioX的核心是一个统一的Diffusion Transformer模型,旨在解决现有音频生成方法中的局限性,如模态隔离、高质量多模态训练数据稀缺以及多样化输入整...
AI,开源 4228 14
Ovis2图片反推提示词工具3.0 基于AI大模型反推图片+视频批量生成提示词 英伟达6G显卡即可愉快玩耍

Ovis2图片反推提示词工具3.0 基于AI大模型反推图片+视频批量生成提示词 英伟达6G显卡即可愉快玩耍

本工具基于Ovis2-4B和Ovis2-2B 这2个大模型制作而成。其实早之前我就有分享过反推提示词工具 moondream,但是我昨天遇到了这个大模型,发现功能更加强大,反推出来的提示更加丰富,更多细节描述。这个工具要求显卡比较低,英伟达显卡6g及以上就可以愉快玩耍了我用同一张图片反推提示词下面是Ovis2-4B生成的提示词The...
AI,开源 5105 19
BEN2 v1.1 AI人工智能 图片批量抠图+视频抠像工具 一键整合包 视频可以输出透明通道

BEN2 v1.1 AI人工智能 图片批量抠图+视频抠像工具 一键整合包 视频可以输出透明通道

虽然我已经分享了不少的抠图和视频抠像的工具,但是谁又会嫌弃好工具多呢?所以抽空做了这个BEN2的整合包,这个整合包最大的特点就是可以输出带有透明通道的webm视频格式。在图像和视频处理领域,前景分割技术一直是研究和应用的热点。无论是视频编辑、特效制作,还是人工智能驱动的内容生成,精准的前景分割都是实现高质量输出的关键。而今天我们要介绍的,是一...
AI,开源 3668 4
ClearerVoice-Studio   AI语音增强、语音降噪工具,一键整合包,二开作品 支持批量操作

ClearerVoice-Studio AI语音增强、语音降噪工具,一键整合包,二开作品 支持批量操作

ClearerVoice-Studio是由阿里巴巴达摩院通义实验室开源的综合性语音处理工具包,旨在为语音技术研究和应用提供高效解决方案。其核心功能覆盖语音增强、分离、目标说话人提取及超分辨率处理,通过融合复数域深度学习算法与先进模型架构,显著提升了复杂声学场景下的语音处理效果。技术架构与核心优势该框架采用复数域深度学习技术,通过FRCRN(复...
AI,开源 2732 0
MeloTTS v0.1.2  AI文本生成语音工具,支持英伟达显卡+cpu运行,速度极快 支持六国语言,一键整合包

MeloTTS v0.1.2 AI文本生成语音工具,支持英伟达显卡+cpu运行,速度极快 支持六国语言,一键整合包

MeloTTS:高质量多语言文本到语音合成工具详解MeloTTS是由MyShell AI开发的一款开源文本到语音(TTS)合成工具,其核心目标是提供高效、自然的多语言语音合成解决方案。该工具通过深度学习技术实现了从文本到语音的流畅转换,支持包括英语、中文、日语、韩语在内的多种语言,尤其在中英混合发音场景中具有显著优势。以下从技术架构、核心功能...
AI,开源 2110 2
LatentSync v1.5 字节跳动联合北京交通大学推出AI数字人工具,汉化一键整合包

LatentSync v1.5 字节跳动联合北京交通大学推出AI数字人工具,汉化一键整合包

LatentSync是由字节跳动联合北京交通大学推出的端到端唇形同步框架,基于音频条件潜在扩散模型(Latent Diffusion Models),旨在实现语音与唇形运动的高精度同步。该项目通过结合Stable Diffusion的生成能力与音视频联合建模技术,解决了传统方法依赖中间表示(如3D模型或2D关键点)的复杂性问题,直接生成动态逼...
AI,开源 3533 9
开源 免费 换脸工具 roop_unleashed v4.4.1 中文版 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示

开源 免费 换脸工具 roop_unleashed v4.4.1 中文版 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示

昨天分享了roop的整合包支持AMD显卡来运行,今天分享的这个工具是roop的一个分支,虽然roop的作者已经弃更了,但是还有其他人继续更新。这就有产生了一个新的项目roop_unleashed。估计是这个项目出来并没有多久,所以知道的人不是很多,这2天我心血来潮就把这个项目也做了一个整合包,这个roop_unleashed是支持N卡的,但是...
AI,开源 4.1万 135