AI#软件 开源 # 人工智能 # AI # 整合包 人工智能AI相关工具软件 合集整理 小巧实用效率高AI生成动漫图片整合包,12G英伟达显卡即可愉快玩耍IndexTTS:重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音 附效果演示穿越千年的文字魔法:AI助力现代文变古文 ancient_text_generation_LLM开源AI图像描述:JoyCaption ,图片AI反推提示... 2025-5-21 16分钟前 AI,软件 2.7万 15
AI 图像处理 # 工具 # 日常应用 # 绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 整合包 小巧实用效率高AI生成动漫图片整合包,12G英伟达显卡即可愉快玩耍 v20250520 今天在网上逛的时候,无意发现这个模型,一个动漫图片生成的模型,感觉还不错,生成的动漫效果也还可以,所以就花了几分钟写了个界面,然后又汉化了下,感觉还可以,就随手发到群里,各位小伙伴要求分享出来,所以就打包上传上来了。这个模型是支持NSFW ,所以请勿用于任何非法途径,所造成的任何后果请自行承担,本人只做AI图片生成技... 2025-5-20 昨天 12:54 AI 2148 0
AI#软件 语音 # 工具 # 日常应用 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 语音工具 # 效率工具 # 整合包 IndexTTS:重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音 附效果演示 v1.5 20250519更新 IndexTTS是由B站推出的一款基于XTTS和Tortoise的GPT风格文本转语音(TTS)模型。该项目在中文文本转语音领域展现出显著的技术优势和应用潜力,以下从项目背景、技术架构、应用场景、社区支持及未来挑战五个维度进行详细介绍。一、项目背景:重新定义中文TTS技术标杆IndexTTS的诞生旨在解决传统TTS系统在中文语音合成中的两大核... 2025-5-20 AI,软件 4807 22
AI#开源 工具 # 神器 # 绿色软件 # 开源 # 人工智能 # AI # 多图预览 # 效率工具 # 整合包 开源 神器 Stability Matrix v2.14.1 一款功能强大、易于使用的Stable Diffusion管理工具 Stability Matrix是由Lykos AI开发的一款革命性工具,专为简化Stable Diffusion的使用和管理而设计。作为一款多平台包管理器和推理用户界面,它极大地提升了Stable Diffusion的易用性和用户体验。核心功能多平台支持:Stability Matrix支持macOS、Windows和Linux系统,确保用... 2025-5-19 AI,开源 3145 1
AI#开源 工具 # 开源 # 人工智能 # AI # 大模型 # deepseek lmstudio v0.3.15 一款强大而灵活的本地大模型部署工具 我的rx580 都能流畅运行 附模型文件 支持DeepSeek LM Studio是由lmstudio.ai提供的一款强大而灵活的本地大模型部署工具。它不仅降低了机器学习的使用门槛,还为用户提供了一个安全、高效、隐私保护的环境,以便在本地运行各种大型语言模型。首先,LM Studio具备强大的离线使用能力。这意味着用户无需互联网连接即可运行模型,极大地提升了使用的便捷性和灵活性。对于那些需要保护数据隐私或... 2025-5-18 AI,开源 5637 15
AI#开源 工具 # 日常应用 # 绿色软件 # 编程开发 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包 # deepseek DeepSeek 本地部署一键运行 DeepSeek-tool v11,解压即可使用 支持2G显卡 支持99%的语言大模型 附QWEN3 8b模型 琢磨了一天,把DeepSeek的本地部署彻底完成了,并测试了一下午基本完美运行了。当然AI环境你们必须要先安装好。然后下载这个这个本地部署压缩,解压即可完美运行。我的4070ti spuer 运行32b已经是极限了,所以我也只能把模型下载到32b了,如果你们有更牛的显卡,可以继续下载模型。这是我运行14b的截图 你们看看显... 2025-5-16 AI,开源 6540 29
AI#开源 图像处理 # 工具 # 文本 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包 开源AI图像描述:JoyCaption ,图片AI反推提示词 支持批量操作 v20250515 一键整合包 JoyCaption 是一个开源的图像描述生成视觉语言模型(VLM),旨在为社区提供一个免费、开放且无审查的工具,用于训练扩散模型。以下是该项目的主要特点和相关信息:项目特点免费与开放:JoyCaption 以免费、开放的权重发布,没有使用限制,并且提供训练脚本及详细的构建细节。无审查:平等覆盖适合工作场合(SFW)和不适合工作场合(NSFW... 2025-5-15 AI,开源 5647 2
AI#开源 文本 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 模型 # 大模型 # 整合包 穿越千年的文字魔法:AI助力现代文变古文 ancient_text_generation_LLM v20250514一键整合包 一个专注于将现代汉语句子转换为古汉语风格句子的创新项目。以下是对该项目的详细介绍:项目概述:该项目旨在通过先进的自然语言处理技术,实现现代汉语到古汉语风格的自动转换,为文化传承、文学创作等领域提供有力支持。技术背景:项目基于荀子基座大模型,该模型作为起点,为项目提供了强大的语言理解和生成能力。通过采用LoRA(Low-Rank Adaptat... 2025-5-14 AI,开源 3736 0
AI#开源 视频处理 # 人工智能 # AI # 换脸 # 整合包 新一代开源 免费 AI换脸神器 FaceFusion 3.2.0 支持AMD显卡+N卡 速度更快 支持50系显卡,效果更惊艳 操作更简单 附视频演示 FaceFusion这个AI换脸的项目已经太久没有更新了。作者终于在昨天更新了3.0,更新幅度大得惊人。这么久不更新,原来是一直在憋大招,这个CD冷却也太久了。。。我第一次时间就去做整合包了。本以为这还不是有手就行的事,但是有点难度。因为3.0更新太大了,所以之前版本的模型还有一些东西根本用不上了,我只能慢慢去研究了。搞半天最后把我的系统的c... 2025-5-13 AI,开源 37.5万 3478
AI#开源 图像处理 # 工具 # 日常应用 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包 想换脸、换衣服还是换风格?DreamO图像定制,一键搞定!v20250513 AI生成图片 一键整合包 DreamO是一个由字节跳动开源的统一图像定制化框架(A Unified Framework for Image Customization),旨在通过先进的算法和技术,为用户提供高度灵活和高质量的图像定制化服务。以下是该项目的详细介绍说明:核心功能:图像定制化:DreamO允许用户根据需求定制图像,支持多种定制化任务,包括但不限于人物形象定... 2025-5-13 AI,开源 1874 3
AI 语音 # 音乐 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 语音工具 # 效率工具 # 整合包 ACE-Step:解锁音乐创作无限可能,以技术革新重塑音乐生成生态,AI生成音乐 支持中文 v20250512 ACE-Step是一个开源的音乐生成基础模型项目,旨在通过全面的架构设计克服现有音乐生成方法的局限性,并实现最先进的性能。以下是对该项目的详细介绍:项目背景与目标:ACE-Step项目针对当前音乐生成方法中存在的生成速度、音乐连贯性和可控性之间的权衡问题,提出了一种新的解决方案。项目的目标是建立一个快速、通用、高效且灵活的音乐AI基础模型,使... 2025-5-13 AI 1872 5
AI#开源 视频处理 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包 AI 视频生成新突破:FramePack 开源项目引领视频扩散技术变革 一键汉化整合包 FramePack-F1 20250512更新 支持批量生成视频 FramePack 是一个开源项目,旨在通过创新的神经网络结构实现高效的视频生成。以下是对其的详细介绍:项目概述FramePack 是 “Packing Input Frame Contexts in Next - Frame Prediction Models for Video Generation” 论文的官方实现和桌面软件。它采用逐帧... 2025-5-12 AI,开源 5874 39
AI#开源 翻译 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 字幕 # 整合包 开源 免费 pyVideoTrans v3.69 视频翻译开源软件 自动识别并生成字幕后,翻译 + 配音 绿色免安装 这个工具我用来很长一段时间了,只是我居然一直忘记给大伙分享出来,直到昨天群里有人在问这样的工具。我才想起来把这个分享出来给大伙。虽然这个工具的标题叫视频翻译,实际上远远不只这些功能,我一直用这个工具来做字幕识别,比如我以前的教程那些字幕很多都是这个工具帮我做的。识别率也很高,超级方便。本来想今天一早就分享出来,但是事情比较多,又是瞎折腾的一天... 2025-5-11 AI,开源 9152 29
AI#开源 工具 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 语音工具 # 整合包 E2/F5-TTS v1.1.4 AI人工智能 文字转语音工具,可克隆声音,可训练,一键中文整合包 SWivid/F5-TTS 是一个开源项目,旨在提供一个基于 Diffusion Transformer 和 ConvNeXt V2 架构的文本到语音(TTS)系统,该系统名为 F5-TTS。F5-TTS 的全称是“A Fairytaler that Fakes Fluent and Faithful Speech with Flow Mat... 2025-5-8 AI,开源 5536 18
AI#开源 图像处理 # 变脸 # 人工智能 # AI # 换脸 # 整合包 开源 AI人脸替换工具离线版V8.3 兼容50系列显卡 CPU、显存占用优化,速度更快 一张图实现视频或者图片换脸,完全免费!附演示和教程视频 这是热心网友万能君做的一个整合包,整合包里面已经包含了几个换脸项目和一些高清修复功能等,具体可以看下图截图所示。要顺利使用这个工具,必须做好以下几点第一个 这个工具只支持CPU+N卡。如果需要使用N卡,一定要先安装好驱动和CUDA。第二个 一定要安装好运行库。https://www.jian27.com/html/2290.html第三个 所... 2025-5-6 AI,开源 477.2万 10189
AI 工具 # 日常应用 # 绿色软件 # 人工智能 # AI # 免费 # 效率工具 KaKaDa AI答题辅助工具V1.0.0.3 KaKaDa是一款创新的答题辅助工具,它借助了阿里云开源的72B大模型进行问题推断,旨在为用户提供快速、准确的答题推荐。与传统的答题工具不同,KaKaDa直接显示推荐的选项,而不是先解释后展示文字答案,从而大大节省了用户的时间。一、主要功能OCR识别与推送:KaKaDa支持在问题界面使用Alt+Q快捷键截取完整的题目和选项,然后利用OCR技术... 2025-4-28 AI 1901 0
AI 工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 语音工具 # 整合包 文本转语音,如此简单真实:Nari Labs开源Dia,一轮处理生成高度逼真的对话音频 Dia是一个由Nari Labs创建的文本转语音(TTS)模型,它拥有16亿(1.6B)参数,能够在一轮处理中生成超逼真的对话。这个项目的核心特点是其高度真实的语音生成能力,可以直接从文本中生成高度逼真的对话,同时支持通过音频条件来控制输出,实现情感和语调的调整。主要功能高度逼真的对话生成:Dia能够直接从文本中生成高质量的对话,无需多轮处理... 2025-4-25 AI 2363 0
AI#开源 工具 # 神器 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包 GPT-SoVITS 20250422v4 一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成 一键整合包 GPT-SoVITS是一个强大的开源工具,专注于少样本语音转换和文本到语音(TTS)的合成。该工具由RVC-Boss团队开发,并在GitHub上公开分享,为用户提供了一个灵活且功能丰富的平台,以满足语音合成的多样化需求。核心功能GPT-SoVITS的核心功能包括零样本和少样本TTS。零样本TTS允许用户仅通过输入一个5秒的语音样本,就能即时体... 2025-4-24 AI,开源 6746 4
AI 工具 # 日常应用 # 绿色软件 # 图片处理 # 人工智能 # AI # 免费 魔搭 批量AI文生图工具 27pic-api v4.0 无需显卡,无需搭建解压即可运行。 大伙都知道,我直接分享过挂机流工作流,还有批量提示词工具。但是考虑到平时电脑也还有别的用途,老是用显卡来挂机生图,也是很耽误事。所以我就想利用各大平台的API来生成图片,这样就不会占用本地的资源又可以实现批量文生图的需求。所以今天花了一点时间做出来这个 AI文生图工具 27pic-api,暂时就取这个名字吧。远程调用魔塔的API&n... 2025-4-24 AI 3804 17
AI 图像处理 # 工具 # 绿色软件 # 开源 # 人工智能 # AI # 免费 # 整合包 # 图像图形 OmniGen:统一框架,高效灵活,图像生成从未如此简单 基于最新模型一键整合包 已经汉化 OmniGen 是一个由 VectorSpaceLab 开发的开源项目,旨在提供一个统一的图像生成模型,能够处理多种图像生成任务,而无需依赖额外的插件或复杂的预处理步骤。该项目的核心目标是简化图像生成流程,使其像 GPT 在语言生成中的应用一样灵活和高效。OmniGen 支持多种任务,包括文本到图像生成、图像编辑、主题驱动生成和经典计算机视觉... 2025-4-24 AI 4897 7
AI#开源 图像处理 # 工具 # 日常应用 # 绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 整合包 字节开源 UNO:电商图片生成的高效利器,一键汉化整合包 ,支持文生图和图生图 UNO(Universal Customization)是由字节跳动公司开发并开源的一个通用自定义方法的项目,旨在解决单主体和多主体条件下的图像生成问题,具有很强的可控性和通用性。该项目通过提出一种高度一致的数据合成流程,利用扩散变换器的内在上下文生成能力,生成高一致性的多主体配对数据。UNO模型包含渐进式跨模态对齐和通用旋转位置嵌入,是从文... 2025-4-21 AI,开源 1999 4
AI#开源 工具 # 日常应用 # 文本 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 文本编辑 # 整合包 SenseVoice:解锁语音理解新高度,多语言情感识别与事件检测全攻略 语音转文本 一键汉化整合包 v1.0 FunAudioLLM/SenseVoice: Multilingual Voice Understanding Model 是一个专注于语音理解的开源项目,旨在提供高精度的多语言语音识别、语音情感识别和音频事件检测功能。这个项目由 FunAudioLLM 团队开发和维护,基于 FunASR 工具包构建,支持多种语言和方言,包括中文、英语、粤... 2025-4-21 AI,开源 2365 0
AI#开源 工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包 Free-TTS_unlimted-words v1.0 AI文字生成语音,调用Edge TTS接口运行 一键整合包 无需要显卡即可运行 Edge TTS(Edge Text-to-Speech) 是微软推出的一款基于深度学习技术的文本转语音(TTS)工具,具有高质量语音合成、多语言支持、灵活配置和开源可扩展等特点,广泛应用于语音助手、电子书阅读、视频制作、教育及智能客服等领域。核心功能高质量语音合成Edge TTS 采用先进的深度学习技术,能够生成自然流畅、接近真人... 2025-4-15 AI,开源 1854 0
AI#开源 工具 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包 Orpheus-TTS:AI文字合成语音,让语言更有温度 一键整合包 支持生成中文语音 Orpheus-TTS是一个前沿的开源文本转语音(Text-To-Speech,TTS)系统,它基于Llama-3b这一强大的大型语言模型(LLM)构建。该项目展示了在语音合成领域使用大型语言模型的新兴能力,为用户带来了前所未有的自然语音体验。Orpheus-TTS的核心优势在于其人类般的语音表现。它能够生成具有自然语调、情感和节奏的语音,这... 2025-4-15 AI,开源 2514 2
AI#软件 工具 # 编程开发 # 免费 # 整合包 LNMP v2.2正式版 一键网站环境部署包 LNMP一键安装包是一个用Linux Shell编写的可以为Linux服务器搭建网站环境的shell程序,LNMP代指Linux,Nginx,MySQL和PHP,相似的我们还可以到LAMP(Linux,Apache,Mysql,Php),WAMP(Windows,Apache,Mysql,Php)等等一键部署包。LNMP支持自定义Nginx、... 2025-4-14 AI,软件 1929 0
AI#开源 日常应用 # 音乐 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 整合包 AudioX 一个极具创新性和实用性的AI开源音频和视频生成工具。一键汉化整合包 AudioX是一个创新的开源项目,专注于实现一种全新的音频与音乐生成方式。该项目由Zeyue Tian及其团队开发,并在GitHub上公开分享,为音频生成领域带来了革命性的突破。AudioX的核心是一个统一的Diffusion Transformer模型,旨在解决现有音频生成方法中的局限性,如模态隔离、高质量多模态训练数据稀缺以及多样化输入整... 2025-4-10 AI,开源 4228 14
AI#开源 工具 # 视频处理 # 文本 # 绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 免费 # 效率工具 # 整合包 Ovis2图片反推提示词工具3.0 基于AI大模型反推图片+视频批量生成提示词 英伟达6G显卡即可愉快玩耍 本工具基于Ovis2-4B和Ovis2-2B 这2个大模型制作而成。其实早之前我就有分享过反推提示词工具 moondream,但是我昨天遇到了这个大模型,发现功能更加强大,反推出来的提示更加丰富,更多细节描述。这个工具要求显卡比较低,英伟达显卡6g及以上就可以愉快玩耍了我用同一张图片反推提示词下面是Ovis2-4B生成的提示词The... 2025-4-5 AI,开源 5105 19
AI#开源 图像处理 # 工具 # 日常应用 # 视频处理 # 绿色软件 # 开源 # 抠像 # 抠图 # 人工智能 # AI # 免费 # 效率工具 # 整合包 BEN2 v1.1 AI人工智能 图片批量抠图+视频抠像工具 一键整合包 视频可以输出透明通道 虽然我已经分享了不少的抠图和视频抠像的工具,但是谁又会嫌弃好工具多呢?所以抽空做了这个BEN2的整合包,这个整合包最大的特点就是可以输出带有透明通道的webm视频格式。在图像和视频处理领域,前景分割技术一直是研究和应用的热点。无论是视频编辑、特效制作,还是人工智能驱动的内容生成,精准的前景分割都是实现高质量输出的关键。而今天我们要介绍的,是一... 2025-4-1 AI,开源 3668 4
AI#开源 工具 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包 ClearerVoice-Studio AI语音增强、语音降噪工具,一键整合包,二开作品 支持批量操作 ClearerVoice-Studio是由阿里巴巴达摩院通义实验室开源的综合性语音处理工具包,旨在为语音技术研究和应用提供高效解决方案。其核心功能覆盖语音增强、分离、目标说话人提取及超分辨率处理,通过融合复数域深度学习算法与先进模型架构,显著提升了复杂声学场景下的语音处理效果。技术架构与核心优势该框架采用复数域深度学习技术,通过FRCRN(复... 2025-3-25 AI,开源 2732 0
AI#开源 工具 # 日常应用 # 绿色软件 # 音频 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 效率工具 # 整合包 MeloTTS v0.1.2 AI文本生成语音工具,支持英伟达显卡+cpu运行,速度极快 支持六国语言,一键整合包 MeloTTS:高质量多语言文本到语音合成工具详解MeloTTS是由MyShell AI开发的一款开源文本到语音(TTS)合成工具,其核心目标是提供高效、自然的多语言语音合成解决方案。该工具通过深度学习技术实现了从文本到语音的流畅转换,支持包括英语、中文、日语、韩语在内的多种语言,尤其在中英混合发音场景中具有显著优势。以下从技术架构、核心功能... 2025-3-24 AI,开源 2110 2
AI#开源 工具 # 日常应用 # 视频处理 # 绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 免费 # 数字人 # 效率工具 # 整合包 LatentSync v1.5 字节跳动联合北京交通大学推出AI数字人工具,汉化一键整合包 LatentSync是由字节跳动联合北京交通大学推出的端到端唇形同步框架,基于音频条件潜在扩散模型(Latent Diffusion Models),旨在实现语音与唇形运动的高精度同步。该项目通过结合Stable Diffusion的生成能力与音视频联合建模技术,解决了传统方法依赖中间表示(如3D模型或2D关键点)的复杂性问题,直接生成动态逼... 2025-3-23 AI,开源 3533 9
AI#开源 工具 # 绿色软件 # 开源 # 人工智能 # AI # 换脸 # 免费 # 整合包 开源 免费 换脸工具 roop_unleashed v4.4.1 中文版 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示 昨天分享了roop的整合包支持AMD显卡来运行,今天分享的这个工具是roop的一个分支,虽然roop的作者已经弃更了,但是还有其他人继续更新。这就有产生了一个新的项目roop_unleashed。估计是这个项目出来并没有多久,所以知道的人不是很多,这2天我心血来潮就把这个项目也做了一个整合包,这个roop_unleashed是支持N卡的,但是... 2025-3-22 AI,开源 4.1万 135