视频创作者的新宠:这个开源工具正在悄悄改变内容生产方式 一键整合包 MoneyPrinterPlus v1.2.6

视频创作者的新宠:这个开源工具正在悄悄改变内容生产方式 一键整合包 MoneyPrinterPlus v1.2.6

你可以把它想象成一个 “AI全自动视频工厂”。它最大的特点就是:输入一段文字,就能自动生成一个完整的高清视频。是不是有点像你写一篇作文,然后机器帮你拍成了短视频?没错,就是这个意思!🧠 它是怎么工作的?简单来说,它的流程是这样的:你告诉它要说什么内容(文字)比如:“今天教你怎么在家做蛋糕”它会自动找合适的画面素材比如网上免费的高清视频片段:打...
AI,开源 7261 4
AI 自动生成短剧解说视频 输入一段话就能生成短剧解说视频  一键整合包 NarratoAI v0.6.1

AI 自动生成短剧解说视频 输入一段话就能生成短剧解说视频 一键整合包 NarratoAI v0.6.1

这个工具是做什么的?你可以把 NarratoAI 理解成一个“AI自动剪辑视频的神器”,它最大的特点就是:输入一段文字或口播内容,就能自动生成一部短剧解说视频。是不是听起来像你写了个剧本,AI 就帮你拍成了短视频?没错,就是这样!🧠 它是怎么工作的?它的流程大概是这样的:你提供一段文字内容(比如口播文案、剧情简介)比如:“今天给大家讲一个爱情...
AI,开源 7208 3
一键提取伴奏/人声!轻松搞定音乐音轨分离 支持批量处理 开源一键整合包 6G N卡就可以愉快玩耍 UVR5 UI v1.8.4

一键提取伴奏/人声!轻松搞定音乐音轨分离 支持批量处理 开源一键整合包 6G N卡就可以愉快玩耍 UVR5 UI v1.8.4

UVR5-UI是基于 python-audio-separator(即 UVR5 的命令行版本)开发的,提供了友好的可视化界面,使得用户无需掌握编程知识或命令行操作即可使用强大的音频处理功能。它支持多种模型和功能,包括:所有主流音源分离模型:VR Arch 模型MDX-NET 模型Demucs v4 模型Mel-Band Roformer 和...
AI,开源 4966 2
你负责写文字(支持中文),画画交给 AI!Kolors 让想象秒变现实 一键整合包 v20250523

你负责写文字(支持中文),画画交给 AI!Kolors 让想象秒变现实 一键整合包 v20250523

Kolors 是一个“文字生成图片”的人工智能工具,你可以输入一段中文或英文的文字描述,它就能根据你的描述自动生成一张对应的图像。比如你写:“一只穿着西装的熊猫,在山顶上喝咖啡,背景是日出,风格是写实高清”它就能根据这段话,画出这样的一张图!🧠 它是怎么工作的?简单来说,这个 AI 模型已经学习了非常多的文字和图片之间的对应关系。所以当你输入...
AI,开源 7416 3
小巧实用效率高AI生成动漫图片整合包,12G英伟达显卡即可愉快玩耍 v20250520

小巧实用效率高AI生成动漫图片整合包,12G英伟达显卡即可愉快玩耍 v20250520

   今天在网上逛的时候,无意发现这个模型,一个动漫图片生成的模型,感觉还不错,生成的动漫效果也还可以,所以就花了几分钟写了个界面,然后又汉化了下,感觉还可以,就随手发到群里,各位小伙伴要求分享出来,所以就打包上传上来了。这个模型是支持NSFW ,所以请勿用于任何非法途径,所造成的任何后果请自行承担,本人只做AI图片生成技...
AI 4433 6
开源AI图像描述:JoyCaption ,图片AI反推提示词 支持批量操作 v20250515 一键整合包

开源AI图像描述:JoyCaption ,图片AI反推提示词 支持批量操作 v20250515 一键整合包

JoyCaption 是一个开源的图像描述生成视觉语言模型(VLM),旨在为社区提供一个免费、开放且无审查的工具,用于训练扩散模型。以下是该项目的主要特点和相关信息:项目特点免费与开放:JoyCaption 以免费、开放的权重发布,没有使用限制,并且提供训练脚本及详细的构建细节。无审查:平等覆盖适合工作场合(SFW)和不适合工作场合(NSFW...
AI,开源 8702 11
穿越千年的文字魔法:AI助力现代文变古文 ancient_text_generation_LLM v20250514一键整合包

穿越千年的文字魔法:AI助力现代文变古文 ancient_text_generation_LLM v20250514一键整合包

一个专注于将现代汉语句子转换为古汉语风格句子的创新项目。以下是对该项目的详细介绍:项目概述:该项目旨在通过先进的自然语言处理技术,实现现代汉语到古汉语风格的自动转换,为文化传承、文学创作等领域提供有力支持。技术背景:项目基于荀子基座大模型,该模型作为起点,为项目提供了强大的语言理解和生成能力。通过采用LoRA(Low-Rank Adaptat...
AI,开源 4632 0
ACE-Step:解锁音乐创作无限可能,以技术革新重塑音乐生成生态,AI生成音乐 支持中文 v20250512

ACE-Step:解锁音乐创作无限可能,以技术革新重塑音乐生成生态,AI生成音乐 支持中文 v20250512

ACE-Step是一个开源的音乐生成基础模型项目,旨在通过全面的架构设计克服现有音乐生成方法的局限性,并实现最先进的性能。以下是对该项目的详细介绍:项目背景与目标:ACE-Step项目针对当前音乐生成方法中存在的生成速度、音乐连贯性和可控性之间的权衡问题,提出了一种新的解决方案。项目的目标是建立一个快速、通用、高效且灵活的音乐AI基础模型,使...
AI 4043 7
想换脸、换衣服还是换风格?DreamO图像定制,一键搞定!v20250513 AI生成图片 一键整合包

想换脸、换衣服还是换风格?DreamO图像定制,一键搞定!v20250513 AI生成图片 一键整合包

DreamO是一个由字节跳动开源的统一图像定制化框架(A Unified Framework for Image Customization),旨在通过先进的算法和技术,为用户提供高度灵活和高质量的图像定制化服务。以下是该项目的详细介绍说明:核心功能:图像定制化:DreamO允许用户根据需求定制图像,支持多种定制化任务,包括但不限于人物形象定...
AI,开源 4935 11
超强挂机AI生图comfyui工作流,提示词自动生成,一键操作,出图效果好,效率高 挂机流20250429更新

超强挂机AI生图comfyui工作流,提示词自动生成,一键操作,出图效果好,效率高 挂机流20250429更新

距离上一次的分享的挂机工作流已经过去了几个月了,感觉是时候分享更强大的了。这个工作流早几天就发到Q群给大伙玩了,经过多人测试 没有什么问题后,我今天才分享出来。如果拖到comfyui后,提示大量的红色,缺失节点,可以点管理器进去自行安装好缺失的节点。如果安装老是失败,可以开启科学上网工具进行安装随便上传几张工作流说明1 生成的提示词更加丰富2...
素材 8035 3
 KaKaDa AI答题辅助工具V1.0.0.3

KaKaDa AI答题辅助工具V1.0.0.3

KaKaDa是一款创新的答题辅助工具,它借助了阿里云开源的72B大模型进行问题推断,旨在为用户提供快速、准确的答题推荐。与传统的答题工具不同,KaKaDa直接显示推荐的选项,而不是先解释后展示文字答案,从而大大节省了用户的时间。一、主要功能OCR识别与推送:KaKaDa支持在问题界面使用Alt+Q快捷键截取完整的题目和选项,然后利用OCR技术...
AI 3064 0
文本转语音,如此简单真实:Nari Labs开源Dia,一轮处理生成高度逼真的对话音频

文本转语音,如此简单真实:Nari Labs开源Dia,一轮处理生成高度逼真的对话音频

Dia是一个由Nari Labs创建的文本转语音(TTS)模型,它拥有16亿(1.6B)参数,能够在一轮处理中生成超逼真的对话。这个项目的核心特点是其高度真实的语音生成能力,可以直接从文本中生成高度逼真的对话,同时支持通过音频条件来控制输出,实现情感和语调的调整。主要功能高度逼真的对话生成:Dia能够直接从文本中生成高质量的对话,无需多轮处理...
AI 3228 0
OmniGen:统一框架,高效灵活,图像生成从未如此简单  基于最新模型一键整合包 已经汉化

OmniGen:统一框架,高效灵活,图像生成从未如此简单 基于最新模型一键整合包 已经汉化

OmniGen 是一个由 VectorSpaceLab 开发的开源项目,旨在提供一个统一的图像生成模型,能够处理多种图像生成任务,而无需依赖额外的插件或复杂的预处理步骤。该项目的核心目标是简化图像生成流程,使其像 GPT 在语言生成中的应用一样灵活和高效。OmniGen 支持多种任务,包括文本到图像生成、图像编辑、主题驱动生成和经典计算机视觉...
AI 6260 7
多图预览 VideoProc Converter AI  v8.0.0 视频处理转换软件特别版

多图预览 VideoProc Converter AI v8.0.0 视频处理转换软件特别版

在我没有接触ffmpeg之前,我用过一段时间这个工具,那时候还没有带上AI字样,操作简单功能强大。确实是很不错的一个工具,还带有个简单的视频下载工具VideoProc Converter 是一个功能强大的视频处理和转换软件,它具有多种视频处理功能,包括视频转换、视频压缩、视频编辑、屏幕录制和音频提取等。VideoProc Converter ...
软件 8024 17
一款功能强大、操作简便的视频字幕处理工具 卡卡字幕助手 VideoCaptioner v1.3.3

一款功能强大、操作简便的视频字幕处理工具 卡卡字幕助手 VideoCaptioner v1.3.3

VideoCaptioner是一款基于大语言模型(LLM)的视频字幕处理助手,它集成了语音识别、字幕断句、优化、翻译等全流程处理功能,为视频制作者提供了极大的便利。这款工具操作简单,无需高配置电脑,支持网络调用和本地离线(包括GPU调用)两种模式进行语音识别,灵活性极高。在功能方面,VideoCaptioner表现出色。它支持从国内外主流视频...
开源 2357 0
字节开源 UNO:电商图片生成的高效利器,一键汉化整合包 ,支持文生图和图生图

字节开源 UNO:电商图片生成的高效利器,一键汉化整合包 ,支持文生图和图生图

UNO(Universal Customization)是由字节跳动公司开发并开源的一个通用自定义方法的项目,旨在解决单主体和多主体条件下的图像生成问题,具有很强的可控性和通用性。该项目通过提出一种高度一致的数据合成流程,利用扩散变换器的内在上下文生成能力,生成高一致性的多主体配对数据。UNO模型包含渐进式跨模态对齐和通用旋转位置嵌入,是从文...
AI,开源 3781 4
SenseVoice:解锁语音理解新高度,多语言情感识别与事件检测全攻略 语音转文本 一键汉化整合包 v1.0

SenseVoice:解锁语音理解新高度,多语言情感识别与事件检测全攻略 语音转文本 一键汉化整合包 v1.0

FunAudioLLM/SenseVoice: Multilingual Voice Understanding Model 是一个专注于语音理解的开源项目,旨在提供高精度的多语言语音识别、语音情感识别和音频事件检测功能。这个项目由 FunAudioLLM 团队开发和维护,基于 FunASR 工具包构建,支持多种语言和方言,包括中文、英语、粤...
AI,开源 3883 0
探索AI与古典诗歌的完美融合:中文诗词生成器 一键整合包 chinese-poem v1.0 附效果演示

探索AI与古典诗歌的完美融合:中文诗词生成器 一键整合包 chinese-poem v1.0 附效果演示

在数字化与智能化飞速发展的今天,人工智能技术正以前所未有的速度改变着我们的生活。从日常的语音助手到复杂的图像识别,AI的应用无处不在。然而,你是否想过,AI也能与古典文化相结合,创造出令人惊叹的艺术作品?今天,我要向大家介绍一款独特的工具——中文诗歌生成器,它将AI的强大功能与中华古典诗歌的韵味完美融合,为诗歌创作带来了全新的可能。一、工具简...
开源 2581 0
Free-TTS_unlimted-words v1.0 AI文字生成语音,调用Edge TTS接口运行 一键整合包 无需要显卡即可运行

Free-TTS_unlimted-words v1.0 AI文字生成语音,调用Edge TTS接口运行 一键整合包 无需要显卡即可运行

Edge TTS(Edge Text-to-Speech) 是微软推出的一款基于深度学习技术的文本转语音(TTS)工具,具有高质量语音合成、多语言支持、灵活配置和开源可扩展等特点,广泛应用于语音助手、电子书阅读、视频制作、教育及智能客服等领域。核心功能高质量语音合成Edge TTS 采用先进的深度学习技术,能够生成自然流畅、接近真人...
AI,开源 2714 0
Orpheus-TTS:AI文字合成语音,让语言更有温度 一键整合包 支持生成中文语音

Orpheus-TTS:AI文字合成语音,让语言更有温度 一键整合包 支持生成中文语音

Orpheus-TTS是一个前沿的开源文本转语音(Text-To-Speech,TTS)系统,它基于Llama-3b这一强大的大型语言模型(LLM)构建。该项目展示了在语音合成领域使用大型语言模型的新兴能力,为用户带来了前所未有的自然语音体验。Orpheus-TTS的核心优势在于其人类般的语音表现。它能够生成具有自然语调、情感和节奏的语音,这...
AI,开源 4525 6
Geekbench AI v1.3.0 一款功能强大、易于使用的跨平台AI性能评估工具

Geekbench AI v1.3.0 一款功能强大、易于使用的跨平台AI性能评估工具

Geekbench AI是一款专为跨平台人工智能性能评估设计的基准测试软件,由Primate Labs开发并推出。该软件不仅适用于macOS,还兼容Windows、Linux等多种操作系统,为开发者、数据科学家以及技术爱好者提供了强大的AI性能评估工具。主要功能与特点跨平台支持:Geekbench AI的跨平台特性使其能够在不同操作系统和设备...
开源 2306 0
AI 图像增强软件 Aiarty Image Enhancer v3.3 一款基于人工智能(AI)技术的图像增强工具 附全部模型文件

AI 图像增强软件 Aiarty Image Enhancer v3.3 一款基于人工智能(AI)技术的图像增强工具 附全部模型文件

Aiarty Image Enhancer是一款利用先进人工智能技术专为图像优化和增强设计的软件。这款工具通过集成复杂的机器学习算法和深度神经网络模型,为用户提供了一套全面且高效的图像处理解决方案,旨在帮助用户轻松提升照片质量,修复老旧或损坏的照片,以及进行艺术化创作,从而满足专业摄影师、设计师乃至普通用户的多元化需求。核心功能与特点:智能图...
软件 6481 15
Trae v1.98.2 字节跳动 开发的AI 自动编程工具

Trae v1.98.2 字节跳动 开发的AI 自动编程工具

Trae 是由字节跳动推出的一款人工智能集成开发环境(AI IDE),旨在通过智能化的功能提升开发者的编程效率和体验。以下是对 Trae 的详细介绍:智能代码生成与补全Trae 集成了先进的 AI 模型,如 Claude 3.5 和 GPT-4o,能够根据开发者的描述自动生成高质量的代码片段或完整的项目代码。在编写代码的过程中,Trae 还会...
软件 2314 0
AudioX  一个极具创新性和实用性的AI开源音频和视频生成工具。一键汉化整合包

AudioX 一个极具创新性和实用性的AI开源音频和视频生成工具。一键汉化整合包

AudioX是一个创新的开源项目,专注于实现一种全新的音频与音乐生成方式。该项目由Zeyue Tian及其团队开发,并在GitHub上公开分享,为音频生成领域带来了革命性的突破。AudioX的核心是一个统一的Diffusion Transformer模型,旨在解决现有音频生成方法中的局限性,如模态隔离、高质量多模态训练数据稀缺以及多样化输入整...
AI,开源 6157 14
BEN2 v1.1 AI人工智能 图片批量抠图+视频抠像工具 一键整合包 视频可以输出透明通道

BEN2 v1.1 AI人工智能 图片批量抠图+视频抠像工具 一键整合包 视频可以输出透明通道

虽然我已经分享了不少的抠图和视频抠像的工具,但是谁又会嫌弃好工具多呢?所以抽空做了这个BEN2的整合包,这个整合包最大的特点就是可以输出带有透明通道的webm视频格式。在图像和视频处理领域,前景分割技术一直是研究和应用的热点。无论是视频编辑、特效制作,还是人工智能驱动的内容生成,精准的前景分割都是实现高质量输出的关键。而今天我们要介绍的,是一...
AI,开源 6847 5
魔塔文生图工具 魔塔ai网页本地版 群内bing制作分享,大小不到10K

魔塔文生图工具 魔塔ai网页本地版 群内bing制作分享,大小不到10K

我之前做的那个27pic-api还算受大伙的欢迎,但是可能使用的人多了就导致接口被封了,好像现在失效了,一直没去更新。这不群内小伙伴bing 制作了本工具。非常不错,我就喜欢善于动手动脑的小伙伴。API Token去魔搭社区获取注册账号后,记得绑定阿里云账号,就可以获取令牌了再次感谢bing的无私分享使用说明,解压双击即可打开网页,...
开源 2232 0
ClearerVoice-Studio   AI语音增强、语音降噪工具,一键整合包,二开作品 支持批量操作

ClearerVoice-Studio AI语音增强、语音降噪工具,一键整合包,二开作品 支持批量操作

ClearerVoice-Studio是由阿里巴巴达摩院通义实验室开源的综合性语音处理工具包,旨在为语音技术研究和应用提供高效解决方案。其核心功能覆盖语音增强、分离、目标说话人提取及超分辨率处理,通过融合复数域深度学习算法与先进模型架构,显著提升了复杂声学场景下的语音处理效果。技术架构与核心优势该框架采用复数域深度学习技术,通过FRCRN(复...
AI,开源 5145 0
MeloTTS v0.1.2  AI文本生成语音工具,支持英伟达显卡+cpu运行,速度极快 支持六国语言,一键整合包

MeloTTS v0.1.2 AI文本生成语音工具,支持英伟达显卡+cpu运行,速度极快 支持六国语言,一键整合包

MeloTTS:高质量多语言文本到语音合成工具详解MeloTTS是由MyShell AI开发的一款开源文本到语音(TTS)合成工具,其核心目标是提供高效、自然的多语言语音合成解决方案。该工具通过深度学习技术实现了从文本到语音的流畅转换,支持包括英语、中文、日语、韩语在内的多种语言,尤其在中英混合发音场景中具有显著优势。以下从技术架构、核心功能...
AI,开源 3686 4
LatentSync v1.5 字节跳动联合北京交通大学推出AI数字人工具,汉化一键整合包

LatentSync v1.5 字节跳动联合北京交通大学推出AI数字人工具,汉化一键整合包

LatentSync是由字节跳动联合北京交通大学推出的端到端唇形同步框架,基于音频条件潜在扩散模型(Latent Diffusion Models),旨在实现语音与唇形运动的高精度同步。该项目通过结合Stable Diffusion的生成能力与音视频联合建模技术,解决了传统方法依赖中间表示(如3D模型或2D关键点)的复杂性问题,直接生成动态逼...
AI,开源 6478 17
免费使用 麻薯AI变声器 v5.0 内含模型+虚拟声卡 让榜一大哥连夜跑路工具

免费使用 麻薯AI变声器 v5.0 内含模型+虚拟声卡 让榜一大哥连夜跑路工具

这个是用在电脑上的AI变声,其内核应该是开源项目RVC,具体的我没去研究。因为我貌似也用不上这个工具,比如你打游戏的时候或者和别人语音聊天的时候 可以实时变声玩玩,感觉还是有点意思的,这类的软件不多,大大部分都是收费的,难得遇到一个免费使用的良心工具,切用且珍惜如果不会使用,可以点击软件右下角的使用教程,是视频教程应该很容易学会本地端永久免费...
开源 3.3万 116
免费开源的 AI 图像放大提升增强画质工具,跨平台 upscayl 最新v2.15 官方中文版 20241226更新

免费开源的 AI 图像放大提升增强画质工具,跨平台 upscayl 最新v2.15 官方中文版 20241226更新

我之前分享的那几波AI图片素材,全部都是用爬虫爬取后,把原来比较小的图片用这个工具无损放大后再分享的。Upscayl 是一个免费开源的 AI 图像超分辨率工具,AI 模型通过猜测细节来增强图像,提升分辨率。Upscayl 适用于 Linux、macOS 和 Windows,以 Linux 为先的理念建立。下载后即开即用,无需联网。Upscay...
开源 6.3万 277
Stable Diffusion(AI绘画) 绘世 WebUI+comfyui+SD-Forge  自更新一键下载安装汉化版 4.9 202408更新 附A卡整合包 附我常用的大模型和ControlNet 模型

Stable Diffusion(AI绘画) 绘世 WebUI+comfyui+SD-Forge 自更新一键下载安装汉化版 4.9 202408更新 附A卡整合包 附我常用的大模型和ControlNet 模型

距离我上次更新这个已经过去了三个月多了,这中间AI发展实在是太迅速了,我也中间分享了无数用AI生成的图片素材,感兴趣的小伙伴可以在文末的链接进去看看,基本都是基于这个工具生成的。全部免费下载。大概有几千张,大部分都是精品。目前秋叶同学的这个离线包已经更新到了2.58,因为实在是太大了,上传速度实在是慢,所以更新时间稍稍晚了一点点。喜欢这个工具...
开源 24.8万 865