WhisperDesktop1.12音频转文字软件双向 免费开源 ·附模型文件,

Stable Diffusion(AI绘画) 绘世 WebUI+comfyui+SD-Forge 自更新一键下载安装汉化版 4.9 202408更新附A卡整合包附我常用的大模型和ControlNet 模型

距离我上次更新这个已经过去了三个月多了，这中间AI发展实在是太迅速了，我也中间分享了无数用AI生成的图片素材，感兴趣的小伙伴可以在文末的链接进去看看，基本都是基于这个工具生成的。全部免费下载。大概有几千张，大部分都是精品。目前秋叶同学的这个离线包已经更新到了2.58，因为实在是太大了，上传速度实在是慢，所以更新时间稍稍晚了一点点。喜欢这个工具...

2025-3-22 开源 0

工具 # 图形图像 # 开源 # 图片处理 # 人工智能 # AI # 免费

CogView4 一键整合包一个功能强大且易于使用的文本到图像生成模型支持中文提示词

该项目由群里傻木推荐，我测试了下说实话效果真是一般，对中文的支持还是不够好，下面有截图。我目前这个整合包只能算是半成品，目前只做到了可以运行，但是效率性能什么的都没有去做优化。以后看心血来潮了再动动。CogView4是一个前沿的文本到图像生成模型，由THUDM（清华大学计算机系自然语言处理与人机交互实验室）开发并开源在...

2025-3-5 开源 0

工具 # 绿色软件 # 开源 # 人工智能 # AI # 语音工具

开源 CosyVoice v20250229整合包一款AI人工智能多语言语音生成模型文字生成语音工具附效果演示

CosyVoice是由阿里通义实验室开源的一款多语言语音生成模型，旨在提升人类与大型语言模型（LLMs）之间的自然语音交互体验。该项目作为FunAudioLLM框架中的核心模型之一，专注于高质量的语音合成，能够生成自然且逼真的语音。以下是对CosyVoice开源项目的详细介绍：一、项目背景与目的随着人工智能技术的不断发展，语音交互已成为人机交...

2025-2-28 软件 0

开源 # 人工智能 # AI # 免费 # 工作流 # comfyui

超爽自制Comfyui工作流一键批量读取海量提示词，生成海量不同图片。挂机生图专用 flux+xl模型

这个工作流算是我的第二步构想，第一步就是批量生成提示词，这个工具已经分享出来了moondream v1.2 开源 AI人工智能图片反推提示词神器，可批量处理图片提示词一键整合包升级比较大。然后生成的提示词用现在的这个工作流来生成对应的图片，效果是相当劲爆了现在这个截图就是我下午一直在挂机生图的这个工作流，具体有多少行提示词我也没数。我...

2024-12-12 素材 0

工具 # 开源 # 人工智能 # AI # 免费 # 数字人 # 整合包

复旦、百度联手推出全新AI模型Hallo2 AI数字人一键整合包，可生成高清4K数字人视频

Hallo是一个由复旦大学、百度公司、苏黎世联邦理工学院和南京大学共同开发的AI对口型肖像图像动画技术，该技术能够基于语音音频输入生成逼真且动态的肖像图像视频。以下是该项目的详细介绍：项目背景：肖像图像动画技术：该技术旨在从单个静态图像和相应的语音音频中生成一个说话的人像，在视频游戏和虚拟现实、电影和电视制作、社交媒体和数字营销等领域具有巨大...

2024-10-19 AI,开源 0

开源 # 人工智能 # AI # 免费 # 整合包

PuLID-flux模型 AI整合包字节开源的图像生成ID定制化项目，通过对比对齐技术引领纯净高效新纪元

PuLID是一个由ByteDance Inc.开发的开源项目，专注于通过对比对齐技术实现纯净且高效的图像生成ID定制化。该项目由Zinan Guo、Yanze Wu、Zhuowei Chen、Lang Chen和Qian He等研究人员共同贡献，其中Zinan Guo和Yanze Wu为等量贡献者，Yanze Wu为通讯作者。PuLID项目的...

2024-9-19 AI,开源 0

开源 # 人工智能 # AI # 模型 # 整合包

Flux 文生图模型一键整合包解压即可食用出图效果超级惊艳附图片演示

Flux文生图模型是由Black Forest Labs（黑森林实验室）开发的一款高质量文本到图像生成模型。该模型在多个维度上展现了卓越性能，特别是在文本引导的图像生成、多主体场景构建以及精细的手部细节生成等方面，实现了显著的提升，为文生图领域设定了新的技术标杆。Flux模型的核心特点包括：高性能与高质量：Flux模型采用了先进的混合架构，融...

2024-9-18 AI,开源 0

人工智能 # AI # 模型

本群第一个自练 flux lora模型苗疆倩影

群内大牛icolor 自练了一个lora模型，首发在里布上。我也觉得非常牛X了本LORA由近300张苗族服饰、头饰等高清美图，经36000步近12小时炼制而成，经过本人测试后精选其一分享给大家使用。本人算力有限，在本地forge中使用dve Q8以及dve NF4模型进行测试，本LORA对人物服饰、脸型、肤色、整体色调色彩均有加强，可使用原版...

2024-9-11 素材 0

绿色软件 # 开源 # 图片处理 # 人工智能 # AI # 修图

开源 MimicBrush 一款创新性AI图像编辑工具图片局部自动重绘一键整合包附模型

MimicBrush是一款由阿里巴巴、中国香港大学和蚂蚁集团共同研发的创新性AI图像编辑工具，该软件通过先进的AI技术，实现了零样本图像编辑，为用户带来了前所未有的图像编辑体验。核心特点模仿式编辑：MimicBrush能够自动识别并模仿参考图像中的视觉元素，将其应用到源图像中指定的编辑区域，实现精准且自然的图像融合。自动化编辑：用户只需简单指...

2024-7-25 开源 0

工具 # 视频处理 # 绿色软件 # 人工智能 # AI

开源 DiffSynth-Studio 视频风格转绘，视频转动漫一键整合包附模型附官方视频演示

写在最前面，这个开源项目我早就关注了，但是一直没有合适的硬件来折腾，但是不折腾又不甘心。这不群里傻木小伙伴提供了一台机器暂时折腾一下，我就用这个机器昨天抽空弄了这个的开源整合包，模型是真的多啊。下载了我半夜。。。虽然整合包是做好了可惜很遗憾，这个视频重绘还是太耗显卡。我估计最低都需要12G 显存，否则一点运行就直接爆了显存。不信的可以看后面的...

2024-7-25 软件 0

工具 # 开源 # 人工智能 # AI # 语音工具 # 整合包

Bark UI Enhanced v0.7.4 整合包一款开源的具有 Gradio 网络用户界面的文本触发的生成音频模型

最近都在留意这个文字转语音工具，无意发现了这个开源项目，效果相当不错，所以顺手就做成了整合包，本身这个项目是支持N卡的，但是因为我没有N卡，所以就只能做成了用CPU跑。。。如果你有N卡，想高效率去生成语音的话可以去开源项目那里看看。群里有小伙伴说这个能否做小说推文，我自己测试了下完全可以，而且我感觉比某音某手上面的小说推文的语音好多了，文末会...

2024-6-23 AI,开源 0

开源 # 人工智能 # AI # 免费 # 语音工具

开源免费 ChatTTS 一个用于日常对话的生成式语音模型自带情感文字转语音工具

ChatTTS是一个开源的基于PyTorch的文本到语音（TTS）转换项目，旨在为开发者提供一个简便、高效的方式来将文本转换为自然 sounding 的语音。尽管项目的文档表明它还在开发完成阶段，这个项目具有实验和开发潜力，特别是在人工智能和机器学习领域的应用中。功能与使用方式：ChatTTS 项目的主要功能是将文本输入转换为语音输出。项目内...

2024-6-9 开源 0

开源 # 人工智能 # AI # 免费 # 人声分离

SpleeterGUI 2.95 开源免费人声背景音乐分离工具无需联网内附模型附视频教程

我之前在微信公众号上有分享这个工具的视频演示。点这里进去看看可以实现人声和背景音乐分类，也可以歌曲人声分类，我已经把所有的模型都下载好，解压即可使用。这个算是上次分享的那个人声背景音乐分离工具的后续吧，之前分享的时候是免费的，后来收费了，喜欢白嫖的人还是很多啊，这次补上这个工具吧免费开源无需联网即可操作SpleeterGUI是一款功能强大...

2024-5-3 软件,开源 0

工具 # 人工智能 # AI # Stable Diffusion # 大模型

Stable-diffusion下载量超过100万的大模型表现会如何的？附大模型下载地址

C站上有一款大模型下载量已经过了100万了，而且展示的图片也看起来很普通的。为什么这个下载量会远超其他模型。下载量居然是恐怖的100万+。先看截图你们就知道了我们平时很熟悉的麦橘都是屈居第二，看截图之前也没接触过这个排名第一的大模型，先看看它给出的演示图片。这么一天，这个大模型其实表现一般般嘛，没有想象中的那么惊艳，亲自测试一下，模仿下它的提...

2024-4-12 软件 0

绿色软件 # 音频处理 # 开源 # 人工智能 # AI # 免费