想换脸、换衣服还是换风格?DreamO图像定制,一键搞定!v20250513 AI生成图片 一键整合包

想换脸、换衣服还是换风格?DreamO图像定制,一键搞定!v20250513 AI生成图片 一键整合包

DreamO是一个由字节跳动开源的统一图像定制化框架(A Unified Framework for Image Customization),旨在通过先进的算法和技术,为用户提供高度灵活和高质量的图像定制化服务。以下是该项目的详细介绍说明:核心功能:图像定制化:DreamO允许用户根据需求定制图像,支持多种定制化任务,包括但不限于人物形象定...
AI,开源 5427 11
吾爱出品 开源 口算出题工具 v1.1.3 家有小学生必备工具

吾爱出品 开源 口算出题工具 v1.1.3 家有小学生必备工具

这个开源工具是ArithmeticGenerator,它是一个简单的口算生成工具。以下是关于该工具的详细介绍:功能描述:生成口算题目:该工具能够生成口算题目,方便用户进行口算练习。保存常用题型:用户可以将常用的题型保存为题库,方便日后重复使用。支持导出:生成的口算题目或题库可以导出,便于打印或分享。使用场景:教育领域:教师可以利用该工具生成口...
软件 3515 2
超强挂机AI生图comfyui工作流,提示词自动生成,一键操作,出图效果好,效率高 挂机流20250429更新

超强挂机AI生图comfyui工作流,提示词自动生成,一键操作,出图效果好,效率高 挂机流20250429更新

距离上一次的分享的挂机工作流已经过去了几个月了,感觉是时候分享更强大的了。这个工作流早几天就发到Q群给大伙玩了,经过多人测试 没有什么问题后,我今天才分享出来。如果拖到comfyui后,提示大量的红色,缺失节点,可以点管理器进去自行安装好缺失的节点。如果安装老是失败,可以开启科学上网工具进行安装随便上传几张工作流说明1 生成的提示词更加丰富2...
素材 8469 3
 KaKaDa AI答题辅助工具V1.0.0.3

KaKaDa AI答题辅助工具V1.0.0.3

KaKaDa是一款创新的答题辅助工具,它借助了阿里云开源的72B大模型进行问题推断,旨在为用户提供快速、准确的答题推荐。与传统的答题工具不同,KaKaDa直接显示推荐的选项,而不是先解释后展示文字答案,从而大大节省了用户的时间。一、主要功能OCR识别与推送:KaKaDa支持在问题界面使用Alt+Q快捷键截取完整的题目和选项,然后利用OCR技术...
AI 3270 0
文本转语音,如此简单真实:Nari Labs开源Dia,一轮处理生成高度逼真的对话音频

文本转语音,如此简单真实:Nari Labs开源Dia,一轮处理生成高度逼真的对话音频

Dia是一个由Nari Labs创建的文本转语音(TTS)模型,它拥有16亿(1.6B)参数,能够在一轮处理中生成超逼真的对话。这个项目的核心特点是其高度真实的语音生成能力,可以直接从文本中生成高度逼真的对话,同时支持通过音频条件来控制输出,实现情感和语调的调整。主要功能高度逼真的对话生成:Dia能够直接从文本中生成高质量的对话,无需多轮处理...
AI 3401 0
OmniGen:统一框架,高效灵活,图像生成从未如此简单  基于最新模型一键整合包 已经汉化

OmniGen:统一框架,高效灵活,图像生成从未如此简单 基于最新模型一键整合包 已经汉化

OmniGen 是一个由 VectorSpaceLab 开发的开源项目,旨在提供一个统一的图像生成模型,能够处理多种图像生成任务,而无需依赖额外的插件或复杂的预处理步骤。该项目的核心目标是简化图像生成流程,使其像 GPT 在语言生成中的应用一样灵活和高效。OmniGen 支持多种任务,包括文本到图像生成、图像编辑、主题驱动生成和经典计算机视觉...
AI 6515 7
字节开源 UNO:电商图片生成的高效利器,一键汉化整合包 ,支持文生图和图生图

字节开源 UNO:电商图片生成的高效利器,一键汉化整合包 ,支持文生图和图生图

UNO(Universal Customization)是由字节跳动公司开发并开源的一个通用自定义方法的项目,旨在解决单主体和多主体条件下的图像生成问题,具有很强的可控性和通用性。该项目通过提出一种高度一致的数据合成流程,利用扩散变换器的内在上下文生成能力,生成高一致性的多主体配对数据。UNO模型包含渐进式跨模态对齐和通用旋转位置嵌入,是从文...
AI,开源 4050 4
SenseVoice:解锁语音理解新高度,多语言情感识别与事件检测全攻略 语音转文本 一键汉化整合包 v1.0

SenseVoice:解锁语音理解新高度,多语言情感识别与事件检测全攻略 语音转文本 一键汉化整合包 v1.0

FunAudioLLM/SenseVoice: Multilingual Voice Understanding Model 是一个专注于语音理解的开源项目,旨在提供高精度的多语言语音识别、语音情感识别和音频事件检测功能。这个项目由 FunAudioLLM 团队开发和维护,基于 FunASR 工具包构建,支持多种语言和方言,包括中文、英语、粤...
AI,开源 4271 2
探索AI与古典诗歌的完美融合:中文诗词生成器 一键整合包 chinese-poem v1.0 附效果演示

探索AI与古典诗歌的完美融合:中文诗词生成器 一键整合包 chinese-poem v1.0 附效果演示

在数字化与智能化飞速发展的今天,人工智能技术正以前所未有的速度改变着我们的生活。从日常的语音助手到复杂的图像识别,AI的应用无处不在。然而,你是否想过,AI也能与古典文化相结合,创造出令人惊叹的艺术作品?今天,我要向大家介绍一款独特的工具——中文诗歌生成器,它将AI的强大功能与中华古典诗歌的韵味完美融合,为诗歌创作带来了全新的可能。一、工具简...
开源 2813 0
Free-TTS_unlimted-words v1.0 AI文字生成语音,调用Edge TTS接口运行 一键整合包 无需要显卡即可运行

Free-TTS_unlimted-words v1.0 AI文字生成语音,调用Edge TTS接口运行 一键整合包 无需要显卡即可运行

Edge TTS(Edge Text-to-Speech) 是微软推出的一款基于深度学习技术的文本转语音(TTS)工具,具有高质量语音合成、多语言支持、灵活配置和开源可扩展等特点,广泛应用于语音助手、电子书阅读、视频制作、教育及智能客服等领域。核心功能高质量语音合成Edge TTS 采用先进的深度学习技术,能够生成自然流畅、接近真人...
AI,开源 2928 0
Orpheus-TTS:AI文字合成语音,让语言更有温度 一键整合包 支持生成中文语音

Orpheus-TTS:AI文字合成语音,让语言更有温度 一键整合包 支持生成中文语音

Orpheus-TTS是一个前沿的开源文本转语音(Text-To-Speech,TTS)系统,它基于Llama-3b这一强大的大型语言模型(LLM)构建。该项目展示了在语音合成领域使用大型语言模型的新兴能力,为用户带来了前所未有的自然语音体验。Orpheus-TTS的核心优势在于其人类般的语音表现。它能够生成具有自然语调、情感和节奏的语音,这...
AI,开源 4867 6
神器 Z-Info v1.0.45.45 硬件检测4件套 一款功能强大且全面适用于Windows操作系统的硬件检测工具组合

神器 Z-Info v1.0.45.45 硬件检测4件套 一款功能强大且全面适用于Windows操作系统的硬件检测工具组合

Z-Info硬件检测4件套是一款功能强大且全面适用于Windows操作系统的硬件检测工具组合,它整合了CPU-Z、GPU-Z、PCI-Z和SSD-Z四个热门软件的所有功能,为用户提供了一个方便、快捷、全面的硬件信息分析平台。这款工具组合由独立开发者精心打造,支持Windows XP、Windows 7、Windows 8以及Windows 1...
软件 2966 0
大笨狗更名器 批量修改文件名工具4.56 正式版 绿色免安装

大笨狗更名器 批量修改文件名工具4.56 正式版 绿色免安装

大笨狗批量修改文件名工具一款功能强大且完全免费的绿色软件,由缤纷软件推出,专为解决用户批量修改文件名而设计。该软件无需安装,解压缩后即可直接使用,且不会附带安装其他软件,保证了用户使用的便捷性和安全性。以下是该软件的详细介绍:主要功能批量删除与替换:用户可以批量删除文件名中的指定字符,或从文件名中指定位置删除n个字符;同时支持批量替换文件名中...
软件 3176 0
MyFileReName v1.4.1 简单好用又强大的Windows改名助手,公式化改名

MyFileReName v1.4.1 简单好用又强大的Windows改名助手,公式化改名

功能详细介绍1. 文件和文件夹拖放功能拖放操作:用户可以将文件或文件夹拖放到软件界面中,工具会自动处理拖放的文件路径文件夹处理:工具能够递归处理文件夹中的文件,根据用户选择决定是否包括子目录2. 重命名规则设置规则添加:用户可以在规则输入框中输入自定义的重命名规则,支持多种规则格式规则保存:用户可以保存自定义的重命名规则到rules.txt文...
软件 2719 2
 20250412 更新 pexels 最新热门视频素材 免费商用 无水印 高清 1200+

20250412 更新 pexels 最新热门视频素材 免费商用 无水印 高清 1200+

Pexels 是一个提供免费高清视频素材的优质平台,其视频资源具有以下特点:1. 丰富多样的内容主题广泛:涵盖自然风光(如山川、海洋、星空)、城市景观(如建筑、街道、交通)、人物活动(如生活场景、工作瞬间)、科技元素(如电子产品、数据展示)、美食制作(如烹饪过程、食材特写)等多种类别。风格多样:从写实记录到创意剪辑,满足不同创作需求。2. 高...
素材 3376 0
澎湃音乐 v1.9.2 一款既具备高颜值又功能强大的本地音乐播放器

澎湃音乐 v1.9.2 一款既具备高颜值又功能强大的本地音乐播放器

B站大神必辟系地 出品在数字音乐盛行的今天,一款既具备高颜值又功能强大的本地音乐播放软件成为了众多音乐爱好者的追求。澎湃音乐,正是这样一款集美观与实用于一身的音乐播放神器。澎湃音乐由必辟系地的大佬精心开发,它不仅拥有令人赏心悦目的界面设计,更在功能上进行了全面优化,以满足用户对于本地音乐播放的多样化需求。这款软件支持多种存储介质,包括但不限于...
软件 3578 0
AudioX  一个极具创新性和实用性的AI开源音频和视频生成工具。一键汉化整合包

AudioX 一个极具创新性和实用性的AI开源音频和视频生成工具。一键汉化整合包

AudioX是一个创新的开源项目,专注于实现一种全新的音频与音乐生成方式。该项目由Zeyue Tian及其团队开发,并在GitHub上公开分享,为音频生成领域带来了革命性的突破。AudioX的核心是一个统一的Diffusion Transformer模型,旨在解决现有音频生成方法中的局限性,如模态隔离、高质量多模态训练数据稀缺以及多样化输入整...
AI,开源 6533 14
BEN2 v1.1 AI人工智能 图片批量抠图+视频抠像工具 一键整合包 视频可以输出透明通道

BEN2 v1.1 AI人工智能 图片批量抠图+视频抠像工具 一键整合包 视频可以输出透明通道

虽然我已经分享了不少的抠图和视频抠像的工具,但是谁又会嫌弃好工具多呢?所以抽空做了这个BEN2的整合包,这个整合包最大的特点就是可以输出带有透明通道的webm视频格式。在图像和视频处理领域,前景分割技术一直是研究和应用的热点。无论是视频编辑、特效制作,还是人工智能驱动的内容生成,精准的前景分割都是实现高质量输出的关键。而今天我们要介绍的,是一...
AI,开源 7174 5
WechatRealFriends V1.0.4 快速、精准筛查出微信朋友圈已删除或拉黑你的好友 开源 支持pc端

WechatRealFriends V1.0.4 快速、精准筛查出微信朋友圈已删除或拉黑你的好友 开源 支持pc端

WechatRealFriends 是一款基于微信iPad协议的Windows端开源工具,专注于解决微信生态中长期存在的单向好友检测难题。其核心价值在于快速、精准筛查出已删除或拉黑你的好友,并通过自动化标签分类功能,帮助用户高效管理社交关系。该工具通过模拟iPad设备登录微信,调用公开协议接口分析好友关系链,无需主动发送消息或转账,即可在后台...
软件 4081 0
ClearerVoice-Studio   AI语音增强、语音降噪工具,一键整合包,二开作品 支持批量操作

ClearerVoice-Studio AI语音增强、语音降噪工具,一键整合包,二开作品 支持批量操作

ClearerVoice-Studio是由阿里巴巴达摩院通义实验室开源的综合性语音处理工具包,旨在为语音技术研究和应用提供高效解决方案。其核心功能覆盖语音增强、分离、目标说话人提取及超分辨率处理,通过融合复数域深度学习算法与先进模型架构,显著提升了复杂声学场景下的语音处理效果。技术架构与核心优势该框架采用复数域深度学习技术,通过FRCRN(复...
AI,开源 5556 0
MeloTTS v0.1.2  AI文本生成语音工具,支持英伟达显卡+cpu运行,速度极快 支持六国语言,一键整合包

MeloTTS v0.1.2 AI文本生成语音工具,支持英伟达显卡+cpu运行,速度极快 支持六国语言,一键整合包

MeloTTS:高质量多语言文本到语音合成工具详解MeloTTS是由MyShell AI开发的一款开源文本到语音(TTS)合成工具,其核心目标是提供高效、自然的多语言语音合成解决方案。该工具通过深度学习技术实现了从文本到语音的流畅转换,支持包括英语、中文、日语、韩语在内的多种语言,尤其在中英混合发音场景中具有显著优势。以下从技术架构、核心功能...
AI,开源 4048 4
LatentSync v1.5 字节跳动联合北京交通大学推出AI数字人工具,汉化一键整合包

LatentSync v1.5 字节跳动联合北京交通大学推出AI数字人工具,汉化一键整合包

LatentSync是由字节跳动联合北京交通大学推出的端到端唇形同步框架,基于音频条件潜在扩散模型(Latent Diffusion Models),旨在实现语音与唇形运动的高精度同步。该项目通过结合Stable Diffusion的生成能力与音视频联合建模技术,解决了传统方法依赖中间表示(如3D模型或2D关键点)的复杂性问题,直接生成动态逼...
AI,开源 7036 17
Stable Diffusion(AI绘画) 绘世 WebUI+comfyui+SD-Forge  自更新一键下载安装汉化版 4.9 202408更新 附A卡整合包 附我常用的大模型和ControlNet 模型

Stable Diffusion(AI绘画) 绘世 WebUI+comfyui+SD-Forge 自更新一键下载安装汉化版 4.9 202408更新 附A卡整合包 附我常用的大模型和ControlNet 模型

距离我上次更新这个已经过去了三个月多了,这中间AI发展实在是太迅速了,我也中间分享了无数用AI生成的图片素材,感兴趣的小伙伴可以在文末的链接进去看看,基本都是基于这个工具生成的。全部免费下载。大概有几千张,大部分都是精品。目前秋叶同学的这个离线包已经更新到了2.58,因为实在是太大了,上传速度实在是慢,所以更新时间稍稍晚了一点点。喜欢这个工具...
开源 25.7万 865
AI人工智能 图片高清修复放大Tile-Upscaler v1.0  一键汉化整合包

AI人工智能 图片高清修复放大Tile-Upscaler v1.0 一键汉化整合包

本工具基于Tile-Upscaler二次开发,简单直接,操作点2下即可,图片高清修复效果还不错,处理速度我的4070tisuper一张1080x1920的图片大概8秒就可以完成高清修复。效果演示原图我个人觉得高清修复效果还可以。所以就花了点时间整合了一下,另外修改了部分代码1 修正一些小bug2 删除没用的演示例子3&nb...
AI,开源 5265 2
MatAnyone v1.0.0 人工智能AI 自定义视频抠图 一键汉化整合包 附视频演示

MatAnyone v1.0.0 人工智能AI 自定义视频抠图 一键汉化整合包 附视频演示

MatAnyone是一个专注于人类视频抠图(Matting)的实用框架,其独特之处在于支持目标分配功能,并能在核心区域语义和精细边界细节上表现出稳定的性能。该项目由Peiqing Yang等人在2025年提出,并在CVPR(Conference on Computer Vision and Pattern Recognition)这一顶级计算...
AI,开源 8794 12
吾爱大神的原创作品 图片批量转化工具v1.6.1 绿色免安装

吾爱大神的原创作品 图片批量转化工具v1.6.1 绿色免安装

以下是作者的原话写给老婆用的,需求简单,就是可以转换图片格式,当时主要是webp的格式转换麻烦,要一张张弄~初始版本太简单了,没发目前V1.1.0 版本发布,功能大幅增强,代码优化了下,速度也挺快了,同时把防呆和异常处理也补齐了分享给兄弟们啦! 操作还是非常简单的,目前同类型咱们这个很实用!主要功能:1. “全”图片格式支持,常见不常见的大概...
软件 2999 0
InspireMusic AI人工智能音乐、歌曲和音频生成的开源一键中文整合包

InspireMusic AI人工智能音乐、歌曲和音频生成的开源一键中文整合包

InspireMusic是一个专注于音乐、歌曲和音频生成的开源项目,它提供了一个统一的框架来实现这些生成任务。以下是对该项目的详细介绍:主要功能音乐生成:支持文本提示、音乐类型、音乐结构等多种控制方式,可生成高质量的音乐作品。歌曲生成:能够根据用户的文本描述或音乐结构生成完整的歌曲。音频生成:可以生成各种类型的音频,包括但不限于背景音乐、音效...
AI,开源 3629 0
手机软件 安卓app DiskUsage v5.0-alpha1 一款开源的Android设备空间占用扫app

手机软件 安卓app DiskUsage v5.0-alpha1 一款开源的Android设备空间占用扫app

DiskUsage是一个专为Android设备设计的开源应用程序,旨在帮助用户高效地管理和清理存储卡上的空间。DiskUsage的核心功能是提供一个直观且易用的界面,让用户能够轻松找到并识别出存储卡上占用大量空间的文件和目录。它采用了一种独特的图表显示方式,将各个目录的大小以比例形式直观地呈现出来,同时还展示了多层子目录的结构。这种可视化的方...
安卓 3008 0
手机软件 安卓pp UnitConverterUltimate v5.7.3 一款功能全面、界面美观、易于使用的开源单位转换应用

手机软件 安卓pp UnitConverterUltimate v5.7.3 一款功能全面、界面美观、易于使用的开源单位转换应用

Unit Converter Ultimate是一款由physphil开发的开源单位转换应用。这款应用以其简洁、轻量级和Material Design主题的用户界面脱颖而出,为用户提供了一种快速、便捷的单位转换体验。Unit Converter Ultimate支持多种类型的单位转换,包括但不限于货币、温度、长度、质量/重量、速度、面积、烹饪...
安卓 1672 0
手机软件 安卓app Iceraven v2.28.0 一款专为 Android 平台设计的开源浏览器

手机软件 安卓app Iceraven v2.28.0 一款专为 Android 平台设计的开源浏览器

Iceraven Browser 是一款专为 Android 平台设计的开源浏览器,其代码库托管于 GitHub,由社区开发者基于 Mozilla Firefox 的分支(Fenix 项目)进行优化和扩展。该项目旨在提供更高效、安全、高度可定制的移动浏览体验,同时支持丰富的扩展功能和隐私保护机制。以下是其核心特性与技术亮点:一、项目背景与目标...
安卓 2252 0
Spark-TTS 一款开源 功能强大、高效且灵活的文本转语音工具 一键整合包

Spark-TTS 一款开源 功能强大、高效且灵活的文本转语音工具 一键整合包

Spark-TTS是一款先进的文本转语音(Text-to-Speech,TTS)系统,它利用大型语言模型(Large Language Model,LLM)的强大功能,实现了高度准确且自然流畅的语音合成。该系统旨在为研究和生产使用提供高效、灵活且强大的解决方案。Spark-TTS的核心优势在于其简洁性和效率。它完全基于Qwen2.5构建,无需...
安卓 7640 14