不止AI抠图,更懂细节,应该是最强的AI抠图了,集合了15种抠图模型:BiRefNet 覆盖多场景图像抠除处理需求 一键整合包 v20250920

不止AI抠图,更懂细节,应该是最强的AI抠图了,集合了15种抠图模型:BiRefNet 覆盖多场景图像抠除处理需求 一键整合包 v20250920

BiRefNet 是一个专注于 高分辨率二值图像分割(Dichotomous Image Segmentation, DIS) 的开源深度学习模型。它在背景移除、前景提取、掩码生成等任务中表现出卓越性能,广泛应用于:图像编辑与合成视觉特效处理自动抠图(无需 Trimap)数字内容创作(如 Blender 插件、AI 绘画工具集成)🚀 核心特性...
AI,开源 0
IndexTTS  v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS是由B站推出的一款基于XTTS和Tortoise的GPT风格文本转语音(TTS)模型。该项目在中文文本转语音领域展现出显著的技术优势和应用,以下从项目背景、技术架构、应用场景、社区支持及未来挑战五个维度进行详细介绍。一、项目背景:重新定义中文TTS技术标杆IndexTTS的诞生旨在解决传统TTS系统在中文语音合成中的两大核心痛...
AI,软件 0
手机留在口袋,电脑直接“隔空”收发短信、接电话、翻相册——这就是  plain-app v2.1.18

手机留在口袋,电脑直接“隔空”收发短信、接电话、翻相册——这就是 plain-app v2.1.18

PlainApp 是一款开源的「手机本地管理器」,它把整部 Android 手机变成一个只在你自己网络里运行的 Web 服务。所有数据始终停留在设备本体,不经过云端,也不依赖第三方存储;通信全程用 TLS + XChaCha20-Poly1305 加密,最大限度降低泄露风险。核心思路:用浏览器远程查看和操作手机里的内容,而不把任何信息交出去。...
开源,安卓 0
无显卡压力!中文生成高清美图,AI画师免费为你服务,采用魔搭API 生图 27pic-api-qwen v1.0

无显卡压力!中文生成高清美图,AI画师免费为你服务,采用魔搭API 生图 27pic-api-qwen v1.0

这是一个傻瓜式 AI 图像工具,你只需要:输入一段文字描述(比如:“一个穿汉服的美女在大树下微笑”)点一下“开始处理”等几秒~几分钟 → AI 自动生成一张精美图片!你还可以:✏️ 编辑已有图片:上传一张图,告诉 AI “把她的头发染成蓝色”、“加一只猫”、“换成海滩背景” → AI 自动修改!📸 批量生成:一次输入 10 行、100 行描述...
AI 0
一键生成视频内容:Wan2.2让AI创作变得简单  基于官方开源模型二次开发 6分钟出视频 v20250913

一键生成视频内容:Wan2.2让AI创作变得简单 基于官方开源模型二次开发 6分钟出视频 v20250913

Wan2.2-TI2V-5B 是一个基于 Transformer 架构的文本到视频(Text-to-Video)生成模型,具有以下特点:🔧 核心特性50亿参数规模:大型 Transformer 模型,具备强大的视频生成能力文本生成视频(T2V):直接根据文本描述生成视频内容图像生成视频(I2V):基于参考图像生成相关视频内容高分辨率支持:支持...
AI,开源 0
开源 小宾AI抠图 image-matting 一款功能强大、操作简便、注重隐私保护的本地AI图片处理软件 v0.2.5

开源 小宾AI抠图 image-matting 一款功能强大、操作简便、注重隐私保护的本地AI图片处理软件 v0.2.5

image-matting是一个基于开源模型的本地AI图片处理软件,旨在通过AI技术实现高效的图像抠图功能。该项目采用了briaai发布的RMBG-1.4开源模型,为用户提供了一个功能丰富、操作简便的图片处理工具。核心功能AI抠图:支持单张和批量图片抠图,用户无需复杂的操作即可快速从图片中提取出所需的前景物体,无论是人像还是物体,都能达到较高...
软件 0
"90分钟不间断!微软新AI能把你的文字变成专业播客 一键整合包 VibeVoice v20250906

"90分钟不间断!微软新AI能把你的文字变成专业播客 一键整合包 VibeVoice v20250906

🎙️ VibeVoice:你的超级AI配音员"把文字变成自然对话的魔法工具"🌟 什么是VibeVoice?想象一下,有一位永不疲倦的配音员,能一口气生成90分钟不间断的语音内容,还能在对话中自如切换不同角色的声音——这就是微软开发的VibeVoice,一款革命性的AI语音生成工具!💡 它能为你做什么?(实用场景)场景用途效...
AI,开源 0
"字节跳动放大招:AI绘画终于能'换装不换人'了!" 能保持主体一致性 USO v20250903 一键整合包

"字节跳动放大招:AI绘画终于能'换装不换人'了!" 能保持主体一致性 USO v20250903 一键整合包

🌟 USO:字节跳动开源的内容与风格解耦统一框架🔍 项目简介USO (Unified Style-Subject Optimized) 是字节跳动UXO团队推出的创新性开源项目,全称为"内容与风格解耦与重组统一框架"。该项目旨在解决图像生成领域中长期存在的风格与内容难以平衡的技术难题,为AI图像创作提供更灵活、更高质量的解...
AI,开源 0
这个开源AI,让你0基础创作歌曲 YuE v20250902  支持50系显卡,最低英伟达12G 显卡

这个开源AI,让你0基础创作歌曲 YuE v20250902 支持50系显卡,最低英伟达12G 显卡

YuE 是由 Multimodal Art Projection (MAP) 团队推出的开源音乐生成基础模型项目,旨在推动开放、可控、高质量的 AI 音乐生成技术发展。该项目专注于实现从文本(如歌词和风格描述)到完整歌曲的端到端生成,是当前 AI 音乐领域中一个功能强大且具有前瞻性的开源解决方案。核心特点与技术亮点全曲生成 (Full-Son...
AI,开源 0
nunchaku-flux.1-kontext-dev AI生图一键整合包 最低4G显卡可运行 30秒出图 v20250830 支持无限生图+批量图片编辑+lora模型+超分

nunchaku-flux.1-kontext-dev AI生图一键整合包 最低4G显卡可运行 30秒出图 v20250830 支持无限生图+批量图片编辑+lora模型+超分

心血来潮,想试试FLUX.1-Kontext-dev 这个新出的模型,但是奈何显卡不是很牛X,生图效率不够高,所以找了下,发现nunchaku 双截棍 这个量化模型还不错,就花了点时间学习下。然后又花点时间写了个界面,方便大伙来玩玩这个。 我的4070ti spuer 16G 30步 出1024x1024 大概30秒,显卡占用不到4G,这个效...
AI,开源 0
腾讯AI会“配音”了!给视频能自动配上声音+音乐 一键整合包 HunyuanVideo-Foley v20250830

腾讯AI会“配音”了!给视频能自动配上声音+音乐 一键整合包 HunyuanVideo-Foley v20250830

HunyuanVideo-Foley 是一个基于深度学习的音效生成系统,能够根据输入的视频内容,自动识别其中的视觉动作和场景(如脚步、关门、物体碰撞等),并生成与之同步、逼真的环境音效或动作音效。这类技术在影视后期、短视频制作、游戏开发、虚拟现实等领域具有广泛的应用前景,能够显著降低人工配音效的成本和时间。🔧 核心功能视频驱动音效生成(Vid...
AI,开源 0
"让AI有‘灵魂’的神器:开源项目免费下载,语音聊天不尬聊,打游戏能当军师,关键数据不传云端!" airi v0.7.2-beta.2

"让AI有‘灵魂’的神器:开源项目免费下载,语音聊天不尬聊,打游戏能当军师,关键数据不传云端!" airi v0.7.2-beta.2

Project AIRI 是一个基于大语言模型驱动的AI虚拟伴侣系统,旨在创建AI"女仆"(waifu)/虚拟角色的灵魂容器,将这些虚拟角色带入现实世界。该项目致力于重现Neuro-sama(一个知名的AI虚拟角色)的功能高度,完全由LLM和AI驱动。核心功能🎙️ 实时语音聊天支持与AI进行自然流畅的语音对话交互实现低延迟...
AI,开源 0
视频创作者必备!KrillinAI提供从翻译到配音的全流程解决方案,智能分段与精确字幕,打造专业级视频内容 v1.4.0

视频创作者必备!KrillinAI提供从翻译到配音的全流程解决方案,智能分段与精确字幕,打造专业级视频内容 v1.4.0

KrillinAI是一个基于AI大模型的视频翻译和配音工具,它提供了专业级的翻译服务以及一键部署的全流程解决方案。这个开源工具旨在帮助用户轻松实现视频内容的本地化与增强,使其能够适配多种内容平台,如YouTube、TikTok、Bilibili、抖音(国内版)、微信视频号、快手等。KrillinAI的核心功能包括视频翻译、配音与声音克隆、字幕...
安卓 0
多图预览 开源 手机软件 安卓app FairEmail 电子邮件工具 v1.2292

多图预览 开源 手机软件 安卓app FairEmail 电子邮件工具 v1.2292

FairEmail是一款功能齐全,开源,隐私友好的安卓电子邮件应用程序。几乎包含所有的电子邮件供应商,包括 Gmail,Outlook 和雅虎。FairEmail 可能适合你,如果你重视你的隐私。FairEmail 只是一个电子邮件客户端,所以你只需要带上自己的电子邮件地址。FairEmail 不支持非标准协议,如 MicrosoftExch...
开源,安卓 0
RainbowTaskbar 一个功能强大且实用的Windows任务栏自定义开源工具 v3.2.2

RainbowTaskbar 一个功能强大且实用的Windows任务栏自定义开源工具 v3.2.2

RainbowTaskbar是一个功能强大且实用的Windows任务栏自定义工具,它允许用户根据个人喜好深度定制任务栏的外观和功能,从而提升整体的使用体验。该工具不仅拥有丰富的自定义选项,还以其高速、低资源占用以及支持GPU渲染的特点而著称。RainbowTaskbar的核心功能之一是支持多种任务栏效果,包括文本、图像、圆角、模糊效果、渐变和...
开源 0
Ovis2图片反推提示词工具v5.0 基于AI大模型反推图片+视频批量生成提示词 英伟达6G显卡即可愉快玩耍

Ovis2图片反推提示词工具v5.0 基于AI大模型反推图片+视频批量生成提示词 英伟达6G显卡即可愉快玩耍

本工具基于Ovis2-4B和Ovis2-2B 这2个大模型制作而成。其实早之前我就有分享过反推提示词工具 moondream,但是我昨天遇到了这个大模型,发现功能更加强大,反推出来的提示更加丰富,更多细节描述。这个工具要求显卡比较低,英伟达显卡6g及以上就可以愉快玩耍了我用同一张图片反推提示词下面是Ovis2-4B生成的提示词The...
AI,开源 0
AI 一键换衣,想穿哪件试哪件!AI-Clothes-Changer 一键整合包 支持50系显卡 v20250818

AI 一键换衣,想穿哪件试哪件!AI-Clothes-Changer 一键整合包 支持50系显卡 v20250818

AI-Clothes-Changer 是一个基于深度学习的交互式图像生成项目,旨在实现“虚拟试衣”功能 —— 用户上传一张人物穿着衣服的照片,再上传一件想要试穿的服装图像,系统即可将目标服装自然地“穿”在人物身上,生成逼真的换装效果图像。🔍 核心功能虚拟换衣(Virtual Try-On)输入:一张人物全身照 + 一件衣服的正面图像(如 T ...
AI 0
EchoMimic 一个由阿里巴巴推出的开源AI数字人项目 支持50系显卡 一键整合包 v3 20250815更新

EchoMimic 一个由阿里巴巴推出的开源AI数字人项目 支持50系显卡 一键整合包 v3 20250815更新

EchoMimic是一个由阿里巴巴推出的开源AI数字人项目,该项目在数字人技术领域内实现了显著的创新与突破。以下是对EchoMimic的详细介绍:一、项目背景与意义随着人工智能、深度学习、计算机视觉以及自然语言处理技术的飞速发展,数字人技术逐渐成为连接现实世界与虚拟世界的重要桥梁。EchoMimic项目的诞生,旨在通过先进的技术手段,将静态图...
AI,开源 0
别只截图——让AI看懂它!Snippai秒出翻译、表格、配色方案 v0.2.0

别只截图——让AI看懂它!Snippai秒出翻译、表格、配色方案 v0.2.0

Snippai 是一款开源的 AI 截图分析工具,主打“截一下,秒懂一切”。它把传统截图工具的功能边界彻底打破:截完图后,AI 会自动识别图片里的内容并给出“下一步”服务,而不是简单保存一张图片。核心能力一览公式识别:截图里的数学公式直接变成可编辑的 LaTeX。文字提取:OCR 精准抓字,支持多语言,抓完还能顺手翻译。表格识别:把图片中的表...
AI,开源 0
GiliSoft AI Toolkit v10.5  一款功能丰富的AI工具综合软件包

GiliSoft AI Toolkit v10.5 一款功能丰富的AI工具综合软件包

GiliSoft AI Toolkit 是一款功能丰富的综合软件包,专为希望将AI技术集成到其工作流程中的企业和个人设计。该软件包集成了多种AI工具,包括但不限于聊天机器人、OCR(光学字符识别)、TTS(文本到语音)和ASR(自动语音识别)等功能,为用户提供了全方位、高效便捷的AI解决方案。在OCR方面,GiliSoft AI Toolki...
软件 0
E2/F5-TTS AI人工智能 文字转语音工具,可克隆声音,可训练,一键中文整合包 已支持最新50系显卡 v1.1.7

E2/F5-TTS AI人工智能 文字转语音工具,可克隆声音,可训练,一键中文整合包 已支持最新50系显卡 v1.1.7

SWivid/F5-TTS 是一个开源项目,旨在提供一个基于 Diffusion Transformer 和 ConvNeXt V2 架构的文本到语音(TTS)系统,该系统名为 F5-TTS。F5-TTS 的全称是“A Fairytaler that Fakes Fluent and Faithful Speech with Flow Mat...
AI,开源 0
字节出品 MegaTTS3 - AI智能语音合成系统,文字秒变自然语音,支持多语言高质量输出 v20250725

字节出品 MegaTTS3 - AI智能语音合成系统,文字秒变自然语音,支持多语言高质量输出 v20250725

MegaTTS3 是字节跳动开源的一个先进的文本到语音(TTS)合成系统,具有以下特点:🌟 核心特性1. 高质量语音合成基于扩散模型的语音生成技术支持高保真度的语音合成生成自然、流畅的语音输出2. 强大的语音克隆能力能够克隆特定人的声音特征只需少量参考音频即可实现声音复制保持原始音色的同时合成新内容3. 多语言支持支持中文、英文等多种语言跨语...
AI,开源 0
人工智能AI相关工具软件 合集整理

人工智能AI相关工具软件 合集整理

MOSS-TTSD:一个高质量的开源中文文本到语音合成系统 一键整合包 支持免费商业使用LoRA 千面 AI图片编辑 超N多风格转换 Kontext-Style-LoRAs光影魔法来了!AI一键切换日光/夜景/霓虹灯效果 relighting-kontext 0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版&...
AI,软件 0
LoRA 千面 AI图片编辑 超N多风格转换 Kontext-Style-LoRAs v20250722

LoRA 千面 AI图片编辑 超N多风格转换 Kontext-Style-LoRAs v20250722

在huggingface瞎逛的时候,无意中发现了这个开源的模型,真的超级强,聚集了N多风格lora模型,操作也是极其简单,感觉可能有小伙伴能用的上,就花了时间做了整合,并进行了小小的二次开发,自我感觉还行。整合包说明1 支持50系显卡,最低英伟达8G显卡可以运行,如果你的显卡刚好是8G的话,可能内存要超过30G,安装好你显卡能支持的最高版本c...
AI,开源 0
光影魔法来了!AI一键切换日光/夜景/霓虹灯效果 relighting-kontext v20250720

光影魔法来了!AI一键切换日光/夜景/霓虹灯效果 relighting-kontext v20250720

在网上瞎逛的时候,发现了这个模型,很不错,光影效果做出来很逼真,虽然我以前也做过一个类似的整合包,但是跟这个没法比,所以抽空进行了二次开发。🌟 Relighting Kontext [dev] LoRA v3 模型介绍Relighting Kontext [dev] LoRA v3是一个针对 FLUX.1-Kontext-dev模型优化的低秩...
AI,开源 0
Topaz Video AI破解版(人工智能视频修复,视频增强软件) v7.1.0 绿色版 集成OFX插件

Topaz Video AI破解版(人工智能视频修复,视频增强软件) v7.1.0 绿色版 集成OFX插件

这个软件更新频率实在是太快了,关键是又很大,上传好慢的说。。。这个工具修复视频还是要N卡,如果你没有n卡的话,用cpu跑会让你怀疑人生的,就算10多秒的视频都要半小时以上了。老有人问要什么设备才能好使,我这么说吧,你的显卡是N卡,越贵越好。如果你有N卡,那么这个软件还是很不错的,修复的效果还是很明显。试试吧. 另外我手头还有个开源免费的高清视...
软件 0
开源 Deep-Live-Cam v2.1 AI人工智能 图片视频换脸+直播换脸 整合包 支持AMD+英伟达N卡50系

开源 Deep-Live-Cam v2.1 AI人工智能 图片视频换脸+直播换脸 整合包 支持AMD+英伟达N卡50系

Deep-Live-Cam是一款由hacksider开发并维护的创新性软件,旨在为快速发展的AI生成媒体行业贡献一份力量。该软件的主要功能是通过深度学习技术,实现实时的人脸替换与增强,为艺术家、设计师以及内容创作者提供了一个强大的工具,帮助他们以全新的方式创作和表达。项目概述Deep-Live-Cam的核心价值在于其广泛的应用场景。艺术家可以...
AI,开源 0
AI 视频生成新突破:FramePack 开源项目引领视频扩散技术变革 一键汉化整合包 FramePack-F1 20250716更新 支持magcache加速 支持50系显卡

AI 视频生成新突破:FramePack 开源项目引领视频扩散技术变革 一键汉化整合包 FramePack-F1 20250716更新 支持magcache加速 支持50系显卡

FramePack 是一个开源项目,旨在通过创新的神经网络结构实现高效的视频生成。以下是对其的详细介绍:项目概述FramePack 是 “Packing Input Frame Contexts in Next - Frame Prediction Models for Video Generation” 论文的官方实现和桌面软件。它采用逐帧...
AI,开源 0
FLUX.1-Kontext-dev:图文协同,让AI图像编辑更可控,支持局部重绘与图文控制,英伟达12G可运行 v20250716

FLUX.1-Kontext-dev:图文协同,让AI图像编辑更可控,支持局部重绘与图文控制,英伟达12G可运行 v20250716

前段时间一直死劲在更新的nunchaku-flux.1-kontext-dev,还算受到大伙的欢迎,主要是显卡要求很低。运行速度快,但是有些好显卡的小伙伴说能否出一个出图质量更好的版本?量化不要这么强的,对出图有一定要求的小伙伴。所以我今天就分享了这个FLUX.1-Kontext-dev,虽然也是nunchaku量化下的,但是相对来讲这个出图...
AI,开源 0
开源 免费 视频AI自动抠像 速度快 操作简单 效果很是惊艳 值得珍藏 RobustVideoMattingGUI  v1.1.0

开源 免费 视频AI自动抠像 速度快 操作简单 效果很是惊艳 值得珍藏 RobustVideoMattingGUI v1.1.0

之前分享的图片抠像,有些小伙伴在问是否有视频抠像的,那必须要有啊。这个工具我也是放在我的收藏夹里面好久了,今天就分享出来。我的好东西多的是就怕你们硬盘空间不够。这个软件解压后近8G。先看视频演示 这个开源项目真的是很良心了,抠像真的是不错,我个人觉得已经很媲美剪映那个抠像了。目前不支持N卡,我只能用cpu来跑,但是效率还可以,我10多秒的视频...
软件,开源 0
让AI绘画更听你的话:DRA-Ctrl 实现图像局部控制生成 v20250712 一键整合包,最低支持8G英伟达,支持50系显卡

AI绘画更听你的话:DRA-Ctrl 实现图像局部控制生成 v20250712 一键整合包,最低支持8G英伟达,支持50系显卡

DRA-Ctrl 是一个由 Kunbyte-AI开发的开源项目,其核心目标是为扩散模型(Diffusion Models)提供一种可控的生成机制。该项目专注于实现对图像生成过程中的“区域感知控制”(Region-aware Control),即在图像生成过程中,允许用户对图像的不同区域施加不同的控制条件,从而实现更加精细化和结构化的生成效果。...
AI,开源 0
AIStarter启动器:AI Starter v4.1.0 实现一键AI下载使用,实现开箱即用 完整包包含项目文件

AIStarter启动器:AI Starter v4.1.0 实现一键AI下载使用,实现开箱即用 完整包包含项目文件

分享给喜欢玩AI的朋友,我下载测试体验了,基本热门的ai项目都可以下载本地部署,全自动。您的AI项目管理专家,AIStarter实现一键下载使用,实现开箱即用我分享的是完整包 里面已经包含AI的项目文件下面简单说下完整包使用方法。先装好AIStarter Setup 2.0.1.exe。然后启动这个工具设置好目录,硬盘少于1T的千万不要来自取...
开源 0