flameshot  一款开源的屏幕截图工具 v13.3.0

flameshot 一款开源的屏幕截图工具 v13.3.0

Flameshot是一款开源的屏幕截图工具,专为Linux用户设计,但也能在Windows和macOS上通过适当的包装和安装方法运行。它以其直观的用户界面和丰富的功能集而闻名,为用户提供了快速捕捉屏幕内容、编辑和分享截图的便捷方式。Flameshot支持多种截图模式,包括全屏截图、窗口截图、区域截图以及滚动截图(用于捕获超出屏幕长度的内容,如...
软件 3245 0
 AI 播客 :一键生成多角色对话音频 SoulX-Podcast 剑二十七二次开发 一键整合包 v20251103

AI 播客 :一键生成多角色对话音频 SoulX-Podcast 剑二十七二次开发 一键整合包 v20251103

SoulX-Podcast是由 Soul AI Lab 开源的一个面向播客场景的高质量、长篇、多说话人对话式语音合成(TTS)系统,专为生成自然、富有表现力、支持方言与副语言特征的播客音频而设计。🔍 项目核心特点1. 长篇多轮多说话人对话生成支持生成多人交替对话的播客内容(如主持人 + 嘉宾);能处理长文本输入,保持语音连贯性和角色一致性;适...
AI,开源 4744 1
支持图像、动图、短视频、PDF:AI逐页/逐帧分析,AI不仅能看懂,还能回答你的问题  Qwen3-VL 一键整合包 v20251024

支持图像、动图、短视频、PDF:AI逐页/逐帧分析,AI不仅能看懂,还能回答你的问题 Qwen3-VL 一键整合包 v20251024

基于 Qwen3-VL-4B-Instruct 的多模态智能交互平台📌 简介本应用是一个基于 通义千问 Qwen3-VL-4B-Instruct 大模型的多模态推理系统,支持对 图像、视频、PDF 文档、GIF 动图 等多种媒体内容进行智能理解与分析,并能自动生成精准描述、解答问题或提取关键信息。借助 Gradio 构建的直观 Web 界面,...
AI,开源 3976 0
DeepSeek-OCR 可视化工具:支持自由OCR、Markdown转换、图表解析与目标定位 一键整合包 v20251023

DeepSeek-OCR 可视化工具:支持自由OCR、Markdown转换、图表解析与目标定位 一键整合包 v20251023

🐳 DeepSeek-OCR 智能图像文字识别工具 — 使用说明🌟 这是什么?这是一个智能图像处理工具,可以自动从你上传的图片中:识别文字内容把文档转成 Markdown 格式(适合写博客、笔记)解析图表数据(比如柱状图、折线图里的数字)定位图片中的特定内容(比如“找出老师在哪里”)它基于先进的 AI 模型(DeepSeek-OCR),由剑二...
AI,开源 3606 4
一句话改图,两张图参考——DreamOmni2 让 AI 理解你的编辑意图 一键整合包优化版 v20251014 支持风格迁移、物体替换、光照调整等全能图像编辑

一句话改图,两张图参考——DreamOmni2 让 AI 理解你的编辑意图 一键整合包优化版 v20251014 支持风格迁移、物体替换、光照调整等全能图像编辑

DreamOmni2 是一个“万能图像编辑器” —— 你给它两张图 + 一句指令,它就能智能地把第一张图“改”成你想要的样子,参考第二张图的风格、内容、细节等。🖼️ 它能做什么?(举几个例子)你想做什么DREAMOMNI2 能做到把照片里的衣服换成另一件✅ 上传原图 + 新衣服图 + 指令:“把第一张图的衣服换成第二张的”让人物发型和参考图一...
AI,开源 3788 0
AI 一键换装 + 换姿势:你的虚拟造型师来了! Leffa v20251010 一键整合包

AI 一键换装 + 换姿势:你的虚拟造型师来了! Leffa v20251010 一键整合包

🎯 这个工具能做什么?这是一个 AI 换装 + 换姿势 的智能图像生成工具,名字叫 Leffa。它能帮你完成两件很酷的事情:1️⃣ 虚拟试衣(AI 换衣服) 👗你只需要提供:一张你自己的全身照片(人像)一张你喜欢的衣服照片AI 就会自动把这件衣服“穿”到你身上,生成一张逼真的试穿效果图!✅ 支持上衣、裤子、连衣裙等多种服装类型✅ 衣服纹理、褶...
AI,开源 8172 1
Kani TTS:轻量、流式、类人 — 开源AI语音合成系统一键整合包  v20251008

Kani TTS:轻量、流式、类人 — 开源AI语音合成系统一键整合包 v20251008

🎙️ Kani TTS — 高质量、模块化、类人语音合成开源项目Kani TTS 是一个由 nineninesix-ai维护的开源文本到语音(TTS)系统,致力于从文本输入生成高质量、自然流畅的语音。项目支持本地独立运行与Web 流式服务,适用于开发、研究及个性化 TTS 场景。GitHub 仓库地址:https://github.com/n...
AI,开源 5289 0
国产AI画画太强了!一句话生成高清美图,支持中文提示词,最低6G英伟达即可运行,15秒出图 Qwen-Image+Edit一键整合包 v20250828 新增 qwen-image-edit-2509-lightningv2.0-20250927 整合包

国产AI画画太强了!一句话生成高清美图,支持中文提示词,最低6G英伟达即可运行,15秒出图 Qwen-Image+Edit一键整合包 v20250828 新增 qwen-image-edit-2509-lightningv2.0-20250927 整合包

Qwen-Image 是由通义实验室推出的多模态大模型,集成在 Qwen(通义千问)系列中,专注于实现强大的图文理解与生成能力。该模型基于 Qwen 的语言理解基础,深度融合视觉模块,使其能够同时处理和理解图像与文本信息,支持跨模态任务,如图像描述生成、视觉问答(VQA)、图文匹配、图像理解与推理等。核心特点:强大的图文理解能力Qwen-Im...
AI,开源 7337 10
27video v3.1 超级强大AI视频抠像工具 剑二十七原创作品 附视频演示

27video v3.1 超级强大AI视频抠像工具 剑二十七原创作品 附视频演示

这个工具基于AI大模型BiRefNet文件二次开发。可以对视频进行抠像。速度快,效果也不错。对显卡占用很低,8G的英伟达显卡就可以流畅运行了。操作极其简单,无需任何基础 会点鼠标即可。下面截图几张抠像效果演示20241209 v1.1 更新记录1 保留白色和黑色背景这2种视频抠像,新增了一个自定义背景图片抠像。2...
AI,开源 1.5万 55
不止AI抠图,更懂细节,应该是最强的AI抠图了,集合了15种抠图模型:BiRefNet 覆盖多场景图像抠除处理需求 一键整合包 v20250920

不止AI抠图,更懂细节,应该是最强的AI抠图了,集合了15种抠图模型:BiRefNet 覆盖多场景图像抠除处理需求 一键整合包 v20250920

BiRefNet 是一个专注于 高分辨率二值图像分割(Dichotomous Image Segmentation, DIS) 的开源深度学习模型。它在背景移除、前景提取、掩码生成等任务中表现出卓越性能,广泛应用于:图像编辑与合成视觉特效处理自动抠图(无需 Trimap)数字内容创作(如 Blender 插件、AI 绘画工具集成)🚀 核心特性...
AI,开源 8418 2
IndexTTS  v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS是由B站推出的一款基于XTTS和Tortoise的GPT风格文本转语音(TTS)模型。该项目在中文文本转语音领域展现出显著的技术优势和应用,以下从项目背景、技术架构、应用场景、社区支持及未来挑战五个维度进行详细介绍。一、项目背景:重新定义中文TTS技术标杆IndexTTS的诞生旨在解决传统TTS系统在中文语音合成中的两大核心痛...
AI,软件 2.1万 51
无显卡压力!中文生成高清美图,AI画师免费为你服务,采用魔搭API 生图 27pic-api-qwen v1.0

无显卡压力!中文生成高清美图,AI画师免费为你服务,采用魔搭API 生图 27pic-api-qwen v1.0

这是一个傻瓜式 AI 图像工具,你只需要:输入一段文字描述(比如:“一个穿汉服的美女在大树下微笑”)点一下“开始处理”等几秒~几分钟 → AI 自动生成一张精美图片!你还可以:✏️ 编辑已有图片:上传一张图,告诉 AI “把她的头发染成蓝色”、“加一只猫”、“换成海滩背景” → AI 自动修改!📸 批量生成:一次输入 10 行、100 行描述...
AI 3778 0
一键生成视频内容:Wan2.2让AI创作变得简单  基于官方开源模型二次开发 6分钟出视频 v20250913

一键生成视频内容:Wan2.2让AI创作变得简单 基于官方开源模型二次开发 6分钟出视频 v20250913

Wan2.2-TI2V-5B 是一个基于 Transformer 架构的文本到视频(Text-to-Video)生成模型,具有以下特点:🔧 核心特性50亿参数规模:大型 Transformer 模型,具备强大的视频生成能力文本生成视频(T2V):直接根据文本描述生成视频内容图像生成视频(I2V):基于参考图像生成相关视频内容高分辨率支持:支持...
AI,开源 4223 0
开源 小宾AI抠图 image-matting 一款功能强大、操作简便、注重隐私保护的本地AI图片处理软件 v0.2.5

开源 小宾AI抠图 image-matting 一款功能强大、操作简便、注重隐私保护的本地AI图片处理软件 v0.2.5

image-matting是一个基于开源模型的本地AI图片处理软件,旨在通过AI技术实现高效的图像抠图功能。该项目采用了briaai发布的RMBG-1.4开源模型,为用户提供了一个功能丰富、操作简便的图片处理工具。核心功能AI抠图:支持单张和批量图片抠图,用户无需复杂的操作即可快速从图片中提取出所需的前景物体,无论是人像还是物体,都能达到较高...
软件 6281 7
手机软件 安卓app libretorrent 一款专为Android平台打造的自由且开源的全功能bt下载工具 v4.0.1

手机软件 安卓app libretorrent 一款专为Android平台打造的自由且开源的全功能bt下载工具 v4.0.1

LibreTorrent是一款专为Android平台打造的自由且开源的全功能Torrent客户端软件。它不仅提供了丰富的功能特性,还确保了用户的数据安全和隐私保护。以下是对LibreTorrent的详细介绍:一、软件概述LibreTorrent基于开源理念开发,致力于为用户提供高效、稳定且易于使用的Torrent下载体验。其界面简洁明了,操作...
安卓 3094 0
"字节跳动放大招:AI绘画终于能'换装不换人'了!" 能保持主体一致性 USO v20250903 一键整合包

"字节跳动放大招:AI绘画终于能'换装不换人'了!" 能保持主体一致性 USO v20250903 一键整合包

🌟 USO:字节跳动开源的内容与风格解耦统一框架🔍 项目简介USO (Unified Style-Subject Optimized) 是字节跳动UXO团队推出的创新性开源项目,全称为"内容与风格解耦与重组统一框架"。该项目旨在解决图像生成领域中长期存在的风格与内容难以平衡的技术难题,为AI图像创作提供更灵活、更高质量的解...
AI,开源 3795 4
这个开源AI,让你0基础创作歌曲 YuE v20250902  支持50系显卡,最低英伟达12G 显卡

这个开源AI,让你0基础创作歌曲 YuE v20250902 支持50系显卡,最低英伟达12G 显卡

YuE 是由 Multimodal Art Projection (MAP) 团队推出的开源音乐生成基础模型项目,旨在推动开放、可控、高质量的 AI 音乐生成技术发展。该项目专注于实现从文本(如歌词和风格描述)到完整歌曲的端到端生成,是当前 AI 音乐领域中一个功能强大且具有前瞻性的开源解决方案。核心特点与技术亮点全曲生成 (Full-Son...
AI,开源 3129 0
nunchaku-flux.1-kontext-dev AI生图一键整合包 最低4G显卡可运行 30秒出图 v20250830 支持无限生图+批量图片编辑+lora模型+超分

nunchaku-flux.1-kontext-dev AI生图一键整合包 最低4G显卡可运行 30秒出图 v20250830 支持无限生图+批量图片编辑+lora模型+超分

心血来潮,想试试FLUX.1-Kontext-dev 这个新出的模型,但是奈何显卡不是很牛X,生图效率不够高,所以找了下,发现nunchaku 双截棍 这个量化模型还不错,就花了点时间学习下。然后又花点时间写了个界面,方便大伙来玩玩这个。 我的4070ti spuer 16G 30步 出1024x1024 大概30秒,显卡占用不到4G,这个效...
AI,开源 1.9万 95
腾讯AI会“配音”了!给视频能自动配上声音+音乐 一键整合包 HunyuanVideo-Foley v20250830

腾讯AI会“配音”了!给视频能自动配上声音+音乐 一键整合包 HunyuanVideo-Foley v20250830

HunyuanVideo-Foley 是一个基于深度学习的音效生成系统,能够根据输入的视频内容,自动识别其中的视觉动作和场景(如脚步、关门、物体碰撞等),并生成与之同步、逼真的环境音效或动作音效。这类技术在影视后期、短视频制作、游戏开发、虚拟现实等领域具有广泛的应用前景,能够显著降低人工配音效的成本和时间。🔧 核心功能视频驱动音效生成(Vid...
AI,开源 4546 16
开源免费、无时间限制 数字人 图片+音频一键生成视频 InfiniteTalk v20250825

开源免费、无时间限制 数字人 图片+音频一键生成视频 InfiniteTalk v20250825

InfiniteTalk 是由 MeiGen-AI 团队开发的先进开源项目,专注于解决长视频生成中的关键挑战——实现无限长度的高质量会说话视频生成。该项目突破了传统数字人技术的时长限制,能够生成任意长度的自然流畅的"会说话"视频内容。核心功能与特点1. 无限长度视频生成突破性技术:解决了传统TTS(文本转语音)和数字人视频...
AI,开源 6589 27
视频创作者必备!KrillinAI提供从翻译到配音的全流程解决方案,智能分段与精确字幕,打造专业级视频内容 v1.4.0

视频创作者必备!KrillinAI提供从翻译到配音的全流程解决方案,智能分段与精确字幕,打造专业级视频内容 v1.4.0

KrillinAI是一个基于AI大模型的视频翻译和配音工具,它提供了专业级的翻译服务以及一键部署的全流程解决方案。这个开源工具旨在帮助用户轻松实现视频内容的本地化与增强,使其能够适配多种内容平台,如YouTube、TikTok、Bilibili、抖音(国内版)、微信视频号、快手等。KrillinAI的核心功能包括视频翻译、配音与声音克隆、字幕...
安卓 4863 4
balenaEtcher 一款功能强大、易于使用、开源的镜像烧录软件 v2.1.4

balenaEtcher 一款功能强大、易于使用、开源的镜像烧录软件 v2.1.4

Etcher是一款功能强大且易于使用的操作系统镜像烧录软件,它专为将OS镜像安全、快速地烧录到SD卡、USB驱动器等存储设备而设计。Etcher采用Web技术开发,确保用户体验流畅且直观,使得即便是非技术背景的用户也能轻松上手。Etcher的核心优势在于其安全性和稳定性。它能够有效防止用户在操作过程中意外写入到硬盘,从而保护用户的数据安全。同...
软件 3282 0
开源 DashPlayer(视频播放器) 专为英语学习者打造 v5.1.7

开源 DashPlayer(视频播放器) 专为英语学习者打造 v5.1.7

DashPlayer是一款专为英语学习者设计的视频播放器。这款播放器的主要目标是帮助用户通过观看视频来提升他们的英语水平。它提供了一个平台,让用户能够沉浸在真实的语境中,从而更好地理解和掌握英语。通过使用DashPlayer,你可以更轻松地提高你的英语能力,无论你是初学者还是已经有一定基础的学习者。软件特色高效的界面布局:DashPlayer...
软件 2608 1
赛博算命上线!让人工智能为你抽一支未来签 赛博算命师 一键整合包 v20250823

赛博算命上线!让人工智能为你抽一支未来签 赛博算命师 一键整合包 v20250823

🔮 什么是 CyberFortune_Telling?这是一个基于人工智能模型驱动的虚拟占卜系统。它可能结合了自然语言处理、生成模型与命理知识库,能够根据用户输入的信息(如生辰、问题、关键词等),生成个性化的运势解读、塔罗牌占卜、星座分析或签文预测等内容。界面充满赛博朋克美学,科技感与神秘主义交织,带来前所未有的互动体验。🤖 技术亮点:基于M...
AI 5779 14
Ovis2图片反推提示词工具v5.0 基于AI大模型反推图片+视频批量生成提示词 英伟达6G显卡即可愉快玩耍

Ovis2图片反推提示词工具v5.0 基于AI大模型反推图片+视频批量生成提示词 英伟达6G显卡即可愉快玩耍

本工具基于Ovis2-4B和Ovis2-2B 这2个大模型制作而成。其实早之前我就有分享过反推提示词工具 moondream,但是我昨天遇到了这个大模型,发现功能更加强大,反推出来的提示更加丰富,更多细节描述。这个工具要求显卡比较低,英伟达显卡6g及以上就可以愉快玩耍了我用同一张图片反推提示词下面是Ovis2-4B生成的提示词The...
AI,开源 1.8万 52
开源·高速·高质:Shuttle Jaguar 生成电影级图像 剑二十七二次开发 20秒出图 最低6G英伟达显卡 支持50系 v20250818

开源·高速·高质:Shuttle Jaguar 生成电影级图像 剑二十七二次开发 20秒出图 最低6G英伟达显卡 支持50系 v20250818

我在网上瞎逛的时候,发现了这个模型还不错,就花点时间做了二次开发。Shuttle Jaguar 是一款由 ShuttleAI 开发的文本生成图像(Text-to-Image)人工智能模型,专注于生成具有高度审美感、电影级质感和逼真视觉效果的图像。该模型能够在仅需 四步推理 的极短时间内,将自然语言描述的文本提示(prompt)转化为高质量的图...
AI,开源 5811 9
AI 一键换衣,想穿哪件试哪件!AI-Clothes-Changer 一键整合包 支持50系显卡 v20250818

AI 一键换衣,想穿哪件试哪件!AI-Clothes-Changer 一键整合包 支持50系显卡 v20250818

AI-Clothes-Changer 是一个基于深度学习的交互式图像生成项目,旨在实现“虚拟试衣”功能 —— 用户上传一张人物穿着衣服的照片,再上传一件想要试穿的服装图像,系统即可将目标服装自然地“穿”在人物身上,生成逼真的换装效果图像。🔍 核心功能虚拟换衣(Virtual Try-On)输入:一张人物全身照 + 一件衣服的正面图像(如 T ...
AI 5713 5
EchoMimic 一个由阿里巴巴推出的开源AI数字人项目 支持50系显卡 一键整合包 v3 20250815更新

EchoMimic 一个由阿里巴巴推出的开源AI数字人项目 支持50系显卡 一键整合包 v3 20250815更新

EchoMimic是一个由阿里巴巴推出的开源AI数字人项目,该项目在数字人技术领域内实现了显著的创新与突破。以下是对EchoMimic的详细介绍:一、项目背景与意义随着人工智能、深度学习、计算机视觉以及自然语言处理技术的飞速发展,数字人技术逐渐成为连接现实世界与虚拟世界的重要桥梁。EchoMimic项目的诞生,旨在通过先进的技术手段,将静态图...
AI,开源 6050 8
手机软件 安卓app Etar-Calendar 一款基于开源理念设计的日历app  v1.0.51

手机软件 安卓app Etar-Calendar 一款基于开源理念设计的日历app v1.0.51

Etar Calendar是一款基于开源理念设计的日历应用,旨在为用户提供一个简单、直观且功能丰富的日程管理解决方案。这款软件不仅继承了Material Design的美学理念,更在实用性上做出了诸多创新,使其成为了众多开源爱好者心中的优选。Etar Calendar的核心优势在于其简洁而不失强大的功能设计。软件提供了月视图、周视图、日视图以...
安卓 2448 0
不用会设计!用 FLUX.1-Krea-dev,打几个字就能出高质量图片 剑二十七二次开发整合包 v2.0

不用会设计!用 FLUX.1-Krea-dev,打几个字就能出高质量图片 剑二十七二次开发整合包 v2.0

FLUX.1 [Krea-dev] —— 是 Black Forest Labs 推出的 FLUX.1 系列文本到图像生成模型的一个变体,专为设计类应用优化。一、模型背景1. 开发者:Black Forest Labs由前 Stability AI 核心团队成员(包括部分 Stable Diffusion 开发者)创立。2024 年推出 FL...
AI,开源 4462 11
NewPipe 一个专为Android平台设计的自由、轻量级在线流媒体播放APP v0.28.0

NewPipe 一个专为Android平台设计的自由、轻量级在线流媒体播放APP v0.28.0

NewPipe是一个专为Android平台设计的自由、轻量级流媒体前端应用程序。它以其开源、无广告、无需用户登录即可享受多种流媒体服务的特性而广受好评。以下是对NewPipe的详细介绍:一、软件概述NewPipe是一个功能强大的流媒体播放器,它支持多种视频和音频服务,包括但不限于YouTube。该软件通过从用户正在使用的服务的官方API(如P...
安卓 2542 0
手机软件 安卓app mpv-android 一个专为Android平台设计的开源视频播放器 v2025-07-27

手机软件 安卓app mpv-android 一个专为Android平台设计的开源视频播放器 v2025-07-27

mpv-android是一个专为Android平台设计的视频播放器,它基于libmpv库构建,为用户提供了强大且灵活的视频播放体验。mpv-android的核心特性之一是其支持硬件和软件视频解码。这意味着无论用户的设备性能如何,都能获得流畅的视频播放体验。硬件解码能够利用设备的GPU加速功能,减轻CPU的负担,从而在处理高清甚至4K视频时表现...
安卓 2927 0