不只是语音合成:MiMo-Audio 能理解、能生成、还能创作声音,一键整合包 v20251018

不只是语音合成:MiMo-Audio 能理解、能生成、还能创作声音,一键整合包 v20251018

🎧 什么是 MiMo-Audio?MiMo-Audio 是小米推出的一个能听、会说、还能创作声音的智能 AI 模型。你可以把它想象成一个“超级语音大脑”——不仅能听懂你说的话,还能模仿你的声音说话、讲故事、主持节目,甚至帮你把一段话变成不同风格的语音(比如更温柔、更激昂)。🌟 它厉害在哪里?不用专门训练就能学会新任务(Few-Shot Lea...
AI,开源 2510 0
支持图像、动图、短视频、PDF:AI逐页/逐帧分析,AI不仅能看懂,还能回答你的问题  Qwen3-VL 一键整合包 v20251024

支持图像、动图、短视频、PDF:AI逐页/逐帧分析,AI不仅能看懂,还能回答你的问题 Qwen3-VL 一键整合包 v20251024

基于 Qwen3-VL-4B-Instruct 的多模态智能交互平台📌 简介本应用是一个基于 通义千问 Qwen3-VL-4B-Instruct 大模型的多模态推理系统,支持对 图像、视频、PDF 文档、GIF 动图 等多种媒体内容进行智能理解与分析,并能自动生成精准描述、解答问题或提取关键信息。借助 Gradio 构建的直观 Web 界面,...
AI,开源 3298 0
DeepSeek-OCR 可视化工具:支持自由OCR、Markdown转换、图表解析与目标定位 一键整合包 v20251023

DeepSeek-OCR 可视化工具:支持自由OCR、Markdown转换、图表解析与目标定位 一键整合包 v20251023

🐳 DeepSeek-OCR 智能图像文字识别工具 — 使用说明🌟 这是什么?这是一个智能图像处理工具,可以自动从你上传的图片中:识别文字内容把文档转成 Markdown 格式(适合写博客、笔记)解析图表数据(比如柱状图、折线图里的数字)定位图片中的特定内容(比如“找出老师在哪里”)它基于先进的 AI 模型(DeepSeek-OCR),由剑二...
AI,开源 2820 2
一个开源的第三方网易云音乐播放器 VutronMusic  v2.7.0

一个开源的第三方网易云音乐播放器 VutronMusic v2.7.0

VutronMusic 是一个开源的第三方网易云音乐播放器,旨在为用户提供一个高颜值、功能丰富的音乐播放体验。它支持多种音乐源,包括网易云音乐、流媒体服务(如 Navidrome 和 Emby)以及本地音乐播放。无论是在线音乐还是离线歌单,用户都可以通过这个播放器轻松管理和播放音乐。此外,它还支持桌面歌词显示、Mac 状态栏歌词显示以及 Li...
开源 7293 2
NWinfo 一款功能全面、易于使用且兼容性强的开源硬件信息检测工具 v1.4.4

NWinfo 一款功能全面、易于使用且兼容性强的开源硬件信息检测工具 v1.4.4

NWinfo是一款功能强大的Win32程序,专门用于获取系统和硬件的详细信息。这款软件提供了丰富的功能和特性,使得用户能够全面了解其计算机系统的硬件配置和运行状况。首先,NWinfo具有出色的硬件信息检测能力。它能够收集并显示关于SMBIOS、CPUID、SMART、PCI、EDID等硬件组件的详细信息。这些信息对于了解计算机硬件的规格、性能...
开源 2332 0
免费开源  多平台手机投屏 Escrcpy 绿色免安装 强大 设置简单 v1.32.2

免费开源 多平台手机投屏 Escrcpy 绿色免安装 强大 设置简单 v1.32.2

文中有我亲测的截图,确实好用。速度也快。Escrcpy 是一款强大的工具,它允许用户通过图形化的 Scrcpy 界面来显示和控制他们的 Android 设备。这款应用程序由 Electron 作为其底层框架驱动。Escrcpy 无需任何账户就可以使用,无需担心隐私或安全问题。Escrcpy没有广告,完全免费开源。软件特色同步:得益于 Web ...
开源 6044 5
神器 开源 gallery-dl 一个功能全面、易于使用且灵活性高的图片下载工具  v1.30.10

神器 开源 gallery-dl 一个功能全面、易于使用且灵活性高的图片下载工具 v1.30.10

gallery-dl 是一个功能强大的命令行程序,旨在从多个图片托管网站下载图片画廊和集合。这款跨平台工具以其丰富的配置选项和强大的命名功能而闻名,让用户能够轻松地从支持的网站上批量下载图片资源。gallery-dl 的安装过程简单,支持通过 pip、预构建的独立可执行文件、夜间构建版本、Snap 包、Chocolatey、Scoop、Hom...
开源 5625 4
视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包 v20251019

视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包 v20251019

🎥 FlashVSR 是什么?FlashVSR 是一个能让模糊、低清视频“秒变高清”的智能工具。它专门用来做一件事:把低分辨率的视频,快速、高质量地放大成 4 倍清晰度的高清视频。比如:把 480p 的老视频 → 变成接近 4K 的清晰视频让手机拍的模糊视频 → 变得锐利、细节丰富⚡ 它有什么厉害的地方?过去很多“视频超分”(放大变清晰)工具...
AI,开源 3232 0
音乐播放器 拟声 一款新拟物风格的音视频播放器 v0.81.7

音乐播放器 拟声 一款新拟物风格的音视频播放器 v0.81.7

新拟物风格的 音视频播放器后端:c++,基于搜狗开源的 workflow 开发workflow 的任务流设计能把回调也变得简单易懂,c++中不可多得的异步框架,跨平台;支持 http、rpc、mysql 等网络开发和计算任务调度,你值得拥有!客户端:flutter支持[安卓]、[windows];允许多端同时登录账号,并将自动同步 歌单、歌词...
开源 3862 0
免费 全能视频解码器  播放器 K-Lite Codec Pack 最新 v19.2.5

免费 全能视频解码器 播放器 K-Lite Codec Pack 最新 v19.2.5

经常看我的视频的朋友 都应该熟悉这个,因为我一直都是用这个来播放视频。它有个很强大的功能就是可以显示视频的缩略图,超级爽,这个是我电脑必装的一个工具了。K-Lite Codec Pack 是世界闻名,备受好评的解码器。可以为其他播放器提供不同格式的音视频文件解码。是绝对值得使用的优秀产品。K-Lite Codec Pack 是解码器包的鼻祖,...
软件 1.1万 8
一句话改图,两张图参考——DreamOmni2 让 AI 理解你的编辑意图 一键整合包优化版 v20251014 支持风格迁移、物体替换、光照调整等全能图像编辑

一句话改图,两张图参考——DreamOmni2 让 AI 理解你的编辑意图 一键整合包优化版 v20251014 支持风格迁移、物体替换、光照调整等全能图像编辑

DreamOmni2 是一个“万能图像编辑器” —— 你给它两张图 + 一句指令,它就能智能地把第一张图“改”成你想要的样子,参考第二张图的风格、内容、细节等。🖼️ 它能做什么?(举几个例子)你想做什么DREAMOMNI2 能做到把照片里的衣服换成另一件✅ 上传原图 + 新衣服图 + 指令:“把第一张图的衣服换成第二张的”让人物发型和参考图一...
AI,开源 3286 0
AI 一键换装 + 换姿势:你的虚拟造型师来了! Leffa v20251010 一键整合包

AI 一键换装 + 换姿势:你的虚拟造型师来了! Leffa v20251010 一键整合包

🎯 这个工具能做什么?这是一个 AI 换装 + 换姿势 的智能图像生成工具,名字叫 Leffa。它能帮你完成两件很酷的事情:1️⃣ 虚拟试衣(AI 换衣服) 👗你只需要提供:一张你自己的全身照片(人像)一张你喜欢的衣服照片AI 就会自动把这件衣服“穿”到你身上,生成一张逼真的试穿效果图!✅ 支持上衣、裤子、连衣裙等多种服装类型✅ 衣服纹理、褶...
AI,开源 7364 1
Kani TTS:轻量、流式、类人 — 开源AI语音合成系统一键整合包  v20251008

Kani TTS:轻量、流式、类人 — 开源AI语音合成系统一键整合包 v20251008

🎙️ Kani TTS — 高质量、模块化、类人语音合成开源项目Kani TTS 是一个由 nineninesix-ai维护的开源文本到语音(TTS)系统,致力于从文本输入生成高质量、自然流畅的语音。项目支持本地独立运行与Web 流式服务,适用于开发、研究及个性化 TTS 场景。GitHub 仓库地址:https://github.com/n...
AI,开源 4935 0
国产AI画画太强了!一句话生成高清美图,支持中文提示词,最低6G英伟达即可运行,15秒出图 Qwen-Image+Edit一键整合包 v20250828 新增 qwen-image-edit-2509-lightningv2.0-20250927 整合包

国产AI画画太强了!一句话生成高清美图,支持中文提示词,最低6G英伟达即可运行,15秒出图 Qwen-Image+Edit一键整合包 v20250828 新增 qwen-image-edit-2509-lightningv2.0-20250927 整合包

Qwen-Image 是由通义实验室推出的多模态大模型,集成在 Qwen(通义千问)系列中,专注于实现强大的图文理解与生成能力。该模型基于 Qwen 的语言理解基础,深度融合视觉模块,使其能够同时处理和理解图像与文本信息,支持跨模态任务,如图像描述生成、视觉问答(VQA)、图文匹配、图像理解与推理等。核心特点:强大的图文理解能力Qwen-Im...
AI,开源 6028 10
Qwen3-TTS 通义千问推出的高质量文本转语音工具,API调用,小巧,轻量,无需显卡即可快速生成语音,剑二十七二次开发 一键整合包 v20250924

Qwen3-TTS 通义千问推出的高质量文本转语音工具,API调用,小巧,轻量,无需显卡即可快速生成语音,剑二十七二次开发 一键整合包 v20250924

一、什么是 TTS?TTS(Text-To-Speech)是一种将文字转换为自然语音的技术,广泛应用于语音助手、有声书、导航播报、智能客服等场景。二、Qwen-TTS功能简介该项目提供了一个简单的 Web 界面(基于 Gradio),用户可以输入任意文本,并通过 Qwen 的 TTS 模型生成对应的语音文件。该工具支持中文和英文的语音合成。🔧...
AI 6834 9
27video v3.1 超级强大AI视频抠像工具 剑二十七原创作品 附视频演示

27video v3.1 超级强大AI视频抠像工具 剑二十七原创作品 附视频演示

这个工具基于AI大模型BiRefNet文件二次开发。可以对视频进行抠像。速度快,效果也不错。对显卡占用很低,8G的英伟达显卡就可以流畅运行了。操作极其简单,无需任何基础 会点鼠标即可。下面截图几张抠像效果演示20241209 v1.1 更新记录1 保留白色和黑色背景这2种视频抠像,新增了一个自定义背景图片抠像。2...
AI,开源 1.3万 55
不止AI抠图,更懂细节,应该是最强的AI抠图了,集合了15种抠图模型:BiRefNet 覆盖多场景图像抠除处理需求 一键整合包 v20250920

不止AI抠图,更懂细节,应该是最强的AI抠图了,集合了15种抠图模型:BiRefNet 覆盖多场景图像抠除处理需求 一键整合包 v20250920

BiRefNet 是一个专注于 高分辨率二值图像分割(Dichotomous Image Segmentation, DIS) 的开源深度学习模型。它在背景移除、前景提取、掩码生成等任务中表现出卓越性能,广泛应用于:图像编辑与合成视觉特效处理自动抠图(无需 Trimap)数字内容创作(如 Blender 插件、AI 绘画工具集成)🚀 核心特性...
AI,开源 7528 1
IndexTTS  v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS是由B站推出的一款基于XTTS和Tortoise的GPT风格文本转语音(TTS)模型。该项目在中文文本转语音领域展现出显著的技术优势和应用,以下从项目背景、技术架构、应用场景、社区支持及未来挑战五个维度进行详细介绍。一、项目背景:重新定义中文TTS技术标杆IndexTTS的诞生旨在解决传统TTS系统在中文语音合成中的两大核心痛...
AI,软件 1.8万 51
手机留在口袋,电脑直接“隔空”收发短信、接电话、翻相册——这就是  plain-app v2.1.18

手机留在口袋,电脑直接“隔空”收发短信、接电话、翻相册——这就是 plain-app v2.1.18

PlainApp 是一款开源的「手机本地管理器」,它把整部 Android 手机变成一个只在你自己网络里运行的 Web 服务。所有数据始终停留在设备本体,不经过云端,也不依赖第三方存储;通信全程用 TLS + XChaCha20-Poly1305 加密,最大限度降低泄露风险。核心思路:用浏览器远程查看和操作手机里的内容,而不把任何信息交出去。...
开源,安卓 6613 21
Maple Font:为编码而生的开源字体,让每一行代码都赏心悦目  v7.7

Maple Font:为编码而生的开源字体,让每一行代码都赏心悦目 v7.7

Maple Font是一个开源的等宽字体项目,专注于提升编码体验,以下是该项目的详细介绍:项目背景与目的:Maple Mono 字体由开发者创建,旨在提升个人及广大用户的工作编码体验。该项目致力于通过字体设计的优化,减少编码过程中的视觉干扰,使代码更加清晰易读。技术特点与版本:V7版本:这是一个完全重新制作的版本,提供了可变字体格式和字体项目...
开源,素材 2407 0
开源TTS新选择:FireRedTTS2 实现高质量 对话语音合成 一键整合包 v20250916

开源TTS新选择:FireRedTTS2 实现高质量 对话语音合成 一键整合包 v20250916

FireRedTTS 是一个开源的文本转语音(Text-to-Speech, TTS)项目,由 FireRedTeam 开发并维护。该项目致力于提供高质量、低延迟、易于集成的语音合成能力,适用于多种应用场景,如语音助手、有声读物生成、无障碍访问、智能客服等。项目基于深度学习技术,采用了先进的神经网络架构(如 Tacotron、FastSpee...
AI,开源 1.7万 16
无显卡压力!中文生成高清美图,AI画师免费为你服务,采用魔搭API 生图 27pic-api-qwen v1.0

无显卡压力!中文生成高清美图,AI画师免费为你服务,采用魔搭API 生图 27pic-api-qwen v1.0

这是一个傻瓜式 AI 图像工具,你只需要:输入一段文字描述(比如:“一个穿汉服的美女在大树下微笑”)点一下“开始处理”等几秒~几分钟 → AI 自动生成一张精美图片!你还可以:✏️ 编辑已有图片:上传一张图,告诉 AI “把她的头发染成蓝色”、“加一只猫”、“换成海滩背景” → AI 自动修改!📸 批量生成:一次输入 10 行、100 行描述...
AI 3387 0
一键生成视频内容:Wan2.2让AI创作变得简单  基于官方开源模型二次开发 6分钟出视频 v20250913

一键生成视频内容:Wan2.2让AI创作变得简单 基于官方开源模型二次开发 6分钟出视频 v20250913

Wan2.2-TI2V-5B 是一个基于 Transformer 架构的文本到视频(Text-to-Video)生成模型,具有以下特点:🔧 核心特性50亿参数规模:大型 Transformer 模型,具备强大的视频生成能力文本生成视频(T2V):直接根据文本描述生成视频内容图像生成视频(I2V):基于参考图像生成相关视频内容高分辨率支持:支持...
AI,开源 3786 0
手机软件 安卓app KeePassDX 一款专为Android平台设计的轻量级密码管理器 v4.1.8

手机软件 安卓app KeePassDX 一款专为Android平台设计的轻量级密码管理器 v4.1.8

KeePassDX是一款专为Android平台设计的轻量级密码管理器,它以其高效、安全的特点受到了广大用户的青睐。该软件允许用户在单个KeePass格式的文件中编辑加密数据,并能以安全的方式填充表单,极大地简化了密码管理的复杂性。KeePassDX的核心功能在于其强大的加密能力和便捷的操作体验。用户可以将所有密码存储在一个数据库中,该数据库通...
安卓 2394 0
开源 小宾AI抠图 image-matting 一款功能强大、操作简便、注重隐私保护的本地AI图片处理软件 v0.2.5

开源 小宾AI抠图 image-matting 一款功能强大、操作简便、注重隐私保护的本地AI图片处理软件 v0.2.5

image-matting是一个基于开源模型的本地AI图片处理软件,旨在通过AI技术实现高效的图像抠图功能。该项目采用了briaai发布的RMBG-1.4开源模型,为用户提供了一个功能丰富、操作简便的图片处理工具。核心功能AI抠图:支持单张和批量图片抠图,用户无需复杂的操作即可快速从图片中提取出所需的前景物体,无论是人像还是物体,都能达到较高...
软件 5632 7
京墨 ——开源古诗词文、成语等阅读查询学习助手(可离线使用)v1.15.3

京墨 ——开源古诗词文、成语等阅读查询学习助手(可离线使用)v1.15.3

京墨 是一款免费开源集上万首古诗词、名句、上万条歇后语、成语等于一身的查询阅读小工具,另外附带常用的知识卡片。简言之,可充分了解、赏析各种类型的古诗作品,包括唐诗、宋词、元曲、楚辞、歌赋等,涵盖各个朝代和流派,满足不同兴趣和需求。由于谐音成语的盛行,反而导致了原版字样的zt。另外,相比那些第三方功能有限制又弹广告又要求登录的同类app,这款可...
安卓 3489 2
手机软件 安卓app libretorrent 一款专为Android平台打造的自由且开源的全功能bt下载工具 v4.0.1

手机软件 安卓app libretorrent 一款专为Android平台打造的自由且开源的全功能bt下载工具 v4.0.1

LibreTorrent是一款专为Android平台打造的自由且开源的全功能Torrent客户端软件。它不仅提供了丰富的功能特性,还确保了用户的数据安全和隐私保护。以下是对LibreTorrent的详细介绍:一、软件概述LibreTorrent基于开源理念开发,致力于为用户提供高效、稳定且易于使用的Torrent下载体验。其界面简洁明了,操作...
安卓 2387 0
wiliwili 一款功能强大、跨平台兼容且开源的第三方B站客户端 v1.5.2

wiliwili 一款功能强大、跨平台兼容且开源的第三方B站客户端 v1.5.2

Wiliwili是一款由xfangfang开发并维护的开源项目,它是一款专为手柄控制设计的第三方跨平台B站客户端。以下是对该软件的详细介绍:一、项目背景与定位Wiliwili旨在为用户提供一种全新的B站观看体验,它打破了官方客户端的局限性,实现了在多种设备上的跨平台运行。无论是PC全平台、PSVita、PS4,还是Nintendo Switc...
软件 3417 0
多图预览 开源 Qalculate! 科学计算器 官方便携版 v5.7.0

多图预览 开源 Qalculate! 科学计算器 官方便携版 v5.7.0

介绍Qalculate! 是一款强大、多功能且用户友好的计算器软件,广泛用于科学计算、数学运算以及金融计算等多个领域。这款软件的设计目标是提供一种易于使用但功能强大的计算工具,适合于从简单的日常计算到复杂的学术和专业计算的各类用户。功能概述1. 简单易用的界面Qalculate! 具有直观的用户界面,使得无论是普通用户还是专业用户都能轻松上手...
软件 3000 0
免费 FireAlpaca 数字绘画软件 中文版 一款来自小日子的软件 v2.13.23

免费 FireAlpaca 数字绘画软件 中文版 一款来自小日子的软件 v2.13.23

FireAlpaca是一款免费的数字绘画软件,它提供了广泛的功能和工具,使艺术家、设计师和爱好者可以轻松地创作出令人惊叹的数字画作。FireAlpaca在界面设计、多功能工具和用户体验等方面都提供了出色的表现,成为许多人首选的绘图软件之一。首先,FireAlpaca的界面设计简洁直观,使用户能够快速上手。软件的布局清晰,工具栏和选项菜单都被合...
软件 2986 2
一键式效率倍增器 定时/热键自动化任务工具 zTasker v2.3.2-2025-9-10 免费  绿色免安装

一键式效率倍增器 定时/热键自动化任务工具 zTasker v2.3.2-2025-9-10 免费 绿色免安装

zTasker是一个定时/热键自动化任务工具,可以采用定时或热键的方式执行多种自动化任务,支持50+种任务类型,20+种定时/条件执行方法,任务列表随意编辑、排列、移动、更改类型,支持任务执行日志,支持任务列表等数据的备份,支持任务日志,支持数据备份,支持自动更新。使用技巧★ 可以在托盘菜单或者主界面下拉菜单,或者用热键,进入快速提醒、快速定...
软件 4629 0
神器 光影魔术手 NeoImaging 批量处理图片在它面前一个能打的都没有 v4.7.2.1192

神器 光影魔术手 NeoImaging 批量处理图片在它面前一个能打的都没有 v4.7.2.1192

这个神器 时隔十年后再次更新了光影魔术手是一款备受欢迎的图像处理软件,它的全称是Neo Imaging,凭借其强大的功能和简单易用的操作界面,赢得了广大用户的喜爱。首先,光影魔术手在界面设计上非常人性化。工具栏的图标大小适中,方便用户快速识别和操作。同时,软件支持高分辨率的屏幕显示,使得用户在处理图片时能够获得更加细腻和清晰的视觉体验。在功能...
软件 7115 18