索尼开源AI模型 Woosh 一句话生成音效,一键为视频配音 一键AI整合包 解压即可使用 v20260424

索尼开源AI模型 Woosh 一句话生成音效,一键为视频配音 一键AI整合包 解压即可使用 v20260424

索尼人工智能研究院(Sony AI)发布的音效生成基础模型📌 项目定位Woosh是专为音效生成(Sound Effects)优化的多模态生成式 AI 模型套件,旨在为音频研究社区提供高质量的开源基座模型,支持文本到音频(T2A)和视频到音频(V2A)两大核心任务。🔗 技术报告:arXiv:2604.01929🧩 核心模块组成1️⃣ Woosh...
AI 2807 0
京东开源 图片编辑AI大模型 JoyAI-Image-Edit v20260422 二次开发一键整合包 附演示和操作教程

京东开源 图片编辑AI大模型 JoyAI-Image-Edit v20260422 二次开发一键整合包 附演示和操作教程

JoyAI-Image-Edit 是京东开源的多模态基础模型,专注于指令引导的图像编辑任务。它基于 JoyAI-Image 多模态底座构建,通过自然语言指令实现对图像的精确、可控编辑。🔹 核心技术特点1. 强大的空间理解能力场景解析:自动识别图像中的物体、区域及空间关系关系定位:精准理解"物体A在物体B左侧"等空间描述指令...
AI 4704 2
这不是换脸,这是换头! 效果炸裂 AI 图片换头 Flux2-Klein-Face-Swap 一键整合包 v20260421

这不是换脸,这是换头! 效果炸裂 AI 图片换头 Flux2-Klein-Face-Swap 一键整合包 v20260421

本项目是一个基于 FLUX.2 Klein 模型开发的 AI 智能换头工具。通过集成 SDNQ (Spatial Dynamic Neural Quantization) 4-bit 动态量化技术,在显著降低显存占用的同时,保持了卓越的图像生成质量。配合 BFS (Best Face Swap) LoRA 模型,能够精准地实现人头替换,并完美...
AI,开源 1.1万 37
MOSS-TTSD+ MOSS-TTS-Nano 支持CPU运行,一个高质量的开源中文文本到语音合成系统 一键整合包 v20260421 支持免费商业使用

MOSS-TTSD+ MOSS-TTS-Nano 支持CPU运行,一个高质量的开源中文文本到语音合成系统 一键整合包 v20260421 支持免费商业使用

MOSS-TTSD 是由 OpenMOSS 社区开发的一个开源项目,主要聚焦于 文本到语音合成(Text-to-Speech, TTS)领域。该项目是 MOSS 系列模型生态的一部分,旨在提供高质量、低延迟的语音合成能力,适用于多种语言和场景。以下是对该项目的核心功能与技术特点的介绍说明:🎯 项目定位MOSS-TTSD 是一个专注于中文及多语...
AI 7399 18
开源免费 gridplayer 0.5.4 网格播放器,同时播放多个视频 64位便携版

开源免费 gridplayer 0.5.4 网格播放器,同时播放多个视频 64位便携版

简单的基于VLC的媒体播放器,可以同时播放多个视频。你可以随心所欲地播放视频,唯一的限制是你的硬件。它支持VLC支持的所有视频格式(即所有视频格式)。您可以保存播放列表,保留位置、音量、循环、纵横比等信息。软件截图我最多一次播放27个视频,太卡了,基本10个以内 还是很流畅的。如果你的电脑硬件配置高 可能好点
开源 3724 3
开源 换脸工具 roop_unleashed v7.0 中文版 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示

开源 换脸工具 roop_unleashed v7.0 中文版 可支持批量换脸,直播换脸,整合包支持AMD显卡+N卡。速度超快 附视频教程演示

昨天分享了roop的整合包支持AMD显卡来运行,今天分享的这个工具是roop的一个分支,虽然roop的作者已经弃更了,但是还有其他人继续更新。这就有产生了一个新的项目roop_unleashed。估计是这个项目出来并没有多久,所以知道的人不是很多,这2天我心血来潮就把这个项目也做了一个整合包,这个roop_unleashed是支持N卡的,但是...
AI,开源 7.6万 214
开源 Cherry Studio 一个支持多模型服务的桌面客户端工具 支持deepseek v1.9.1

开源 Cherry Studio 一个支持多模型服务的桌面客户端工具 支持deepseek v1.9.1

Cherry Studio是一款专为专业用户打造的桌面客户端,它支持多模型服务,集成了超过300多个大语言模型,涵盖了30多个行业,旨在帮助用户在多种场景下提升工作效率。这款软件的设计初衷是满足各行各业对GPT技术的需求,无论是开发者、设计师还是作家,都能从中受益。对于开发者而言,Cherry Studio是一个强大的代码伙伴。它可以进行代码...
开源 7936 3
0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v11.31 支持Magi Human LTX-2.3 wan2.2 HunyuanVideo-1.5等 数字人文生视频+图生视频+批量生成 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了

0 基础也能当导演:输入一句话,AI 自动生成视频 Wan2GP 中文版 v11.31 支持Magi Human LTX-2.3 wan2.2 HunyuanVideo-1.5等 数字人文生视频+图生视频+批量生成 最低英伟达6G显卡就可以跑起来,有这个你其他视频生成的整合包都可以删了

Wan2GP 是专为“显卡资源有限”的用户打造的**开源视频生成工具箱**。它把目前最先进的文生视频、图生视频、视频编辑模型(Wan 2.1、Hunyuan Video、LTX Video 等)做了重度优化和封装,让只有 6-8 GB 显存的旧显卡也能跑得动、跑得快,并提供了一整套 Web 界面与周边工具,做到“开箱即玩”。一句话总结:**把...
AI,开源 3.8万 154
百度开源图片大模型 ERNIE-Image-Turbo 一键整合包 8G英伟达 16秒出图 文字理解能力超强 v20260416

百度开源图片大模型 ERNIE-Image-Turbo 一键整合包 8G英伟达 16秒出图 文字理解能力超强 v20260416

🎨 ERNIE-Image-Turbo 模型介绍【核心定位】• 极速生成:基于单流 Diffusion Transformer 架构,仅需 8 步推理即可完成高质量图像生成,速度提升 6 倍以上• 精准可控:强调对复杂指令的准确还原,适合需要内容精确落地的实用型创作任务• 轻量化部署:经蒸馏优化,可在 消费级显卡上流畅运行,大幅降低商用门槛【...
AI 2774 8
本地部署 一键整合包FLUX.2-klein-9B-KV-LoRA-Studio 图像编辑大模型 海量lora支持 v3.0

本地部署 一键整合包FLUX.2-klein-9B-KV-LoRA-Studio 图像编辑大模型 海量lora支持 v3.0

FLUX.2-Klein-LoRA-Studio是一款基于 Gradio 构建的本地化图像编辑工作台,集成 Black Forest Labs 最新发布的FLUX.2-klein-9B多模态生成模型,支持通过 LoRA 适配器实现多样化图像编辑任务。⚡ 核心功能🔹 多图像输入编辑支持上传 1~2 张参考图:Picture 1(Base):作为...
AI 3162 4
你想怎么改图?它就怎么改 Qwen-Image-Edit-2511 实现真正可控的 AI 图片编辑 支持海量lora v20260413 一键整合包

你想怎么改图?它就怎么改 Qwen-Image-Edit-2511 实现真正可控的 AI 图片编辑 支持海量lora v20260413 一键整合包

Qwen-Image-Edit-2511 是由阿里云推出的新一代多模态图像编辑大模型,属于 Qwen 系列在视觉生成与编辑方向的重要迭代。该模型基于 Qwen-Image-Edit 系列的持续演进(如 2509、2511 版本),在保留原始图像语义结构和细节的前提下,支持高保真、高可控性的图像编辑任务。该模型主要特点包括:高保真图像编辑:在执...
AI 5942 14
小米开源大模型AI语音合成,600种语言+声音克隆,生成速度提升40倍 不限字数 支持自动语气标签 OmniVoice v20260407 一键整合包

小米开源大模型AI语音合成,600种语言+声音克隆,生成速度提升40倍 不限字数 支持自动语气标签 OmniVoice v20260407 一键整合包

OmniVoice:600+语种的语音合成新纪元剑二十七 · 技术前沿🔹一句话了解由小米下一代 Kaldi 团队(k2-fsa)打造的超大规模多语言零样本 TTS 模型,支持600+ 语种,以卓越音质与极速推理,重新定义语音合成体验。✨ 核心能力一览🗣️全球语种覆盖支持 600+ 语言与方言,从英语、中文到低资源语种,一模型通全球。🔁声音克隆...
AI 3305 0
DeepSeek 本地部署一键运行 DeepSeek-tool v18,解压即可使用 最低支持2G显卡 支持99%的语言大模型 支持联网搜索+知识库

DeepSeek 本地部署一键运行 DeepSeek-tool v18,解压即可使用 最低支持2G显卡 支持99%的语言大模型 支持联网搜索+知识库

琢磨了一天,把DeepSeek的本地部署彻底完成了,并测试了一下午基本完美运行了。当然AI环境你们必须要先安装好。然后下载这个这个本地部署压缩,解压即可完美运行。我的4070ti spuer 运行32b已经是极限了,所以我也只能把模型下载到32b了,如果你们有更牛的显卡,可以继续下载模型。这是我运行14b的截图 你们看看显...
AI,开源 1.5万 36
 一键克隆任意音色,生成自然口语级语音  1B/3.5B 双模型自由切换,还原你最真实的声音  LongCat-AudioDiT v1.0 20260402 更新 一键整合包

一键克隆任意音色,生成自然口语级语音 1B/3.5B 双模型自由切换,还原你最真实的声音 LongCat-AudioDiT v1.0 20260402 更新 一键整合包

LongCat-AudioDiT 语音合成工具 - 功能说明🎯 主要功能本工具基于美团开源的 LongCat-AudioDiT 扩散模型,提供高质量的文本到语音合成,并支持零样本语音克隆(只需几秒参考音频即可克隆音色)。界面采用 Gradio 构建,操作直观,适用于中文和英文混合文本。📌 核心功能模块1. 模型选择支持 1B&nbs...
AI 2414 2
 VisoMaster +VisoMaster-Fusion v1.0  基于rope的二次开发 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持50系英伟达显卡运行 一键整合包

VisoMaster +VisoMaster-Fusion v1.0 基于rope的二次开发 一款功能强大、易于使用且高效的开源换脸工具 中文版 支持50系英伟达显卡运行 一键整合包

VisoMaster 还不错的一个换脸工具,界面也是简洁的很,花了一天的时间做了整合包+汉化。VisoMaster是一款功能强大且易于使用的面部替换与编辑工具,专为图像和视频设计。它利用先进的人工智能技术,能够以最少的努力产生自然逼真的效果,因此无论是普通用户还是专业人士都能轻松上手。这款软件以其独特的魅力和实用性,在图像与视频编辑领域脱颖而...
AI,开源 3.2万 74
造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图+人物一致性图片+自定义lora 一键整合包 20260326 v17

造相 Z-Image-Turbo AI生图大模型 高性能AI图像生成工具 5秒一张图片 支持批量生图+人物一致性图片+自定义lora 一键整合包 20260326 v17

Z-Image-Turbo Generator 是一个基于 Tongyi-MAI/Z-Image-Turbo 模型的高性能AI图像生成应用。通过简洁直观的Gradio界面,用户可以轻松生成高质量的1024x1024分辨率图像,特别擅长生成具有中国传统文化元素与现代风格融合的艺术作品。✨ 核心特性⚡ 极致性能优化8步极速生成:仅需8个推理步骤即...
AI,开源 1.8万 60
开源 Deep-Live-Cam v2.7 beta AI人工智能 图片视频换脸+直播换脸 汉化整合包 支持AMD+英伟达N卡50系

开源 Deep-Live-Cam v2.7 beta AI人工智能 图片视频换脸+直播换脸 汉化整合包 支持AMD+英伟达N卡50系

Deep-Live-Cam是一款由hacksider开发并维护的创新性软件,旨在为快速发展的AI生成媒体行业贡献一份力量。该软件的主要功能是通过深度学习技术,实现实时的人脸替换与增强,为艺术家、设计师以及内容创作者提供了一个强大的工具,帮助他们以全新的方式创作和表达。项目概述Deep-Live-Cam的核心价值在于其广泛的应用场景。艺术家可以...
AI,开源 1.9万 19
视频反推提示词生成器 分镜处理+镜头设定 + 场景描述 + 主体动作 + 角色细节 + 运镜方式 + 风格美学 thinkvideo v2.0

视频反推提示词生成器 分镜处理+镜头设定 + 场景描述 + 主体动作 + 角色细节 + 运镜方式 + 风格美学 thinkvideo v2.0

🎬 剑二十七|视频反推提示词生成器让每一帧画面,都转化为可复用的创作语言🔮 核心定位这是一款面向专业内容创作者的智能视频理解工具。它不满足于简单的画面识别,而是以「镜头语言」为最小单元,深度解析视频内容,自动生成符合影视工业标准的中文提示词描述。不是「看图说话」,而是「读镜写意」。✨ 六大核心能力🎯 智能镜头分割精准识别场景切换点自适应阈值调...
AI 3063 6
手机软件 安卓APP 开源 Trail-Sense 野外探险生存、户外徒步旅行、地理寻宝必备的神器 v7.6.1

手机软件 安卓APP 开源 Trail-Sense 野外探险生存、户外徒步旅行、地理寻宝必备的神器 v7.6.1

Trail Sense 是一款专为户外活动设计的多功能应用程序,由开发者 Kyle Corry 打造。该应用程序旨在为徒步旅行、背包旅行、露营和地理寻宝等活动提供全面的工具支持。以下是对 Trail Sense 的详细介绍。功能特点:导航工具:Trail Sense 提供了强大的导航工具,包括数字指南针、GPS 定位和离线地图。无论你身处何地...
软件 4371 0
语音识别 + 声音克隆 + 模型训练,一个工具全搞定!Easy-Voice-Toolkit v1.3.5

语音识别 + 声音克隆 + 模型训练,一个工具全搞定!Easy-Voice-Toolkit v1.3.5

Easy-Voice-Toolkit 是由 Spr-Aachen开发的一款开源、用户友好的 AI 语音工具箱,旨在为开发者、研究人员和爱好者提供一站式、本地化部署的语音处理解决方案。项目设计注重易用性与功能性,支持多种主流语音任务,适用于科研实验、产品原型开发、语音助手构建等多种应用场景。🌟 核心特性本地部署:所有功能均可在本地运行,保障数据...
AI,开源 4762 0
lmstudio 一款强大而灵活的本地大模型部署工具 我的rx580 都能流畅运行 附模型文件 支持DeepSeek v0.4.6

lmstudio 一款强大而灵活的本地大模型部署工具 我的rx580 都能流畅运行 附模型文件 支持DeepSeek v0.4.6

LM Studio是由lmstudio.ai提供的一款强大而灵活的本地大模型部署工具。它不仅降低了机器学习的使用门槛,还为用户提供了一个安全、高效、隐私保护的环境,以便在本地运行各种大型语言模型。首先,LM Studio具备强大的离线使用能力。这意味着用户无需互联网连接即可运行模型,极大地提升了使用的便捷性和灵活性。对于那些需要保护数据隐私或...
AI,开源 9493 20
一键修复老照片、智能上色、超清还原,去除水印 ,转动漫 ——全能AI图像编辑神器来了!beterpic v20260114

一键修复老照片、智能上色、超清还原,去除水印 ,转动漫 ——全能AI图像编辑神器来了!beterpic v20260114

—— 高清图像修复、增强与风格化处理工具本系统基于先进的 qwen 图片编辑模型 与 Nunchaku 量化技术 构建,结合 LoRA 微调模型支持,提供强大且高效的图像编辑能力。无论是老照片修复、人像增强、风景优化,还是黑白图上色,都能一键实现高质量输出。🔧 核心功能✅ 高清图像修复与增强支持上传任意分辨率图像(最小边自动放大至 1024p...
AI 1.5万 17
开源 免费 win系统资源编辑器 RisohEditor 绿色免安装 v5.9.5

开源 免费 win系统资源编辑器 RisohEditor 绿色免安装 v5.9.5

RisohEditor,全称为“理想资源编辑器”,是一款功能强大的资源编辑和管理工具。它专注于为Windows平台的开发者提供方便、快捷的资源编辑解决方案。以下是关于RisohEditor的详细解说:首先,RisohEditor支持对EXE、DLL、RC、RES等文件中的资源数据进行添加、编辑、导出、克隆和移除等操作。这使得开发者能够轻松地对...
软件 3335 2
开源 Converseen 一款非常实用的批量图像格式转换工具 v0.15.2.1

开源 Converseen 一款非常实用的批量图像格式转换工具 v0.15.2.1

Converseen是一款功能强大的批量图像转换器和调整尺寸工具,旨在帮助用户快速、高效地处理大量图像文件。它支持多种图像格式之间的转换,包括但不限于常见的JPG、PNG、GIF等,让用户能够轻松地将图像文件从一个格式转换为另一个格式,以满足不同的需求和应用场景。除了基本的图像格式转换功能外,Converseen还提供了丰富的图像调整选项。用...
软件 2950 0
京墨 ——开源古诗词文、成语等阅读查询学习助手(可离线使用)v1.16.1

京墨 ——开源古诗词文、成语等阅读查询学习助手(可离线使用)v1.16.1

京墨 是一款免费开源集上万首古诗词、名句、上万条歇后语、成语等于一身的查询阅读小工具,另外附带常用的知识卡片。简言之,可充分了解、赏析各种类型的古诗作品,包括唐诗、宋词、元曲、楚辞、歌赋等,涵盖各个朝代和流派,满足不同兴趣和需求。由于谐音成语的盛行,反而导致了原版字样的zt。另外,相比那些第三方功能有限制又弹广告又要求登录的同类app,这款可...
安卓 4096 2
EditMGT 用文字"指挥"AI修图,想改哪里改哪里 5秒即可完成编辑 一键整合包 v20260219

EditMGT 用文字"指挥"AI修图,想改哪里改哪里 5秒即可完成编辑 一键整合包 v20260219

EditMGT(Masked Generative Transformer for Image Editing)是一个基于掩码生成式变压器的先进图像编辑框架,由字节跳动(ByteDance)主导研发,联合上海交通大学、新加坡国立大学、香港科技大学(广州)等高校共同完成。✨ 核心特点1. 技术创新采用**掩码生成式变压器(Masked Gene...
AI 3055 3
网文作者的 AI 外挂:日更万字还能保证剧情连贯的秘密武器 AI自动写小说  AI_NovelGenerator V1.4.4

网文作者的 AI 外挂:日更万字还能保证剧情连贯的秘密武器 AI自动写小说 AI_NovelGenerator V1.4.4

AI_NovelGenerator 是由 YILING0013 开发并开源在 GitHub 上的一款 基于大语言模型的 AI 长篇小说自动生成工具。它专注于解决 AI 写作中最棘手的长文本连贯性问题,能够创作多章节长篇小说,并确保剧情连贯、设定统一、伏笔合理呼应。核心定位"让 AI 从写作玩具变成生产力工具"传统 AI 写...
AI,开源 4835 1
开源 PDFsam Basic 一款专业且免费的开源PDF处理软件 v5.4.5

开源 PDFsam Basic 一款专业且免费的开源PDF处理软件 v5.4.5

PDFsam Basic是一款专业且免费的开源PDF处理软件,它提供了多种强大的功能,旨在帮助用户轻松地进行PDF文件的编辑和管理。以下是关于PDFsam Basic的详细介绍:一、软件概述PDFsam Basic是一款跨平台的PDF编辑器,支持在Windows、Mac OS及Linux等多个操作系统上运行。它以其免费、开源的特点,以及丰富的...
软件 3938 0
开源 电脑屏幕投屏工具 Deskreen 中文便携版 v3.2.14

开源 电脑屏幕投屏工具 Deskreen 中文便携版 v3.2.14

介绍Deskreen 可以将任何具有 Web 浏览器的设备转换为计算机的辅助屏幕。Deskreen 是一个基于 electronic.js 的应用程序,它使用 WebRTC 将您的桌面实时流传输到任何设备上的 Web 浏览器。它建立在 Electron React Boilerplate 的顶部为了获得更好的安全性机制,实施了端到端加密,这受...
软件 2851 0
Stretchly 一个由Jan Hovancik开发的开源休息提醒工具 v1.20.0

Stretchly 一个由Jan Hovancik开发的开源休息提醒工具 v1.20.0

Stretchly是一个由Jan Hovancik开发的开源休息提醒工具,旨在帮助用户在长时间使用电脑工作时定期休息,以减轻眼睛疲劳和身体压力。该项目基于Electron框架开发,支持跨平台使用,包括macOS、Windows和Linux系统。Stretchly通过定时提醒用户进行短暂的“迷你休息”和较长的“长时间休息”,帮助用户保持工作效率...
软件 3449 0
多图预览 开源 Qalculate! 科学计算器 官方便携版 v5.9.0

多图预览 开源 Qalculate! 科学计算器 官方便携版 v5.9.0

介绍Qalculate! 是一款强大、多功能且用户友好的计算器软件,广泛用于科学计算、数学运算以及金融计算等多个领域。这款软件的设计目标是提供一种易于使用但功能强大的计算工具,适合于从简单的日常计算到复杂的学术和专业计算的各类用户。功能概述1. 简单易用的界面Qalculate! 具有直观的用户界面,使得无论是普通用户还是专业用户都能轻松上手...
软件 3473 0
开源 Dopamine  一款功能强大且操作简单的本地音乐管理与播放软件 v3.0.2

开源 Dopamine 一款功能强大且操作简单的本地音乐管理与播放软件 v3.0.2

介绍Dopamine 音乐播放器是一款功能强大且操作简单的本地音乐管理与播放软件,它在音乐爱好者中拥有一定的用户群体。以下是对该软件的详细介绍:一、软件概述名称:Dopamine 音乐播放器类型:本地音乐播放器平台:主要适用于Windows系统(支持Windows 7及以上版本),同时也可能提供Android等其他平台的版本语言:简体中文,支...
软件 3338 0