MiniMax-Remover是一个基于 minimax 优化的视频物体移除工具,旨在高效、高质量地从视频中移除指定对象,并生成视觉上无缝的修复结果。该项目由 Bojia Zi 等人开发,核心目标是实现 快速(Fast)、有效(Effective)和鲁棒(Robust)的视频内容编辑。
核心特性
两阶段训练策略
第一阶段:使用简化版的 DiT(Diffusion Transformer)架构来训练初始的移除模型。
第二阶段:通过 CFG(Classifier-Free Guidance)增强与更少推理步数的方式,蒸馏出一个更强健的移除模型,提升其在复杂场景下的表现。
高效性(Fast)
推理过程仅需 6 步,不依赖传统的 CFG 方法,显著提升了运行效率。
特别适合需要实时或近实时处理的应用场景。
有效性(Effective)
能够无缝地将视频中的指定对象移除,并生成高质量、自然的背景补全内容。
在视觉效果上保持高度一致性,避免明显的痕迹或伪影。
鲁棒性(Robust)
即使在不同噪声条件下,也能防止被遮罩区域内出现不需要的对象再生或视觉瑕疵。
模型具备良好的泛化能力,适用于多种视频场景。
技术亮点
使用了 3D Transformer架构,更好地建模视频时序与空间信息。
集成了 UniPCMultistepScheduler来加速扩散模型的采样过程。
基于 AutoencoderKLWan进行高效的视频编码与解码。
整体流程构建在一个轻量级但功能强大的推理管道(
Minimax_Remover_Pipeline)之上。
应用场景
MiniMax-Remover 可广泛应用于视频编辑、影视后期处理、隐私保护(如模糊或移除敏感物体)、内容创作等领域。
该项目体现了当前视频生成与编辑领域中扩散模型与对抗训练思想的有效结合,是一个具有实用价值的研究成果。






视频移除效果截图演示






整合包说明
1 支持40系 50系显卡,其他显卡未做测试可以自行测试下
2 显卡最低要求16G,低于16G的显卡 未做测试 你们想玩的话 可以试试,内存至少要20G
3 修正N多bug,终于实现在windows上运行
4 不支持A卡,别再问A卡了
5 效果只能说还行,先占个位置看后续发展吧
视频教程
https://www.bilibili.com/video/BV1STNCzNENu/?vd_source=f0ca2a91a0d1850ea46d21a82729acaa