基于 Ovis2.5-2B 多模态大模型 · 中文支持 · 批量处理 · 智能检索
✨ 核心功能
🔍 智能视频内容理解
自动分析视频内容,生成结构化中文描述,包括:人物性别、年龄段(儿童/少年/青年/中年/老年)
发型发色、服装款式与颜色
动作行为(如跳水、游泳、站立、互动)
场景环境(户外/室内、植被、天气、水域类型)3
等等
⚡ 高效批量处理
递归扫描整个文件夹(含子目录)
智能缓存机制:已成功分析的视频不再重复推理,节省 GPU 资源
自动重试失败项,确保结果完整
🔎 关键词智能检索
输入任意中文关键词(如"女性"、"跳水"、"墨镜"),系统自动:检索所有相关视频
复制或剪切匹配视频到指定分类文件夹
📁 灵活结果管理
自定义导出根目录(如
D:/classified)自动按关键词创建子文件夹(
<根目录>/关键词/)
🚀 技术亮点
模型:采用 Ovis2.5-2B多模态大模型,专为中文场景优化
抽帧策略:随机采样 6 帧,兼顾覆盖率与效率
内存优化:全局模型缓存,多任务共享 GPU 资源
兼容性强:完全支持中文路径、文件名及特殊字符
数据持久化:分析结果存入 SQLite 数据库,可长期积累知识库
📦 支持视频格式
MP4 | AVI | MOV | MKV | FLV | WMV
🖥️ 使用方式
启动
批量分析
在 "批量分析" 标签页输入视频文件夹路径
点击 "开始批量分析",系统将自动处理所有视频
关键词检索
在 "关键词检索" 标签页输入关键词(如"女性")
指定结果保存根目录(默认
results)选择 "复制" 或 "剪切"
点击 "搜索并导出",匹配视频将自动归类
💡 典型应用场景
家庭视频智能归档:自动分类"孩子"、"旅行"、"聚会"等场景
安防监控筛查:快速定位含特定人物或行为的片段
媒体素材管理:按内容自动打标,提升检索效率
老视频数字化整理:结合修复流程,构建智能影像档案库
📌 提示:首次运行将自动下载模型(约 4.8GB),后续分析速度显著提升。
✅ 安全可靠:原始视频仅读取,无任何修改(除非选择"剪切")。
让 AI 为你读懂每一帧画面,释放视频数据的真正价值! 🎯



这个工具是我很久之前的一个想法,一直没有动手去付诸于行动,今天抽空实现了初步构想。限时免费吧
最低要求8G英伟达显卡,16G内存