告别视频手动分类!AI 自动识别视频人物、场景与行为 AI 智能视频分析与自动分类 27sift v1.0

告别视频手动分类!AI 自动识别视频人物、场景与行为 AI 智能视频分析与自动分类 27sift v1.0

基于 Ovis2.5-2B 多模态大模型 · 中文支持 · 批量处理 · 智能检索✨ 核心功能🔍 智能视频内容理解自动分析视频内容,生成结构化中文描述,包括:人物性别、年龄段(儿童/少年/青年/中年/老年)发型发色、服装款式与颜色动作行为(如跳水、游泳、站立、互动)场景环境(户外/室内、植被、天气、水域类型)3等等⚡ 高效批量处理递归扫描整个...
AI 2551 0
中文错别字检测与修正工具(基于 MacBERT模型)jiucuo v1.0 一键整合包,有英伟达显卡就能运行 不限字数

中文错别字检测与修正工具(基于 MacBERT模型)jiucuo v1.0 一键整合包,有英伟达显卡就能运行 不限字数

剑二十七 · 基于 ModelScope 模型 Macadam/macbert4mdcspell_v2 二次开发本系统采用先进的 MacBERT 预训练语言模型,专为中文文本拼写与语法错误检测与修正设计,支持任意长度文本、智能分段处理,并严格保留原始格式(包括换行、空行、标点等),适用于论文、公文、OCR 识别结果、手写转录等多种场景。✅ 核...
AI 2.3万 94
超实用!这款轻量级开源笔记工具,用 AI 让记录与写作效率翻倍 NoteGen v0.22.3

超实用!这款轻量级开源笔记工具,用 AI 让记录与写作效率翻倍 NoteGen v0.22.3

NoteGen 是一个专注于记录 和写作 的跨平台 AI 笔记应用,它基于 Tauri 开发,目前支持 Mac、Windows 和 Linux 平台,并计划在未来支持 iOS 和 Android 。该项目旨在通过结合人工智能技术,提升用户的记录效率与内容整理能力,同时提供强大的 Markdown 写作功能。以下是 NoteGen 的主要特点和...
开源 3840 0
MOSS-TTSD:一个高质量的开源中文文本到语音合成系统 一键整合包 v20251104 支持免费商业使用

MOSS-TTSD:一个高质量的开源中文文本到语音合成系统 一键整合包 v20251104 支持免费商业使用

MOSS-TTSD 是由 OpenMOSS 社区开发的一个开源项目,主要聚焦于 文本到语音合成(Text-to-Speech, TTS)领域。该项目是 MOSS 系列模型生态的一部分,旨在提供高质量、低延迟的语音合成能力,适用于多种语言和场景。以下是对该项目的核心功能与技术特点的介绍说明:🎯 项目定位MOSS-TTSD 是一个专注于中文及多语...
AI,开源 6604 11
DeepSeek 本地部署一键运行 DeepSeek-tool v17,解压即可使用 最低支持2G显卡 支持99%的语言大模型 支持联网搜索+知识库

DeepSeek 本地部署一键运行 DeepSeek-tool v17,解压即可使用 最低支持2G显卡 支持99%的语言大模型 支持联网搜索+知识库

琢磨了一天,把DeepSeek的本地部署彻底完成了,并测试了一下午基本完美运行了。当然AI环境你们必须要先安装好。然后下载这个这个本地部署压缩,解压即可完美运行。我的4070ti spuer 运行32b已经是极限了,所以我也只能把模型下载到32b了,如果你们有更牛的显卡,可以继续下载模型。这是我运行14b的截图 你们看看显...
AI,开源 1.4万 36
 AI 播客 :一键生成多角色对话音频 SoulX-Podcast 剑二十七二次开发 一键整合包 v20251103

AI 播客 :一键生成多角色对话音频 SoulX-Podcast 剑二十七二次开发 一键整合包 v20251103

SoulX-Podcast是由 Soul AI Lab 开源的一个面向播客场景的高质量、长篇、多说话人对话式语音合成(TTS)系统,专为生成自然、富有表现力、支持方言与副语言特征的播客音频而设计。🔍 项目核心特点1. 长篇多轮多说话人对话生成支持生成多人交替对话的播客内容(如主持人 + 嘉宾);能处理长文本输入,保持语音连贯性和角色一致性;适...
AI,开源 4518 1
可执行用户脚本的浏览器插件。这是一款开源的浏览器插件 scriptcat v1.1.2

可执行用户脚本的浏览器插件。这是一款开源的浏览器插件 scriptcat v1.1.2

ScriptCat  是一个基于浏览器的 用户脚本(UserScript)管理平台,旨在为用户提供比传统脚本管理器(如 Tampermonkey、Greasemonkey)更强大、更智能、更社区化的扩展体验。它不仅仅是一个脚本运行环境,更是一个集 脚本管理、在线编辑、版本控制、社区分享、自动更新与安全审计 于一体的用户脚本...
开源 3172 2
告别卡顿与臃肿!Windows 系统全能优化工具,自定义开关 + 安全还原,小白也能上手 ZyperWin++ v4.1

告别卡顿与臃肿!Windows 系统全能优化工具,自定义开关 + 安全还原,小白也能上手 ZyperWin++ v4.1

ZyperWave/ZyperWinOptimize,专注于为 Windows 7 至 Windows 11 最新版系统提供全方位优化,兼顾性能提升、功能定制与实用工具集成,同时支持优化操作回退,降低使用风险。一、核心基础信息项目详情开发架构基于 .NET 4 框架编写,引入 SunnyUI 组件库,界面简洁美观兼容性支持 Windows 7...
开源 2329 0
支持图像、动图、短视频、PDF:AI逐页/逐帧分析,AI不仅能看懂,还能回答你的问题  Qwen3-VL 一键整合包 v20251024

支持图像、动图、短视频、PDF:AI逐页/逐帧分析,AI不仅能看懂,还能回答你的问题 Qwen3-VL 一键整合包 v20251024

基于 Qwen3-VL-4B-Instruct 的多模态智能交互平台📌 简介本应用是一个基于 通义千问 Qwen3-VL-4B-Instruct 大模型的多模态推理系统,支持对 图像、视频、PDF 文档、GIF 动图 等多种媒体内容进行智能理解与分析,并能自动生成精准描述、解答问题或提取关键信息。借助 Gradio 构建的直观 Web 界面,...
AI,开源 3808 0
DeepSeek-OCR 可视化工具:支持自由OCR、Markdown转换、图表解析与目标定位 一键整合包 v20251023

DeepSeek-OCR 可视化工具:支持自由OCR、Markdown转换、图表解析与目标定位 一键整合包 v20251023

🐳 DeepSeek-OCR 智能图像文字识别工具 — 使用说明🌟 这是什么?这是一个智能图像处理工具,可以自动从你上传的图片中:识别文字内容把文档转成 Markdown 格式(适合写博客、笔记)解析图表数据(比如柱状图、折线图里的数字)定位图片中的特定内容(比如“找出老师在哪里”)它基于先进的 AI 模型(DeepSeek-OCR),由剑二...
AI,开源 3369 4
Kani TTS:轻量、流式、类人 — 开源AI语音合成系统一键整合包  v20251008

Kani TTS:轻量、流式、类人 — 开源AI语音合成系统一键整合包 v20251008

🎙️ Kani TTS — 高质量、模块化、类人语音合成开源项目Kani TTS 是一个由 nineninesix-ai维护的开源文本到语音(TTS)系统,致力于从文本输入生成高质量、自然流畅的语音。项目支持本地独立运行与Web 流式服务,适用于开发、研究及个性化 TTS 场景。GitHub 仓库地址:https://github.com/n...
AI,开源 5175 0
27video v3.1 超级强大AI视频抠像工具 剑二十七原创作品 附视频演示

27video v3.1 超级强大AI视频抠像工具 剑二十七原创作品 附视频演示

这个工具基于AI大模型BiRefNet文件二次开发。可以对视频进行抠像。速度快,效果也不错。对显卡占用很低,8G的英伟达显卡就可以流畅运行了。操作极其简单,无需任何基础 会点鼠标即可。下面截图几张抠像效果演示20241209 v1.1 更新记录1 保留白色和黑色背景这2种视频抠像,新增了一个自定义背景图片抠像。2...
AI,开源 1.5万 55
IndexTTS  v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS是由B站推出的一款基于XTTS和Tortoise的GPT风格文本转语音(TTS)模型。该项目在中文文本转语音领域展现出显著的技术优势和应用,以下从项目背景、技术架构、应用场景、社区支持及未来挑战五个维度进行详细介绍。一、项目背景:重新定义中文TTS技术标杆IndexTTS的诞生旨在解决传统TTS系统在中文语音合成中的两大核心痛...
AI,软件 2万 51
开源TTS新选择:FireRedTTS2 实现高质量 对话语音合成 一键整合包 v20250916

开源TTS新选择:FireRedTTS2 实现高质量 对话语音合成 一键整合包 v20250916

FireRedTTS 是一个开源的文本转语音(Text-to-Speech, TTS)项目,由 FireRedTeam 开发并维护。该项目致力于提供高质量、低延迟、易于集成的语音合成能力,适用于多种应用场景,如语音助手、有声读物生成、无障碍访问、智能客服等。项目基于深度学习技术,采用了先进的神经网络架构(如 Tacotron、FastSpee...
AI,开源 1.8万 16
手心输入法 一款专注于输入本质、纯净且好用的输入法软件 v3.2.6.1006

手心输入法 一款专注于输入本质、纯净且好用的输入法软件 v3.2.6.1006

手心输入法是一款专注于输入本质、纯净且好用的输入法软件。它摒弃了与输入法无关的功能,不包含任何广告和推广,确保用户在使用过程中不会受到任何干扰。这款输入法的界面简约清爽,去除了冗余功能,只保留了核心体验,让用户能够专注于输入本身。手心输入法支持多种输入方式,包括九宫格拼音、拼音全键盘、双拼全键盘、英文全键盘、手写键盘、笔画键盘和五笔键盘等,用...
软件 2264 0
视频创作者必备!KrillinAI提供从翻译到配音的全流程解决方案,智能分段与精确字幕,打造专业级视频内容 v1.4.0

视频创作者必备!KrillinAI提供从翻译到配音的全流程解决方案,智能分段与精确字幕,打造专业级视频内容 v1.4.0

KrillinAI是一个基于AI大模型的视频翻译和配音工具,它提供了专业级的翻译服务以及一键部署的全流程解决方案。这个开源工具旨在帮助用户轻松实现视频内容的本地化与增强,使其能够适配多种内容平台,如YouTube、TikTok、Bilibili、抖音(国内版)、微信视频号、快手等。KrillinAI的核心功能包括视频翻译、配音与声音克隆、字幕...
安卓 4677 4
Notepad3 一款功能强大、操作便捷、支持多种编程语言的文本编辑器 v6.25.822.1

Notepad3 一款功能强大、操作便捷、支持多种编程语言的文本编辑器 v6.25.822.1

Notepad3是一款快速且轻量级的基于Scintilla的文本编辑器,以其高效的性能和丰富的功能受到了广大编程爱好者和开发者的青睐。它拥有小巧的内存占用,却能够胜任大多数编程任务,成为许多用户心中的理想文本编辑工具。Notepad3在界面设计上简洁明了,操作便捷。它支持语法高亮,使得代码更加易于阅读和理解。同时,它还提供了代码折叠功能,方便...
开源 2577 0
balenaEtcher 一款功能强大、易于使用、开源的镜像烧录软件 v2.1.4

balenaEtcher 一款功能强大、易于使用、开源的镜像烧录软件 v2.1.4

Etcher是一款功能强大且易于使用的操作系统镜像烧录软件,它专为将OS镜像安全、快速地烧录到SD卡、USB驱动器等存储设备而设计。Etcher采用Web技术开发,确保用户体验流畅且直观,使得即便是非技术背景的用户也能轻松上手。Etcher的核心优势在于其安全性和稳定性。它能够有效防止用户在操作过程中意外写入到硬盘,从而保护用户的数据安全。同...
软件 3154 0
Edge Remover:彻底卸载 Microsoft Edge 的专业工具  v18.24

Edge Remover:彻底卸载 Microsoft Edge 的专业工具 v18.24

Microsoft Edge 卸载工具是一款专门设计用来彻底卸载 Microsoft Edge 浏览器及其相关组件(如 WebView2 运行时)的实用程序。由于 Microsoft Edge 与 Windows 系统高度集成,传统的卸载方法可能无法完全删除其所有组件。这款工具提供了一种更加直接和彻底的方式来帮助用户从系统中清除 Micros...
软件 2841 0
SolveigMM Video Splitter 一款功能强大、易于使用、高效快速的视频编辑软件  v8.1.2508.21

SolveigMM Video Splitter 一款功能强大、易于使用、高效快速的视频编辑软件 v8.1.2508.21

SolveigMM Video Splitter 是一款功能强大的视频编辑软件,主要用于视频分割和剪辑。它以其高效、精准的操作和丰富的功能而受到广大用户的青睐。一、主要功能视频分割:这是该软件的核心功能之一。用户可以轻松地将一个长视频分割成多个片段,精确地选择分割点,确保分割的准确性。无论是按照时间轴进行分割,还是根据特定的场景或内容进行分割...
软件 3766 2
赛博算命上线!让人工智能为你抽一支未来签 赛博算命师 一键整合包 v20250823

赛博算命上线!让人工智能为你抽一支未来签 赛博算命师 一键整合包 v20250823

🔮 什么是 CyberFortune_Telling?这是一个基于人工智能模型驱动的虚拟占卜系统。它可能结合了自然语言处理、生成模型与命理知识库,能够根据用户输入的信息(如生辰、问题、关键词等),生成个性化的运势解读、塔罗牌占卜、星座分析或签文预测等内容。界面充满赛博朋克美学,科技感与神秘主义交织,带来前所未有的互动体验。🤖 技术亮点:基于M...
AI 5582 14
RainbowTaskbar 一个功能强大且实用的Windows任务栏自定义开源工具 v3.2.2

RainbowTaskbar 一个功能强大且实用的Windows任务栏自定义开源工具 v3.2.2

RainbowTaskbar是一个功能强大且实用的Windows任务栏自定义工具,它允许用户根据个人喜好深度定制任务栏的外观和功能,从而提升整体的使用体验。该工具不仅拥有丰富的自定义选项,还以其高速、低资源占用以及支持GPU渲染的特点而著称。RainbowTaskbar的核心功能之一是支持多种任务栏效果,包括文本、图像、圆角、模糊效果、渐变和...
开源 2242 0
Ovis2图片反推提示词工具v5.0 基于AI大模型反推图片+视频批量生成提示词 英伟达6G显卡即可愉快玩耍

Ovis2图片反推提示词工具v5.0 基于AI大模型反推图片+视频批量生成提示词 英伟达6G显卡即可愉快玩耍

本工具基于Ovis2-4B和Ovis2-2B 这2个大模型制作而成。其实早之前我就有分享过反推提示词工具 moondream,但是我昨天遇到了这个大模型,发现功能更加强大,反推出来的提示更加丰富,更多细节描述。这个工具要求显卡比较低,英伟达显卡6g及以上就可以愉快玩耍了我用同一张图片反推提示词下面是Ovis2-4B生成的提示词The...
AI,开源 1.7万 52
开源·高速·高质:Shuttle Jaguar 生成电影级图像 剑二十七二次开发 20秒出图 最低6G英伟达显卡 支持50系 v20250818

开源·高速·高质:Shuttle Jaguar 生成电影级图像 剑二十七二次开发 20秒出图 最低6G英伟达显卡 支持50系 v20250818

我在网上瞎逛的时候,发现了这个模型还不错,就花点时间做了二次开发。Shuttle Jaguar 是一款由 ShuttleAI 开发的文本生成图像(Text-to-Image)人工智能模型,专注于生成具有高度审美感、电影级质感和逼真视觉效果的图像。该模型能够在仅需 四步推理 的极短时间内,将自然语言描述的文本提示(prompt)转化为高质量的图...
AI,开源 5615 9
AI 一键换衣,想穿哪件试哪件!AI-Clothes-Changer 一键整合包 支持50系显卡 v20250818

AI 一键换衣,想穿哪件试哪件!AI-Clothes-Changer 一键整合包 支持50系显卡 v20250818

AI-Clothes-Changer 是一个基于深度学习的交互式图像生成项目,旨在实现“虚拟试衣”功能 —— 用户上传一张人物穿着衣服的照片,再上传一件想要试穿的服装图像,系统即可将目标服装自然地“穿”在人物身上,生成逼真的换装效果图像。🔍 核心功能虚拟换衣(Virtual Try-On)输入:一张人物全身照 + 一件衣服的正面图像(如 T ...
AI 5544 5
Flix 一款局域网内跨设备分享软件 绿色免安装 v1.8.0

Flix 一款局域网内跨设备分享软件 绿色免安装 v1.8.0

Flix快传 是一款用于跨平台文件传输的应用,提供了简洁易于操作的用户界面,使文件传输轻而易举。Flix快传支持多平台,包括Windows、Android、iOS、macOS和Linux等操作系统。用户可以根据自己的需要下载适合自己操作系统的版本,有安装版和绿色版(免安装)可供选择。Flix快传的主要特点是传输速度快且稳定。用户可以实现在不同...
软件 3800 2
小工具 windows IP地址修改器 IPTools 绿色免安装 v5.0.7.1

小工具 windows IP地址修改器 IPTools 绿色免安装 v5.0.7.1

以下文字来自作者网站软件的介绍--------------------------------------------------做了个小工具,IP 地址修改器。准确说,其实是重制了10年前的“IP 地址修改器”。。。之前最后一个版本更新,是2.0最终版,在09年发布。重制有几个原因,首先是不支持Win 10;其次,一些Bug和年轻时的中二等...
软件 3490 2
多图预览 开源 免费 7-zip 单文件版 拥有极高压缩比的开源压缩软件 v25.01

多图预览 开源 免费 7-zip 单文件版 拥有极高压缩比的开源压缩软件 v25.01

7zip是一款免费开源的压缩和解压缩软件,它允许用户在多种不同的格式(例如ZIP,RAR,TAR,GZ和ISO等)中创建和打开压缩文件。其最大的优点是非常高的压缩比,这意味着文件压缩后所占用的空间往往会减小到原来的一半或更小。除此之外,它还支持多种加密算法,使得用户可以为他们的文件添加额外的安全保护。在使用7zip时,用户可以选择使用图形用户...
开源 4977 4
让终端“懂你”:Termora,你的智能命令行副驾驶 开源SSH客户端 v1.0.17

让终端“懂你”:Termora,你的智能命令行副驾驶 开源SSH客户端 v1.0.17

Termora 是一个开源的终端增强工具,旨在提升命令行用户体验,使其更智能、高效且直观。该项目由 TermoraDev 团队开发,专注于将现代用户界面理念与传统终端功能相结合,为开发者和系统管理员提供更强大的命令行交互能力。核心特性:命令智能建议(Command Suggestions)Termora 能够根据用户的历史命令、当前上下文以及...
开源 3976 9
让 Windows 资源管理器秒变「多标签浏览器」!这个开源神器太实用了 ExplorerTabUtility v2.5.0

让 Windows 资源管理器秒变「多标签浏览器」!这个开源神器太实用了 ExplorerTabUtility v2.5.0

Windows 自带的资源管理器长期以来一直缺乏原生的标签页支持(直到 Windows 11 22H2 才在部分版本中实验性引入),而 ExplorerTabUtility 正是为了解决这一痛点而开发的轻量级、开源工具。它通过注入或挂钩(hook)技术,在不修改系统核心文件的前提下,为资源管理器动态添加标签页功能。✅ 主要功能多标签页支持在同...
开源 4415 1
Start Everywhere  一款功能全面、操作简便、定制灵活的开始菜单编辑工具 v1.4.2.43

Start Everywhere 一款功能全面、操作简便、定制灵活的开始菜单编辑工具 v1.4.2.43

Start Everywhere是一款功能强大且操作简单的开始菜单编辑工具,旨在帮助用户更快速、便捷地访问计算机上安装的应用程序、文档及计算机设置。该软件以其独特的解决方案和灵活的定制能力而受到用户的青睐。Start Everywhere复制了Windows 7开始菜单的外观和体验,为用户提供了全新的“Windows 7”风格界面,同时支持W...
软件 2660 0