视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包 v20251231

视频4倍高清修复,一键搞定!清华团队开源实时视频超分模型 FlashVSR 一键整合包 v20251231

🎥 FlashVSR 是什么?FlashVSR 是一个能让模糊、低清视频“秒变高清”的智能工具。它专门用来做一件事:把低分辨率的视频,快速、高质量地放大成 4 倍清晰度的高清视频。比如:把 480p 的老视频 → 变成接近 4K 的清晰视频让手机拍的模糊视频 → 变得锐利、细节丰富⚡ 它有什么厉害的地方?过去很多“视频超分”(放大变清晰)工具...
AI,开源 4875 2
一键生成AI绘画提示词:让你的图片秒变顶级写真描述 跟之前的图片反推工具不同的是这个会思考 thinkpic-4.0-20251230

一键生成AI绘画提示词:让你的图片秒变顶级写真描述 跟之前的图片反推工具不同的是这个会思考 thinkpic-4.0-20251230

这个工具是做什么的?这个程序可以自动为你的人物照片生成一段“AI绘画提示词”。简单来说:你放一张人物照片进去,它就能写出一段详细、生动、充满吸引力的文字描述,这段文字可以直接用在 AI 绘画工具(比如 Stable Diffusion)中,让 AI 画出类似风格或效果的图片。例如,它会描述:人物有多美、眼睛多勾人、嘴唇多诱人;身材曲线多么火辣...
AI 1.1万 4
入梦AI变声器RMAIVoiceChanger v5.8 免费 免安装

入梦AI变声器RMAIVoiceChanger v5.8 免费 免安装

今天因为有点事 需要去找下变声软件。早上已经分享了一款,没想到还是给我另外一款貌似更好用,设置更加简单的变声工具,也是免费使用。入梦自己开发基于RVC的AI变声器,永久免费给大家分享使用,数十种中精选音源一键切换,建议最低配置位N卡1060以上,CPU四核心以上主频大于3.0GHZ,包集成入梦虚拟声卡,AI降噪等,入梦工具箱等辅助工具,使用简...
软件 1.1万 21
AIStarter启动器:AI Starter v5.2.0 实现一键AI下载使用,实现开箱即用 完整包包含项目文件

AIStarter启动器:AI Starter v5.2.0 实现一键AI下载使用,实现开箱即用 完整包包含项目文件

分享给喜欢玩AI的朋友,我下载测试体验了,基本热门的ai项目都可以下载本地部署,全自动。您的AI项目管理专家,AIStarter实现一键下载使用,实现开箱即用我分享的是完整包 里面已经包含AI的项目文件下面简单说下完整包使用方法。先装好AIStarter Setup 2.0.1.exe。然后启动这个工具设置好目录,硬盘少于1T的千万不要来自取...
开源 1.2万 43
手机软件 安卓app Myne 一款功能强大、开源免费的Android电子书阅读app v4.7.1

手机软件 安卓app Myne 一款功能强大、开源免费的Android电子书阅读app v4.7.1

Myne是一款专为Android平台设计的开源应用程序,其核心功能是允许用户从Project Gutenberg下载并阅读电子书。这款应用不仅为用户提供了一个便捷的阅读平台,还通过其现代化的界面设计和丰富的功能,极大地提升了阅读体验。以下是对Myne软件的详细介绍:一、软件背景与定位Myne项目诞生于对开源精神和数字阅读需求的深刻理解。作为一...
安卓 2629 0
别只截图——让AI看懂它!Snippai秒出翻译、表格、配色方案 v0.2.1

别只截图——让AI看懂它!Snippai秒出翻译、表格、配色方案 v0.2.1

Snippai 是一款开源的 AI 截图分析工具,主打“截一下,秒懂一切”。它把传统截图工具的功能边界彻底打破:截完图后,AI 会自动识别图片里的内容并给出“下一步”服务,而不是简单保存一张图片。核心能力一览公式识别:截图里的数学公式直接变成可编辑的 LaTeX。文字提取:OCR 精准抓字,支持多语言,抓完还能顺手翻译。表格识别:把图片中的表...
AI,开源 1.2万 19
洗图必备 基于 Z-Image Turbo 的多模态 ControlNet 工具:ZIT-ControlNet  v2.0 一键整合包

洗图必备 基于 Z-Image Turbo 的多模态 ControlNet 工具:ZIT-ControlNet v2.0 一键整合包

ZIT-ControlNet(Z-Image Turbo ControlNet)—— 精准可控的 AI 图像生成与编辑工具项目简介ZIT-ControlNet(全称Z-Image Turbo ControlNet)是一个基于ControlNet 技术构建的开源图像生成控制项目,致力于在生成图像时实现高精度引导与编辑,同时最大程度保留原始图像的...
开源 1万 18
"方言通+翻译官:一个AI,能说18种中国方言和9国语言" Fun-CosyVoice3-0.5B AI语音生成工具 一键整合包 v20251217

"方言通+翻译官:一个AI,能说18种中国方言和9国语言" Fun-CosyVoice3-0.5B AI语音生成工具 一键整合包 v20251217

CosyVoice:基于大语言模型的先进语音合成系统CosyVoice 是一个由 FunAudioLLM 团队开发的开源文本到语音(TTS)系统,目前已迭代至Fun-CosyVoice 3.0版本。该项目基于大语言模型(LLM)架构,在语音合成领域实现了多项技术突破。核心技术特点Fun-CosyVoice 3.0作为最新版本,在内容一致性、说...
AI,开源 4200 2
GLM-TTS 大语言模型重塑语音合成 3秒克隆人声?GLM-TTS 做到了!声音克隆相似度极高 一键整合包 v20251212

GLM-TTS 大语言模型重塑语音合成 3秒克隆人声?GLM-TTS 做到了!声音克隆相似度极高 一键整合包 v20251212

GLM-TTS是由ZAI 组织开发并开源的高质量文本转语音(Text-to-Speech, TTS)系统。它基于大语言模型(LLM),专注于实现可控、富有情感表达的零样本语音克隆,并通过多奖励强化学习框架显著提升传统 TTS 系统的自然度与表现力。核心特性🗣️ 零样本语音克隆仅需3–10 秒的目标说话人提示音频,即可克隆任意声音,无需微调或说...
AI,开源 3702 4
"90分钟不间断!微软新AI能把你的文字变成专业播客 一键整合包 VibeVoice v20251211

"90分钟不间断!微软新AI能把你的文字变成专业播客 一键整合包 VibeVoice v20251211

🎙️ VibeVoice:你的超级AI配音员"把文字变成自然对话的魔法工具"🌟 什么是VibeVoice?想象一下,有一位永不疲倦的配音员,能一口气生成90分钟不间断的语音内容,还能在对话中自如切换不同角色的声音——这就是微软开发的VibeVoice,一款革命性的AI语音生成工具!💡 它能为你做什么?(实用场景)场景用途效...
AI,开源 7138 19
AI音乐生成工具v2.0 基于 DiffRhythm 二次开发。webui界面 不卡死,速度快 英伟达显卡6g即可运行, 一键整合包

AI音乐生成工具v2.0 基于 DiffRhythm 二次开发。webui界面 不卡死,速度快 英伟达显卡6g即可运行, 一键整合包

DiffRhythm:基于差分节奏建模的通用音乐流派分类开源项目DiffRhythm是由ASLP实验室提出的开源项目,旨在通过创新的差分节奏建模(Differential Rhythm Modeling)框架解决音乐流派分类任务。该项目结合传统信号处理与深度学习技术,从节奏这一音乐核心要素出发,构建了具有强解释性和泛化能力的分类模型。其代码已...
AI,开源 5369 6
魔搭+Pollinations 批量AI文生图工具 27pic-api v10 无需显卡,无需搭建解压即可运行。支持最新Z-Image-Turbo 文生图

魔搭+Pollinations 批量AI文生图工具 27pic-api v10 无需显卡,无需搭建解压即可运行。支持最新Z-Image-Turbo 文生图

大伙都知道,我直接分享过挂机流工作流,还有批量提示词工具。但是考虑到平时电脑也还有别的用途,老是用显卡来挂机生图,也是很耽误事。所以我就想利用各大平台的API来生成图片,这样就不会占用本地的资源又可以实现批量文生图的需求。所以今天花了一点时间做出来这个 AI文生图工具 27pic-api,暂时就取这个名字吧。远程调用魔塔的API&n...
AI 1.4万 26
开源 Apt Full 绿色版 一个功能强大、操作便捷的AI生产力工具  v2.9.15.0

开源 Apt Full 绿色版 一个功能强大、操作便捷的AI生产力工具 v2.9.15.0

该项目集成了多种AI模型,特别是提供了私人专属的ChatGPT AI智能助理,能够处理各种文本任务,为用户提供智能辅助。此外,它还能一键批量智能处理图片和视频,包括但不限于图片无损放大、擦除水印、转换为卡通漫画风格、转制3D效果、上色修复、人脸修复等,以及视频的无损放大、擦除水印、转换为卡通漫画风格、转制3D、上色修复、插值补帧等功能。总之,...
软件 7833 7
告别灵感枯竭?试试 AI-Writing 的智能创作能力 AI智能写作辅导软件 v1.2

告别灵感枯竭?试试 AI-Writing 的智能创作能力 AI智能写作辅导软件 v1.2

AI-Writing 是一个旨在利用人工智能模型来辅助文本创作的开源项目。它可以帮助用户提高写作效率,适用于文章撰写、文案生成、内容润色、创意激发等多种场景。该项目可能整合了当前主流的自然语言处理(NLP)模型,比如 GPT、ChatGLM、BERT 等,以实现以下功能:✨ 主要功能特性自动续写根据用户输入的开头段落或句子,自动生成后续内容。...
AI,开源 3459 0
 AI智能去水印神器   27Watermark v2.0 一键去除视频水印,保持原画质 v20251012  针对sora和通义AI生成的视频水印去除 效果非常好

AI智能去水印神器 27Watermark v2.0 一键去除视频水印,保持原画质 v20251012 针对sora和通义AI生成的视频水印去除 效果非常好

📖 什么是27Watermark?27Watermark 是一款基于先进AI技术的智能视频和图片去水印工具。它使用最新的FLUX.1-Kontext模型,能够智能识别并移除视频和图片中的水印,同时完美保持原始内容的完整性和质量。🎯 核心功能✨ 智能去水印精准识别:AI自动识别水印位置和类型智能修复:用周围背景自然填补水印区域质量保持:保持原始...
AI 7368 0
图像生成神器:用AI画图,零代码也能玩,拖拽操作就能生成精美图片ComfyUI 官方英伟达显卡版 v0.3.70

图像生成神器:用AI画图,零代码也能玩,拖拽操作就能生成精美图片ComfyUI 官方英伟达显卡版 v0.3.70

ComfyUI 是一个基于节点(Node-based)的图形界面工具,专为使用 Stable Diffusion及其衍生模型进行图像生成而设计。它通过可视化的流程图方式,让用户无需编写代码即可构建复杂的生成工作流。🧩 1. 可视化流程图系统节点式编辑器:将每一个操作(如加载模型、输入提示词、图像采样等)封装为独立节点,用户可以通过拖拽连接这些...
AI,开源 7597 3
Snow Shot:开源一键截图,文字识别+翻译+AI对话全搞定 snow-shot v0.7.8-beta

Snow Shot:开源一键截图,文字识别+翻译+AI对话全搞定 snow-shot v0.7.8-beta

介绍说明:项目概述:名称:Snow Shot设计理念:以简洁优雅作为设计理念类型:工具软件功能特点:截图功能:Snow Shot 是一款功能强大的截图工具,支持快速截图。文字识别:集成了文字识别功能,用户可以通过快捷键在截图后自动进行文字识别。翻译功能:支持快速翻译,用户在选中需要翻译的文本后按下翻译快捷键即可查看翻译结果。AI 对话:还集成...
开源 4183 0
开源 AI人脸替换工具离线版V8.7 兼容50系列显卡 CPU、显存占用优化,速度更快 一张图实现视频或者图片换脸,完全免费!附演示和教程视频

开源 AI人脸替换工具离线版V8.7 兼容50系列显卡 CPU、显存占用优化,速度更快 一张图实现视频或者图片换脸,完全免费!附演示和教程视频

这是热心网友万能君做的一个整合包,整合包里面已经包含了几个换脸项目和一些高清修复功能等,具体可以看下图截图所示。要顺利使用这个工具,必须做好以下几点第一个 这个工具只支持CPU+N卡。如果需要使用N卡,一定要先安装好驱动和CUDA。第二个 一定要安装好运行库。https://www.jian27.com/html/2290.html第三个 所...
AI 513.6万 10220
开源 免费 离线 gtp4 语音大模型搭建极其简单无需GPU 聊天机器人 gpt4all v3.10.0 附最新模型 支持deepseek

开源 免费 离线 gtp4 语音大模型搭建极其简单无需GPU 聊天机器人 gpt4all v3.10.0 附最新模型 支持deepseek

上面是教程开源 免费 离线 gtp4 语音大模型搭建极其简单无需GPU安装极其简单,基本就是点几下,然后倒入模型后就可以使用,无须联网。免费,无任何限制。我玩了好多天了,很稳定。效率也不错,才分享出来的。GPT4All是一款引人注目的软件,它为用户提供了一个在本地设备上运行大型语言模型(LLM)的平台。无需昂贵的硬件或持续的网络连接,GPT...
开源 1.2万 32
一键整合包 Step-Audio-EditX  v20251112 解压即用,支持情绪/方言/语气词!让AI说话像真人一样“有血有肉”

一键整合包 Step-Audio-EditX v20251112 解压即用,支持情绪/方言/语气词!让AI说话像真人一样“有血有肉”

🧠 什么是 Step-Audio-EditX?Step-Audio-EditX 是由 StepFun AI 团队开源的一款 30 亿参数(3B)的大语言模型(LLM)驱动的先进音频编辑系统,专注于 高表现力、可迭代、细粒度的语音编辑与零样本语音合成(TTS)。它不仅能高质量克隆任意人声,还能对语音的情绪、说话风格、副语言特征(如笑声、叹息等)...
AI,开源 4202 2
输入一段歌词,AI 自动生成带人声+伴奏的歌(支持中文) 腾讯开源“AI 作曲” SongGeneration v20251109 一键整合包

输入一段歌词,AI 自动生成带人声+伴奏的歌(支持中文) 腾讯开源“AI 作曲” SongGeneration v20251109 一键整合包

腾讯 AI Lab 推出的一个 “AI 自动生成完整歌曲” 的免费工具。你只需要提供一段歌词,它就能帮你自动配上人声 + 伴奏,生成一首像模像样的歌,支持中文和英文!🎤 它能做什么?你写歌词,AI 唱出来:你只要写下带结构的歌词(比如“[主歌]……[副歌]……”),AI 会自动配上旋律、人声和背景音乐。支持风格定制:你可以指定歌曲风格(比如“...
AI,开源 6433 17
NovaMSS(音乐源分离工具) v2.1.0 社区版 轻松地批量提取伴奏、人声、贝斯、鼓点等音轨

NovaMSS(音乐源分离工具) v2.1.0 社区版 轻松地批量提取伴奏、人声、贝斯、鼓点等音轨

NovaMSS是一个基于MSS领域最顶级的人工智能算法模型调优后的新一代音乐源分离工具。它的诞生,旨在解决音频处理中复杂且繁琐的音轨分离问题,为用户带来前所未有的便捷体验。NovaMSS拥有强大的功能,可以一键提取伴奏、人声、贝斯、鼓点等音轨。无论是翻唱、K歌还是扒带等场景,用户只需通过简单的操作,即可轻松获得所需的音频素材。其分离的伴奏质量...
软件 5432 0
告别视频手动分类!AI 自动识别视频人物、场景与行为 AI 智能视频分析与自动分类 27sift v1.0

告别视频手动分类!AI 自动识别视频人物、场景与行为 AI 智能视频分析与自动分类 27sift v1.0

基于 Ovis2.5-2B 多模态大模型 · 中文支持 · 批量处理 · 智能检索✨ 核心功能🔍 智能视频内容理解自动分析视频内容,生成结构化中文描述,包括:人物性别、年龄段(儿童/少年/青年/中年/老年)发型发色、服装款式与颜色动作行为(如跳水、游泳、站立、互动)场景环境(户外/室内、植被、天气、水域类型)3等等⚡ 高效批量处理递归扫描整个...
AI 2549 0
中文错别字检测与修正工具(基于 MacBERT模型)jiucuo v1.0 一键整合包,有英伟达显卡就能运行 不限字数

中文错别字检测与修正工具(基于 MacBERT模型)jiucuo v1.0 一键整合包,有英伟达显卡就能运行 不限字数

剑二十七 · 基于 ModelScope 模型 Macadam/macbert4mdcspell_v2 二次开发本系统采用先进的 MacBERT 预训练语言模型,专为中文文本拼写与语法错误检测与修正设计,支持任意长度文本、智能分段处理,并严格保留原始格式(包括换行、空行、标点等),适用于论文、公文、OCR 识别结果、手写转录等多种场景。✅ 核...
AI 2.3万 94
超实用!这款轻量级开源笔记工具,用 AI 让记录与写作效率翻倍 NoteGen v0.22.3

超实用!这款轻量级开源笔记工具,用 AI 让记录与写作效率翻倍 NoteGen v0.22.3

NoteGen 是一个专注于记录 和写作 的跨平台 AI 笔记应用,它基于 Tauri 开发,目前支持 Mac、Windows 和 Linux 平台,并计划在未来支持 iOS 和 Android 。该项目旨在通过结合人工智能技术,提升用户的记录效率与内容整理能力,同时提供强大的 Markdown 写作功能。以下是 NoteGen 的主要特点和...
开源 3840 0
MOSS-TTSD:一个高质量的开源中文文本到语音合成系统 一键整合包 v20251104 支持免费商业使用

MOSS-TTSD:一个高质量的开源中文文本到语音合成系统 一键整合包 v20251104 支持免费商业使用

MOSS-TTSD 是由 OpenMOSS 社区开发的一个开源项目,主要聚焦于 文本到语音合成(Text-to-Speech, TTS)领域。该项目是 MOSS 系列模型生态的一部分,旨在提供高质量、低延迟的语音合成能力,适用于多种语言和场景。以下是对该项目的核心功能与技术特点的介绍说明:🎯 项目定位MOSS-TTSD 是一个专注于中文及多语...
AI,开源 6602 11
DeepSeek 本地部署一键运行 DeepSeek-tool v17,解压即可使用 最低支持2G显卡 支持99%的语言大模型 支持联网搜索+知识库

DeepSeek 本地部署一键运行 DeepSeek-tool v17,解压即可使用 最低支持2G显卡 支持99%的语言大模型 支持联网搜索+知识库

琢磨了一天,把DeepSeek的本地部署彻底完成了,并测试了一下午基本完美运行了。当然AI环境你们必须要先安装好。然后下载这个这个本地部署压缩,解压即可完美运行。我的4070ti spuer 运行32b已经是极限了,所以我也只能把模型下载到32b了,如果你们有更牛的显卡,可以继续下载模型。这是我运行14b的截图 你们看看显...
AI,开源 1.4万 36
 AI 播客 :一键生成多角色对话音频 SoulX-Podcast 剑二十七二次开发 一键整合包 v20251103

AI 播客 :一键生成多角色对话音频 SoulX-Podcast 剑二十七二次开发 一键整合包 v20251103

SoulX-Podcast是由 Soul AI Lab 开源的一个面向播客场景的高质量、长篇、多说话人对话式语音合成(TTS)系统,专为生成自然、富有表现力、支持方言与副语言特征的播客音频而设计。🔍 项目核心特点1. 长篇多轮多说话人对话生成支持生成多人交替对话的播客内容(如主持人 + 嘉宾);能处理长文本输入,保持语音连贯性和角色一致性;适...
AI,开源 4515 1
AI 提示词智能增强工具 基于 Qwen3 大模型,可直接用于图像生成的专业级提示词,专为AI图像生成创作者打造 27PromptEnhancer v1.1

AI 提示词智能增强工具 基于 Qwen3 大模型,可直接用于图像生成的专业级提示词,专为AI图像生成创作者打造 27PromptEnhancer v1.1

本工具基于 Qwen3 系列轻量化大模型(Qwen3-0.6B 与 Qwen3-1.7B,GPTQ Int8 量化版本),专为图像生成(如 Stable Diffusion、Midjourney 等)用户设计,帮助你将简单粗糙的提示词自动优化为高细节、高表现力、风格明确的专业级描述。🔧 核心功能双模型可选Qwen3-0.6B:轻量快速,适合日...
AI 2733 0
开源 绿色 免安装 离线 Final2x  – 开源图片放大工具,支持 9 款模型,可提高图像分辨率与质量 v4.0.0 Proi Proi

开源 绿色 免安装 离线 Final2x – 开源图片放大工具,支持 9 款模型,可提高图像分辨率与质量 v4.0.0 Proi Proi

这是一个强大的工具,允许使用多个模型将图像超分辨率到任意尺寸,旨在增强图像的分辨率和质量,使图像更清晰、更详细。目前支持RealCUGAN、RealESRGAN、Waifu2x、SRMD等多种模型。Final2x 是一款开源、跨平台的图片放大工具,支持 9 款模型,支持 CPU、GPU,有中文界面。它让可以你使用多个模型将图像放大,得到更清晰...
开源 1.3万 46
支持图像、动图、短视频、PDF:AI逐页/逐帧分析,AI不仅能看懂,还能回答你的问题  Qwen3-VL 一键整合包 v20251024

支持图像、动图、短视频、PDF:AI逐页/逐帧分析,AI不仅能看懂,还能回答你的问题 Qwen3-VL 一键整合包 v20251024

基于 Qwen3-VL-4B-Instruct 的多模态智能交互平台📌 简介本应用是一个基于 通义千问 Qwen3-VL-4B-Instruct 大模型的多模态推理系统,支持对 图像、视频、PDF 文档、GIF 动图 等多种媒体内容进行智能理解与分析,并能自动生成精准描述、解答问题或提取关键信息。借助 Gradio 构建的直观 Web 界面,...
AI,开源 3808 0
DeepSeek-OCR 可视化工具:支持自由OCR、Markdown转换、图表解析与目标定位 一键整合包 v20251023

DeepSeek-OCR 可视化工具:支持自由OCR、Markdown转换、图表解析与目标定位 一键整合包 v20251023

🐳 DeepSeek-OCR 智能图像文字识别工具 — 使用说明🌟 这是什么?这是一个智能图像处理工具,可以自动从你上传的图片中:识别文字内容把文档转成 Markdown 格式(适合写博客、笔记)解析图表数据(比如柱状图、折线图里的数字)定位图片中的特定内容(比如“找出老师在哪里”)它基于先进的 AI 模型(DeepSeek-OCR),由剑二...
AI,开源 3369 4