中文错别字检测与修正工具(基于 MacBERT模型)jiucuo v1.0 一键整合包,有英伟达显卡就能运行 不限字数

中文错别字检测与修正工具(基于 MacBERT模型)jiucuo v1.0 一键整合包,有英伟达显卡就能运行 不限字数

剑二十七 · 基于 ModelScope 模型 Macadam/macbert4mdcspell_v2 二次开发本系统采用先进的 MacBERT 预训练语言模型,专为中文文本拼写与语法错误检测与修正设计,支持任意长度文本、智能分段处理,并严格保留原始格式(包括换行、空行、标点等),适用于论文、公文、OCR 识别结果、手写转录等多种场景。✅ 核...
AI 2.3万 94
 AI 播客 :一键生成多角色对话音频 SoulX-Podcast 剑二十七二次开发 一键整合包 v20251103

AI 播客 :一键生成多角色对话音频 SoulX-Podcast 剑二十七二次开发 一键整合包 v20251103

SoulX-Podcast是由 Soul AI Lab 开源的一个面向播客场景的高质量、长篇、多说话人对话式语音合成(TTS)系统,专为生成自然、富有表现力、支持方言与副语言特征的播客音频而设计。🔍 项目核心特点1. 长篇多轮多说话人对话生成支持生成多人交替对话的播客内容(如主持人 + 嘉宾);能处理长文本输入,保持语音连贯性和角色一致性;适...
AI,开源 4748 1
DeepSeek-OCR 可视化工具:支持自由OCR、Markdown转换、图表解析与目标定位 一键整合包 v20251023

DeepSeek-OCR 可视化工具:支持自由OCR、Markdown转换、图表解析与目标定位 一键整合包 v20251023

🐳 DeepSeek-OCR 智能图像文字识别工具 — 使用说明🌟 这是什么?这是一个智能图像处理工具,可以自动从你上传的图片中:识别文字内容把文档转成 Markdown 格式(适合写博客、笔记)解析图表数据(比如柱状图、折线图里的数字)定位图片中的特定内容(比如“找出老师在哪里”)它基于先进的 AI 模型(DeepSeek-OCR),由剑二...
AI,开源 3613 4
27video v3.1 超级强大AI视频抠像工具 剑二十七原创作品 附视频演示

27video v3.1 超级强大AI视频抠像工具 剑二十七原创作品 附视频演示

这个工具基于AI大模型BiRefNet文件二次开发。可以对视频进行抠像。速度快,效果也不错。对显卡占用很低,8G的英伟达显卡就可以流畅运行了。操作极其简单,无需任何基础 会点鼠标即可。下面截图几张抠像效果演示20241209 v1.1 更新记录1 保留白色和黑色背景这2种视频抠像,新增了一个自定义背景图片抠像。2...
AI,开源 1.5万 55
IndexTTS  v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS v2.0 重新定义中文语音合成,让AI发音比真人更懂‘断句’!AI文本转语音一键整合包 支持批量生成语音+生成字幕 附效果演示 20250920更新

IndexTTS是由B站推出的一款基于XTTS和Tortoise的GPT风格文本转语音(TTS)模型。该项目在中文文本转语音领域展现出显著的技术优势和应用,以下从项目背景、技术架构、应用场景、社区支持及未来挑战五个维度进行详细介绍。一、项目背景:重新定义中文TTS技术标杆IndexTTS的诞生旨在解决传统TTS系统在中文语音合成中的两大核心痛...
AI,软件 2.1万 51
nunchaku-flux.1-kontext-dev AI生图一键整合包 最低4G显卡可运行 30秒出图 v20250830 支持无限生图+批量图片编辑+lora模型+超分

nunchaku-flux.1-kontext-dev AI生图一键整合包 最低4G显卡可运行 30秒出图 v20250830 支持无限生图+批量图片编辑+lora模型+超分

心血来潮,想试试FLUX.1-Kontext-dev 这个新出的模型,但是奈何显卡不是很牛X,生图效率不够高,所以找了下,发现nunchaku 双截棍 这个量化模型还不错,就花了点时间学习下。然后又花点时间写了个界面,方便大伙来玩玩这个。 我的4070ti spuer 16G 30步 出1024x1024 大概30秒,显卡占用不到4G,这个效...
AI,开源 1.9万 95
手心输入法 一款专注于输入本质、纯净且好用的输入法软件 v3.2.6.1006

手心输入法 一款专注于输入本质、纯净且好用的输入法软件 v3.2.6.1006

手心输入法是一款专注于输入本质、纯净且好用的输入法软件。它摒弃了与输入法无关的功能,不包含任何广告和推广,确保用户在使用过程中不会受到任何干扰。这款输入法的界面简约清爽,去除了冗余功能,只保留了核心体验,让用户能够专注于输入本身。手心输入法支持多种输入方式,包括九宫格拼音、拼音全键盘、双拼全键盘、英文全键盘、手写键盘、笔画键盘和五笔键盘等,用...
软件 2365 0
视频创作者必备!KrillinAI提供从翻译到配音的全流程解决方案,智能分段与精确字幕,打造专业级视频内容 v1.4.0

视频创作者必备!KrillinAI提供从翻译到配音的全流程解决方案,智能分段与精确字幕,打造专业级视频内容 v1.4.0

KrillinAI是一个基于AI大模型的视频翻译和配音工具,它提供了专业级的翻译服务以及一键部署的全流程解决方案。这个开源工具旨在帮助用户轻松实现视频内容的本地化与增强,使其能够适配多种内容平台,如YouTube、TikTok、Bilibili、抖音(国内版)、微信视频号、快手等。KrillinAI的核心功能包括视频翻译、配音与声音克隆、字幕...
安卓 4869 4
赛博算命上线!让人工智能为你抽一支未来签 赛博算命师 一键整合包 v20250823

赛博算命上线!让人工智能为你抽一支未来签 赛博算命师 一键整合包 v20250823

🔮 什么是 CyberFortune_Telling?这是一个基于人工智能模型驱动的虚拟占卜系统。它可能结合了自然语言处理、生成模型与命理知识库,能够根据用户输入的信息(如生辰、问题、关键词等),生成个性化的运势解读、塔罗牌占卜、星座分析或签文预测等内容。界面充满赛博朋克美学,科技感与神秘主义交织,带来前所未有的互动体验。🤖 技术亮点:基于M...
AI 5786 14
开源·高速·高质:Shuttle Jaguar 生成电影级图像 剑二十七二次开发 20秒出图 最低6G英伟达显卡 支持50系 v20250818

开源·高速·高质:Shuttle Jaguar 生成电影级图像 剑二十七二次开发 20秒出图 最低6G英伟达显卡 支持50系 v20250818

我在网上瞎逛的时候,发现了这个模型还不错,就花点时间做了二次开发。Shuttle Jaguar 是一款由 ShuttleAI 开发的文本生成图像(Text-to-Image)人工智能模型,专注于生成具有高度审美感、电影级质感和逼真视觉效果的图像。该模型能够在仅需 四步推理 的极短时间内,将自然语言描述的文本提示(prompt)转化为高质量的图...
AI,开源 5817 9
AI 一键换衣,想穿哪件试哪件!AI-Clothes-Changer 一键整合包 支持50系显卡 v20250818

AI 一键换衣,想穿哪件试哪件!AI-Clothes-Changer 一键整合包 支持50系显卡 v20250818

AI-Clothes-Changer 是一个基于深度学习的交互式图像生成项目,旨在实现“虚拟试衣”功能 —— 用户上传一张人物穿着衣服的照片,再上传一件想要试穿的服装图像,系统即可将目标服装自然地“穿”在人物身上,生成逼真的换装效果图像。🔍 核心功能虚拟换衣(Virtual Try-On)输入:一张人物全身照 + 一件衣服的正面图像(如 T ...
AI 5723 5
手机软件 安卓app Etar-Calendar 一款基于开源理念设计的日历app  v1.0.51

手机软件 安卓app Etar-Calendar 一款基于开源理念设计的日历app v1.0.51

Etar Calendar是一款基于开源理念设计的日历应用,旨在为用户提供一个简单、直观且功能丰富的日程管理解决方案。这款软件不仅继承了Material Design的美学理念,更在实用性上做出了诸多创新,使其成为了众多开源爱好者心中的优选。Etar Calendar的核心优势在于其简洁而不失强大的功能设计。软件提供了月视图、周视图、日视图以...
安卓 2453 0
NewPipe 一个专为Android平台设计的自由、轻量级在线流媒体播放APP v0.28.0

NewPipe 一个专为Android平台设计的自由、轻量级在线流媒体播放APP v0.28.0

NewPipe是一个专为Android平台设计的自由、轻量级流媒体前端应用程序。它以其开源、无广告、无需用户登录即可享受多种流媒体服务的特性而广受好评。以下是对NewPipe的详细介绍:一、软件概述NewPipe是一个功能强大的流媒体播放器,它支持多种视频和音频服务,包括但不限于YouTube。该软件通过从用户正在使用的服务的官方API(如P...
安卓 2543 0
让每一张旧照重获新生,从模糊老照片到高清重现:HYPIR 高清修复图片 一键整合包 v20250801

让每一张旧照重获新生,从模糊老照片到高清重现:HYPIR 高清修复图片 一键整合包 v20250801

HYPIR 是由 XPixel Group(一个专注于图像恢复与底层视觉研究的学术团队)提出的一种基于混合先验的图像恢复模型。该项目的核心目标是解决图像在退化过程中(如模糊、噪声、压缩等)丢失的细节信息,通过引入数据驱动先验与模型驱动先验的融合机制,实现高质量的图像复原。HYPIR 的名称来源于其核心思想:Hybrid Prior(混合先验)...
AI,开源 1.2万 34
一键克隆你的声音:Higgs-Audio 高质量的文本转语音生成 开源语音生成工具 中文一键整合包 v20250728

一键克隆你的声音:Higgs-Audio 高质量的文本转语音生成 开源语音生成工具 中文一键整合包 v20250728

HiggsAudio 是由 Boson AI 开发的开源文本转语音(TTS)系统,基于先进的深度学习技术,能够生成高质量、自然的人声。该项目在 GitHub 上开源,提供了强大的语音合成能力。🌟 项目亮点🎵 高质量语音生成生成接近真人发音的语音支持多种语言和口音能够处理情感表达和语调变化🏗️ 先进的模型架构基于 Transformer 的端到...
AI,开源 4203 10
字节出品 MegaTTS3 - AI智能语音合成系统,文字秒变自然语音,支持多语言高质量输出 v20250725

字节出品 MegaTTS3 - AI智能语音合成系统,文字秒变自然语音,支持多语言高质量输出 v20250725

MegaTTS3 是字节跳动开源的一个先进的文本到语音(TTS)合成系统,具有以下特点:🌟 核心特性1. 高质量语音合成基于扩散模型的语音生成技术支持高保真度的语音合成生成自然、流畅的语音输出2. 强大的语音克隆能力能够克隆特定人的声音特征只需少量参考音频即可实现声音复制保持原始音色的同时合成新内容3. 多语言支持支持中文、英文等多种语言跨语...
AI,开源 5774 0
阿里出品 Ovis-U1-3b 多模态理解、文本到图像生成+图像编辑。 一键整合包

阿里出品 Ovis-U1-3b 多模态理解、文本到图像生成+图像编辑。 一键整合包

Ovis-U1 是由阿里巴巴AIDC-AI团队开发的一个先进的多模态大语言模型项目。这个项目专注于构建能够同时处理文本和图像信息的AI系统。核心特点多模态融合能力能够同时理解和处理文本与图像数据实现跨模态的信息理解和生成支持图文混合的输入输出场景统一架构设计采用统一的模型架构处理不同类型的模态数据简化了传统多模态系统中复杂的模块组合提高了模型...
AI,开源 4073 0
光影魔法来了!AI一键切换日光/夜景/霓虹灯效果 relighting-kontext v20250720

光影魔法来了!AI一键切换日光/夜景/霓虹灯效果 relighting-kontext v20250720

在网上瞎逛的时候,发现了这个模型,很不错,光影效果做出来很逼真,虽然我以前也做过一个类似的整合包,但是跟这个没法比,所以抽空进行了二次开发。🌟 Relighting Kontext [dev] LoRA v3 模型介绍Relighting Kontext [dev] LoRA v3是一个针对 FLUX.1-Kontext-dev模型优化的低秩...
AI,开源 5216 10
手机软件 安卓app tasks v14.7.3 一款开源功能强大、易于使用且注重隐私的任务管理APP

手机软件 安卓app tasks v14.7.3 一款开源功能强大、易于使用且注重隐私的任务管理APP

Tasks是一款基于Astrid(一款在2013年被收购并停止服务的流行跨平台生产力服务)的开源Android应用源代码发展而来的任务管理应用。它继承了Astrid的核心功能,并在此基础上进行了优化和扩展,为用户提供了一个强大而灵活的任务管理解决方案。核心功能与特性Tasks的核心功能在于其强大的任务管理能力。用户可以轻松地创建、编辑、删除和...
安卓 2629 0
小旺AI截图:AI加持,截图翻译、OCR文字提取一键搞定!v1.2.0

小旺AI截图:AI加持,截图翻译、OCR文字提取一键搞定!v1.2.0

一、产品概述小旺AI截图是一款集截图与录屏功能于一体的全能神器,作为首款接入DeepSeek大模型的AI截图软件,它以其轻巧、好用、功能强大的特点,赢得了广大用户的喜爱。无论是学习攻坚、办公助手、游戏娱乐、设计研发还是内容创作,小旺AI截图都能成为您的得力助手。二、核心功能截图功能任意截图:支持电脑任意区域截图,简单快捷,满足各种截图需求。A...
软件 4125 0
FishAudio 推出 OpenAudio-S1-Mini:革新语音合成技术, 一键整合包 v20250627

FishAudio 推出 OpenAudio-S1-Mini:革新语音合成技术, 一键整合包 v20250627

openaudio-s1-mini 是一个开源的音频生成模型,主要特点是能够将文本高效地转换为自然流畅的语音。下面是对该模型的详细介绍:基本信息模型名称:openaudio-s1-mini开源平台:ModelScope.cn开发者:FishAudio 团队主要特点高效的文本转语音能力:该模型经过大量数据训练,能够将输入的文本快速转换为自然流畅...
AI,开源 4857 13
开源 PasteBar v0.7.0 一款功能全面、易于使用的剪贴板管理器

开源 PasteBar v0.7.0 一款功能全面、易于使用的剪贴板管理器

PasteBarApp 是一款功能强大且免费的剪贴板管理器,专为Mac和Windows用户设计。这款开源软件致力于让用户能够轻松管理他们复制和粘贴的所有内容,无论是文本、图片、文件、链接还是代码片段。PasteBarApp提供了无限的剪贴板历史记录,用户可以随时回溯并找回之前复制的任何内容,这对于经常需要处理大量信息的用户来说极为便利。软件的...
软件 2753 0
手机软件 安卓APP F-Droid v1.21.1 一个致力于提供自由、开源安卓应用程序的应用商店

手机软件 安卓APP F-Droid v1.21.1 一个致力于提供自由、开源安卓应用程序的应用商店

F-Droid是一个致力于提供自由、开源安卓应用程序的客户端工具。以下是关于它的详细介绍:项目概述名称 :F-Droid Client平台 :主要基于安卓系统托管平台 :该项目托管在 GitLab 上,GitLab 是一个用于仓库托管和代码管理的平台,方便开发者进行版本控制、协作开发等操作。通过 GitLab,F-Droid 的开发团队可以有...
安卓 2636 0
AI 人工智能 一键高清修复模糊照片(支持批量处理),还原清晰细节 Finegrain Image Enhancer  v20250617 一键汉化整合包

AI 人工智能 一键高清修复模糊照片(支持批量处理),还原清晰细节 Finegrain Image Enhancer v20250617 一键汉化整合包

Finegrain Image Enhancer开源图像增强工具通过人工智能技术将低分辨率图像转化为高分辨率版本,智能生成细节以提升画质 。核心功能超分辨率放大支持模糊或低分辨率图像放大(最高可达4倍),增强细节的清晰度和真实感 。细粒度参数控制提供增强强度、风格一致性等参数调节,允许用户进行精细化编辑 。结果可重复性通过种子管理保存特定增强...
AI,开源 7455 11
Meissonic 开源高性能文生图模型 一键整合包 v20250619

Meissonic 开源高性能文生图模型 一键整合包 v20250619

Meissonic 是一个基于 Masked Generative Transformer的高效高分辨率文本到图像生成模型,旨在通过消费级显卡实现高质量的图像生成任务。该项目在 ICLR 2025 上发表,其核心目标是重新激发 Masked Generative Transformers 在图像合成中的潜力,并提供一种高效的推理方案。核心特性...
AI,开源 2714 0
图片加音乐转视频,傻瓜卡点神器 人工智障全自动卡点神器 v3.9

图片加音乐转视频,傻瓜卡点神器 人工智障全自动卡点神器 v3.9

简介: “图片加音乐转视频,傻瓜卡点神器”是一款专为视频创作者设计的工具,旨在简化将图片和音乐结合生成视频的过程。这款工具特别适合那些在视频编辑软件中进行卡点操作时感到困难的用户。它提供了一种简单、直观的方式来创建具有音乐节奏的视频,无需复杂的编辑技巧。功能特点:时长控制:用户可以根据音频的长度和可用图片的数量,灵活控制视频的时长。如果音频时...
软件 4850 0
Mozilla Firefox 火狐浏览器 v140.0b6 简体中文官方

Mozilla Firefox 火狐浏览器 v140.0b6 简体中文官方

火狐浏览器这个没什么讲的,太有名了。软件简介:Mozilla Firefox是一款由Mozilla基金会开发的免费开源的网络浏览器。它于2002年首次发布,经过多年的发展和改进,已成为全球最受欢迎的网络浏览器之一。Firefox以其速度、安全性、稳定性和可定制性而闻名,并且提供了丰富的功能和扩展,以满足用户的各种需求。首先,Firefox注重...
软件 3685 0
 想自己生成图片但怕侵权?试试这个新AI模型!f-lite v20250607 一键整合包 支持40系+50系显卡

想自己生成图片但怕侵权?试试这个新AI模型!f-lite v20250607 一键整合包 支持40系+50系显卡

F Lite是由 Fal AI与 Freepik联合开发的一个基于扩散模型的图像生成工具。它提供了一个轻量但功能强大的模型架构,并在数据合规性方面做出了显著努力。📌 核心特点✅ 合法合规的数据集训练模型仅使用了 8000 万张版权安全(copyright-safe)和 SFW(适合所有年龄层,Safe For Work)内容进行训练。数据来源...
AI,开源 3915 3
视频自动分镜工具,一键智能分割画面 视频自动分割分镜工具

视频自动分镜工具,一键智能分割画面 视频自动分割分镜工具

视频自动分割(分镜)工具介绍说明这是一款基于Python和PyQt5开发的桌面应用程序,名为“视频自动分割(分镜)工具”。它主要用于通过检测画面变化来自动分割视频片段,帮助用户快速实现视频的分镜处理。主要功能自动分割视频工具能够分析视频内容,根据画面变化进行智能分割,将视频分成多个独立片段。支持多种视频格式支持常见的视频文件格式,无需额外转换...
软件 2239 0
视频创作者的新宠:这个开源工具正在悄悄改变内容生产方式 一键整合包 MoneyPrinterPlus v1.2.6

视频创作者的新宠:这个开源工具正在悄悄改变内容生产方式 一键整合包 MoneyPrinterPlus v1.2.6

你可以把它想象成一个 “AI全自动视频工厂”。它最大的特点就是:输入一段文字,就能自动生成一个完整的高清视频。是不是有点像你写一篇作文,然后机器帮你拍成了短视频?没错,就是这个意思!🧠 它是怎么工作的?简单来说,它的流程是这样的:你告诉它要说什么内容(文字)比如:“今天教你怎么在家做蛋糕”它会自动找合适的画面素材比如网上免费的高清视频片段:打...
AI,开源 7570 4
AI 自动生成短剧解说视频 输入一段话就能生成短剧解说视频  一键整合包 NarratoAI v0.6.1

AI 自动生成短剧解说视频 输入一段话就能生成短剧解说视频 一键整合包 NarratoAI v0.6.1

这个工具是做什么的?你可以把 NarratoAI 理解成一个“AI自动剪辑视频的神器”,它最大的特点就是:输入一段文字或口播内容,就能自动生成一部短剧解说视频。是不是听起来像你写了个剧本,AI 就帮你拍成了短视频?没错,就是这样!🧠 它是怎么工作的?它的流程大概是这样的:你提供一段文字内容(比如口播文案、剧情简介)比如:“今天给大家讲一个爱情...
AI,开源 7715 3
一键提取伴奏/人声!轻松搞定音乐音轨分离 支持批量处理 开源一键整合包 6G N卡就可以愉快玩耍 UVR5 UI v1.8.4

一键提取伴奏/人声!轻松搞定音乐音轨分离 支持批量处理 开源一键整合包 6G N卡就可以愉快玩耍 UVR5 UI v1.8.4

UVR5-UI是基于 python-audio-separator(即 UVR5 的命令行版本)开发的,提供了友好的可视化界面,使得用户无需掌握编程知识或命令行操作即可使用强大的音频处理功能。它支持多种模型和功能,包括:所有主流音源分离模型:VR Arch 模型MDX-NET 模型Demucs v4 模型Mel-Band Roformer 和...
AI,开源 5760 3