剑二十七 · 基于 ModelScope 模型 Macadam/macbert4mdcspell_v2 二次开发
本系统采用先进的 MacBERT 预训练语言模型,专为中文文本拼写与语法错误检测与修正设计,支持任意长度文本、智能分段处理,并严格保留原始格式(包括换行、空行、标点等),适用于论文、公文、OCR 识别结果、手写转录等多种场景。
✅ 核心特性
精准纠错:识别错别字、用词不当、同音混淆等常见中文错误(如“机七学习” → “机器学习”)。
格式保留:自动智能分段,确保段落结构、换行符、空行等原始排版不变。
长文本支持:自动将超长文本切分为模型可处理的片段,无缝拼接结果。
错误定位:高亮显示错误位置及修正建议,便于人工复核。
本地部署:基于 Hugging Face Transformers + Gradio,无需联网即可私有化运行。
专业调优:专为中文书面语优化,不引入 AI 幻觉或现代网络用语。
📦 技术栈
模型:
Macadam/macbert4mdcspell_v2(来自 ModelScope)框架:PyTorch + Transformers + Gradio
部署:单文件启动,支持 GPU 加速(自动检测 CUDA)




二次开发说明
基于 Macadam/macbert4mdcspell_v2 模型二次开发。纠错不限字数。对显卡没什么要求,只要你是英伟达显卡就行。看人气再决定是否继续开发,我感觉这个对于一些需要码字的兄弟还是有点用的。
感谢分享
感谢大佬分享~
GooD
看看,谢谢老师分享!
感谢分享,谢谢。
感谢,试试看效果
再次感谢了
非常感谢
6666666
大佬求JavPlayer 这个免安装版
谢谢分享,下个玩玩
谢谢分享
看了半天没看明白,这软件干啥用的
感谢大佬分享~
感谢分享