简介:pycorrector是一个开源的中文文本纠错工具。支持中文音似、形似、语法错误纠正,python3开发。pycorrector实现了Kenlm、ConvSeq2Seq、BERT、MacBERT、ELECTRA、ERNIE、Transformer等多种模子的文本纠错,并在SigHAN数据集评估各模子的效果。
项目开源地址:
- https://github.com/shibing624/pycorrector
复制代码 安装:
- pip install -U pycorrector
复制代码 案例1:文本纠错
- # -*- coding: utf-8 -*-
- # time: 2023/02/18 11:26
- # file: demo1.py
- # 公众号: 伤心的辣条
- import pycorrector
- message = "机七学习是人工智能领遇最能体现智能的一个分知"
- corrected_sent, detail = pycorrector.message(mes)
- print(corrected_sent, detail)
复制代码 运行效果:
- (base) [root@ci4vyvxi572ysx2s write]# python demo1.py
- 2023-02-18 11:53:18.515 | DEBUG | pycorrector.detector:_initialize_detector:89 - Loaded language model: /root/.pycorrector/datasets/zh_giga.no_cna_cmn.prune01244.klm
复制代码 免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |