ToB企服应用市场:ToB评测及商务社交产业平台
标题:
Python:使用pycorrector处置惩罚错字、纠正
[打印本页]
作者:
宝塔山
时间:
2024-9-16 06:54
标题:
Python:使用pycorrector处置惩罚错字、纠正
简介:
pycorrector是一个开源的中文文本纠错工具。支持中文音似、形似、语法错误纠正,python3开发。pycorrector实现了Kenlm、ConvSeq2Seq、BERT、MacBERT、ELECTRA、ERNIE、Transformer等多种模子的文本纠错,并在SigHAN数据集评估各模子的效果。
项目开源地址:
https://github.com/shibing624/pycorrector
复制代码
安装:
pip install -U pycorrector
复制代码
案例1:文本纠错
# -*- coding: utf-8 -*-
# time: 2023/02/18 11:26
# file: demo1.py
# 公众号: 伤心的辣条
import pycorrector
message = "机七学习是人工智能领遇最能体现智能的一个分知"
corrected_sent, detail = pycorrector.message(mes)
print(corrected_sent, detail)
复制代码
运行效果:
(base) [root@ci4vyvxi572ysx2s write]# python demo1.py
2023-02-18 11:53:18.515 | DEBUG | pycorrector.detector:_initialize_detector:89 - Loaded language model: /root/.pycorrector/datasets/zh_giga.no_cna_cmn.prune01244.klm
复制代码
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/)
Powered by Discuz! X3.4