ToB企服应用市场:ToB评测及商务社交产业平台

标题: Python:使用pycorrector处置惩罚错字、纠正 [打印本页]

作者: 宝塔山    时间: 2024-9-16 06:54
标题: Python:使用pycorrector处置惩罚错字、纠正
简介:pycorrector是一个开源的中文文本纠错工具。支持中文音似、形似、语法错误纠正,python3开发。pycorrector实现了Kenlm、ConvSeq2Seq、BERT、MacBERT、ELECTRA、ERNIE、Transformer等多种模子的文本纠错,并在SigHAN数据集评估各模子的效果。
项目开源地址:
  1. https://github.com/shibing624/pycorrector
复制代码
安装:
  1. pip install -U pycorrector
复制代码
案例1:文本纠错
  1. # -*- coding: utf-8 -*-
  2. # time: 2023/02/18 11:26
  3. # file: demo1.py
  4. # 公众号: 伤心的辣条
  5. import pycorrector
  6. message = "机七学习是人工智能领遇最能体现智能的一个分知"
  7. corrected_sent, detail = pycorrector.message(mes)
  8. print(corrected_sent, detail)
复制代码
运行效果:
  1. (base) [root@ci4vyvxi572ysx2s write]# python demo1.py
  2. 2023-02-18 11:53:18.515 | DEBUG    | pycorrector.detector:_initialize_detector:89 - Loaded language model: /root/.pycorrector/datasets/zh_giga.no_cna_cmn.prune01244.klm
复制代码
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4