Python:使用pycorrector处置惩罚错字、纠正

打印 上一主题 下一主题

主题 808|帖子 808|积分 2424

简介:pycorrector是一个开源的中文文本纠错工具。支持中文音似、形似、语法错误纠正,python3开发。pycorrector实现了Kenlm、ConvSeq2Seq、BERT、MacBERT、ELECTRA、ERNIE、Transformer等多种模子的文本纠错,并在SigHAN数据集评估各模子的效果。
项目开源地址:
  1. https://github.com/shibing624/pycorrector
复制代码
安装:
  1. pip install -U pycorrector
复制代码
案例1:文本纠错
  1. # -*- coding: utf-8 -*-
  2. # time: 2023/02/18 11:26
  3. # file: demo1.py
  4. # 公众号: 伤心的辣条
  5. import pycorrector
  6. message = "机七学习是人工智能领遇最能体现智能的一个分知"
  7. corrected_sent, detail = pycorrector.message(mes)
  8. print(corrected_sent, detail)
复制代码
运行效果:
  1. (base) [root@ci4vyvxi572ysx2s write]# python demo1.py
  2. 2023-02-18 11:53:18.515 | DEBUG    | pycorrector.detector:_initialize_detector:89 - Loaded language model: /root/.pycorrector/datasets/zh_giga.no_cna_cmn.prune01244.klm
复制代码
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

宝塔山

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表