Python:使用pycorrector处置惩罚错字、纠正

[复制链接]
发表于 2024-9-16 06:54:23 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
简介:pycorrector是一个开源的中文文本纠错工具。支持中文音似、形似、语法错误纠正,python3开发。pycorrector实现了Kenlm、ConvSeq2Seq、BERT、MacBERT、ELECTRA、ERNIE、Transformer等多种模子的文本纠错,并在SigHAN数据集评估各模子的效果。
项目开源地址:
  1. https://github.com/shibing624/pycorrector
复制代码
安装:
  1. pip install -U pycorrector
复制代码
案例1:文本纠错
  1. # -*- coding: utf-8 -*-
  2. # time: 2023/02/18 11:26
  3. # file: demo1.py
  4. # 公众号: 伤心的辣条
  5. import pycorrector
  6. message = "机七学习是人工智能领遇最能体现智能的一个分知"
  7. corrected_sent, detail = pycorrector.message(mes)
  8. print(corrected_sent, detail)
复制代码
运行效果:
  1. (base) [root@ci4vyvxi572ysx2s write]# python demo1.py
  2. 2023-02-18 11:53:18.515 | DEBUG    | pycorrector.detector:_initialize_detector:89 - Loaded language model: /root/.pycorrector/datasets/zh_giga.no_cna_cmn.prune01244.klm
复制代码
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
继续阅读请点击广告
回复

使用道具 举报

快速回复 返回顶部 返回列表