java 开源中文的繁简体转换 opencc4j-02-一个汉字竟然对应两个 char? ...

打印 上一主题 下一主题

主题 1935|帖子 1935|积分 5805

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
Opencc4j

Opencc4j 支持中文繁简体转换,考虑到词组级别。
开源中文的繁简体转换 opencc4j-01-利用入门概览
开源中文的繁简体转换 opencc4j-02-一个汉字竟然对应两个 char?
开源中文的繁简体转换 opencc4j-03-简体照旧繁体,你说了算!
开源中文的繁简体转换 opencc4j-04-香港繁简体的支持
开源中文的繁简体转换 opencc4j-05-日文转换支持
Features 特点


  • 严格区分「一简对多繁」和「一简对多异」。
  • 完全兼容异体字,可以实现动态替换。
  • 严格审校一简对多繁词条,原则为「能分则不合」。
  • 词库和函数库完全分离,可以自由修改、导入、扩展。
  • 兼容 Windows、Linux、Mac 平台。
  • 支持自定义分词
  • 支持判断单个字(词)是否为简体/繁体
  • 支持返回字符串中简体/繁体的列表信息
  • 支持中国台湾、香港地区繁简体转换
  • 支持与日文字的转换
从一个 bug 提及

很久很久从前,收到了一个用户的 issue 部分生僻字转小写之后会得到一个乱码(不可见字符)
内容如下:
[code]比方“嘪球”在转换之后得到“
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

我可以不吃啊

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表