IKAnalyzer分词组件

写过一篇 · 2024-12-28 04:52:30

IKAnalyzer是一个功能强盛、易于使用、性能优异的中文分词工具包，适用于各种需要进行中文分词的场景，如搜刮引擎、自然语言处置惩罚、文本挖掘等。
Springboot如何集成IKAnalyzer分词组件

引入IKAnalyzer分词组件包

复制代码

IkAnalyzer配置

复制代码

自定义IkAnalyzerService

package com.example.demo.service;
import lombok.extern.slf4j.Slf4j;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.springframework.stereotype.Service;
import javax.annotation.Resource;
import java.io.IOException;
import java.io.StringReader;
import java.util.ArrayList;
import java.util.List;
@Slf4j
@Service
public class IkAnalyzerService {
@Resource
private Analyzer analyzer;
public List<String> textHandler(String text) {
List<String> result = new ArrayList<>();
// 将文本转换为Reader对象
StringReader reader = new StringReader(text);
try {
// 获取TokenStream对象
TokenStream tokenStream = analyzer.tokenStream("content", reader);
// 获取CharTermAttribute对象，用于获取分词结果
CharTermAttribute charTermAttr = tokenStream.addAttribute(CharTermAttribute.class);
// 重置TokenStream，准备读取分词结果
tokenStream.reset();
// 循环读取分词结果
while (tokenStream.incrementToken()) {
result.add(charTermAttr.toString());
}
tokenStream.close();
} catch (IOException e) {
log.error("IkAnalyzerService.textHandler() IOException:{}", e.getMessage(), e);
}
return result;
}
}

复制代码

验证

测试代码

复制代码

运行结果

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

0 个回复