论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
软件与程序人生
›
后端开发
›
Java
›
tomcat安装solr-8.11.2
tomcat安装solr-8.11.2
老婆出轨
金牌会员
|
2023-7-10 10:54:15
|
显示全部楼层
|
阅读模式
楼主
主题
918
|
帖子
918
|
积分
2754
tomcat安装solr-8.11.2
下载solr
# 解压
tar -xzf solr-8.11.2.tgz
# 制作war包
cd solr-8.11.2/server/solr-webapp/webapp/
jar cvf solr.war ./*
# 将制作的war包复制到tomcat的webapps目录下
cp solr.war /tmp/apache-tomcat-9.0.75/webapps/
# 启动tomcat自动解压solr.war
cd /tmp/apache-tomcat-9.0.75/bin/
./startup.sh
# 修改web.xml配置
cd webapps/solr/WEB-INF/
复制代码
配置你的solrhome目录
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/tmp/solrhome</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
复制代码
创建solrhome目录
cd /tmp/
mkdir -p solrhome
复制代码
拷贝配置文件及依赖jar
cd solr-8.11.2/server/solr/
cp solr.xml zoo.cfg /tmp/solrhome/
cd /tmp/solr-8.11.2/server/lib
cp metrics-* /tmp/apache-tomcat-9.0.75/webapps/solr/WEB-INF/lib/
cd /tmp/solr-8.11.2/server/lib/ext/
cp * /tmp/apache-tomcat-9.0.75/webapps/solr/WEB-INF/lib/
cd /tmp/solr-8.11.2/dist/
cp solr-dataimporthandler-* /tmp/apache-tomcat-9.0.75/webapps/solr/WEB-INF/lib/
cd /tmp/apache-tomcat-9.0.75/webapps/solr/WEB-INF/
mkdir classes
cd /tmp/solr-8.11.2/server/resources/
cp log4j2* /tmp/apache-tomcat-9.0.75/webapps/solr/WEB-INF/classes/
复制代码
重新启动tomcat
cd /tmp/apache-tomcat-9.0.75/bin/
./shutdown.sh
./startup.sh
复制代码
创建solrCore
在Solr中、每一个Core、代表一个索引库、里面包含索引数据及其配置信息。
Solr中可以拥有多个Core、也就是可以同时管理多个索引库、就像mysql中可以有多个数据库一样。
所以SolrCore可以理解成MySQL中的数据库;
cd /tmp/solrhome/mkdir -p collectionl/datamkdir -p collectionl/confcd collectionl/touch core.propertiescd /tmp/solr-8.11.2/example/example-DIH/solr/solr/cp -r conf/* /tmp/solrhome/collectionl/conf/# 重新启动tomcatcd /tmp/apache-tomcat-9.0.75/bin/
./shutdown.sh
./startup.sh
复制代码
安装配置中文分词器
ik
自己构建
# 项目地址
https://github.com/magese/ik-analyzer-solr
# 阿里云盘jar文件地址
https://www.aliyundrive.com/s/4o2Tn4gdx99
复制代码
将jar包放入Solr服务的Jetty(server/solr-webapp/webapp/WEB-INF/lib)或Tomcat的webapp/WEB-INF/lib/目录下;
将resources目录下的5个配置文件放入solr服务的Jetty(server/solr-webapp/webapp/WEB-INF/lib)或Tomcat的webapp/WEB-INF/classes/目录下;
① IKAnalyzer.cfg.xml
② ext.dic
③ stopword.dic
④ ik.conf
⑤ dynamicdic.txt
复制代码
配置Solr的/tmp/solrhome/collectionl/conf/managed-schema,添加ik分词器,示例如下;
<fieldType name="text_ik" >
<analyzer type="index">
<tokenizer useSmart="false" conf="ik.conf"/>
<filter />
</analyzer>
<analyzer type="query">
<tokenizer useSmart="true" conf="ik.conf"/>
<filter />
</analyzer>
</fieldType>
复制代码
IKAnalyzer.cfg.xml配置文件说明:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<entry key="use_main_dict">true</entry>
<entry key="ext_dict">ext.dic;</entry>
<entry key="ext_stopwords">stopword.dic;</entry>
</properties>
复制代码
名称类型描述默认use_main_dictboolean是否使用默认主词典trueext_dictString扩展词典文件名称,多个用分号隔开ext.dic;ext_stopwordsString停用词典文件名称,多个用分号隔开stopword.dic;
ik.conf文件说明:files=dynamicdic.txt lastupdate=0
files为动态词典列表,可以设置多个词典表,用逗号进行分隔,默认动态词典表为dynamicdic.txt;
lastupdate默认值为0,每次对动态词典表修改后请+1,不然不会将词典表中新的词语添加到内存中。lastUpdate改为long类型,现可以用时间戳了。
dynamicdic.txt 为动态词典在此文件配置的词语不需重启服务即可加载进内存中。 以#开头的词语视为注释,将不会加载到内存中。
hanlp
#hanlp
https://github.com/hankcs/HanLP
#下载词典
http:/nlp.hankcs.com/download.php?file=data
#下载hanlpl的jar包和配置文件
http:/nlp.nankcs.com/download.ohp?file=jar
#下载handlp整合lucene的jar包
https:/github.com/hankcs/.hanlp-lucene-plugin
复制代码
将hanlp-1.8.4.jar和hanlp-lucene-plugin-1.1.6.jar包放入Solr服务的Jetty(server/solr-webapp/webapp/WEB-INF/lib)或Tomcat的webapp/WEB-INF/lib/目录下;
将hanlp.properties配置文件放入solr服务的Jetty(server/solr-webapp/webapp/WEB-INF/lib)或Tomcat的webapp/WEB-INF/classes/目录下;
将词典data-for-1.7.5上传到/tmp目录下
修改hanlp.properties,配置词典目录
配置Solr的/tmp/solrhome/collectionl/conf/managed-schema,添加hanlp分词器,示例如下;
<fieldType name="text_ik" >
<analyzer type="index">
<tokenizer useSmart="false" conf="ik.conf"/>
<filter />
</analyzer>
<analyzer type="query">
<tokenizer useSmart="true" conf="ik.conf"/>
<filter />
</analyzer>
</fieldType>
复制代码
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
老婆出轨
金牌会员
这个人很懒什么都没写!
楼主热帖
【Linux学习】网络基础 和 SOCKET套接 ...
1000套安卓(Android)毕业设计(带论 ...
在工作中离屏真的不重要吗,代码优化就 ...
设计模式必知必会系列终章
牛客SQL刷题第三趴——SQL大厂面试真题 ...
Git + Jenkins 自动化 NGINX 发布简易 ...
MySQL完整版详解
SRC基础抓包
记一次线上问题 → Deadlock 的分析与 ...
亚马逊云科技Build On-Amazon Neptune ...
标签云
存储
服务器
浏览过的版块
数据仓库与分析
快速回复
返回顶部
返回列表