ToB企服应用市场:ToB评测及商务社交产业平台
标题:
tomcat安装solr-8.11.2
[打印本页]
作者:
老婆出轨
时间:
2023-7-10 10:54
标题:
tomcat安装solr-8.11.2
tomcat安装solr-8.11.2
下载solr
# 解压
tar -xzf solr-8.11.2.tgz
# 制作war包
cd solr-8.11.2/server/solr-webapp/webapp/
jar cvf solr.war ./*
# 将制作的war包复制到tomcat的webapps目录下
cp solr.war /tmp/apache-tomcat-9.0.75/webapps/
# 启动tomcat自动解压solr.war
cd /tmp/apache-tomcat-9.0.75/bin/
./startup.sh
# 修改web.xml配置
cd webapps/solr/WEB-INF/
复制代码
配置你的solrhome目录
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/tmp/solrhome</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
复制代码
创建solrhome目录
cd /tmp/
mkdir -p solrhome
复制代码
拷贝配置文件及依赖jar
cd solr-8.11.2/server/solr/
cp solr.xml zoo.cfg /tmp/solrhome/
cd /tmp/solr-8.11.2/server/lib
cp metrics-* /tmp/apache-tomcat-9.0.75/webapps/solr/WEB-INF/lib/
cd /tmp/solr-8.11.2/server/lib/ext/
cp * /tmp/apache-tomcat-9.0.75/webapps/solr/WEB-INF/lib/
cd /tmp/solr-8.11.2/dist/
cp solr-dataimporthandler-* /tmp/apache-tomcat-9.0.75/webapps/solr/WEB-INF/lib/
cd /tmp/apache-tomcat-9.0.75/webapps/solr/WEB-INF/
mkdir classes
cd /tmp/solr-8.11.2/server/resources/
cp log4j2* /tmp/apache-tomcat-9.0.75/webapps/solr/WEB-INF/classes/
复制代码
重新启动tomcat
cd /tmp/apache-tomcat-9.0.75/bin/
./shutdown.sh
./startup.sh
复制代码
创建solrCore
在Solr中、每一个Core、代表一个索引库、里面包含索引数据及其配置信息。
Solr中可以拥有多个Core、也就是可以同时管理多个索引库、就像mysql中可以有多个数据库一样。
所以SolrCore可以理解成MySQL中的数据库;
cd /tmp/solrhome/mkdir -p collectionl/datamkdir -p collectionl/confcd collectionl/touch core.propertiescd /tmp/solr-8.11.2/example/example-DIH/solr/solr/cp -r conf/* /tmp/solrhome/collectionl/conf/# 重新启动tomcatcd /tmp/apache-tomcat-9.0.75/bin/
./shutdown.sh
./startup.sh
复制代码
安装配置中文分词器
ik
自己构建
# 项目地址
https://github.com/magese/ik-analyzer-solr
# 阿里云盘jar文件地址
https://www.aliyundrive.com/s/4o2Tn4gdx99
复制代码
将jar包放入Solr服务的Jetty(server/solr-webapp/webapp/WEB-INF/lib)或Tomcat的webapp/WEB-INF/lib/目录下;
将resources目录下的5个配置文件放入solr服务的Jetty(server/solr-webapp/webapp/WEB-INF/lib)或Tomcat的webapp/WEB-INF/classes/目录下;
① IKAnalyzer.cfg.xml
② ext.dic
③ stopword.dic
④ ik.conf
⑤ dynamicdic.txt
复制代码
配置Solr的/tmp/solrhome/collectionl/conf/managed-schema,添加ik分词器,示例如下;
<fieldType name="text_ik" >
<analyzer type="index">
<tokenizer useSmart="false" conf="ik.conf"/>
<filter />
</analyzer>
<analyzer type="query">
<tokenizer useSmart="true" conf="ik.conf"/>
<filter />
</analyzer>
</fieldType>
复制代码
IKAnalyzer.cfg.xml配置文件说明:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<entry key="use_main_dict">true</entry>
<entry key="ext_dict">ext.dic;</entry>
<entry key="ext_stopwords">stopword.dic;</entry>
</properties>
复制代码
名称类型描述默认use_main_dictboolean是否使用默认主词典trueext_dictString扩展词典文件名称,多个用分号隔开ext.dic;ext_stopwordsString停用词典文件名称,多个用分号隔开stopword.dic;
ik.conf文件说明:files=dynamicdic.txt lastupdate=0
files为动态词典列表,可以设置多个词典表,用逗号进行分隔,默认动态词典表为dynamicdic.txt;
lastupdate默认值为0,每次对动态词典表修改后请+1,不然不会将词典表中新的词语添加到内存中。lastUpdate改为long类型,现可以用时间戳了。
dynamicdic.txt 为动态词典在此文件配置的词语不需重启服务即可加载进内存中。 以#开头的词语视为注释,将不会加载到内存中。
hanlp
#hanlp
https://github.com/hankcs/HanLP
#下载词典
http:/nlp.hankcs.com/download.php?file=data
#下载hanlpl的jar包和配置文件
http:/nlp.nankcs.com/download.ohp?file=jar
#下载handlp整合lucene的jar包
https:/github.com/hankcs/.hanlp-lucene-plugin
复制代码
将hanlp-1.8.4.jar和hanlp-lucene-plugin-1.1.6.jar包放入Solr服务的Jetty(server/solr-webapp/webapp/WEB-INF/lib)或Tomcat的webapp/WEB-INF/lib/目录下;
将hanlp.properties配置文件放入solr服务的Jetty(server/solr-webapp/webapp/WEB-INF/lib)或Tomcat的webapp/WEB-INF/classes/目录下;
将词典data-for-1.7.5上传到/tmp目录下
修改hanlp.properties,配置词典目录
配置Solr的/tmp/solrhome/collectionl/conf/managed-schema,添加hanlp分词器,示例如下;
<fieldType name="text_ik" >
<analyzer type="index">
<tokenizer useSmart="false" conf="ik.conf"/>
<filter />
</analyzer>
<analyzer type="query">
<tokenizer useSmart="true" conf="ik.conf"/>
<filter />
</analyzer>
</fieldType>
复制代码
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/)
Powered by Discuz! X3.4