tomcat安装solr-8.11.2

打印 上一主题 下一主题

主题 918|帖子 918|积分 2754

tomcat安装solr-8.11.2

下载solr
  1. # 解压
  2. tar -xzf solr-8.11.2.tgz
  3. # 制作war包
  4. cd solr-8.11.2/server/solr-webapp/webapp/
  5. jar cvf solr.war ./*
  6. # 将制作的war包复制到tomcat的webapps目录下
  7. cp solr.war /tmp/apache-tomcat-9.0.75/webapps/
  8. # 启动tomcat自动解压solr.war
  9. cd /tmp/apache-tomcat-9.0.75/bin/
  10. ./startup.sh
  11. # 修改web.xml配置
  12. cd webapps/solr/WEB-INF/
复制代码
配置你的solrhome目录
  1. <env-entry>   
  2.   <env-entry-name>solr/home</env-entry-name>
  3.    
  4.     <env-entry-value>/tmp/solrhome</env-entry-value>   
  5.    <env-entry-type>java.lang.String</env-entry-type>  
  6. </env-entry>
复制代码
创建solrhome目录
  1. cd /tmp/
  2. mkdir -p solrhome
复制代码
拷贝配置文件及依赖jar
  1. cd solr-8.11.2/server/solr/
  2. cp solr.xml zoo.cfg /tmp/solrhome/
  3. cd /tmp/solr-8.11.2/server/lib
  4. cp metrics-* /tmp/apache-tomcat-9.0.75/webapps/solr/WEB-INF/lib/
  5. cd /tmp/solr-8.11.2/server/lib/ext/
  6. cp * /tmp/apache-tomcat-9.0.75/webapps/solr/WEB-INF/lib/
  7. cd /tmp/solr-8.11.2/dist/
  8. cp solr-dataimporthandler-* /tmp/apache-tomcat-9.0.75/webapps/solr/WEB-INF/lib/
  9. cd /tmp/apache-tomcat-9.0.75/webapps/solr/WEB-INF/
  10. mkdir classes
  11. cd /tmp/solr-8.11.2/server/resources/
  12. cp log4j2* /tmp/apache-tomcat-9.0.75/webapps/solr/WEB-INF/classes/
复制代码
重新启动tomcat
  1. cd /tmp/apache-tomcat-9.0.75/bin/
  2. ./shutdown.sh
  3. ./startup.sh
复制代码
创建solrCore
在Solr中、每一个Core、代表一个索引库、里面包含索引数据及其配置信息。
Solr中可以拥有多个Core、也就是可以同时管理多个索引库、就像mysql中可以有多个数据库一样。
所以SolrCore可以理解成MySQL中的数据库;
  1. cd /tmp/solrhome/mkdir -p collectionl/datamkdir -p collectionl/confcd collectionl/touch core.propertiescd /tmp/solr-8.11.2/example/example-DIH/solr/solr/cp -r conf/* /tmp/solrhome/collectionl/conf/# 重新启动tomcatcd /tmp/apache-tomcat-9.0.75/bin/
  2. ./shutdown.sh
  3. ./startup.sh
复制代码
安装配置中文分词器

ik

自己构建
  1. # 项目地址
  2. https://github.com/magese/ik-analyzer-solr
  3. # 阿里云盘jar文件地址
  4. https://www.aliyundrive.com/s/4o2Tn4gdx99
复制代码

  • 将jar包放入Solr服务的Jetty(server/solr-webapp/webapp/WEB-INF/lib)或Tomcat的webapp/WEB-INF/lib/目录下;
  • 将resources目录下的5个配置文件放入solr服务的Jetty(server/solr-webapp/webapp/WEB-INF/lib)或Tomcat的webapp/WEB-INF/classes/目录下;
  1. ① IKAnalyzer.cfg.xml
  2. ② ext.dic
  3. ③ stopword.dic
  4. ④ ik.conf
  5. ⑤ dynamicdic.txt
复制代码

  • 配置Solr的/tmp/solrhome/collectionl/conf/managed-schema,添加ik分词器,示例如下;
  1. <fieldType name="text_ik" >
  2.   <analyzer type="index">
  3.       <tokenizer  useSmart="false" conf="ik.conf"/>
  4.       <filter />
  5.   </analyzer>
  6.   <analyzer type="query">
  7.       <tokenizer  useSmart="true" conf="ik.conf"/>
  8.       <filter />
  9.   </analyzer>
  10. </fieldType>
复制代码
IKAnalyzer.cfg.xml配置文件说明:
  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
  3. <properties>
  4.     <comment>IK Analyzer 扩展配置</comment>
  5.         
  6.         <entry key="use_main_dict">true</entry>
  7.    
  8.     <entry key="ext_dict">ext.dic;</entry>
  9.    
  10.     <entry key="ext_stopwords">stopword.dic;</entry>
  11. </properties>
复制代码
名称类型描述默认use_main_dictboolean是否使用默认主词典trueext_dictString扩展词典文件名称,多个用分号隔开ext.dic;ext_stopwordsString停用词典文件名称,多个用分号隔开stopword.dic;

  • ik.conf文件说明:files=dynamicdic.txt lastupdate=0

    • files为动态词典列表,可以设置多个词典表,用逗号进行分隔,默认动态词典表为dynamicdic.txt;
    • lastupdate默认值为0,每次对动态词典表修改后请+1,不然不会将词典表中新的词语添加到内存中。lastUpdate改为long类型,现可以用时间戳了。

  • dynamicdic.txt 为动态词典在此文件配置的词语不需重启服务即可加载进内存中。 以#开头的词语视为注释,将不会加载到内存中。
hanlp
  1. #hanlp
  2. https://github.com/hankcs/HanLP
  3. #下载词典
  4. http:/nlp.hankcs.com/download.php?file=data
  5. #下载hanlpl的jar包和配置文件
  6. http:/nlp.nankcs.com/download.ohp?file=jar
  7. #下载handlp整合lucene的jar包
  8. https:/github.com/hankcs/.hanlp-lucene-plugin
复制代码


  • 将hanlp-1.8.4.jar和hanlp-lucene-plugin-1.1.6.jar包放入Solr服务的Jetty(server/solr-webapp/webapp/WEB-INF/lib)或Tomcat的webapp/WEB-INF/lib/目录下;
  • 将hanlp.properties配置文件放入solr服务的Jetty(server/solr-webapp/webapp/WEB-INF/lib)或Tomcat的webapp/WEB-INF/classes/目录下;
  • 将词典data-for-1.7.5上传到/tmp目录下
  • 修改hanlp.properties,配置词典目录


  • 配置Solr的/tmp/solrhome/collectionl/conf/managed-schema,添加hanlp分词器,示例如下;
  1. <fieldType name="text_ik" >
  2.   <analyzer type="index">
  3.       <tokenizer  useSmart="false" conf="ik.conf"/>
  4.       <filter />
  5.   </analyzer>
  6.   <analyzer type="query">
  7.       <tokenizer  useSmart="true" conf="ik.conf"/>
  8.       <filter />
  9.   </analyzer>
  10. </fieldType>                        
复制代码
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

老婆出轨

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表