1. 了解Solr
Solr是一个独立的企业级搜索应用服务器,对外提供API接口。用户可以通过HTTP请求向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过HTTP GET操作提出查找请求, 并得到XML格式的返回结果。Solr现在支持多种返回结果。
2. 安装配置Solr
2.1Solr安装
(1)访问镜像网站,下载Solr压缩包。
(2)在下载完成后解压文件,在“cmd"控制台进入"solr/bin”目录下,输入"solr start" 命令启动Solr。
如果出现以下提示,则表示成功启动。
Waiting up to 30 to see Solr running on port 8983
Started Solr server on port 8983. Happy searching!
(3)访问 http://localhost:8983/solr 就可以看到已经启动了。
常用命令如下。
- 停止:"solr stop -p 8983" 或 "solr stop - all"。
- 查看运行状态:solr status
2.2 Solr配置
(1)进入Solr 的安装目录下的server/solr/,创建一个名字为new_core的文件夹。
(2)将 conf 目录(在安装目录/server/solr/configsets/sample_techproducts_configs 下) 复制到new_core目录下。
(3)访问 "http://localhost:8983/solr/#/"
单击导航栏的“Core Admin”,在弹出窗口中单击“Add Core"命令,弹出如图13-8所示的对话框,输入名字和目录名,再单击“Add Core”按钮,完成创建。
图 13-8
3. 整合 Spring Boot 和 Solr
(1)添加依赖,见以下代码:
- <dependency>
- <groupId>org.springframework.boot</groupId>
- <artifactId>spring-boot-starter-data-solr</artifactId>
- </dependency>
复制代码 (2)写入Solr配置
- spring:
- data:
- solr:
- host: http://localhost:8983/solr/new_core
复制代码 实例:
1.创建 User 类
User类必须继承可序列化接口,见以下代码:- package com.intehel.demo.domain;
- import lombok.Data;
- import org.apache.solr.client.solrj.beans.Field;
- import java.io.Serializable;
- @Data
- public class User implements Serializable {
- @Field("id")
- private String id;
- @Field("name")
- private String name;
- }
复制代码 2. 测试增加、删除、修改和查询功能
(1)测试増加功能
- @RequestMapping("/addUser")
- public String addUser() throws IOException, SolrServerException {
- User user = new User();
- user.setId("155371");
- user.setName("鸡蛋火腿饼");
- solrClient.addBean(user);
- UpdateResponse commit = solrClient.commit();
- return commit.toString();
- }
复制代码 (2)测试増加功能,根据id查询刚刚添加的内容,见以下代码:
- @RequestMapping("/getByIdFromSolr/{id}")
- public String getByIdFromSolr(@PathVariable String id) throws IOException, SolrServerException {
- //根据id查询内容
- SolrDocument solrDocument = solrClient.getById(id);
- //获取filedname
- Collection<String> filedname = solrDocument.getFieldNames();
- Map<String, Object> filedValueMap = solrDocument.getFieldValueMap();
- List<SolrDocument> childDocuments = solrDocument.getChildDocuments();
- String result = solrDocument.toString();
- return result;
- }
复制代码 (3)测试修改功能,根据id修改内容,见以下代码:
- @RequestMapping("/updateUser")
- public String updateUser() throws IOException, SolrServerException {
- User user = new User();
- user.setId("155371");
- user.setName("烤冷面");
- solrClient.addBean(user);
- UpdateResponse commit = solrClient.commit();
- return commit.toString();
- }
复制代码 所谓Solr的更新操作,就是对相同id的文档重新添加一次。修改之后,Version变得不一样了。
(4)测试删除功能,根据id删除内容,见以下代码:
- @RequestMapping("/deleteUser")
- public String deleteUser() throws IOException, SolrServerException {
- UpdateResponse updateResponse = solrClient.deleteById("155371");
- long elapsedTime = updateResponse.getElapsedTime();
- int qTime = updateResponse.getQTime();
- //请求地址
- String requestUrl = updateResponse.getRequestUrl();
- //请求的结果
- NamedList<Object> response = updateResponse.getResponseHeader();
- //请求的状态
- solrClient.commit();
- int status = updateResponse.getStatus();
- //成功,则返回0,如果没有文档被删除也会返回0,代表根本没有
- return String.valueOf(status);
- }
复制代码 (5)实现文档高亮显示,见以下代码:
- @RequestMapping("/queryAll")
- public String queryAll() throws IOException, SolrServerException {
- SolrQuery solrQuery = new SolrQuery();
- //设置默认搜索域
- solrQuery.setQuery("*.*");
- solrQuery.set("q","知然");
- solrQuery.add("q", "知然");
- //设置返回结果的排序规则
- solrQuery.setSort("id",SolrQuery.ORDER.asc);
- //设置查询的条数
- solrQuery.setRows(50);
- //设置查询的开始
- solrQuery.setStart(0);
- //设置分页参数
- solrQuery.setStart(0);
- solrQuery.setRows(20);
- //设置高亮
- solrQuery.setHighlight(true);
- //设置高亮的字段
- solrQuery.addHighlightField("name");
- //设置高亮的样式
- solrQuery.setHighlightSimplePre("<font color='red'>");
- solrQuery.setHighlightSimplePost("</font>");
- System.out.println(solrQuery);
- QueryResponse queryResponse = solrClient.query(solrQuery);
- Map<String, Map<String, List<String>>> highlightMap = queryResponse.getHighlighting();
- SolrDocumentList documents = queryResponse.getResults();
- long numFound = documents.getNumFound();
- System.out.println("查询到的文档数量"+numFound);
- for (SolrDocument document : documents) {
- System.out.println(document);
- System.out.println(document.get("name"));
- }
- System.out.println(highlightMap);
- return "true";
- }
复制代码 对比Elasticsearch和Solr:
(1)Solr的优点。
- Solr有一个更大、更成熟的用户、开发和页献者社区。
- 支持添加多种格式的索引,如:HTML、PDF、微软Office系列软件格式,以及JSON、 XML、CSV等纯文本格式。
- 比较成熟、稳定。
- 搜索速度更快(不建索引时)。
- Solr利用Zookeeper进行分布式管理,而Elasticsearch自身带有分布式协调管理功能。 如果项目本身使用了 Zookeeper,那Solr可能是最好选择。有时缺点在特点场景下可能会变成优点。
- 如果项目后期升级,要朝着Hadoop这块发展,当数据量较大时,用Hadoop处理数据, Solr可以很方便地与Hadoop结合。
(2)Elasticsearch 的优点。
- Elasticsearch本身是分布式、分发实时的,不需要其他组件。
- Elasticsearch完全支持Apache Lucene的接近实时的搜索。
- 它处理多用户不需要特殊配置,而Solr则需要更多的高级设置。
- Elasticsearch采用Gateway的槪念,备份更加简单。各节点组成对等的网络结构,某节点出现故障会自动分配其他节点代替其进行工作。
(3)Solr的缺点。
- 建立索引时,搜索效率下降,实时索引搜索效率不高。
- 实时搜索应用效率明显低于Elasticsearch.
(4)Elasticsearch 的缺点。
- 没有Solr的生态系统发达。
- 仅支持JSON文件格式。
- 本身更注重核心功能,高级功能多由第三方插件提供。
总结:Solr是传统搜索应用的有力解决方案,但Elasticsearch更适用于新兴的实时搜索应用。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |