Elasticsearch名词表明

打印 上一主题 下一主题

主题 822|帖子 822|积分 2466

基于Elasticsearch-7.15.1,必要安装jdk8 或者jdk11支持
1.什么是Elasticsearch?

一个开源的分布式搜索引擎,通过Restful方式进行交互的近实时搜索平台框架,可以用来实现搜索、日记统计、分析、体系监控等功能,
2.什么是elastic stack(ELK)?

是以elasticsearch为焦点的技能栈,包罗(beats,(L)Logstash)数据抓取,((K)kibana)数据可视化,((E)elasticsearch)存储、计算、搜索数据
3.什么是Lucene?

java语言的搜索引擎类库,提供了搜索引擎的焦点API,elasticsearch就是基于Lucene开发的
4.什么是文档(document)?

每一条数据就是文档,相当于mysql中的一条记录,但是ES中的文档是json格式的,文档中的字段成为Field,相当于mysql中的列Column
5.什么是词条(term)?

对文档中的内容进行分词,得到的词语就是词条
6.什么是正向索引?

基于文档id创建索引,查询词条的时候先找到文档,后判断文档是否包罗词条
7.什么是倒排索引?

对文档的内容进行分词,对词条创建索引,查询时根据词条查询文档id,而后得到文档
8.ES中的索引(index)

相同范例的文档(json格式)集合,相当于mysql中的表(相同数据的集合)
9.映射(Mapping)

ES索引中文档的约束
10.DSL

DSL是elasticsearch提供的json风格的请求语句,就是操作ES,实现增删改查,相当于mysql中的sql语句
11.elastcisearch与mysql的关系(读写分离)

数据库负责事务范例的操作,可以确保数据的原子性、一致性、隔离性、持久性
擅长海量数据的搜索、分析、计算(针对业务量大、搜索需求比力复杂)
12.Elasticsearch目次介绍

bin/elasticsearch.bat:启动文件
config/log4j2:日记配置文件
config/jvm.options:假造机相关的配置
config/elasticsearch.yml:ES的配置文件!默认端口!跨域!
lib:相关jar包
logs:日记目次
modules:功能模块目次
data:数据目次
plugins:插件目次
13.ES默认的两个端口

9200:客户端使用
9300:集群内部通信
14.怎样解决ES跨域问题

找到config/elasticsearch.yml文件
http.cors.enabled: true
http.cors.allow-origin: “*”# 也可以指定详细的允许来源
15.Kibana默认端口和启动文件

5601
bin/kibana.bat
默认会指向9200从而操作ES
16.Kibana汉化

x-pack/plugins/translations/translations/zh-CN.json
修改:config/kibana.yml --> i18n.locale: “zh-CN”
17.什么是IK分词器?

把一个一个中文划分成一个一个的关键字,如果使用中文,发起使用IK分词器,下载ik分词器之后,在ES的plugins目次解压放入ik目次,重启即可
在bin目次下打开命令行,实行elasticsearch-plugin list可以查看加载进来的插件
18.IK分词器的两种分词算法

ik_smart:最少切分,粗粒度
ik_max_word:最细粒度切分
19.IK分词器扩展词条,停用词条

当词典没有本身必要的词的时候就可以本身添加词语,例如"白嫖"
进入IK分词器的config/IKAnalyzer.cfg.xml文件更改配置
  my.dic
  mystop.dic
my.dic、mystop.dic就是本身在config目次下新建的词条文件
20.ES的默认分词器

standard分词器:默认的分词规则对中文处理处罚并不友爱

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

河曲智叟

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表