数据仓库与分析es 笔记二之基础查询

南七星之家 发表于 2023-5-20 05:13:18

es 笔记二之基础查询

本文首发于公众号：Hunter后端
原文链接：es笔记二之基础查询
这一篇笔记介绍 es 的基础查询。
基础查询包括很多，比如排序，类似数据库 limit 的操作，like 操作，与或非等，对于这些操作，我会在介绍他们的用法之后加上对应的数据库 sql 便于理解。
注意：下面的操作都在 kibana 中实现
以下是本篇文章目录：

[*]全量查询
[*]返回数据排序
[*]限制返回条数
[*]指定字段搜索
[*]多条件查询
[*]大小于过滤
1、全量查询

如果是想要查看 es 中都有哪些 index，可以如下操作：
GET /_cat/indices然后可以看到在右侧会输出所有的 index，其中就包含我们上一篇笔记导入的 bank 数据，接下来我们使用 bank 作为查询示例。
如果我们想查看 bank 中的全部数据，可以如下操作，但是不指定 size 参数的话默认最多只返回 10 条数据：
GET /bank/_search出来的结果大致如下：
{
"took" : 2,
"timed_out" : false,
"_shards" : {
"total" : 1,
"successful" : 1,
"skipped" : 0,
"failed" : 0
},
"hits" : {
"total" : {
   "value" : 1000,
   "relation" : "eq"
},
"max_score" : 1.0,
"hits" : [
   {
   "_index" : "bank",
   "_type" : "_doc",
   "_id" : "1",
   "_score" : 1.0,
   "_source" : {
      "account_number" : 1,
      "balance" : 39225,
      "firstname" : "Amber",
      "lastname" : "Duke",
      "age" : 32,
      "gender" : "M",
      "address" : "880 Holmes Lane",
      "employer" : "Pyrami",
      "email" : "amberduke@pyrami.com",
      "city" : "Brogan",
      "state" : "IL"
   }
   },
   ...
]
}
}took 表示查询花费了多少时间，以毫秒为单位
time_out 表示查询是否超时
_shards 表示分片的查询信息，表示有多少个分片被查询，失败，和跳过
然后查询的结果都被放在 hits 字段下，在 hits 信息中，
hits.total 表示查询到了多少匹配的数据
hits.hits 是一个数组，包含了返回信息的全部内容，每个元素都是单个查询的返回结果。
在每个元素中，_index，_type，_id，_score 表示单条数据的所属的数据库信息
_source 其中包含了获取信息的字段信息，如果没有指定字段，则返回该数据所有字段。
2、返回数据排序

查询出的数据如果想要以某种顺序返回，可以使用 sort 来排序
比如说根据 balance 倒序排序
GET /bank/_search
{
"sort": [
{"balance": {"order": "desc"}}
]
}这条数据对应于 sql 中的语法就是：
order by balance descsort 后接一个数组，表示可以根据多个字段进行正序，逆序的排序方式。
3、限制返回条数

在前面的搜索中可以看出，如果不限定返回条数，系统会默认返回 10 条数据，在 es 中有类似于 MySQL 的 limit 和 offset 的操作，那就是 size 和 from。
from 表示从第 n 个开始获取数据，从 0 开始取值
size 表示获取数据量的大小。
比如说从第0条数据开始，获取5条数据，可以如下操作：
GET /bank/_search
{
"sort": [
{"balance": {"order": "asc"}}
],
"from": 0,
"size": 5
}对应于 sql 语法是：
limit 5 offset 0;4、指定字段搜索

关于字段搜索，有几个关键字，match，match_phrase等。
match 表示模糊搜索，会将搜索的内容先进行分词操作，然后搜索，比如我们搜索 bank 这个 index 中 address 字段中包含 "cove" 或者包含 "lane" 的的数据，我们可以如下操作：
GET /bank/_search
{
"query": {
"match": {"address": "Cove Lane"}
}
}这条语句类似于 sql 中的：
where address like "%cove%" or address like "%lane%"只要 address 的字符包含 cove 或者 lane 之一即可。
而如果我们想要实现 cove lane 作为一个整体进行查询，我们可以使用 match_phrase 来实现：
GET /bank/_search
{
"query": {
"match_phrase": {"address": "Cove Lane"}
}
}这个操作类似于 sql 中的：
where address like "%mill lane%"上面这些 match 操作都是大小写不敏感的。
关于 match 和 match_phrase 的筛选方式这里只做一个示例，在后面我会单开一篇笔记详细介绍其用法，针对 text 类型和 keyword 类型的字段。
5、多条件查询

多条件，就是与或非连接操作，类似于 sql 中的 and、or、not，对应在 es 中就是 must，should，must_not
在 es 中，每个连接操作都是一个数组，用于连接多个条件操作，示例如下：
GET /bank/_search
{
"query": {
"bool": {
   "should": [
   {"match": {"age": 24}},
   {"match": {"age": 25}}
   ],
   "must_not": [
   {"match": {"gender": "M"}}
   ]
}
}
}可以看到，与或非的操作我们是在 query 的 bool 这个 key 的下一级，这个查询对应的 sql 的查询是：
where (age = 24 or age = 25) and gender != "M";6、大小于过滤

在 es 中，大小于的过滤操作是复杂一点的，也在 bool 这个 key 下一级，用到 filter 和 range 关键字
大小于的关键字和 Django 里的是一样的用到 gt, gte, lt, lte 这几个
比如我们要搜索 age 的范围在 21 到 23 之间的包括 21 和 23的数据
GET /bank/_search
{
"query": {
"bool":{
   "filter": {
   "range": {
      "age": {
         "gte": 21,
         "lte": 22
      }
   }
   }
}
}
}上面的操作可以和与或非的操作进行并列，如果是直接搜索大小于的操作，可以直接如下操作：
GET /bank/_search
{
"query": {
"range": {
   "age": {
   "gte": 10,
   "lte": 20
   }
}
}
}如果想获取更多后端相关文章，可扫码关注阅读：
https://img2023.cnblogs.com/blog/1298097/202305/1298097-20230519212219260-482450302.png

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

页: [1]

ToB企服应用市场:ToB评测及商务社交产业平台's Archiver

es 笔记二之基础查询