elasticsearch中的数据类型：flattened和join

灌篮少年 · 2023-8-29 04:43:18

flattened：比如你有一个字段的值是一个json，这个json里面又有很多字段，你又不想一个一个的定义这些字段到mapping，就可以用flattened
直接动手：创建索引：

PUT person
{
"mappings": {
"properties": {
"patient_name": {
"type": "text"
},
"detail": {
"type": "flattened"
}
}
}
}

复制代码

注意这里detail字段类型为flattened, 然后插入文档：

PUT person/_doc/1
{
"patient_name": "John Doe",
"detail": {
"age": 143,
"skills": [
"java",
"python",
"ai"
],
"history": "none",
"friends": [
"Neo",
"James",
"Tony Stark"
]
}
}

复制代码

然后搜索：

GET person/_search
{
"query": {
"match": {
"detail": "java"
}
}
}

复制代码

注意这里直接搜索detail，可以搜索到我们刚刚插入的那个文档，但是我们也可以搜索detail.skills,比如

"detail.skills": "java"

复制代码

也能搜索到那个文档，但是如果我们这样搜索就搜索不到：

"detail.friends": "java"

复制代码

还有一点，这里的每个字段会被定义成keyword类型，所以你如果这样搜索就搜索不到：

"detail.friends": "Tony"

复制代码

你必须完全匹配才能搜索的到：

"detail.friends": "Tony Stark"

复制代码

再来看看join类型，说的是一个索引里面一个文档和其他几个文档有关联，比如几个文档的父文档都是那一个文档,动手：
先创建索引：

PUT person2
{
"mappings": {
"properties": {
"relationship": {
"type": "join",
"relations": {
"star": "fans"
}
}
}
}
}

复制代码

这里relationship是一个字段名，类型是join，指的明星和粉丝的关系，所以里面有一个类型的参数relations,它的取值star:fans分别表示父和子的关联类型，后面会用到。
插入文档，首先是父文档：

PUT person2/_doc/1
{
"name": "star1",
"relationship": {
"name": "star"
}
}

复制代码

这里的relationship.name是star，这个值是在前面mapping里面定义的，前面提到过，如果你写个super_star,就会报错：
unknown join name [super_star] for field [relationship]

然后插入第一个子文档：

PUT person2/_doc/2?routing=tony
{
"name":"fan1",
"relationship":{
"name":"fans",
"parent":1
}
}

复制代码

注意这里有个routing参数，如果插入子文档的时候没有指定routing是会报错的，这是为了将相关的文档分配到相同的分片，比如后面插入第二个子文档真爱粉的时候也指定相同的路由参数值。
[routing] is missing for join field [relationship]
还有这里的relationship.name是fans，也是在前面mapping里面定义的。
指定parent是1，就确定了父子文档的关系。
最后插入第二个子文档：

PUT person2/_doc/3?routing=tony
{
"name":"fan2",
"relationship":{
"name":"fans",
"parent":1
}
}

复制代码

路由参数一样，下面查询：

GET person2/_search
{
"query": {
"parent_id": {
"type": "fans",
"id": 1
}
}
}

复制代码

可以查到两个子文档，两个子文档，但是不包括父文档：

"hits" : [
{
..."_routing" : "tony",
"_source" : {
"name" : "fan1",
"relationship" : {
"name" : "fans",
"parent" : 1
}
}
},
{
..."_routing" : "tony",
"_source" : {
"name" : "fan2",
"relationship" : {
"name" : "fans",
"parent" : 1
}
}
}

复制代码

如果插入第二个子文档的时候指定路由参数是neo，也可以搜索到两个子文档，不影响搜索，但不建议这样做。

PUT person2/_doc/3?routing=neo<br><br>还有要注意的是如果查询的时候，指定parent_id.type为star会报错：<br>

复制代码

GET person2/_search
{
"query": {
"parent_id": {
"type": "star",
"id": 1
}
}
}

复制代码

报错如下：
[parent_id] no relation found for child [star]
也就是说这里要指定的是子文档的关联类型

复制代码

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

		自动登录	找回密码
密码			立即注册

elasticsearch中的数据类型：flattened和join

0 个回复

快速回复

楼主热帖

标签云