读图数据库实战笔记05格式化结果

耶耶耶耶耶 · 2024-12-17 07:50:54

1. 格式化结果

1.1. 在图中查找数据是一项技能，但是高效地返回数据则是一种全新的挑战
1.2. 最好在数据库层尽大概多地对数据进行处理

1.2.1. 客户端应用程序处理用户交互就够忙的了

1.3. 图数据库不返回元素属性，因此必须显式哀求这些属性
2. 值操作

2.1. SELECT ROWID FROM person WHERE first_name = 'Ted';

2.1.1. g.V().has('person', 'first_name', 'Ted')==＞v[4]

2.2. 大多数数据库要求指定要返回的特定属性

2.2.1. 在SELECT子句中利用通配符（*）是SQL中的一种常见做法

2.3. 在Gremlin中，利用values()和valueMap()等操作以所需的形式检索值
2.4. values()

2.4.1. 尽管采用了单词的复数形式，但是values()最常用于返回标量，特殊是单个属性的值
2.4.2. 它仅返回属性的值部分，而没有键或标签，所以哀求代码必须知道调用的是哪个属性
2.4.3. 利用带属性值的键可以更轻易地处理结果
2.4.4. 采用复数形式因为values()被设计为处理一个或多个属性，并且能将其与很少利用的value()操作区分开
- 2.4.4.1. g.V().has('person', 'first_name', 'Hank').values()==＞ Hank
2.4.5. 通常更喜欢valueMap()操作
- 2.4.5.1. g.V().has('person', 'first_name', 'Hank').valueMap()==＞
2.4.6. 空values()操作
- 2.4.6.1. 利用空values()操作通常是个坏主意
- 2.4.6.2. 相称于运行利用通配符的SQL SELECT查询

2.5. 图数据库引擎处理遍历的方式与SQL引擎处理查询的方式之间存在一个关键的区别

2.5.1. 在图数据库中，只检索当前极点或边的值
- 2.5.1.1. 图结果只包含了产物极点的属性
- 2.5.1.2. 在图数据库中，遍历中任何操作的输出都是当前极点或边的集
2.5.2. 在关系数据库中，所有联接表（joined table）的所有值都可以包含在结果中
- 2.5.2.1. SQL结果同时包含了关于订单和产物的信息
- 2.5.2.2. 在关系数据库中，join操作的输出结果是所有联接表的组合

3. 构建结果

3.1. 在订单处理图中，获取订单/产物组合结果的操作

3.1.1. 找到图中的所有order极点
3.1.2. 给这些极点起一个标记为O的别名
3.1.3. 通过contains边遍历到product极点
3.1.4. 给这些极点起一个标记为P的别名
3.1.5. 从标记为O的元素返回所有属性，并从标记为P的元素返回所有属性
- 3.1.5.1. 当返回别名元素时，所有这些元素都必须有别名，而不仅限于中间遍历元素

3.2. 最好将代码分成小块编写，并尽早、经常地进行测试

3.2.1. 经常训练是指不断试错，直到得到预期的结果

3.3. 在遍历过程中利用as()给对元素起别名

3.3.1. as()：为上一个操作的输出分配一个（或多个）标签，这些标签可以在同一遍历中被背面的操作访问
3.3.2. SELECT alias_name.* FROM table AS alias_name;
3.3.3. g.V().hasLabel('table').as('alias_name')
3.3.4. 给遍历的每个操作分配一个as()大概很诱人，但利用它是有代价的
3.3.5. 最佳做法是只给计划在背面遍历需要检索的操作起别名
3.3.6. 遍历中的别名答应在背面的操作中引用前面操作的结果，从而支持组合强大的遍历

3.4. select(string[])：选择先前遍历中的别名元素

3.4.1. 该操作总是回首遍历中的先前操作以找到别名

3.5. by()调节器只作用于另一个操作的上下文

3.5.1. by(key)：指定属性的键，以从相应的别名元素返回值
3.5.2. by(traversal)：指定要对相应别名元素执行的遍历
3.5.3. 利用by()语句令人狐疑的一个方面是，在select()语句里指定的每个别名元素都应该有一个对应的by()语句，以指示要对其执行的操作
3.5.4. by()操作的顺序还要对应于指定别名的顺序
3.5.5. 严格来说，by()语句的数量大概比引用的元素多，也大概比引用的元素少

4. 投射结果而不应用别名

4.1. 与其在遍历中回溯以获取之前的结果，不如从当前元素向前投射结果
4.2. 投射结果与以前检索结果的方式不同，是一种简单而微妙的方式
4.3. 当投射结果时，则会创建新的结果，大概会延伸分支到尚未遍历的项
4.4. 选择是利用极点、属性或其他遍历表达式来返回先前标记操作结果的过程

4.4.1. 选择总是回溯到遍历的之前部分
4.4.2. 选择利用select()操作，基于先前遍历的图元素创建结果集
4.4.3. 选择操作基于先前遍历的图元素创建结果集

4.5. 投射是利用极点、属性或其他遍历表达式来创建从输入到当前操作的结果的过程

4.5.1. 投射总是向前移动，以输入的数据为起点
4.5.2. 投射利用project()操作，从图中当前位置发出分支并创建新对象
4.5.3. 投射操作从图的当前位置运行，并创建具有静态或计算属性的新对象

4.6. 选择操作和投射操作从多个极点或边创建复杂的结果，从而答应组成复杂的结果结构
5. 对结果进行组织

5.1. 利用order()、group()和groupCount()操作进行排序、分组或按组计数是转换结果的常用方法
5.2. limit()操作可以限制结果的数量，tail()操作用于返回最后X 条记录，range()操作答应对结果分页
5.3. 对图遍历返回的结果排序

5.3.1. order()：将遍历到此点为止的所有对象收集到一个列表中，该列表根据附带的by()调节器排序
5.3.2. 默认按升序分列
1. g.V().hasLabel('person').values('first_name').
2. order().
3. by()
4. ==＞Dave
5. ==＞Denise
6. ==＞Hank
7. ==＞Jim
8. ==＞Josh
9. ==＞Kelly
10. ==＞Paras
11. ==＞Ted
复制代码
5.3.3. 要按降序分列，则在by()操作中指定decr参数
1. g.V().hasLabel('person').values('first_name').
2. order().
3. by(decr)
4. ==＞Ted
5. ==＞Paras
6. ==＞Kelly
7. ==＞Josh
8. ==＞Jim
9. ==＞Hank
10. ==＞Denise
11. ==＞Dave
复制代码
5.3.4. 随机地对数据排序，在by()操作中利用shuffle参数
1. g.V().hasLabel('person').values('first_name').
2. order().
3. by(shuffle)
4. ==＞Dave
5. ==＞Jim
6. ==＞Ted
7. ==＞Paras
8. ==＞Kelly
9. ==＞Hank
10. ==＞Denise
11. ==＞Josh
复制代码
5.3.5. 首先，按值的降序分列，然后按键排序
- 5.3.5.1. 按键排序是一种打破僵局的好方法，可以确保得到相对确定的结果

5.4. 对图遍历返回的结果分组

5.4.1. group()：根据指定的by()调节器对结果分组
- 5.4.1.1. 利用一个或两个by()调节器来对数据分组
- 5.4.1.2. 第一个by()调节器指定分组的键
- 5.4.1.3. 第二个by()调节器如果存在，将指定值；如果不存在，则将传入数据收集为与分组键相关联的值列表
  1. g.V().has('person', 'first_name', 'Dave').
  2. both().
  3. both().
  4. group().
  5. by('first_name')
  6. ==＞{Denise=[v[19], v[19]], Ted=[v[4]], Hank=[v[6]], Paras=[v[17]], Josh=[v[2],
  7. v[2]], Dave=[v[0], v[0], v[0], v[0], v[0]], Kelly=[v[13]], Jim=[v[15]]}
  复制代码
5.4.2. groupCount()：根据指定的by()调节器对结果分组和计数
- 5.4.2.1. 需要一个by()调节器来指定键
- 5.4.2.2. 值总是通过count()操作进行聚合
- 5.4.2.3. groupCount()操作只是一个小语法糖，最常用于group()操作——聚合计数
  1. g.V().has('person', 'first_name', 'Dave').
  2. both().
  3. both().
  4. group().
  5. by('first_name').
  6. by(count()).
  7. unfold()
  8. ==＞Denise=2
  9. ==＞Ted=1
  10. ==＞Hank=1
  11. ==＞Paras=1
  12. ==＞Josh=2
  13. ==＞Dave=5
  14. ==＞Kelly=1
  15. ==＞Jim=1
  复制代码
5.4.3. unfold()：将一个可迭代或map结果的各个组成部分展开
1. g.V().has('person', 'first_name', 'Dave').
2. both().
3. both().
4. group().
5. by('first_name').
6. unfold()
7. ==＞Denise=[v[19], v[19]]
8. ==＞Ted=[v[4]]
9. ==＞Hank=[v[6]]
10. ==＞Paras=[v[17]]
11. ==＞Josh=[v[2], v[2]]
12. ==＞Dave=[v[0], v[0], v[0], v[0], v[0]]
13. ==＞Kelly=[v[13]]
14. ==＞Jim=[v[15]]
复制代码

5.5. 限制结果记录的数量

5.5.1. 对结果进行组织的最后一个主题是返回数据的子集
5.5.2. 通常用于最小化结果数量或分页功能
5.5.3. limit(number)：返回数据集的前number个结果
1. g.V().hasLabel('person').values('first_name').
2. order().
3. by().
4. limit(3)
5. ==＞Dave
6. ==＞Denise
7. ==＞Hank
复制代码
5.5.4. tail(number)：返回数据集的后number个结果
1. g.V().hasLabel('person').values('first_name').
2. order().
3. by().
4. tail(3)
5. ==＞Kelly
6. ==＞Paras
7. ==＞Ted
复制代码
5.5.5. range(startNumber, endNumber)：返回数据集中从第startNumber个（包含第startNumber个，从0算起）到第endNumber个（不包含第endNumber个）结果
1. g.V().hasLabel('person').values('first_name').
2. order().
3. by().
4. range(0, 3)
5. ==＞Dave
6. ==＞Denise
7. ==＞Hank
复制代码

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

读图数据库实战笔记05格式化结果

本帖子中包含更多资源

0 个回复

快速回复

楼主热帖

标签云

浏览过的版块