一给 发表于 2025-1-7 17:09:07

GaussDB数据库的元数据及其管理简介

一、前言
GaussDB是一种分布式的关系型数据库,元数据(表、列、视图、索引、存储过程等对象)是其告急的一部分。元数据是指描述数据的数据,包罗数据的定义、结构、属性、关系等信息。本文以GaussDB物理数据库为主,联合元数据的概念简单介绍一下相关内容。
二、元数据简介
1、元数据定义
按照传统的定义,元数据(Metadata)是描述数据的数据。元数据主要纪录数据库应用系统中模型的定义、各层级间的映射关系、监控数据库应用系统的数据状态及ETL的任务运行状态等。在数据库应用系统中,元数据可以资助数据库管理员和开发职员非常方便地找到其所关心的数据,并用于引导其进行数据管理和开发工作,提高工作服从。
2、元数据分类
元数据可根据不同的维度进行分类,按用途的不同,可以分为两类:技术元数据(Technical Metadata)和业务元数据(Business Metadata)。
技术元数据是存储关于数据库应用系统技术细节的数据,是用于开发和管理数据库应用系统使用的数据。技术元数据即为技术资产,显示数据库、数据表、数据量的数量及其详情。
业务元数据从业务角度描述了数据库应用系统中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂盘算机技术的业务职员也可以或许“读懂”数据库应用系统中的数据。业务元数据包罗业务资产和指标资产,业务资产显示业务对象、逻辑实体、业务属性的数量及其详情,指标资产显示业务指标及其详情。
3、数据库元数据管理
元数据管理是对数据采集、存储、加工和展现等数据全生命周期的描述信息,资助用户明白数据关系和相关属性。 数据库的元数据指的是关于数据库对象(如表、列、索引、视图、存储过程等)的信息,这些信息描述了这些对象的结构和属性。并且最终目标是服务于数据库应用系统的高效实行(开发、管理、维护等)。
三、GaussDB数据库的元数据管理
1、GaussDB数据库的元数据管理
通过登录GaussDB提供的“数据管理服务(DAS)” 工具,进入“库管理(Schema列表/对象列表/元数据采集)”主页面,可进行相关元数据的基础管理(如下图)。
GaussDB数据库对象列表:
https://i-blog.csdnimg.cn/direct/74ecfbbe656c425a914add1198078120.png
GaussDB数据库元数据采集(DAS工具内置功能):
https://i-blog.csdnimg.cn/direct/20734d8960354ddfa9375cd4f9386372.png
Tip:对象列表数据来自实时查询(最多显示10000条),对数据库有一定的性能消耗,发起开启元数据自动采集。
2、通过“SQL + 系统表/系统视图/系统函数”的方式管理(采集)元数据
1)获取表、视图及表字段等信息
(1)PG_GET_TABLEDEF(tablename)系统信息函数,获取表定义信息。
SELECT * FROM PG_GET_TABLEDEF(‘test_1’);
https://i-blog.csdnimg.cn/direct/96ff3f70ecfb45a089999b079ded4ea6.png
返回范例:text。说明:pg_get_tabledef重构出表定义的CREATE语句,包罗了表定义本身、索引信息、comments信息。对于表对象依赖的group、schema、tablespace、server等信息。
(2)ADM_TABLES视图存储关于数据库下的全部表信息。主要字段:表的全部者、表名、存储表的表空间名、表的估计行数、是否为临时表等
SELECT * FROM ADM_TABLES;
https://i-blog.csdnimg.cn/direct/bde22ca265a1439ca7f1fafe5e346494.png
(3)DB_ALL_TABLES视图存储当前用户所能访问的表或视图。主要字段:表或视图的全部者、表或视图的名称、表或视图所在的表空间。
SELECT * FROM DB_ALL_TABLES;
https://i-blog.csdnimg.cn/direct/68598906e4dd435caf0e2752a482c946.png
(4)DB_TABLES视图存储当前用户可访问的全部表。主要字段:表的全部者、表名、存储表的表空间名、表的估计行数、是否为临时表等。
SELECT * FROM DB_TABLES;
https://i-blog.csdnimg.cn/direct/16630dcc85bb42f191f6cdcaec832d0e.png
(5)ADM_TAB_COLUMNS视图存储关于表和视图的字段信息。数据库里每个表或视图的每个字段都在ADM_TAB_COLUMNS里有一行。主要字段:表的全部者、表的名称、列名、列的数据范例、列的字节长度等。
SELECT * FROM ADM_TAB_COLUMNS;
https://i-blog.csdnimg.cn/direct/0f8b2dd710fd42e880efd46685ffda6d.png
(6)DB_TAB_COLUMNS视图存储了当前用户可访问的表和视图的列的描述信息。主要字段:表的全部者、表的名称、列名、列的数据范例、列的字节长度等。
SELECT * FROM DB_TAB_COLUMNS;
https://i-blog.csdnimg.cn/direct/2e7d84fb92994cd0860e9e50e83e9d4e.png
2)获取定时任务信息
MY_JOBS系统视图获取其定义信息。主要字段:作业创建者、作业实行者、作业对应的数据库名称、开始实行时间、竣事时间、运行状态等。
–获取定时任务信息
SELECT * FROM MY_JOBS;
https://i-blog.csdnimg.cn/direct/7ac65e8b5dfd49cfa8246d159e87928e.png
3)获取索引信息
PG_INDEXES系统视图获取表中的索引信息
– 根据表名获取对应的索引信息
SELECT schemaname
,tablename

,indexname

,tablespace

,indexdef
FROM PG_INDEXES
WHERE TABLENAME = ‘sell_info_full’
AND INDEXNAME IS NOT NULL;
https://i-blog.csdnimg.cn/direct/2622ccc6d1a04be78f88256c2b1f54dc.png
4)获取存储过程、函数、触发器等信息
DB_SOURCE视图存储当前用户可访问的存储过程、函数、触发器的定义信息。该视图同时存在于PG_CATALOG和SYS schema下。 主要字段:对象的全部者、对象名字、对象范例(function, procedure, trigger)、存储对象的文原来源等。
SELECT * FROM DB_SOURCE;
https://i-blog.csdnimg.cn/direct/18a32400188748788544c9f14a3982e6.png
GaussDB数据库元数据的获取/采集主要是以系统表、视图、函数等方式获取,其元数据不止包罗TABLES、VIEWS、COLUMNS、SOURCE、JOB,还包罗USERS、COMMENTS等。 具体可根据实际业务需要进行采集管理。
四、小结
元数据管理从技术角度,元数据管理着企业的数据源系统、数据平台、数据仓库、数据模型、数据库、表、字段以及字段间的数据关系等技术元数据。从业务角度,元数据管理着企业的业务术语表、业务规则、质量规则、安全策略以及表的加工策略、表的生命周期信息等业务元数据。从应用系统角度,元数据管理为数据提供了完整的加工处理全链路跟踪,方便数据的溯源和审计,这对于数据的合规使用越来越告急。通过数据血缘分析,追溯发生数据质量题目和其他错误的根本原因,并对更改后的元数据进行影响分析等。
GaussDB数据库的元数据管理是数据库系统管理工作的核心之一。它可以资助用户更好地管理和维护数据库,提高数据的安全性和可靠性,减少数据丢失和破坏的风险。同时,元数据管理还可以资助用户更好地明白和使用数据库,提高工作服从 。
——竣事
​GaussDB

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: GaussDB数据库的元数据及其管理简介