PostgreSQL体系架构知多少

打印 上一主题 下一主题

主题 1928|帖子 1928|积分 5784

PostgreSQL体系架构知多少

Whoami:5年+金融、政府、医疗范畴工作经验的DBA
Certificate:PGCM、OCP、YCP
Skill:Oracle、Mysql、PostgreSQL、国产数据库
Platform:CSDN、墨天伦、公众号(呆呆的私房菜)
   业务范围:数据库安装部署、日常维护、主备切换、故障处理、性能优化、技术培训等。
需要的伙伴或者贸易合作请移步 公众号【呆呆的私房菜】获取联系方式。
    阅读本文可以了解PostgreSQL数据库的体系架构,包罗内存结构和进程结构,逻辑结构和物理结构。
  

01 内存结构


  • **共享进程:**PostgreSQL 启动之后,会生成一块共享内存(shared_buffers),共享内存主要用作数据块的缓冲区,以便进步读写性能。wal 日志缓冲区 和 clog 缓冲区也存放于共享内存中。除此之外,一些全局信息也存放在内存中,如进程信息,锁信息、全局统计信息等。
  • **本地进程:**后台进程除了访问共享内存外,还会申请分配一些本地内存,以便暂存一些不需要全局存储的数据,这些内存缓冲区主要有:
   暂时缓冲区:用于访问暂时表的本地缓冲区;
work_mem:内部排序操作和hash表在使用暂时磁盘文件之前使用的内存缓冲区;
maintenance_work_mem:在维护性操作(如vacuum、create index和alter table add foreign key等)中使用的内存缓冲区。
  02 进程结构


  • **postmaster:**客户端发起毗连,PG会启动一个服务进程为这个毗连服务。当某个服务进程出现非常,Postmaster主进程会自动完成体系的恢复,恢复过程中会停掉所有的服务进程,然后举行数据一致性恢复,恢复完成之后才开始接收新的毗连。
  • **syslogger:**通过从postmaster进程、所有的服务进程及其他辅助进程网络所有的stderr输出,并将这些输出写入到日志文件中。
  • **bgwriter:**辅助进程是把共享内存中的脏页写入磁盘上的进程。
  • **walwriter:**负责写入Wal日志的进程。概念就是在修改数据之前,必须将这些修改操作记载到磁盘中,后面更新实际数据时,就不需要及时的将数据长期化到文件中了。WAL日志生存在pg_wal下,每个文件默认是16MB。
  • **pgarch:**由于Wal日志会被循环使用,PgArch归档进程会把覆盖前的WAL日志备份出来。
  • **autovacuum:**postgresql对表举行delete操作后,旧的数据并不会立刻被删除。并且,在更新数据时,也不会在旧的数据上做更新,而是生成一行新的数据。旧的数据只是被表示为删除状态,只有在没有并发的其他事务读到这些旧数据时,它们就会被autovacuum进程清除。
  • **pgstat:**该辅助进程用来做数据的统计网络工作。网络的信息主要用于查询优化时的代价估算,这些信息包罗在一个表和索引上举行了多少次的插入、更新、删除操作,磁盘块读写的次数以及行的读次数。体系表pg_statistic中存储了PgStat网络的各类统计信息。
03 物理结构


  • 数据文件:物理存储结构是操作体系中组织和管理数据库的方式。主要包罗数据文件、日志文件、参数文件、控制文件、wal文件。实验initdb的时候会初始化一个目次,在这个目次会生成相关的子目次和一些文件。PG的表空间概念差异于其他关系型数据库,这里的tablespace对应的都是一个目次。
    下图是对每个目次的功能和作用的先容。


    数据文件用于存储数据。文件名以oid命名,对于超出1G的表数据文件,PostgreSQL会自动将其拆分为多个文件来存储,而拆分的文件名将由pg_class中的relfilenode字段来决定。
  1. ## 查看t1表物理文件存储路径,实际上就是 base/<database oid>/<relation oid>
  2. test=# select pg_relation_filepath('t1');
  3. pg_relation_filepath
  4. ----------------------
  5. base/16384/16413
  6. (1 行记录)
  7. ## 查看数据库oid
  8. test=# select oid, datname from pg_database where datname = 'test';
  9.   oid  | datname
  10. -------+---------
  11. 16384 | test
  12. (1 行记录)
  13. ## 如下是查看t1表的oid和relfilenode
  14. test=# select oid, relfilenode, relname, relkind from pg_class where relname = 't1';
  15.   oid  | relfilenode | relname | relkind
  16. -------+-------------+---------+---------
  17. 16413 |       16413 | t1      | r
  18. (1 行记录)
  19. ## 值得注意的是,relation的oid是唯一的,但是relfilenode是会变化的,例如当执行vacuum full t1的时候,relfilenode就会变化,这跟
复制代码
04 逻辑结构

逻辑存储结构是内部的组织和管理数据的方式。所有的数据库对象都有各自的object identifers,oid是一个无符号的4字节整数,相关对象的oid都存放在相关的体系catalog表中,比如数据库的oid和表的oid分别存放在pg_database和pg_class表中。
**database cluster:**数据库集群簇,它是指向单个PG服务器实例管理的数据库集合,组合数据库集群的这些数据库使用相同的全局配置文件和监听端口,共用进程和内存结构。
一个Database cluster可以包罗多个database、多个user以及databases中的所有对象。
database:在PG中,数据库本身也是数据库对象,并且在逻辑上相互分离,出数据库之外的其他数据库对象(比方表、索引等)都属于它们各自的数据库。
database object:如:表、视图、索引、序列、函数等等。在PostgreSQL中的所有数据库对象都由各自的对象标识符(OID)举行内部的管理。数据库的OID存储在pg_database体系表中,数据库对象的OID存储在pg_class体系表中。
**tablespace:**数据库在逻辑上分为多个存储单元,称为表空间。表空间的作用把逻辑上相关的结构放在一起。数据库逻辑上是一个或多个表空间组成。初始化的时候,会自动创建pg_default和pg_global两个表空间。
**schema:**当创建一个数据库时,会为其创建一个名为public的默认schema。Schema是数据库中的命名空间。在数据库创建的所有对象都是在schema中创建。一个用户可以从同一个客户端毗连中访问差异的schema。而差异的schema中可以有多个同名的table、index、view、sequence、Funcation等数据库对象。
**segment:**一个段是分配给一个逻辑结构(一个表、一个索引或其他对象)的一组区,是数据库对象使用的空间的集合;段可以有表段、索引段、回滚段、暂时段和高速缓存段等。
extent:
区是数据库存储空间分配的一个逻辑单元,它由一连数据块所组成。第一个段是由一个或多个盘区组成。当一段中间所有空间已完全使用,PostgreSQL为该段分配一个新的范围。
**block:**数据块是PostgreSQL 管理数据文件中存储空间的单元,为数据库使用的I/O的最小单元,是最小的逻辑部件。默认值8K。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

盛世宏图

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表