MongoDB 架构

打印 上一主题 下一主题

主题 808|帖子 808|积分 2424

优质博文:IT-BLOG-CN
  一、存储数据格式

MongoDB作为主流的NoSQL数据库之一,使用面向文档的数据存储方式,将数据以JSON和BSON的方式存储在磁盘中。BSON Binary JSON是一种基于JSON的二级制序列化格式,用于MongoDB存储文档并进行长途过程调用,作为网络数据交互的一种存储形式,类似于Protocol Buffer和Thrift。BSON是一种schema-less的存储形式,它的优点是机动性高,但它的缺点是空间利用率不是很抱负
一个Collection包含一个JSON和BSON文档:

JSON和BSON之间最重要的区别如下表所示:
JSONBSONJSON是javascript对象表现法BSON是二进制JSON是一种轻量级的、基于文本的、开放的数据互换格式是一种二进制序列化文档格式JSON包含一些根本数据类型,如字符串、数字、布尔值、空值除了支持JSON中的类型外,BSON还包含一些额外的数据类型,比方日期Date、二进制BinData等AnyDB、Redis等数据库将数据存储为JSON格式MongoDB中将数据存储为BSON格式重要用于传输数据重要用于存储数据没有相应的编码息争码技术有专用的编码息争码技术假如想从JSON文件中读取指定信息,需要遍历整个数据在BSON中,可以使用索引跳过到指定内容JSON格式不需要剖析,因为它是人类可读的BSON需要剖析,因为它是二进制的JSON是对象和数组的组合,其中对象是键值对的聚集,而数组是元素的有序列表BSON是二进制数据,在其中可以存储一些附加信息,比方字符串长度、对象类型等 二、架构视图


MongoDB与MySQL中的架构相似,底层都使用了可插拔的存储引擎以满足用户的不同需要。用户可以根据程序的数据特性选择不同的存储引擎,在最新版本的MongoDB中使用了WiredTiger作为默认的存储引擎,WiredTiger提供了不同粒度的并发控制和压缩机制,可以或许为不同种类的应用提供了最好的性能和存储率。
在存储引擎上层的就是MongoDB的数据模型和查询语言了,由于MongoDB对数据的存储与RDBMS:Relational Database Management System有较大的差异,以是它创建了一套不同的数据模型和查询语言。虽然MongoDB查询语言非常强大,支持的功能也很多,同时也是可编程的,不外其中包含的内容非常繁杂、API计划也不是非常优雅,以是照旧需要一些学习成本的,对于长时间使用MySQL的开发者肯定会有些不风俗。
数据模型Data Model:
【1】内嵌: 内嵌的方式指的是把相干联的数据保存在同一个文档结构之中。MongoDB的文档结构答应一个字段大概一个数组内的值作为一个嵌套的文档。通常如了局景选择内嵌:
  ■ 数据对象之间有包含关系,一般是数据对象之间有一对多大概一对一的关系。
  ■ 需要常常一起读取的数据。
  ■ 有map-reduce/aggregation需求的数据放在一起,这些操作都只能操作单个collection。
【2】引用: 引用方式通过存储数据引用信息来实现两个不同文档之间的关联,应用程序可以通过剖析这些数据引用来访问相干数据。通常如了局景选择内嵌引用:
  ■ 当内嵌数据会导致很多数据的重复,并且读性能的优势又不足于覆盖数据重复的弊端。
  ■ 需要表达比力复杂的多对多关系的时间。
  ■ 大型条理结果数据集嵌套不要太深。
三、存储引擎

存储引擎是MongoDB的焦点组件,负责管理数据如何存储在硬盘和内存上。MongoDB支持的存储引擎有:MMAPv1、WiredTiger、InMemory。
InMemory存储引擎用于将数据只存储在内存中,只将少量的元数据meta-data和诊断日志Diagnostic存储到硬盘文件中,由于不需要Disk的IO操作,就能获取所需的数据,InMemory存储引擎大幅度降低了数据查询的延迟Latency。从mongodb3.2开始默认的存储引擎是WiredTiger,3.2版本之前的默认存储引擎是MMAPv1,mongodb4.x版本不再支持MMAPv1存储引擎。
  1. storage:
  2.         journal:
  3.                 enabled: true
  4.         dbPath: /data/mongo/
  5.         #是否一个库一个文件夹
  6.         directoryPerDB: true
  7.         ##数据引擎
  8.         engine: wiredTiger
  9.         ##WT引擎配置
  10.         WiredTiger:
  11.                 engineConfig:
  12.                         ##WT最大使用cache(根据服务器实际情况调节)
  13.                         cacheSizeGB: 2
  14.                         ##是否将索引也按数据库名单独存储
  15.                         directoryForIndexes: true
  16.                         journalCompressor:none (默认snappy)
  17.     ##表压缩配置
  18.     collectionConfig:
  19.             blockCompressor: zlib (默认snappy,还可选none、zlib)
  20.     ##索引配置
  21.     indexConfig:
  22.             prefixCompression: true
复制代码
WiredTiger优势

【1】文档空间分配方式: WiredTiger使用的是BTree存储; MMAPV1线性存储需要Padding;
【2】并发级别:WiredTiger文档级别锁; MMAPV1引擎使用表级锁;
【3】数据压缩:snappy默认和zlib,相比MMAPV1无压缩空间节省数倍;
【4】内存使用:WiredTiger可以指定内存的使用巨细,从MongoDB 3.2版本开始,WiredTiger内部缓存的使用量,默认值是:1GB或60%of RAM - 1GB ,取两值中的较大值(不同版本会有区别,具体参考版本配置文件阐明);文件系统缓存的使用量不固定, MongoDB自动使用系统空闲的内存;
【5】Cache使用: WT引擎使用了二阶缓存WiredTiger Cache,File System Cache来保证Disk上的数据的终极一致性。而MMAPv1只有journal日志;
【6】文档级别的锁: MongoDB在执行写操作时, WiredTiger在文档级别进行并发控制,就是说,在同一时间,多个写操作可以或许修改同一个聚集中的不同文档;当多个写操作修改同一个文档时,必须以序列化方式执行;这意味着,假如该文档正在被修改,其他写操作必须等候,直到在该文档上的写操作完成之后,其他写操作相互竞争,获胜的写操作在该文档上执行修改操作;
【7】检查点机制: 类似关系数据库的CheckPoint,在Checkpoint操作开始时, WiredTiger提供指定时间点point-in-time的数据库快照Snapshot,该Snapshot出现的是内存中数据的一致性视图。当向Disk写入数据时,WiredTiger将Snapshot中的所有数据以一致性方式写入到数据文件中。同样MongoDB借助Journal日志文件也可以还原数据;

【1】WiredTiger.basecfg: 存储根本配置信息,与ConfifigServer有关系;
【2】WiredTiger.lock: 界说锁操作;
【3】table*.wt: 存储各张表的数据;
【4】WiredTiger.wt: 存储table*的元数据;
【5】WiredTiger.turtle: 存储WiredTiger.wt的元数据;
【6】journal: 存储WAL(Write Ahead Log);
WiredTiger存储引擎实现原理

Transport Layer是处理哀求的根本单位。Mongo有专门的listener线程,每次有连接进来,listener会创建一个新的线程conn负责与客户端交互,它把具体的查询哀求交给network线程,真正到数据库里查询由TaskExecutor来进行。

写哀求:WiredTiger的写操作会默认写入Cache,并持久化到WAL (Write Ahead Log),每60s或Log文件到达2G做一次checkpoint(当然我们也可以通过在写入时传入j: true的参数强制journal文件的同步,writeConcern: { w: , j: , wtimeout: })产生快照文件。WiredTiger初始化时,规复至最新的快照状态,然后再根据WAL规复数据,保证数据的完整性。

Cache是基于BTree的,节点是一个page,rootpage是根节点,internal page是中间索引节点,leaf page真正存储数据,数据以page为单位读写。
WiredTiger采用Copy on write的方式管理写操作insert、update、delete,写操作会先缓存在cache里,持久化时,写操作不会在原来的leaf page上进行,而是写入新分配的page,每次checkpoint都会产生一个新的rootpage。
checkpoint流程:
【1】对所有的table进行一次checkpoint,每个table的checkpoint的元数据更新至WiredTiger.wt
【2】对WiredTiger.wt进行checkpoint,将该tablecheckpoint的元数据更新至临时文件WiredTiger.turtle.set
【3】将WiredTiger.turtle.set重命名为WiredTiger.turtle
【4】上述过程假如中间失败,WiredTiger在下次连接初始化时,起首将数据规复至最新的快照状态,然后根据WAL规复数据,以保证存储可靠性
Journaling:在数据库宕机时,为保证MongoDB中数据的持久性,MongoDB使用了Write Ahead Logging向磁盘上的journal文件预先进行写入。除了journal日志,MongoDB还使用检查点checkpoint来保证数据的一致性,当数据库发生宕机时,我们就需要checkpoint和journal文件协作完成数据的规复工作。
【1】在数据文件中查找上一个检查点的标识符;
【2】在journal文件中查找标识符对应的记录;
【3】重做对应记录之后的全部操作;

丢数据的环境: 写入数据时,引擎内部是先将数据存在内存中,每隔60s或内存存储容量到达2G后提交一次到磁盘中,因此在这60s期间假如机器宕机,则有极大的大概性会丢失数据
不丢数据的环境: 写入数据时,引擎内部是先将数据存在内存中,同时也会写一份操作日志到内存中,该日志会每个100ms持续化到磁盘文件,这种日志成为Journaling。Journaling类似于关系数据库中的事务日志。Journaling可以或许使MongoDB数据库由于不测故障后快速规复。MongoDB2.4版本后默认开启了Journaling日志功能,mongod实例每次启动时都会检查journal日志文件看是否需要规复。由于提交journal日志会产生写入壅闭,以是它对写入的操作有性能影响,但对于读没有影响。
四、写入计谋

MongoDB的写入计谋有多种方式,写入计谋是指当客户端发起写入哀求后,数据库什么时间给应答,MongoDB有三种处理计谋:客户端发出去的时间,服务器收到哀求的时间,服务器写入磁盘的时间。
【1】Unacknowledged:客户端发出哀求丢到socket的时间就收到相应,这个时间客户端不需要等服务器的应答,但是的当地的驱动照旧尽大概的通知客户端网络的异常,这和客户端操作系统的配置有关。
【2】Acknowledged:这种方式客户端发送接口会等候服务器给简直认,这种方式一定能确保服务器收到了客户端的哀求,并且当服务器可以或许异常时,相应客户端。
【3】Journaled:Journaled方式相比Acknowledged的方式是要保证服务器端已经写入到硬盘文件了。对于Acknowledged的方式有大概服务收到哀求数据相应客户端后的一刹时当机了,这个数据就丢失了,但是对于Journaled方式,服务器保证写入到磁盘后再相应客户端,纵然当机了,也不会导致数据丢失。
【4】Replica Acknowledged:这个方式和Acknowledged是一样的意思,适用于Replica sets模式。Acknowledged模式下只有一台机器收到了哀求就返回了,对于复制集模式有多台机器的环境,可以要求有多台机器收到写入哀求后再相应客户端。这种更安全,但是导致了客户端耗时增长,以是要联合本身的场景设置合适的计谋。
可以通过下面的方式设置默认的计谋,majority表现多数节点写入乐成后才相应客户端,也可以更换成具体的数子,比如w:2表现至少写入2个节点才返回。wtimeout表现超时时间,还有一个到场j可以设置true,false表现是否是写入日志才返回。
  1. cfg = rs.conf()
  2. cfg.settings.getLastErrorDefaults = { w: "majority", wtimeout: 5000 }
  3. rs.reconfig(cfg)
复制代码
也可以通过客户端来指定具体的计谋,如下: 至少要写入两个节点,超时时间是5s
  1. db.products.insert(
  2.    { item: "envelopes", qty : 100, type: "Clasp" },
  3.    { writeConcern: { w: 2, wtimeout: 5000 } }
  4. )
复制代码
假如复制集是3台机器,写入两台机器,流程如下:


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

用户国营

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表