IT评测·应用市场-qidao123.com

标题: 明解数据库------数据库存储演变史 [打印本页]

作者: 祗疼妳一个    时间: 2023-3-10 20:03
标题: 明解数据库------数据库存储演变史

一、文件系统存储

计算机刚开始出现的时候,那时候没有硬盘,只有内存,数据不会进行存储,一般只用于科技计算,计算完输出结果后,程序就撤出内存了。后来随着技术发展,有了硬盘、文件,在文件的基础上有了文件系统。文件系统可以满足数据存放和查找的需求。
文件系统作为数据库用了一段时间,当数据越来越多、规模越来越大后,数据查找特别麻烦。数据很容易重复(冗余)、占用存储空间多,数据结构化被迫推进。

总的来说,数据库顾名思义其实就是存取数据的地方;另外随着时间线的发展产生了不同种类的数据库,但本质技术提升的本质都是为了提升业务性能!


二、关系型数据库存储

关系型数据库也被称为RDBMS,顾名思义就是信息遵循一种利用表或关系的结构化方法,是一种存储和操作历史数据的经典方法。
SQL这个词既是一种语言,也是数据库的类型。SQL代表结构化查询语言,是数据库设计理念的先驱。自80年代中期以来,SQL一直是管理和查询关系数据集的标准;然而,关系模型的早期雏形可以追溯到60年代和70年代,当时出现了区分应用数据和应用代码的迫切需求,使开发人员能够专注于程序开发的其他方面,如访问和操作手头的数据。IBM的IMS是第一个功能齐全的关系型数据库,尽管设计的目的不同,是为了组织阿波罗太空探索计划的数据。关系数据库是各种程度的时间变化的、规范化的关系的集合。可以做出以下直观的对应。
特性:ACID

原子性、一致性、隔离性、持久性以保持交易的可靠性。
范式设计

一个设计高效数据库的过程

可扩展性

数据库处理不断增长的数据量的能力。垂直扩展有助于增强数据库服务器的现有能力。大多数SQL数据库支持垂直扩展。然而,他们可以扩大规模,而不是缩小规模。

从使用角度来说用户不直接接触数据库,而是通过我们的应用程序与数据库进行交互。
如果用户比较多,发出的请求多了之后,由于我们的数据库是放置在磁盘,而磁盘的性能是比较低的,所以会导致Web应用程序每次到与数据库进行交互之后,用户的响应速度会变慢!

解决方案:池化技术,实现资源的复用(降低资源创建销毁的开销)

以上是Web应用与数据库连接层面的优化,至于在数据库本身我们也可以进行优化,以提升性能。

数据分片,使用分布式集群结构等虽然提高了可扩展性更好了,但也带来了新的麻烦
1、以前在一个库里的数据,现在跨了多个库,应用系统不能自己去多个库中操作,需要使用数据库分片中间件
2、分片中间件做简单的数据操作时还好,但涉及到跨库join、跨库事务时就很头疼了,很多人干脆自己在业务层处理,复杂度较高
关系型数据库劣势

数据建模的僵化
关系型数据库最大的限制之一是将数据组织到表和关系的特定结构中的僵硬性。由于所有的数据都不能方便地装入表格,因此这种方法不能应用于所有的自然数据,也不能以树和图的形式存储,但是,RDBMS通过以父子关系的规范化方式对这些数据进行建模来解决这个限制,这仍然是不够的。
多样性
数据的复杂性也给关系型数据库带来了限制。这些数据库是按共同特征来组织数据的。复杂的数字、图像和多媒体数据很难存储、访问和处理。
空间使用效率低下
当我们定义关系的模式时,我们定义所有属性的大小。不是所有的记录都有使用全部空间的数据。一些有很短的长度。每条记录不一定又适合给定的数据类型,造成了空间浪费。
沉重的变化
一个记录所需的任何改变都需要应用于所有的记录。因此造成了重量级的改变。根据当时存在的记录的大小和数量,这些改变可能是昂贵的,不可行的。因此,改变一个已经存在的数据库的模式是一个挑战。
对大数据来说效率低下
SQL不适合数量大、速度快、种类多的数据,使得它在基于云的应用中效率很低。
总结:随着大数据时代的到来,结构化的方法已经无法满足巨大的信息处理需求,这些信息往往是非结构化的。随着时间的推移,SQL已经经历了许多迭代,以支持大量的数据处理和管道。然而,对于期望快速响应和最高可扩展性的大数据系统来说,它仍然是低效的。
三、非关系型数据库存储

关系数据库近期还是非常广泛使用的模型,它们仍然在许多企业得到了广泛采用。然而,面对当今多样化、高速和海量的数据,有时需要用一个高度不同的数据库来补充关系数据库。这促进了 NoSQL 数据库在某些领域的采用,该数据库也称为“非关系数据库”。由于支持快速横向扩展,因此非关系数据库可以处理高流量,这也使其具有很强的适应性。非关系型数据库也即NoSQL(Not Only SQL),目的总结就是高性能,提升可扩展性!
优势:

不推荐NoSQL的场景:
NoSQL VS RDBMS


RDBMS
NoSQL
主要类型




键值存储类型

这是极为灵活的 NoSQL 数据库类型,因为应用可以完全控制 value 字段中存储的内容,没有任何限制!
典型代表:MemcacheDB、Redis
特点:

文档存储类型

也称为文档存储或面向文档的数据库,这些数据库用于存储、检索和管理半结构化数据。无需指定文档将包含哪些字段。
典型代表:MongoDB、CouchDB
特点:

列式存储类型

这些数据库以表、行和列的形式来存储和管理数据。它们广泛部署于需要用列格式来捕获无模式数据的应用中。
典型代表:Hbase、Cassandra、Hypertable
特点:将数据按照列进行存储,最大的特点是方便存储结构化和半结构化数据,方便做数据压缩,对针对某一列或者某几列的查询有着极大的IO优势

图形存储类型

此数据库将数据组织为节点和关系,这将显示节点之间的连接。这支持更加丰富和完整的数据表示。图形数据库应用于社交网络、预订系统和欺诈检测。
典型代表:Neo4J、FlockDB
特点:
最典型的例子就是社交网络中人与人的关系,数据模型主要是以节点和边(关系)来实现,特点在于能高效地解决复杂的关系问题
如社交网络中人物之间的关系,如果用关系型数据库则非常复杂,用图形数据库将非常简单

总结:


NoSQL缺点

四、NewSQL存储

NewSQL 提供了与 NoSQL 相同的可扩展性,而且仍基于关系模型,还保留了极其成熟的 SQL 作为查询语言,保证了ACID事务特性。简单来讲,NewSQL就是在传统关系型数据库上集成了NoSQL 强大的可扩展性。
传统的SQL架构设计基因中是没有分布式的,而NewSQL 生于云时代,天生就是分布式架构。
NewSQL 的主要特性:

总的来说数据库产品演进就是分为三代:
主流数据库产品:
RDBMS:Oracle,MySQL,PG,MSSQL,DB2,SQLLite
NoSQL:MongoDB,Redis,ElasticSearch,Cassandra,Neo4j,Solr
NewSQL: Google Spanner,PinCAP TiDB
云数据库:Aliyun RDS,DRDS,PolarDB,腾讯云 TDSQL
参考文章:

出处:https://www.cnblogs.com/hanyu-2020/
---------------------------------------------------------
个性签名:独学而无友,则孤陋而寡闻。做一个灵魂有趣的人!
如果觉得这篇文章对你有小小的帮助的话,记得在右下角点个“推荐”哦,博主在此感谢!

本文内容若有疏漏请多多包涵,如有错误麻烦请指正,如有想法交流非常欢迎在下方评论!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!




欢迎光临 IT评测·应用市场-qidao123.com (https://dis.qidao123.com/) Powered by Discuz! X3.4