什么是大数据?一文讲清大数据的概念、演进、趋势、产业链及关键技术! ...

打印 上一主题 下一主题

主题 656|帖子 656|积分 1968

前言

数字经济浪潮下,数据已成为当今最为焦点的资源之一,数据成为推动企业和社会发展、转型、创新的新型生产要素。
大数据这个词,不管您是不是相干行业的从业者,也都听过无数遍了,但对于大多数人来说,并不能清楚的讲出什么是大数据。本日小兵尝试通过普通的语言,团结贴近生活的例子,将大数据及相干的概念一次讲清楚。



01 基本概念


1.1 大数据的界说


大数据:是指规模巨大、范例复杂多样,在获取、存储、管理、分析方面大大超出了传统数据库软件工具本领范围的数据聚集。
大数据技术:是通过获取、存储、分析,从大容量数据中发掘代价的一种全新的技术架构。

1.2 大数据的特性







  • 规模巨大(Volume):大数据聚集的规模通常超出传统数据库管理体系的处理本领,数据量可能到达TB、PB甚至EB级别。这种规模的数据必要强盛的存储和处理本领,以确保数据的高效管理和分析。
  • 范例多样(Variety):大数据的多样性指的是数据的泉源和格式多种多样,包括结构化数据、半结构化数据和非结构化数据。传统的数据库和数据管明白决方案缺乏灵活性且功能范围有限,根本无法应对大数据中各种差别且复杂的数据集。
  • 处理速度快(Velocity):大数据的生成、传输和处理的速度非常快,借助大数据技术(如分布式技术、流处理技术等),能极大的增长数据处理速度,确保体系能够及时响应。
  • 代价密度低(Value):大数据的数据量很大,但是代价密度很低。必要通过深度分析和发掘才华发现和发挥大数据的代价。

1.3 大数据的级别


先通过表格介绍一下数据的级别:

1 KB=1024 B1个TXT文本文件的巨细为几KB
1 MB=1024 KB1份word文档或1首音乐的巨细为几MB
1 GB=1024 MB一部720P的电影巨细约为5GB
1 TB=1024 GB电脑主流的硬盘为1TB/2TB/4TB
1 PB=1024 TB约21万部720P的电影
1 EB=1024 PB约2000个机柜的硬盘存储装备总容量
1 ZB=1024 EB全球已存储的全部数据总规模约几十ZB

上表中蓝色字体部分,也就是1PB以上规模的,我们通常算作大数据级别。举一些大数据级别的例子:



  • 1辆自动驾驶汽车每天可以产生的数据:60 TB
  • 1个智慧工厂每天可以产出的数据:1 PB
  • 1座智慧城市每天可以产出的数据:2.5 PB
  • 大型强子对撞机实验每年产出的数据:25 PB
  • 谷歌搜索引擎的数据总规模(2021年)为:62 PB
  • 预计到2025年,全球数据量将到达:175 ZB




1.4 大数据的泉源




  • 传统企业数据:
    包括CRM用户数据、ERP 数据、库存数据、人事数据、财务数据等。



  • 机器和传感器数据:
    包括装备日志、智能仪表、工业传感器、环境传感器、摄像头等。

  • 社交数据:
    包括用户行为记录、访问记录、UGC内容、反馈数据等。

1.5 大数据的范例

数据按照结构可以分为结构化数据、非结构化数据、半结构化数据




数据按照访问频率可以分为热数据、温数据、冷数据




  • 热数据:约占团体数据的5%,访问频率极高,必要能够快速读写,及时响应业务体系
  • 温数据:约占团体数据的15%,访问频率适中,读写性能要求一般。
  • 冷数据:约占团体数据的80%,可以说大部分数据均属于冷数据,很少被访问,对读写性能要求较低,通常为归档存储的一些历史数据,必要长期进行保存。

1.6 大数据与传统数据的区别


通过表格对传统数据和大数据进行对比:



02 大数据的发展演进

2.1 大数据的发展(国际)



  • 1980年,美国作家阿尔文 ·托夫勒在《第三次浪潮》书中,将“大数据”称为“第三次浪潮的华彩乐章”。
  • 1997年,美国宇航局研究员迈克尔 ·考克斯和大卫 ·埃尔斯沃斯首次使用“大数据”这一术语来形貌海量数据带来的挑衅。数据之大,超出了存储器的承载本领,称之为“大数据题目”。
  • 2006年,云计算出现。2007-2008年,社交网络激增,刺激了大数据技术的发展。
  • 2011年6月,麦肯锡发布陈诉,正式界说了大数据的概念,后逐渐受到了各行各业关注。
  • 2012年1月瑞士达沃斯召开的天下经济论坛上,大数据是主题之一,会上发布的陈诉《大数据,大影响》宣称,数据已经成为一种新的经济资产类别。
  • 2014年4月,天下经济论坛以“大数据的回报与风险”主题发布了《全球信息技术陈诉(第13版)》。

2.2 大数据的发展(国内)



  • 2011年12月,工信部发布的物联网十二五规划上,把信息处理技术作为4项关键技术创新工程之一被提出来,此中包括了海量数据存储、数据发掘、图像视频智能分析,这些是大数据的重要构成部分。
  • 2014年,“大数据”首次出现在当年的《当局工作陈诉》中。《陈诉》中指出,要设立新兴产业创业创新平台,在大数据等方面赶超先进,引领将来产业发展。
  • 2015年,大数据上升到国家战略层面,我国当局于2015年8月通过了《关于促进大数据发展的举措纲要》。
  • 2015年10月26日至29日,党的十八届五中全会召开,公报提出要实施“国家大数据战略”,这是大数据第一次写入党的全会决定,标志着大数据战略正式上升为国家战略,五中全会开启了大数据建设的新篇章。
  • 2022年,中共中心国务院《关于构建数据基础制度更好发挥数据要素作用的意见》,开端搭建我国数据基础制度20条政策举措,简称“数据二十条”。
  • 2023年10月,国家数据局正式挂牌成立,负责和谐推进数据基础制度建设,统筹数据资源整合共享和开发使用,统筹推进数字中国、数字经济、数字社会规划和建设。



2.3 大数据面临的挑衅



  • 需求模糊
    业务部门需求模糊,企业处于观望状态,担心投入回报。
  • 数据孤岛
    当局部门或企业内部数据碎片化,无法相互买通,没有进行关联和整合,无法发挥数据代价。
  • 数据流失
    企业保存数据的成本较高,导致大量的有代价历史数据被遗弃,数据资产流失。
  • 数据质量差
    企业忽视了大数据的预处理阶段,导致数据处理很不规范,影响了数据的准确率和可用性。
  • 数据安全隐患
    安全威胁日益增长,对体系和数据进行掩护的难度也随之增长。
  • 隐私掩护
    隐私权益掩护的法律法规越来越严格,企业必要进行合规审计,公道正当地进行数据网络和使用。
  • 人才缺乏
    大数据相干人才的短缺,对大数据技术和市场发展形成了肯定拦阻。
2.4 大数据的将来趋势




03 大数据的产业链

3.1 产业架构



泉源:艾瑞咨询



  • 基础层:是大数据技术的底层支撑环境,包括计算、存储、网络等基础硬件和数据库、中间件及相干体系等软件。
  • 技术层:包括大数据平台和数据中台,为大数据提供采集、集成、存储、构造、处理、分析、可视化等本领,并以数据服务的方式提供给应用层。
  • 应用层:是面向各行业和场景的应用体系和办理方案。

3.2 大数据产业链



3.3 大数据的应用领域




04 大数据的关键技术



4.1 大数据的技术演进


我们可以把大数据的技术演进明白为数据存储技术与数据计算技术的演进,这两个领域的技术是大数据技术的焦点。





  • 1960年代,能够统一管理和共享数据的数据库管理体系(DBMS)  诞生;
  • 1990年代,为满意企业数据分析的诉求,数据仓库诞生;
  • 2000年代,以Hadoop为代表的大数据技术体系诞生,大数据研究框架成型;
  • 2010年代,在云技术的动员下,云上纯托管的存储体系逐步取代HDFS,  开始出现数据湖;·
  • 2020年代,开始逐渐走向“云湖共生”、“湖仓一体”。
4.2 大数据的技术栈




免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

用户国营

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表