ToB企服应用市场:ToB评测及商务社交产业平台

标题: 云计算和大数据处理 [打印本页]

作者: 缠丝猫    时间: 2024-6-15 03:25
标题: 云计算和大数据处理
1.云计算基础知识

1.1 根本概念

云计算是一种提供资源的网络,使用者可以随时获取“云”上的资源,按需求量使用,并且可以看成是无穷扩展的,只要按使用量付费就可以。
云计算是与信息技术、软件、互联网相干的一种服务,把许多计算资源集合起来,通过软件实现自动化管理,只需要很少的人参与,就能让资源被快速提供。
云计算是以一种方便的使用方式和服务模式,通过互联网按需访问资源池模型(例如网络、服务器、存储、应用程序和服务),以快速和最少的管理工作为用户提供服务。接纳“量入为出”的计费方式,即根据用户使用云服务情况收费。
团体而言,云计算时一种将可伸缩、弹性、共享的物理和假造资源池以按需自服务的方式供应和管理,并提供网络访问的模式。
按照ISO/EG17788尺度,云计算的关键特征有:广泛的网络接入、可测量的服务、多租户、按需自服务、快速的弹性和可扩展性、资源池化。

其他关键特征:假造化技术(应用假造和资源假造)、可靠性高、性价比高。
1.2 云计算分类

1)根据云部署模式和云应用范围分类
云计算常见的部署模式有公有云、社区云、私有云和混合云。

2)根据云计算的服务层次和服务范例分类
根据云计算的服务范例可将云分为三层:基础办法即服务、平台即服务和软件即服务。

3)云关键技术
云焦点的关键技术有假造化技术、分布式数据存储、并行计算、运营支撑管理等。

2.大数据处理基础知识

2.1 基础知识

大数据定义:大数据是具有数量巨大、来源多样、生成极快且多变等特征且难以使用传统数据体系布局有效处理的包罗大量数据集的数据。
大数据的5V特征:

2.3 大数据处理技术

大数据处理的根本流程包罗:数据收罗、数据分析和数据表明。

1)数据收罗
数据收罗阶段的主要任务就是获取各个不同数据源的各类数据,按照统一的尺度进行数据的转换、清洗等工作,以形成后续数据处理的符合尺度要求的数据集。
ETL(Extract Transform Load)用来描述将数据从来源端经过抽取 (extract)、转换 (transform)、加载(load)至目标端的过程。目标是将企业中的分散、零乱、尺度不统一的数据整合到一起,为企业的决策提供分析依据。
常用的ETL工具有三种:DataStage、Informatica PowerCenter和Kettle。

爬虫技术也称为数据收罗阶段的一个主要基础性的技术。网络爬虫(又称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取互联网信息的程序或者脚本。

爬虫调度器主要负责统筹其他四个模块的和谐工作。URL管理器负责管理URL链接,维护已经爬取的URL集合和未爬取的URL集合,提供获取新URL链接的接口。HTML下载器用于从URL管理器中获取未爬取的URL链接并下载HTML网页。HTML剖析器用于从HTML下载器中获取已经下载的HTML网页,并从中剖析出新的URL链接交给URL管理器,剖析出有效数据交给数据存储器。
网络爬虫大致可以分为通用网络爬虫、聚焦网络爬虫、深层网络(Deep Web)爬虫:

常见的爬虫工具:

2)数据分析
机器学习一般分为监督学习和非监督学习(或无监督学习)。
监督学习是指利用一组已知种别的样本调解分类器的参数,使其达到所要求性能的过程,也称为监督练习,是从标记的练习数据来推断一个功能的机器学习任务。根据练习集中的标识是一连的还是离散的,可以将监督学习分为回归和分类。

无监督学习是根据种别未知(没有被标记)的练习样本办理模式识别中的各种问题。常见的算法有:关联规则挖掘,是从数据背后发现事物之间可能存在的关联或联系。好比数据挖掘范畴著名的“啤酒-尿不湿”的故事。K-means算法,根本头脑是两个对象的间隔越近,其相似度越大;相似度靠近的若干对象组成一个簇;算法的目标是从给定命据集中找到紧凑且独立的簇。
深度学习算法是基于神经网络发展起来的,包罗BP神经网络、深度神经网络。

3)数据表明
数据表明的主要工作是对大数据处理后产生的输出数据进行处理,接纳公道合适的人机交互方式将结果显现给用户,资助用户做出相应的决策。
信息可视化是指对抽象数据使用计算机支持的、交互的、可视化的表示形式以加强认知能力。为了清晰有效地转达信息,数据可视化使用统计图形、图表、信息图表和其他工具。可以使用点、线或条对数字数据进行编码,以便在视觉上传达定量信息。有效的可视化可以资助用户分析和推理数据和证据。它使复杂的数据更容易理解和使用。用户可能有特定的分析任务 (如进行比较或理解因果关系),以及该任务要遵照的图形计划原则。
常见的大数据可视化工具主要分为三类:底层程序框架,如OpenGL、Java2D等;第三方库,如D3、ECharts、HighCharts、Google ChartAPI等;软件工具,如Tableau、Gephi等。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4