Windows Azure支持Hadoop服务来进行大数据处理惩罚,主要的服务组成部分如图所示。为了利用Windows Azure的Hadoop服务,须要指定所需的虚拟机数量,在云平台上创建一个Hadoop集群。相比于用户自己来构建一个Hadoop集群,Windows Azure将会让用户更简便地完成这一任务。当任务完成不须要集群时,可以将其关闭。同时,用户也不须要付出没利用盘算资源的云代价。
一个Hadoop 应用往往被称为一个作业,它利用MapReduce编程模型。一个MapReduce作业逻辑上在多个虚拟机上同时运行;通过数据并行处理惩罚,Hadoop较单机策略分析数据更快。在Windows Azure平台上,MapReduce作业处理惩罚的数据往往存放在Blob存储中。不同于传统Hadoop的MapReduce作业将数据存放在HDFS上,Windows Azure的Hadoop平台利用Blob存储取代HDFS API来实现数据管理功能。然而,在逻辑上MapReduce作业像访问一般的HDFS文件一样访问Blob存储上的数据流。为了支持多个作业运行在同一数据集上,Windows Azure的Hadoop答应将数据从Blob存储复制到虚拟机上运行的完整HDFS。
MapReduce作业一般采用Java实现。微软也增长了利用C#、F#和JavaScript语言实现功能。除了HDFS和MapReduce, Windows Azure平台的Hadoop服务还支持大数据分析语言Pig、类SQL处理惩罚语言Hive、机器学习库Mahout和图像挖掘体系Pegasus 等技术。
(六)媒体支持
Windows Azure媒体服务是一个PaaS平台用来为用户部署和提供媒体办理方案,具有机动性、可缩放性和可靠性。Windows Azure媒体服务包括注入、编码、格式转换、内容掩护、内容分析、按需和实时流等功能。支持的客户端毗连装备包括Xbox、WP手机、PC、智能TV、机顶盒、MacOS、iOS和安卓装备。