ToB企服应用市场:ToB评测及商务社交产业平台
标题:
Hadoop简介
[打印本页]
作者:
万万哇
时间:
昨天 22:02
标题:
Hadoop简介
1. Hadoop简介
官网:http://hadoop.apache.org
1.1 Hadoop架构
Hadoop由三个模块构成:
分布式
存储HDFS、分布式计算MapReduce、资源调度引擎YARN
1.2 Hadoop汗青
Hadoop作者Doug Cutting
Apache Lucene是一个文本搜索系统库
Apache Nutch作为前者的一部门,主要包罗web爬虫、全文检索;2003年“谷歌分布式文件系统GFS”论文,2004年开源版本
NDFS
2004年“谷歌MapReduce”论文,2005年Nutch开源版MapReduce
2、更多内容:
Hadoop相关
HDFS分布式文件系统
MR(MapReduce)离线数据处理
YARN集群资源管理
Hive相关
Hive-01之数仓、架构、数据范例、DDL、内外部表
Hive-02之分桶表、数据导入导出、静动态分区、查询、排序、hiveserver2
Hive-03之传参、常用函数、explode、lateral view、行专列、列转行、UDF
Hive-04之存储格式、SerDe、企业级调优
Hive-05之查询 分组、排序、case when、 什么情况下Hive可以制止举行MapReduce
Hive-06之函数 聚合Cube、Rollup、窗口函数
Hive-07之企业级调优
Hive-08之数据仓库之建模、分析
Hive-09之主流文件存储格式对比
Hive-10之数据倾斜处理办法
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/)
Powered by Discuz! X3.4