2024年全国职业院校技能大赛中职组大数据应用与服务赛项题库参考答案陆续更 ...

打印 上一主题 下一主题

主题 652|帖子 652|积分 1956

(2)启动Hive的动态分区功能,并将Hive设置为非严格模式;
答:
  1. set hive.exec.dynamic.partition=true;
  2. set hive.exec.dynamic.partition.mode=nostrict;
复制代码
(3)使用insert overwrite … select …子句将dwd_behavior_log表中数据插入分区表dws_behavior_log中,并实现根据dt进行动态分区;
答:insert overwrite table dws_behavior_log PARTITION (dt) select * from dwd_behavior_log;
(4)查看dws_behavior_log表的全部现有分区、前3行数据,并统计统计表数据总行数;
答:
  1. SHOW PARTITIONS dws_behavior_log;
  2. SELECT * FROM dwd_behavior_log LIMIT 3;
  3. SELECT count(*) FROM dws_behavior_log;
复制代码
(5)在comm数据库下创建一个名为dim_date的外部表,如果表已存在,则先删除;另外,要求指定表的存储路径为HDFS的/behavior/dim/dim_date目录,字段分隔符为 “\t” , 建 表 时 添 加 TBLPROPERTIES
(‘skip.header.line.count’=‘1’) 语句让Hive读取外表数据时跳过文件行首(表头);字段类型如下表所示;
表7 字段类型表

答:
  1. DROP TABLE IF EXISTS comm.dim_date;
  2. create external table comm.dim_date(date_id string,week_id string,week_day string,day string,month string,quarter string,year string,is_workday string,holiday string) row format delimited fields terminated by '\t' location '/behavior/dim/dim\_date' TBLPROPERTIES ('skip.header.line.count'='1');
复制代码
(6)在comm数据库下创建一个名为dim_area的外部表,如果表已存在,则先删除

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

悠扬随风

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表