两种方法把数据导入到Hive

打印 上一主题 下一主题

主题 829|帖子 829|积分 2487

一,在Hive中,我们可以当地数据上传到hive,也可以当地数据上传到HDFS,然后再从HDFS中加载到Hive表中。

了解一下hive的导入数据的方法语句

方法一:使用 LOAD DATA INPATH 语句


  • 创建Hive表:首先,创建一个Hive表,表的布局应该与你要导入的数据的布局相匹配。你可以使用类似以下的SQL语句创建表:
    1. CREATE TABLE my_table (
    2.     column1 datatype1,
    3.     column2 datatype2,
    4.     ...
    5. )
    复制代码
  • 加载数据:使用LOAD DATA INPATH语句将HDFS上的数据加载到Hive表中。比方:
    1. LOAD DATA INPATH '/path/to/hdfs/file' INTO TABLE my_table;
    复制代码
    请替换/path/to/hdfs/file为你要导入的HDFS文件的路径。
方法二:使用 INSERT INTO TABLE 语句


  • 创建Hive表:同样,首先创建一个Hive表,表的布局应该与你要导入的数据的布局相匹配。
  • 使用 INSERT INTO TABLE 语句:如果你想保存原始数据,并将其复制到Hive表中,可以使用INSERT INTO TABLE语句。比方:
    1. INSERT INTO TABLE my_table SELECT * FROM my_temp_table;
    复制代码
    在这个例子中,my_temp_table是一个暂时表,其中包含了HDFS上的数据。你可以在SELECT语句中添加适当的过滤条件、转换操作等。
   要确保你的Hive表的布局与你要导入的数据的布局相匹配,以及数据文件的格式正确。成功导入数据后,你就可以在Hive中对数据举行查询和分析了。
  二,举例子

假设你有一个名为sales_data.csv的CSV文件,它位于你的当地盘算机的/home/user/data目次中,你希望将其导入到 ive中的sales_table表中。
首先,确保在Hive中创建了一个适当的表来存储这些数据。假设你已经创建了一个名为sales_table的表,其布局与sales_data.csv中的数据字段对应。你可以使用类似以下的SQL语句创建这个表:
  1. CREATE TABLE sales_table (
  2.     transaction_id INT,
  3.     product_id INT,
  4.     amount DOUBLE,
  5.     transaction_date STRING
  6. )
  7. ROW FORMAT DELIMITED
  8. FIELDS TERMINATED BY ','
  9. STORED AS TEXTFILE;
复制代码
然后,你可以按照以下步调操作:
直接将当地文件上传到hive
  1. LOAD DATA INPATH 'file://home/user/data/sales_data.csv' INTO TABLE sales_table;
复制代码

  • 将文件上传到HDFS:使用hadoop fs -put或者hdfs dfs -put命令将当地文件上传到HDFS。比方:
  1. hadoop fs -put /home/user/data/sales_data.csv /user/hive/data
复制代码

  • 在Hive中加载数据:使用LOAD DATA INPATH语句将数据加载到Hive表中。比方:
  1. LOAD DATA INPATH '/user/hive/data/sales_data.csv' INTO TABLE sales_table;
复制代码
这样,sales_data.csv文件中的数据就被成功加载到了Hive表sales_table中。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

欢乐狗

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表