大数据(Hive-外部表分区)

本小妞迷上赌 提交于 2020-03-19 20:18:23

3 月,跳不动了?>>>

1:定义
    未被external修改的是内部表(MANAGED TABLE),被external修饰的为外部表(EXTERNAL TABLE)
    创建外部表语法:

    create external table person2(
     id int,
     name string,
     hobby array<string>,
     addr map<string,string>
     )
     row format delimited 
     fields terminated by ',' 
     collection items terminated by '-' 
     map keys terminated by ':' 
     location '/user/person2' 
     ;

2:区别
    1)内部表数据由hive自身管理,外部表数据由hdfs来管理
        内部表数据存储的位置默认/user/hive/warehouse,
        外部表数据存储的位置由用户自己指定

    2)删除内部表会直接删除元数据和存储数据
       删除外部表仅仅只会删除元数据,HDFS上的文件不会删除。


3:分区表
    1)定义语法

     create table p1(
             id int,
             name string,
             hobby array<string>,
             addr map<string,string>
         )
         partitioned by (p_dt string) 
         row format delimited 
         fields terminated by ',' 
         collection items terminated by '-' 
         map keys terminated by ':' 
         ;


    注意:分区字段不能和表中的字段重复,若要创建分区表,必须在表定义的时候创建partition

    


 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!