1、Hive内部表和外部表区别:主要分为两方面,数据加载load、删除表drop。
数据加载:创建内部表时,会将数据移动到hive指向的路径,并且由hive来管理数据的生命周期。
创建外部表时,只是记录数据所在的路径,不对数据位置做改变。
删除表:删除内部表,数据和元数据会一起删除掉。
删除外部表,只是删除元数据,数据不会删除。
2、如何选择内部表还是外部表:
a、所有数据都由hive管理,就创建内部表;数据由hive和其他工具一起管理,就创建外部表。
b、管理表不方便获取数据的权限,数据由其他工具管理,选用外部表。
来源:https://www.cnblogs.com/guoyu1/p/12238605.html