首页 > 技术文章 > 分区表的操作

wangzhaojun1670 2020-08-24 08:22 原文

1.什么是分区表

在大数据中,最常用的一种思想就是分治,我们可以把大的文件分割成一个个的小文件,这样每次操作一个小文件就很容易了。在hive中仍然支持这种操作,将大的数据按照时间等划分成一个个的小文件,存放在不同的文件夹中。

2.创建分区表

 

 关键字:partitioned by(分区字段,类型)分区字段与表没有联系,在向该表中加载数据时,为分区字段指定参数,系统会自动创建该目录,将文件保存入该目录下

分区字段可以有多个,一个分区字段会创建一级文件夹,多个分区字段会创建多级文件夹

3.向分区表中加载数据

 

 4.查看某一分区的数据

 

 5.多分区联合查询

 

 6.查看分区

 

7.添加分区

8.删除分区

 

推荐阅读