分区表

数据分区定义为表属性,并在该表的所有投影上实施。在所有加载、刷新和恢复操作中,Vertica Tuple Mover 会将数据自动分区到不同的 ROS 容器中。每个 ROS 容器包含单个分区或分区组的数据;根据空间要求,一个分区或分区组可以跨多个 ROS 容器。

例如,按时间段对数据进行分区很常见。如果表包含数十年的数据,则可以按年份对其进行分区。如果表仅包含一年的数据,则可以按月份对其进行分区。

数据的逻辑划分可以显著改善查询执行。例如,如果对表的 partition 子句中的列查询表,则查询优化器可以快速隔离相关的 ROS 容器(请参阅分区修剪)。

分区还可以促进 DML 操作。例如,给定一个按月份分区的表,便可以在新月份开始时删除最旧月份的所有数据。在这种情况下,Vertica 可以轻松识别存储要删除的分区数据的 ROS 容器。有关详细信息,请参阅管理分区