查看存储库效率

“存储库效率 (Depot Efficiency)”选项卡提供了几个图形,可帮助用户快速确定存储库是否经过适当优化。

文件读取(按位置)(File Reads By Location)

显示在指定时间范围内从存储库和公共存储读取的百分比。一般来说,您希望大多数查询和其他读取操作从存储库而非公用存储中获取数据,如下图所示。如果显示从公共存储读取文件所占百分比很大,则可能需要增加存储库大小。

存储库中的前 10 个重新获取

Vertica 会根据需要从存储库中逐出数据,以便为新数据提供空间,以及提高请求处理速度。繁忙的数据库中预期会发生存储库获取和逐出操作。但是,您通常希望避免对相同的表数据重复执行逐出和获取操作。如果发生这种情况,请考虑增加存储库的大小,或者将表或经常访问的分区固定到存储库。

存储库固定

通常建议固定其数据被频繁访问的表或表分区。这样做可以降低其从存储库中逐出的风险。但是,您还应该注意,固定数据不应占用过多的存储库存储空间。如果固定对象占用了过多的存储库空间(如下所示),则存储库可能无法处理未固定对象的加载操作。

存储库中表的数量(按年限)

通常情况下,表应驻留在存储库中,前提是需要使用其数据。如果表驻留的平均时间较短,这可能表明执行了频繁的存储库逐出操作,这可能会对整体性能产生不利影响。如果发生这种情况,请考虑增加存储库大小,或固定经常访问的表数据。

存储库中表的数量(按访问计数)

一般来说,存储库应主要包含经常访问的表,包括已固定和未固定的表。

存储库中表的数量(按大小)

了解存储库中表大小的分布非常有用。