基数

是指关系表中某一指定列的唯一值的数量:

  • 高基数:指包含具有高度唯一性的值(如客户 ID 或员工电子邮件地址)的列。例如,在 Vertica VMart 架构中,employee_dimension 表包含一个 employee_key 列。此列包含唯一标识各位员工的值。由于此列中的值是唯一的,并且有可能数量庞大,因此该列的基数类型称为高基数。

  • 普通基数:指包含具有较低唯一性的值(如职称和街道地址)的列。job_title 表中的 employee_first_nameemployee_dimension 都属于普通基数列,其中很多员工可以共享相同职称或同一名字。

  • *低基数:指唯一值的数量相对于表中记录的总数而言较少。例如,在 employee_dimension 表中,名为 employee_gender 的列将包含两个唯一值:“男性”或“女性”。由于此列中只能有两个值,因此为低基数。