基数
是指关系表中某一指定列的唯一值的数量:
-
高基数:指包含具有高度唯一性的值(如客户 ID 或员工电子邮件地址)的列。例如,在 Vertica VMart 架构中,
employee_dimension
表包含一个employee_key
列。此列包含唯一标识各位员工的值。由于此列中的值是唯一的,并且有可能数量庞大,因此该列的基数类型称为高基数。 -
普通基数:指包含具有较低唯一性的值(如职称和街道地址)的列。
job_title
表中的employee_first_name
或employee_dimension
都属于普通基数列,其中很多员工可以共享相同职称或同一名字。 -
*低基数:指唯一值的数量相对于表中记录的总数而言较少。例如,在
employee_dimension
表中,名为employee_gender
的列将包含两个唯一值:“男性”或“女性”。由于此列中只能有两个值,因此为低基数。