SUMMARIZE_NUMCOL
返回 Vertica 表中列的统计摘要:
-
Count
-
平均值
-
标准偏差
-
最小值/最大值
-
近似百分位
-
中间值
除了计数为 INTEGER 类型,所有汇总值均为 FLOAT 数据类型。
语法
SUMMARIZE_NUMCOL (input‑columns [ USING PARAMETERS exclude_columns = 'excluded‑columns'] ) OVER()
参数
- input‑columns
- 输入关系中要使用的列的逗号分隔列表,或者使用星号 (*) 选择所有列。 所有列都必须为数字数据类型。如果选择所有列,
SUMMARIZE_NUMCOL
将标准化模型中的所有列
参数
exclude_columns
input-columns 中要排除在处理范围之外的列名的逗号分隔列表。
示例
显示 employee
表中 age
和 salary
列的统计摘要:
=> SELECT SUMMARIZE_NUMCOL(* USING PARAMETERS exclude_columns='id,name,gender,title') OVER() FROM employee;
COLUMN | COUNT | MEAN | STDDEV | MIN | PERC25 | MEDIAN | PERC75 | MAX
---------------+-------+------------+------------------+---------+---------+---------+-----------+--------
age | 5 | 63.4 | 19.3209730603818 | 44 | 45 | 67 | 71 | 90
salary | 5 | 3456.76 | 1756.78754300285 | 1234.56 | 2345.67 | 3456.78 | 4567.89 | 5678.9
(2 rows)