AUTOREGRESSOR
通过具有一致时间步长的平稳时间序列创建自回归 (AR) 模型,此模型可用于通过 PREDICT_AUTOREGRESSOR 进行预测。
自动回归模型将根据先前的值来预测时间序列的未来值。更具体地说,用户指定的 lag 决定了该模型在计算过程中要考虑多少个先前的时间段,且预测值为每个 lag 的线性组合。
由于输入数据必须按时间戳排序,因此,此算法为单线程算法。
这是元函数。您必须在顶级 SELECT 语句中调用元函数。
行为类型
易变语法
AUTOREGRESSOR ('model‑name', 'input‑relation', 'data‑column', 'timestamp‑column'
[ USING PARAMETERS
[ p = lags ]
[, missing = "imputation‑method" ]
[, regularization = "regularization‑method" ]
[, lambda = regularization‑value ]
[, compute_mse = boolean ]
] )
参数
-
model‑name
- 标识要创建的模型,其中 model‑name 符合标识符中描述的约定。 同一架构中的序列、表、投影、视图和模型中也必须是唯一的。
-
input‑relation
- 包含 timestamp‑column 的表或视图。
该算法需要平稳的时间序列作为输入;使用平均值随着时间变化的时间序列可能会导致结果欠佳。
-
data‑column
- 包含因变量或结果的 NUMERIC 类型的输入列。
-
timestamp‑column
- 表示时间戳变量的 INTEGER、FLOAT 或 TIMESTAMP 列。时间步长必须一致。
参数
p
- [1, 1999] 范围内的 INTEGER,表示计算中要考虑的滞后数。较大的
p
值会削弱相关性。默认值: 3
missing
- 用于处理缺失值的方法,为以下之一:
-
drop:忽略缺失值。
-
error:缺失值会引发错误。
-
zero:将缺失值替换为 0。
-
linear_interpolation:将缺失值替换为基于缺失值前后最近的有效条目的线性插值。这意味着如果数据集中第一个或最后一个值缺失,会将其直接删除。
默认值: linear_interpolation
-
regularization
- 拟合数据时使用的正则化方法,为以下之一:
-
无
-
L2:权重正则化项,即惩罚权重的平方值
默认值: 无
-
lambda
- [0, 100000] 范围内的 FLOAT,正则化值 lambda。
默认值: 1.0
compute_mse
- BOOLEAN,是否计算并输出均方误差 (MSE)。
默认值: False
示例
请参阅自回归模型示例。