下载机器学习示例数据
您需要多个数据集来运行机器学习示例。可以从 Vertica GitHub 存储库下载这些数据集。
重要
GitHub 示例基于最新的 Vertica 版本。如果您注意到差异,请升级到最新版本。您可以通过以下两种方式之一下载示例数据:
-
下载 ZIP 文件。将文件内容解压缩到目录中。
-
克隆 Vertica 机器学习 GitHub 存储库。使用终端窗口,运行以下命令:
$ git clone https://github.com/vertica/Machine-Learning-Examples
加载示例数据
您可以通过执行以下操作之一加载示例数据。请注意,模型不会自动删除。您必须重新运行 load_ml_data.sql
脚本来删除模型,或者手动删除模型。
-
在 vsql 提示符或其他 Vertica 客户端中,使用
load_ml_data.sql
复制并粘贴 DDL 和 DML 操作。 -
从 Machine-Learning-Examples 目录的 data 文件夹中的终端窗口运行以下命令:
$ /opt/vertica/bin/vsql -d <name of your database> -f load_ml_data.sql
您还必须在 Machine-Learning-Examples 目录中加载 naive_bayes_data_prepration.sql
脚本:
$ /opt/vertica/bin/vsql -d <name of your database> -f ./naive_bayes/naive_bayes_data_preparation.sql
示例数据描述
存储库包含以下数据集。