下载机器学习示例数据

您需要多个数据集来运行机器学习示例。可以从 Vertica GitHub 存储库下载这些数据集。

您可以通过以下两种方式之一下载示例数据:

  • 下载 ZIP 文件。将文件内容解压缩到目录中。

  • 克隆 Vertica 机器学习 GitHub 存储库。使用终端窗口,运行以下命令:

    $ git clone https://github.com/vertica/Machine-Learning-Examples
    

加载示例数据

您可以通过执行以下操作之一加载示例数据。请注意,模型不会自动删除。您必须重新运行 load_ml_data.sql 脚本来删除模型,或者手动删除模型。

  • 在 vsql 提示符或其他 Vertica 客户端中,使用 load_ml_data.sql 复制并粘贴 DDL 和 DML 操作。

  • 从 Machine-Learning-Examples 目录的 data 文件夹中的终端窗口运行以下命令:

    $ /opt/vertica/bin/vsql -d <name of your database> -f load_ml_data.sql
    

您还必须在 Machine-Learning-Examples 目录中加载 naive_bayes_data_prepration.sql 脚本:

$ /opt/vertica/bin/vsql -d <name of your database> -f ./naive_bayes/naive_bayes_data_preparation.sql

示例数据描述

存储库包含以下数据集。