使用 MC 从 Amazon S3 加载数据

您可以使用管理控制台中的“数据加载活动 (Data Load Activity)”页面,将数据从 Amazon S3 存储导入到现有 Vertica 表。当您运行加载作业时,Vertica 将行附加到您提供的目标表中。如果作业失败,或者您取消了作业,Vertica 则不会向目标表提交任何行。

在“实例 (Instance)”选项卡上查看加载历史记录时,使用 Amazon S3 在 MC 中启动的加载作业在“流名称 (Stream Name)”列中具有名称 MC_S3_Load。

先决条件

要使用 MC 加载功能,您必须:

  • 能够访问 Amazon S3 存储帐户。

  • 在 Vertica 数据库中具有可用来将数据复制到的现有表。您必须是此表的所有者。

  • (对于非 CloudFormation 模板安装)具有 S3 网关端点。

如果您不使用 CloudFormation 模板 (CFT) 来安装 Vertica,则必须在 VPC 中创建一个 S3 网关终端节点。有关详细信息,请参阅 AWS 文档

例如,Vertica CFT 具有以下 VPC 终端节点:

"S3Enpoint" : {
    "Type" : "AWS::EC2::VPCEndpoint",
    "Properties" : {
    "PolicyDocument" : {
        "Version":"2012-10-17",
        "Statement":[{
        "Effect":"Allow",
        "Principal": "*",
        "Action":["*"],
        "Resource":["*"]
        }]
    },
    "RouteTableIds" : [ {"Ref" : "RouteTable"} ],
    "ServiceName" : { "Fn::Join": [ "", [ "com.amazonaws.", { "Ref": "AWS::Region" }, ".s3" ] ] },
    "VpcId" : {"Ref" : "VPC"}
}

创建加载作业

将数据从 Amazon S3 存储桶加载到目标数据库的现有表:

  1. 在目标数据库 MC 仪表板上,单击页面底部的“加载 (Load)”选项卡查看“数据加载活动 (Data Load Activity)”页面。

  2. 单击“实例 (Instance)”选项卡。

  3. 单击选项卡右上方的“新建 S3 数据加载 (New S3 Data Load)”。此时将打开“创建新的 Amazon S3 加载作业 (Create New Amazon S3 Loading Job)”对话框。

  4. 在带有星号 (*) 的必填字段中输入您的 AWS 帐户凭据以及目标位置信息。对存储桶名称使用 S3:// 格式。

  5. (可选)通过填写以下字段指定其他选项:

    • COPY 参数 (COPY Parameters)

    • 将遭到拒绝的数据捕获到表中

    • 拒绝的最大数量 (Reject max)

    有关使用这些字段的更多信息,请参阅关于通过 S3 配置数据加载

取消已启动的加载作业

如果加载作业正在进行,您可以使用“加载历史记录 (Load History)”选项卡的“取消 (Cancel)”列中的“取消 (Cancel)”选项进行取消。单击“取消 (Cancel)”取消加载作业。取消作业时,Vertica 会回退所有行,而且不会向目标表提交任何数据。

另请参阅