使用 MC 从 Amazon S3 加载数据
您可以使用管理控制台中的“数据加载活动 (Data Load Activity)”页面,将数据从 Amazon S3 存储导入到现有 Vertica 表。当您运行加载作业时,Vertica 将行附加到您提供的目标表中。如果作业失败,或者您取消了作业,Vertica 则不会向目标表提交任何行。
在“实例 (Instance)”选项卡上查看加载历史记录时,使用 Amazon S3 在 MC 中启动的加载作业在“流名称 (Stream Name)”列中具有名称 MC_S3_Load。
先决条件
要使用 MC 加载功能,您必须:
-
能够访问 Amazon S3 存储帐户。
-
在 Vertica 数据库中具有可用来将数据复制到的现有表。您必须是此表的所有者。
-
(对于非 CloudFormation 模板安装)具有 S3 网关端点。
如果您不使用 CloudFormation 模板 (CFT) 来安装 Vertica,则必须在 VPC 中创建一个 S3 网关终端节点。有关详细信息,请参阅 AWS 文档。
例如,Vertica CFT 具有以下 VPC 终端节点:
"S3Enpoint" : {
"Type" : "AWS::EC2::VPCEndpoint",
"Properties" : {
"PolicyDocument" : {
"Version":"2012-10-17",
"Statement":[{
"Effect":"Allow",
"Principal": "*",
"Action":["*"],
"Resource":["*"]
}]
},
"RouteTableIds" : [ {"Ref" : "RouteTable"} ],
"ServiceName" : { "Fn::Join": [ "", [ "com.amazonaws.", { "Ref": "AWS::Region" }, ".s3" ] ] },
"VpcId" : {"Ref" : "VPC"}
}
创建加载作业
将数据从 Amazon S3 存储桶加载到目标数据库的现有表:
-
在目标数据库 MC 仪表板上,单击页面底部的“加载 (Load)”选项卡查看“数据加载活动 (Data Load Activity)”页面。
-
单击“实例 (Instance)”选项卡。
-
单击选项卡右上方的“新建 S3 数据加载 (New S3 Data Load)”。此时将打开“创建新的 Amazon S3 加载作业 (Create New Amazon S3 Loading Job)”对话框。
-
在带有星号 (*) 的必填字段中输入您的 AWS 帐户凭据以及目标位置信息。对存储桶名称使用 S3:// 格式。
-
(可选)通过填写以下字段指定其他选项:
-
COPY 参数 (COPY Parameters)
-
将遭到拒绝的数据捕获到表中
-
拒绝的最大数量 (Reject max)
有关使用这些字段的更多信息,请参阅关于通过 S3 配置数据加载。
-
取消已启动的加载作业
如果加载作业正在进行,您可以使用“加载历史记录 (Load History)”选项卡的“取消 (Cancel)”列中的“取消 (Cancel)”选项进行取消。单击“取消 (Cancel)”取消加载作业。取消作业时,Vertica 会回退所有行,而且不会向目标表提交任何数据。