欢迎学习用于 Google Cloud Platform 的 vertica 的指南。
Vertica 提供了两个模板来帮助您部署在 企业模式或 Eon 模式下运行的 Vertica 数据库。有关这些模式的详细信息,请参阅体系结构。
以下主题介绍了在 Google Cloud Platform 上运行 Vertica 的几种部署方法。
Vertica 分析数据库支持一系列计算机类型,每种都针对不同的工作负载进行了优化。当您将 Vertica 分析数据库群集部署到 Google Cloud Platform (GCP) 时,可以使用不同的计算机类型,具体取决于您配置数据库的方式。
以下部分列出了 Vertica 支持用于 Vertica 群集主机以及用于管理控制台的 GCP 计算机类型。有关计算机类型选项配置的详细信息,请参阅 Google Cloud 文档的计算机类型页面。
Vertica 支持所有 N1、N2、E2、M1、M2 和 C2 计算机类型来部署实例以运行 Vertica 管理控制台。
Vertica 支持所有 N1、N2、E2、M1、M2 和 C2 计算机类型来部署群集主机。
下表列出了当您从管理控制台配置群集时 Vertica 支持的 GCP 计算机类型。
Google Cloud Launcher Marketplace 中的 Vertica 条目可让您在 Google Cloud Platform (GCP) 中快速部署 Vertica 群集。目前,有三个条目可让您选择数据库模式和要使用的许可证:
企业模式启动器部署具有 3 个或更多节点的 Vertica 数据库,以及一个运行 管理控制台 (MC) 的附加 VM。有关详细信息,请参阅在 GCP 中从市场部署企业模式数据库。
Eon 模式 BYOL(自带许可证)启动器部署单个运行 MC 的实例。您使用此 MC 实例部署在 Eon 模式下运行的 Vertica 数据库。此数据库最初应用了社区版许可证。您可以稍后将其升级为您从 Vertica 获得的许可证。有关详细信息,请参阅在 GCP 上部署 Eon 模式数据库。
Eon 模式 BTH(按小时)启动器还会部署单个运行用于部署数据库的 MC 的实例。此数据库应用了按小时计算的许可证。您无需预先支付许可证费用,而是按小时支付 Vertica 和运行实例的费用。 BTH 许可证将自动应用于您使用 BTH MC 实例创建的所有群集。 有关详细信息,请参阅在 GCP 上部署 Eon 模式数据库。如果您愿意,则可以将这一每小时许可证升级到从 Vertica 购买的长期许可证。要将 BTH 群集迁移到 BYOL 许可证,请按照将云安装从按小时 (BTH) 计算迁移到自带许可证 (BYOL) 中的说明进行操作,以获取更多信息。
Vertica Cloud Launcher 解决方案创建一个 Vertica 企业模式数据库。该解决方案包括 Vertica 管理控制台 (MC) 作为您入门的主要 UI。
启动器使用社区版 (CE) 许可证自动创建名为 vdb 的数据库。CE 许可证限制为最多 3 个节点。您可以告诉启动器向您的部署中添加 3 个以上的节点。在这种情况下,它使用群集中的前三个节点来创建数据库。其余节点不是数据库的一部分,而是添加到您的群集中。要将这些节点添加到您的数据库中,您必须将社区版许可证替换为从软件授权支持站点获得的许可证密钥。有关详细信息,请参阅管理许可证。
在启动器创建初始数据库后,它会将 MC 配置为自动附加到该数据库。
要从 Google Cloud Launcher 开始部署 Vertica,请搜索 Vertica Data Warehouse, Enterprise Mode 条目。
请遵循以下步骤:
验证您的用户帐户具有编辑者 (Editor) 角色和 runtimeconfig.waiters.getIamPolicy
权限。
在列表页面中,单击启动 (LAUNCH)。
在新 Vertica Analytics Platform 部署页面上,输入以下信息:
部署名称 (Deployment name):每个部署必须具有唯一的名称。该名称用作部署期间创建的所有 VM 的名称的前缀。部署名称只能包含小写字符、数字和短划线。该名称必须以小写字母开头,不能以短划线结尾。
分区 (Zone):GCP 将其云数据中心划分为区域和分区。区域是位于同一地理位置的分区的集合。分区是计算资源的集合,这些资源因分区而异。
为获得最佳效果,请在指定区域中选择支持最新 Intel CPU 的分区。有关区域和分区(包括支持的处理器)的完整列表,请参阅区域和分区。
服务帐户:服务帐户允许自动化流程通过 GCP 进行身份验证。选择
project_number-compute@developer.gserviceaccount.com
标识的默认服务帐户。
在 Vertica 管理控制台 (Vertica Management Console) 下,选择将运行管理控制台的虚拟机的配置。Cloud Launcher 中的 Vertica Analytics Platform 始终将 Vertica 管理控制台 (MC) 部署为解决方案的一部分。
MC 的默认计算机类型足以满足大多数部署的需求。您可以选择更适合任何其他用途的其他计算机类型,例如用作备份、数据转换或其他管理工具的目标节点。
Vertica 群集的节点计数 (Node count for Vertica Cluster):要在 Vertica 群集中部署的 VM 总数。默认值为 3。
如上所述,Cloud Launcher 会自动部署 Vertica 社区版许可证,该许可证将数据库限制为 3 个节点和最多 1 TB 的原始数据。任何其他节点都将成为您的数据库群集的一部分,但不会成为您的数据库的一部分。
如果您打算对数据库使用社区版许可证,请将设置保留为 3。否则,您将添加闲置的节点,这些节点将花费您的资金,而不会成为数据库的一部分。
Vertica 群集节点的计算机类型 (Machine type for Vertica Cluster nodes):Cloud Launcher 使用相同的计算机类型构建群集中的每个节点。根据您希望数据库处理的工作负载,修改节点的计算机类型。有关详细信息,请参阅支持的 GCP 计算机类型。
数据磁盘类型 (Data disk type):GCP 提供两种类型的永久性磁盘存储:标准和 SSD。与标准存储相关的成本较低,但 SSD 存储的性能要好得多。Vertica 建议您使用 SSD 存储。有关标准和 SSD 永久性磁盘存储的详细信息,请参阅存储选项。
磁盘大小 (GB) (Disk size in GB):磁盘性能与 GCP 中的磁盘大小直接相关。默认值 2000 GB (2 TB) 是 SSD 永久性磁盘的最小磁盘大小,可实现最大吞吐量。
如果选择较小的磁盘大小,则吞吐量性能会降低。如果选择较大的磁盘大小,则性能与 2 TB 选项相同。
网络 (Network):GCP 中的 VM 必须存在于虚拟私有云 (VPC) 上。当创建了 GCP 帐户时,会创建一个默认 VPC。创建额外的 VPC 以将解决方案或项目彼此隔离。Vertica Analytics Platform 在同一个 VPC 中创建所有节点。
子网 (Subnetwork):正如一个 GCP 帐户可能有多个 VPC,每个 VPC 也可能有多个子网。使用其他子网对同一 VPC 中的解决方案进行分组或隔离。
防火墙 (Firewall):如果您希望通过 Internet 访问您的 MC,请选中“允许从 Internet 访问管理控制台 (Allow access to the Management Console from the Internet)”框。Vertica 建议您使用防火墙保护您的 MC,该防火墙将访问限制为仅需要访问它的用户的 IP 地址。您可以输入一个或多个以逗号分隔的 CIDR 地址范围。
输入所有必需信息后,单击部署 (Deploy) 开始部署过程。
部署开始后,Google Cloud Launcher 会自动打开“部署管理器 (Deployment Manager)”页面,其中显示了部署状态。仍在处理的项目的左侧有一个旋转的圆圈,文本为浅灰色。已创建的项目为深灰色,左侧有一个指定该资源类型的图标。
部署完成后,屏幕左上角的部署名称旁边会出现一个绿色复选标记。
部署完成后,屏幕右侧部分会显示以下信息:
dbadmin 密码 (dbadmin password):为节点上的 dbadmin 帐户随机生成的密码。出于安全原因,请在首次登录到其中一个 Vertica 群集节点时更改 dbadmin 密码。
mcadmin 密码 (mcadmin password):为用于访问管理控制台的 mcadmin 帐户随机生成的密码。出于安全原因,请在首次登录 MC 后更改 mcadmin 密码。
Vertica 节点 1 IP 地址 (Vertica Node 1 IP address):Vertica 群集中第一个节点的外部 IP 地址在此处公开,以便您可以使用标准 SSH 客户端连接到 VM。要访问 MC,请按该对话框的开始 (Get Started) 部分中的访问 Vertica MC (Access Vertica MC) 按钮。复制 mcadmin 密码并在需要时粘贴。
有关使用 MC 的详细信息,请参阅管理控制台。
有两种方法可以直接访问群集节点:
通过选择开始 (Get Started) 部分中的“SSH”按钮,使用 GCP 的集成 SSH Shell。此 Shell 会在浏览器中打开一个弹出窗口,用于运行 GCP 的基于 Web 的 SSH 客户端。您将以您在 GCP 环境中进行身份验证的用户身份自动登录。
在您有权访问第一个 Vertica 群集节点后,执行 su dbadmin
命令,并使用 dbadmin 密码进行身份验证。
此外,使用其他标准 SSH 客户端直接连接到第一个 Vertica 群集节点。使用屏幕上列出的 Vertica 节点 1 IP 地址作为 dbadmin 用户,并使用 dbadmin 密码进行身份验证。
按照屏幕上的说明使用 mcadmin 帐户登录并接受 EULA。通过身份验证后,通过单击最近使用的数据库 (Recent Databases) 部分中的 vdb 图标(外观为绿色圆柱体)来访问初始数据库。
通常,您应使用 GCP 部署创建的默认服务帐号 (
project_number-compute@developer.gserviceaccount.com
),但如果您想使用自定义服务帐户:
自定义服务帐户必须具有编辑 角色。
个人用户帐户必须在自定义服务帐户中具有服务帐户用户 角色。
您可以使用 Google Cloud Platform Launcher 将 Eon 模式数据库部署到 GCP,以部署管理控制台 (MC) 实例。然后,使用 MC 实例配置和部署 Eon 模式数据库。
当使用 MC 将 Eon 模式数据库部署到 Google Cloud Platform (GCP) 时,您可以选择要部署为数据库节点的实例类型。MC 中的默认实例设置是更保守的选项(当前为 n1-standard-16)。它们足以满足大多数工作负载的需求。但是,如果您的查询执行可能会溢出到磁盘的复杂联接,则可以选择具有更多内存的实例(例如 n1-highmem-16)。如果您执行高度复杂的计算密集型分析,则还可以选择具有更多核心的实例(例如 n1-standard-32)。以下链接提供了有关 GCP 计算机类型实例和 Vertica 的其他信息:
计算机类型:描述每个实例选项的配置详细信息的 Google Cloud 文档。
支持的 GCP 计算机类型:当将 Vertica 部署到 GCP 时可用的计算机类型。
GCP 的 Eon 模式卷配置默认值:有关 Vertica 默认卷配置的详细信息。
您选择的实例越强大,每小时的成本就越高。您需要权衡是要使用更少、功能更强但成本更高的实例,还是要依赖成本更低、功能更弱的实例。由于 Eon 模式的弹性,如果您选择使用功能较弱的实例,则始终可以添加更多节点来满足高峰需求。当您在非高峰时段将实例数量减少到最小值时,您花费的开销将比拥有类似数量的功能更强的实例时要少。
MC 的部署向导还要求您为实例选择本地存储类型。您可以为 Vertica 使用的每种本地存储类型选择不同的选项:编录、存储库和临时空间。对于所有这些存储位置,您可以选择要使用的磁盘类型(标准与 SSD)。您会看到使用 SSD 磁盘时性能最佳。但是,SSD 磁盘的成本更高。
对于存储库,您还可以选择是使用本地磁盘还是永久性磁盘。本地选项更快,因为它直接驻留在虚拟机主机上。但是,每当您关闭节点时,此存储都会被清除干净。永久性存储比本地选项慢,因为它不直接存储在托管实例的计算机上。但是,每当您关闭实例时,它都不会被清除。有关详细信息,请参阅 Google Cloud 文档的存储选项页面。
您选择哪些选项取决于节点在启动时必须执行多长时间 存储库预热。如果节点的存储库内容随时间变化不大(或者您倾向于频繁启动和停止实例),则使用永久性存储是有意义的。在这种情况下,存储库预热期会更短,因为当节点启动时,节点参与查询所需的大部分数据可能仍在其存储库中。当节点参与查询时,节点将从公共存储中执行更少的数据提取。
如果您的工作数据集快速变化,或者您倾向于让节点长时间停止,那么最佳选择通常是使用本地存储。在这种情况下,当节点重新启动时,节点存储库中的数据通常是陈旧的。要参与查询,节点必须从公共存储中提取所需的大部分数据,从而导致性能降低,直到它预热了其存储库。在这里使用本地临时存储是有意义的,因为您将获得因存储库的存储速度提高所带来的好处。由于您的节点无论如何都必须预热它们的存储库,因此将存储库放在临时存储上的缺点较少。
有关为 Eon 模式数据库扩展群集的常规指导原则,请参阅为 Eon 模式配置 Vertica 群集。
在 GCP 上部署 Eon 模式数据库之前,您必须执行以下几个步骤:
查看 GCP 项目的默认服务帐户的权限。
创建要在创建群集时使用的 HMAC 密钥。
创建公共存储位置。
服务帐户允许自动化流程通过 GCP 进行身份验证。Eon 模式数据库部署过程使用 GCP 项目的项目服务帐户来部署实例。当您创建新项目时,GCP 会自动为该项目创建一个默认服务帐户(由
project_number-compute@developer.gserviceaccount.com
标识),并授予其 IAM 角色编辑者。有关此角色和其他 IAM 角色的详细信息,请参阅 Google Cloud 文档的了解角色。
编辑者角色允许服务帐户从市场创建资源。当您创建管理控制台 (MC) 的实例时,MC 使用该帐户部署更多资源,例如为数据库配置实例。
有关详细信息,请参阅 Google Cloud 文档的了解服务帐户页面。
要在 GCP 上部署 Vertica,您的用户帐户必须具有:
编辑者 (Editor) 角色。
runtimeconfig.waiters.getIamPolicy
权限。
Vertica 使用基于哈希的消息身份验证代码 (HMAC) 密钥对访问公共存储位置的请求进行身份验证。此密钥有两部分:访问 ID 和密钥。当您在 GCP 中创建 Eon 模式数据库时,您需要提供 HMAC 密钥的两个部分供节点用于访问公共存储。
要创建 HMAC 密钥:
登录到您的 Google Cloud 帐户。
如果您将用于创建数据库的项目的名称未显示在顶部横幅中,请单击下拉列表并选择正确的项目。
在左上角的导航菜单中的“存储 (Storage)”标题下,单击存储 (Storage) 并选择设置 (Settings)。
在“设置 (Settings)”页面中,单击互操作性 (Interoperability)。
滚动到页面底部,并找到“用户帐户 HMAC (User account HMAC)”标题。
除非您已经设置了默认项目,否则您会看到一条消息,指出您尚未为用户帐户设置默认项目。单击设置 project-id 作为默认项目 (Set project-id as default project) 按钮选择当前项目作为默认项目以实现互操作性。
在您的用户帐户的“访问密钥 (Access keys)”下,单击创建密钥 (Create a key)。
您的新访问密钥将显示在 HMAC 密钥列表中。当您创建 Eon 模式数据库时将需要它们。您可以将它们复制到方便的位置(例如文本编辑器),或使用一个浏览器选项卡打开此页面,同时使用另一个选项卡或窗口创建数据库。这些密钥在此页面上仍然可用,因此您无需担心它们会保存到其他位置。
您的 Eon 模式数据库需要将一个存储位置作为其公共存储。在 GCP 上运行的 Eon 模式数据库使用 Google Cloud Storage (GCS) 作为其公共存储位置。当您创建新的 Eon 模式数据库时,您将为 MC 的向导提供存储位置的 GCS URL。
此位置需要满足以下条件:
URL 必须至少包含一个存储桶名称。您也可以使用一个或多个级别的文件夹。例如,以下 GCS URL 是有效的:
gs://verticabucket/mydatabase
gs://verticabucket/databases/mydatabase
gs://verticabucket
多个数据库可以共享同一个存储桶,只要每个数据库都有自己的文件夹即可。
如果提供,则 URL 中的最低级别文件夹应当尚不存在。例如,在 GCS URL gs://verticabucket/databases/mydatabase
中,必须存在名为 verticabucket
的存储桶和名为 databases
的目录。名为 mydatabase
的子目录不得存在。Vertica 安装过程应该自行创建最终文件夹。如果该文件夹已存在,则安装过程将失败。
必须将存储桶的权限设置为允许服务帐户对存储桶具有读取、写入和删除权限。要获得这些权限,分配给用户的最佳角色是存储对象管理员。
为防止出现性能问题,存储桶必须与运行 Eon 模式数据库的所有节点位于同一区域。
如果通过 admintools UI 创建数据库,则必须在 admintools.conf
中将 gcsauth
设置为引导参数。有关此参数和其他 GCP 参数的详细信息,请参阅 Google Cloud Storage 参数。
[BootstrapParameters]
gcsauth = ID:secret
执行 GCP 上 Eon 模式的先决条件中列出的步骤后,您就可以在 GCP 中部署 Eon 模式数据库了。此过程包含两个步骤:部署单节点 MC 实例,然后使用 MC 配置和部署数据库。以下主题介绍了这些步骤。
要将能够部署 Eon 模式数据库的 MC 实例部署到 GCP:
登录到您的 GCP 帐户(如果您当前未登录)。
验证您的用户帐户具有编辑者 (Editor) 角色和 runtimeconfig.waiters.getIamPolicy
权限。
验证要用于部署的 GCP 项目的名称是否显示在顶部横幅中。如果没有,请单击项目名称旁边的向下箭头并选择正确的项目。
单击页面左上角的导航菜单图标,然后选择市场 (Marketplace)。
在搜索解决方案 (Search for solutions) 框中,键入 Vertica Eon Mode 并按 Enter。
单击 Vertica 数据仓库,Eon 模式 (Vertica Data Warehouse, Eon Mode) 的搜索结果。有两个许可证选项:按小时 (BTH) 和自带许可证 (BYOL)。有关此许可证选择的详细信息,请参阅从 Google Cloud Marketplace 部署 Vertica。
在您喜欢的许可证选项上单击启动 (Launch)。
在下一页面上,填写字段以配置您的 MC 实例:
部署名称 (Deployment name):在 GCP 部署页面中标识您的 MC 部署。
区域 (Zone):是运行 MC 实例的虚拟机的部署位置。将此位置设置为与公共存储桶所在的位置相同。
服务帐户:服务帐户允许自动化流程通过 GCP 进行身份验证。选择
project_number-compute@developer.gserviceaccount.com
标识的默认服务帐户。
计算机类型 (Machine Type):是将运行 MC 的实例的虚拟硬件配置。此处的默认值是“中间”设置,足以满足大多数用例。如果您正在进行一个小型的概念验证部署,则可以选择一个功能不那么强大的实例来节省资金。如果您计划部署多个大型数据库,请考虑增加虚拟 CPU 和 RAM 的计数。
有关 Vertica 的默认卷配置的详细信息,请参阅GCP 的 Eon 模式卷配置默认值。
用于访问 MC 的用户名 (User Name for Access to MC):是 MC 的管理员用户名。如果需要,您可以自定义它。
网络 (Network) 和子网 (Subnetwork):是您希望 MC 实例和 Vertica 节点使用的虚拟私有云 (VPC) 网络和该网络中的子网。此设置不会影响您的 MC 的外部网络地址。如果要将 Vertica 群集与项目中的其他 GCP 实例隔离,请在 GCP 项目中创建自定义 VPC 网络和子网(可选),然后在这些字段中选择它们。有关详细信息,请参阅 Google Cloud 文档的 VPC 网络概述页面。
防火墙 (Firewall):允许通过在防火墙中打开端口 5450 从 Internet 访问 MC。您可以通过清除我接受在防火墙中为 Vertica 打开端口 (5450) (I accept opening a port in the firewall (5450) for Vertica) 框来选择不打开此端口。但是,如果您未在防火墙中打开端口,则只能从 VPC 网络内访问您的 MC 实例。不打开端口将使访问您的 MC 实例变得更加困难。
MC 流量的源 IP 范围 (Source IP ranges for MC traffic):如果选择打开 MC 进行外部访问,请将一个或多个 CIDR 地址范围添加到此框中,以指定您希望能够访问 MC 的网络地址。
单击部署 (Deploy) 按钮开始部署您的 MC 实例。
部署过程将需要几分钟时间。
通常,您应使用 GCP 部署创建的默认服务帐号 (
project_number-compute@developer.gserviceaccount.com
),但如果您想使用自定义服务帐户:
自定义服务帐户必须具有编辑 角色。
个人用户帐户必须在自定义服务帐户中具有服务帐户用户 角色。
在部署过程完成后,MC 实例的“部署管理器 (Deployment Manager)”页面包含通过浏览器或 SSH 连接到 MC 的链接。
要连接到 MC 实例:
MC 管理员用户有一个随机生成的密码,您需要使用该密码登录 MC。将 MC 管理员密码 (MC Admin Password) 字段中的密码复制到剪贴板。
单击访问管理控制台 (Access Management Console)。
将打开一个新的浏览器选项卡或窗口,向您显示标题为“重定向通知 (Redirection Notic)”的页面。单击 MC URL 的链接以继续进入 MC 登录页面。
您的浏览器可能会向您显示安全警告。MC 实例使用自签名安全证书。大多数浏览器将这些证书视为安全隐患,因为它们无法验证其来源。您可以放心地忽略此警告并继续。在大多数浏览器中,单击警告页面上的“高级 (Advanced)”按钮,然后选择选项以继续。在 Chrome 中,它是一个标题为“继续* xxx.xxx.xxx.xxx***(不安全) (Proceed toxxx.xxx.xxx.xxx(unsafe))**”的链接。在 Firefox 中,它是一个标有“接受风险并继续 (Accept the Risk and Continue)”的按钮。
在登录屏幕上的用户名 (Username) 框中输入 MC 管理员用户名。此用户名为 mcadmin,除非您在 MC 部署表单中更改了用户名。
将您之前从“MC 管理员密码 (MC Admin Password)”字段复制的自动生成的密码粘贴到密码 (Password) 框中。
单击登录 (Log In)。
登录 MC 后,更改 MC 管理员帐户的密码。
要更改密码:
在 MC 主页的“MC 工具 (MC Tools)”部分下,单击 MC 设置 (MC Settings)。
在左侧菜单中,单击用户管理 (User Management)。
选择 MC 管理员帐户的条目,然后单击编辑 (Edit)。
单击生成新的 (Generate new) 或编辑密码 (Edit password) 按钮以更改密码。如果单击生成新的 (Generate new) 按钮,请务必将自动生成的密码保存在安全位置。如果单击编辑密码 (Edit password),系统会提示您输入新密码两次。
单击保存 (Save) 以更新密码。
现在,您已经创建了 MC 实例,可以部署 Vertica Eon 模式群集了。请参阅使用 MC 在 GCP 中配置和创建 Eon 模式数据库。
将 MC 实例部署到 GCP 后,可以使用它来部署 Eon 模式数据库。
要使用 MC 在 GCP 上配置和部署新的 Eon 模式数据库:
在 MC 主屏幕中,单击创建新数据库 (Create new database),以启动“在 Google Cloud 上创建 Vertica 群集 (Create a Vertica Cluster on Google Cloud)”向导。
在该向导的第一页,输入以下信息:
Google Cloud Storage HMAC 访问密钥 (Google Cloud Storage HMAC Access Key) 和 HMAC 密钥 (HMAC Secret Key):复制并粘贴您之前创建的 HMAC 访问密钥和秘密访问密钥。您可以在“存储设置 (Storage Settings)”页面的“互操作性 (Interoperability)”选项卡上找到这些值。有关详细信息,请参阅GCP 上 Eon 模式的先决条件。
分区 (Zone):此值默认为包含 MC 实例的区域。将此值设置为与 Google Cloud Storage 存储桶(您的数据库将使用该存储桶处理公共存储)所在的区域相同。
CIDR 范围 (CIDR Range):您要授予其数据库访问权限的客户端的 IP 地址范围。请尽可能限制此范围,以限制对数据库的访问。
单击下一步 (Next),并提供以下信息:
Vertica 数据库名称 (Vertica Database Name):新数据库的名称。有关数据库名称的要求,请参阅创建数据库名称和密码。
Vertica 版本 (Vertica Version):选择所需的 Vertica 数据库版本。您可以选择最近发布的 Vertica 的最新修补程序。对于每个数据库版本,还可以选择操作系统。
Vertica 数据库用户名 (Vertica Database User Name): 数据库超级用户 的名称。此名称默认为 dbadmin,但您可以在此处输入其他用户名。
密码 (Password) 和确认密码 (Confirm Password):输入数据库超级用户帐户的密码。
数据库大小 (Database Size):初始数据库中节点的数量。如果您在此处指定三个以上的节点,则必须在“Vertica 许可证 (Vertica License)”字段(如下)中提供有效的 Vertica 许可证文件。
Vertica 许可证 (Vertica License):单击浏览 (Browse) 以查找并上传 Vertica 许可证密钥文件。如果未在此处提供许可证密钥文件,向导将使用 Vertica Community Edition 许可证来部署数据库。此许可证限制只能有三个节点,因此如果未提供许可证,“数据库大小 (Database Size)”字段中的值不能大于 3。如果使用 Community Edition 许可证进行部署,则可以稍后升级该许可证以将群集负载扩展到超过 1TB 数据。有关详细信息,请参阅管理许可证。
加载示例数据 (Load example data):如果您希望部署的数据库加载一些示例点击流数据,请选中此框。如果您正在测试功能且仅想查询数据库中的一些预加载数据,则此选项十分有用。
单击下一步 (Next),并提供以下信息:
实例类型 (Instance Type):MC 将用来部署数据库节点的虚拟机实例规范。有关每种实例类型的详细信息,请参阅 Google Cloud 文档的计算机类型页面。另请参阅 GCP Eon 模式实例建议。
数据库存储库路径 (Database Depot Path) 和磁盘类型 (Disk Type):存储库的本地挂载点,以及每个节点专用于该 存储库的本地磁盘的类型和数量。您无法更改存储库的挂载路径。您在磁盘类型 (Disk Type) 字段中选择的磁盘仅用于存储存储库。在向导的下一页上,您将为编录和临时磁盘空间配置磁盘。使用 SSD 磁盘时,您将获得最佳性能,不过它的成本会更高。您可以选择为存储库使用更快捷的本地存储。但是,本地存储是短暂的。只要您停止实例,GCP 就会将磁盘擦除干净。这意味着每次启动节点时,它都必须从头开始 预热其存储库,而不是利用其存储库中的当前任何数据。有关本地磁盘选项的详细信息,请参阅 Google Cloud 文档的存储选项页面。
卷大小 (Volume Size):连接到群集中每个节点的每个磁盘上的可用磁盘空间量。此字段显示群集中每个节点的可用总磁盘空间。有关为节点选择磁盘空间量的最佳实践,请参阅为 Eon 模式配置 Vertica 群集。
数据分段分片 (Data Segmentation Shards):设置数据库中 分片的数量。设置此值后,以后将无法更改。如需建议,请参阅为 Eon 模式配置 Vertica 群集。默认值取决于您在先前指定的“数据库大小 (Database Size)”中输入的节点数。这通常已足够,除非您预计群集会急剧扩展并超出初始节点数。
公共位置 (Communal Location):一个 Google Cloud Storage URL,用于指定存储数据库公共数据的位置。有关要求,请参阅 GCP 上 Eon 模式的先决条件。
实例 IP 设置 (Instance IP settings):指定数据库中的节点是具有可从 Internet 访问的静态或临时网络地址,还是只能从内部虚拟网络内访问的地址。
单击下一步 (Next)。该向导会验证公共存储位置 URL。如果您输入的 URL 有问题,则会显示错误消息并提示您修复 URL。
公共存储 URL 通过验证后,请填写以下信息:
数据库编录路径 (Database Catalog Path)、磁盘类型 (Disk Type) 和每个可用节点的大小 (GB) (Size (GB) per Available Node):挂载点磁盘类型,以及每个节点上数据库 编录的本地副本的磁盘大小。您无法编辑挂载点。您选择用于编录的本地磁盘类型及其大小。您只能为编录选择永久性磁盘存储。SSD 驱动器比标准磁盘速度更快,但更昂贵。磁盘大小的默认设置足以满足大多数中型数据库的需求。如果您预计维护大型数据库,请增加大小。
数据库临时路径 (Database Catalog Path)、磁盘类型 (Disk Type) 和每个可用节点的大小 (GB) (Size (GB) per Available Node):挂载点磁盘类型,以及每个节点上临时存储空间的磁盘大小。您无法编辑挂载点。您可以选择要使用的本地磁盘类型及其大小。您只能为临时磁盘空间选择永久性磁盘存储。SSD 驱动器比标准磁盘速度更快,但更昂贵。对于大多数数据库,默认设置已足够。如果您执行许多要溢出到磁盘的复杂合并操作,请考虑增加临时空间。
标签实例 (Label Instances):选中此框以启用向节点实例添加标签。许多组织都会使用标签来安排和跟踪职责并分配实例成本。有关详细信息,请参阅 Google Cloud 文档的标记资源页面。如果您选择添加标签,请输入标签名称和值,然后单击添加 (Add)。
单击下一步 (Next)。查看所有数据库设置的摘要。如果需要进行更正,请使用“返回 (Back)”按钮返回至向导的前几页。
当您对数据库设置感到满意之后,选中接受条款和条件 (Accept terms and conditions),然后单击创建 (Create)。
配置和创建数据库的过程需要几分钟。成功完成后,MC 将显示开始使用 (Get Started) 按钮。此按钮将指向一个包含多个有用链接的页面,帮助您开始使用新数据库。
在使用手动步骤在 Google Cloud Platform (GCP) 中创建 Vertica 群集之前,您必须从 GCP 的“计算引擎 (Compute Engine)”部分创建一个虚拟机 (VM) 实例。
您创建的所有 VM 实例都应在同一个虚拟公共云 (VPC) 中启动。
要配置并启动新的 VM 实例,请按照以下说明操作:
在 GCP 的“计算引擎 (Compute Engine)”部分中,从屏幕左侧站点的菜单中选择 VM 实例 (VM Instances)。
GCP 会显示到目前为止您创建的所有 VM 实例。
选择创建实例 (CREATE INSTANCE) 链接。
输入新实例的名称。
选择您计划在其中部署实例的分区。
GCP 按区域和分区划分其云数据中心。区域是全部位于同一地理位置的分区的集合。分区是计算资源的集合,这些资源因分区而异。始终选择指定区域中支持最新 Intel CPU 的分区。
有关区域和分区(包括支持的处理器)的完整列表,请参阅区域和分区。
选择计算机类型。
GCE 提供了许多不同类型的 VM 实例。为获得最佳效果,请仅在具有 8 个或更多 vCPu 且至少 30 GB RAM 的 VM 实例上部署 Vertica。
选择启动磁盘(映像)。
您可以从公共映像或自定义映像创建 VM 实例。如果您是第一次在 GCP 中使用 Vertica,请选择 CentOS 7 或 RHEL 7 公共映像。这些映像已经在 Vertica 上进行了全面测试。
有关部署 VM 实例的详细信息,请参阅创建和启动实例。
将 VM 实例配置为用作 Vertica 群集节点后,GCP 允许您将该实例转换为自定义映像。这样做允许您部署该 VM 实例的多个版本;除了节点名称和 IP 地址之外,每个 VM 实例都是相同的。
有关创建自定义映像的详细信息,请参阅创建、删除和弃用自定义映像。
在您可以连接到您创建的任何 VM 之前,您必须先确定外部 IP 地址。GCP 的 VM 实例部分包含所有当前部署的 VM 及其关联的外部 IP 地址的列表。
要连接到您的 VM,请完成以下任务:
使用在配置步骤中创建的外部 IP 地址,通过 SSH 连接到您的 VM。
使用在创建时提供给 GCP 帐户的凭据和 SSH 密钥进行身份验证。
要连接到虚拟网络中的其他虚拟机:
通过 SSH 连接到公共连接的 VM。
从该 VM 再次使用 SSH 通过其他 VM 的专用 IP 地址进行连接。
由于 GCP 强制使用私钥身份验证,您可能需要将密钥文件移动到公共连接的 VM 的 root
目录中。然后,通过 SSH 连接到虚拟网络中的其他 VM。
创建 VM 后,您需要准备它们以形成群集。
通过将私钥(如果使用的话)添加到每个节点和 Vertica 许可证来准备节点。以下步骤假定您配置的初始用户是 DBADMIN 用户:
以 DBADMIN 用户身份将私钥文件从本地保存位置复制到主节点。
根据您用于复制文件的过程,文件的权限可能会发生更改。如果权限发生更改,install_vertica 脚本将失败,并显示类似以下内容的消息:
Failed Login Validation 10.0.2.158, cannot resolve or connect to host as root.
如果您看到上述失败消息,请输入以下命令更正私钥文件的权限:
$ chmod 600 /<name-of-key>.pem
将 Vertica 许可证复制到主 VM。将其保存在主目录或其他已知位置。
除了 Vertica 标准软件包依赖项之外,作为 root 用户,您必须在安装 Vertica 之前安装以下软件包:
pstack
mcelog
sysstat
dialog
为了在 GCP 中获得最佳磁盘性能,Vertica 建议客户使用 SSD 永久性存储,配置为至少 2TB (2000 GB) 大小。磁盘性能与 GCP 中的磁盘大小直接相关。2000 GB (2TB) 是 SSD 永久性磁盘的最小磁盘大小,可实现最大吞吐量。
root
根卷中,尤其不要存储在数据和编录目录中。在根卷上存储信息可能会导致数据丢失。
当配置存储时,请确保使用受支持的文件系统。有关详细信息,请参阅推荐的存储格式类型。
除了存储卷来存储数据之外,Vertica 还需要交换卷或交换文件才能完成安装脚本。
创建至少 2 GB 的交换文件或交换卷。以下步骤显示了如何在 GCP 上的 Vertica 中创建交换文件:
安装 devnull
和 swapfile
文件:
$ install -o root -g root -m 0600 /dev/null /swapfile
创建交换文件:
$ dd if=/dev/zero of=/swapfile bs=1024 count=2048k
使用 mkswap
准备交换文件:
$ mkswap /swapfile
使用 swapon
指示 Linux 在交换文件上进行交换:
$ swapon /swapfile
将交换文件保留在 FSTAB 中:
$ echo "/swapfile swap swap auto 0 0" >> /etc/fstab
对群集中的每个 VM 重复卷附加、组合和交换文件创建过程。
要下载适合您的操作系统和许可证类型的 Vertica 服务器,请按照下载并安装 Vertica 服务器软件包中所述的步骤进行操作。
完成下载和提取后,使用 install_vertica 脚本形成群集并安装 Vertica 数据库软件,如下一节所述。
使用 install_vertica 脚本将两个或多个单独的 VM 组合在一起,以形成群集并安装 Vertica 数据库。
在运行 install_vertica 脚本之前,请执行以下步骤:
检查 GCP 上“计算引擎 (Compute Engine)”部分的 VM 实例 (VM Instances) 页面,以找到当前 VM 及其关联的内部 IP 地址的列表。
确定 VM 上的存储位置。安装程序假定您已将存储挂载到 /home/dbadmin
。要指定另一个位置,请使用 --data-dir
实参。
以下步骤显示了如何使用 install_vertica 脚本将虚拟机 (VM) 组合为一个群集:
当连接到主节点时,构造以下命令以将节点组合为一个群集。
$ sudo /opt/vertica/sbin/install_vertica --hosts 10.2.0.164,10.2.0.165,10.2.0.166 --dba-user-password-disabled --point-to-point --data-dir /vertica/data --ssh-identity ~/ .pem --license
替换您的 VM 的 IP 地址,并包括您的根密钥文件名(如果适用)。
包括 --point-to-point
参数以将 Spread 配置为在所有 Vertica 节点之间使用直接点对点通信,这是安装或更新 Vertica 时 GCP 上的群集所需要的。
如果您使用的是 Vertica 社区版(它限制您只能使用三个节点),请指定 -L CE
而不使用许可证文件。
组合节点后,为降低安全风险,请将您的密钥文件保存在与群集分开的安全位置,并使用 shred 命令删除群集上的密钥:
$ shred examplekey.pem
有关 install_vertica 脚本及其参数的完整信息,请参阅使用安装脚本安装 Vertica。
现在,您的群集已配置并正在运行,并且 Vertica 正在运行,请执行以下步骤: