在 GCP 上手动部署企业模式数据库

在使用手动步骤在 Google Cloud Platform (GCP) 中创建 Vertica 群集之前,您必须从 GCP 的“计算引擎 (Compute Engine)”部分创建一个虚拟机 (VM) 实例。

配置并启动新实例

您创建的所有 VM 实例都应在同一个虚拟公共云 (VPC) 中启动。

要配置并启动新的 VM 实例,请按照以下说明操作:

  1. 在 GCP 的“计算引擎 (Compute Engine)”部分中,从屏幕左侧站点的菜单中选择 VM 实例 (VM Instances)

    GCP 会显示到目前为止您创建的所有 VM 实例。

  2. 选择创建实例 (CREATE INSTANCE) 链接。

  3. 输入新实例的名称。

  4. 选择您计划在其中部署实例的分区。

    GCP 按区域和分区划分其云数据中心。区域是全部位于同一地理位置的分区的集合。分区是计算资源的集合,这些资源因分区而异。始终选择指定区域中支持最新 Intel CPU 的分区。

    有关区域和分区(包括支持的处理器)的完整列表,请参阅区域和分区

  5. 选择计算机类型。

    GCE 提供了许多不同类型的 VM 实例。为获得最佳效果,请仅在具有 8 个或更多 vCPu 且至少 30 GB RAM 的 VM 实例上部署 Vertica。

  6. 选择启动磁盘(映像)。

    您可以从公共映像或自定义映像创建 VM 实例。如果您是第一次在 GCP 中使用 Vertica,请选择 CentOS 7 或 RHEL 7 公共映像。这些映像已经在 Vertica 上进行了全面测试。

    有关部署 VM 实例的详细信息,请参阅创建和启动实例

将 VM 实例配置为用作 Vertica 群集节点后,GCP 允许您将该实例转换为自定义映像。这样做允许您部署该 VM 实例的多个版本;除了节点名称和 IP 地址之外,每个 VM 实例都是相同的。

有关创建自定义映像的详细信息,请参阅创建、删除和弃用自定义映像

连接到虚拟机

在您可以连接到您创建的任何 VM 之前,您必须先确定外部 IP 地址。GCP 的 VM 实例部分包含所有当前部署的 VM 及其关联的外部 IP 地址的列表。

连接到您的 VM

要连接到您的 VM,请完成以下任务:

  1. 使用在配置步骤中创建的外部 IP 地址,通过 SSH 连接到您的 VM。

  2. 使用在创建时提供给 GCP 帐户的凭据和 SSH 密钥进行身份验证。

连接到其他 VM

要连接到虚拟网络中的其他虚拟机:

  1. 通过 SSH 连接到公共连接的 VM。

  2. 从该 VM 再次使用 SSH 通过其他 VM 的专用 IP 地址进行连接。

由于 GCP 强制使用私钥身份验证,您可能需要将密钥文件移动到公共连接的 VM 的 root 目录中。然后,通过 SSH 连接到虚拟网络中的其他 VM。

准备虚拟机

创建 VM 后,您需要准备它们以形成群集。

添加 Vertica 许可证和私钥

通过将私钥(如果使用的话)添加到每个节点和 Vertica 许可证来准备节点。以下步骤假定您配置的初始用户是 DBADMIN 用户:

  1. 以 DBADMIN 用户身份将私钥文件从本地保存位置复制到主节点。

    根据您用于复制文件的过程,文件的权限可能会发生更改。如果权限发生更改,install_vertica 脚本将失败,并显示类似以下内容的消息:

    Failed Login Validation 10.0.2.158, cannot resolve or connect to host as root.
    

    如果您看到上述失败消息,请输入以下命令更正私钥文件的权限:

    $ chmod 600 /<name-of-key>.pem
    
  2. 将 Vertica 许可证复制到主 VM。将其保存在主目录或其他已知位置。

在 GCP 上安装 Vertica 的软件依赖项

除了 Vertica 标准软件包依赖项之外,作为 root 用户,您必须在安装 Vertica 之前安装以下软件包:

  • pstack

  • mcelog

  • sysstat

  • dialog

配置存储

为了在 GCP 中获得最佳磁盘性能,Vertica 建议客户使用 SSD 永久性存储,配置为至少 2TB (2000 GB) 大小。磁盘性能与 GCP 中的磁盘大小直接相关。2000 GB (2TB) 是 SSD 永久性磁盘的最小磁盘大小,可实现最大吞吐量。

当配置存储时,请确保使用受支持的文件系统。有关详细信息,请参阅推荐的存储格式类型

创建交换文件

除了存储卷来存储数据之外,Vertica 还需要交换卷或交换文件才能完成安装脚本。

创建至少 2 GB 的交换文件或交换卷。以下步骤显示了如何在 GCP 上的 Vertica 中创建交换文件:

  1. 安装 devnullswapfile 文件:

    $ install -o root -g root -m 0600 /dev/null /swapfile
    
  2. 创建交换文件:

    $ dd if=/dev/zero of=/swapfile bs=1024 count=2048k
    
  3. 使用 mkswap 准备交换文件:

    $ mkswap /swapfile
    
  4. 使用 swapon 指示 Linux 在交换文件上进行交换:

    $ swapon /swapfile
    
  5. 将交换文件保留在 FSTAB 中:

    $ echo "/swapfile swap swap auto 0 0" >> /etc/fstab
    
  6. 对群集中的每个 VM 重复卷附加、组合和交换文件创建过程。

下载 Vertica

要下载适合您的操作系统和许可证类型的 Vertica 服务器,请按照下载并安装 Vertica 服务器软件包中所述的步骤进行操作。

完成下载和提取后,使用 install_vertica 脚本形成群集并安装 Vertica 数据库软件,如下一节所述。

形成群集并安装 Vertica

使用 install_vertica 脚本将两个或多个单独的 VM 组合在一起,以形成群集并安装 Vertica 数据库。

在运行 install_vertica 脚本之前,请执行以下步骤:

  1. 检查 GCP 上“计算引擎 (Compute Engine)”部分的 VM 实例 (VM Instances) 页面,以找到当前 VM 及其关联的内部 IP 地址的列表。

  2. 确定 VM 上的存储位置。安装程序假定您已将存储挂载到 /home/dbadmin。要指定另一个位置,请使用 --data-dir 实参。

以下步骤显示了如何使用 install_vertica 脚本将虚拟机 (VM) 组合为一个群集:

  1. 当连接到主节点时,构造以下命令以将节点组合为一个群集。

    $ sudo /opt/vertica/sbin/install_vertica --hosts 10.2.0.164,10.2.0.165,10.2.0.166 --dba-user-password-disabled --point-to-point --data-dir /vertica/data --ssh-identity ~/.pem --license 
    
  2. 替换您的 VM 的 IP 地址,并包括您的根密钥文件名(如果适用)。

  3. 包括 --point-to-point 参数以将 Spread 配置为在所有 Vertica 节点之间使用直接点对点通信,这是安装或更新 Vertica 时 GCP 上的群集所需要的。

  4. 如果您使用的是 Vertica 社区版(它限制您只能使用三个节点),请指定 -L CE 而不使用许可证文件。

  5. 组合节点后,为降低安全风险,请将您的密钥文件保存在与群集分开的安全位置,并使用 shred 命令删除群集上的密钥:

    $ shred examplekey.pem
    

有关 install_vertica 脚本及其参数的完整信息,请参阅使用安装脚本安装 Vertica

在群集启动并运行后

现在,您的群集已配置并正在运行,并且 Vertica 正在运行,请执行以下步骤:

  1. 创建数据库。有关详细信息,请参阅创建数据库
  2. 安装 Vertica 时,创建了一个具有 DBADMIN 角色的数据库管理员用户(通常名为 dbadmin)。使用此帐户创建并启动数据库。
  3. 有关重要的数据库配置步骤,请参阅配置数据库