在 Hadoop 环境中导入并监控数据库

您可以使用管理控制台连接到并监控位于 Apache Hadoop 环境的 Vertica 数据库。要在 Hadoop 环境中监控数据库,必须连接到 Apache Ambari 服务器。

先决条件

开始操作之前,必须:

  • 在 Hadoop 群集上安装 Vertica

  • 安装 Apache Ambari 版本 1.6.1 或 2.1.0

  • 在 Hadoop 群集中启用 Ganglia,以便从 Hadoop 环境中获取尽可能多的信息

导入 Hadoop 环境中的 Vertica

要导入位于 Hadoop 环境的 Vertica 数据库,请在管理控制台中通过 Apache Ambari 服务器连接至该 Hadoop 环境。

  1. 从管理控制台主页选择其他导入选项 (Additional import options)

  2. 配置 (Provisioning) 中,选择使用 Ambari 服务器连接以导入 Hadoop 环境中的 Vertica (Connect using an Ambari server to impotVerticawithin a Hadoop environment)

  3. 配置 Hadoop 环境访问权限 (Provision Access Within Hadoop Environment) 窗口提供了以下选项:

    • 连接到新的 Ambari 服务器 (Connect to a new Ambari server):选择此选项以输入新 Ambari 服务器连接的用户名和密码。

    • 已知 Ambari URL (Known Ambari URLs):如果要使用预先存在的 Ambari 连接,请从下拉列表中进行选择。

  4. 在下一个窗口中,选择包含要监控的 Vertica 数据库的 Hadoop 群集。
    管理控制台可自动发现当前由您指定的 Ambari 服务器监控的 Hadoop 群集。如果管理控制台未监控指定 Hadoop 环境中的 Vertica 群集,您可以在此时导入群集。
    选择 Hadoop 群集后,将收到保存 Hadoop 群集的确认信息。

  5. 输入要导入和监控的 Vertica 数据库的 IP 地址。如果 Vertica 正在多个主机上运行,请输入其中一个主机的 IP 地址。

  6. 输入 Vertica 群集的 API 密钥。API 密钥是在 Vertica 安装期间生成的,您可以在 /opt/vertica/config/apikeys.dat 文件中找到它。

  7. 下一个窗口显示发现的数据库。选择要导入的一个或多个数据库,然后输入相应的用户名和密码。

  8. 如果导入成功,将收到成功消息。单击完成 (Done) 可转至现有基础设施 (Existing Infrastructure) 页面。

要导入 Hadoop 环境中的其他 Vertica 群集,请单击配置 (Provisioning) 下方的使用 IP 地址发现导入群集或数据库 (Import Cluster or database using IP address discovery)。管理控制台会自动将群集与现有 Hadoop 环境关联起来。

监控 Hadoop 环境中的 Vertica

要监控 Hadoop 环境中的 Vertica 群集,请导航至现有基础设施 (Existing Infrastructure) 页面:

单击以选择 Hadoop 环境,然后单击查看 Vertica 数据库 (View Vertica Databases)

管理控制台显示位于 Hadoop 环境的 Vertica 数据库的信息:

您可以监控资源利用率、Hadoop 服务以及数据库和连接状态等信息。

更新或移除 ambari 连接

要更新或移除现有 Ambari 连接,请转至 MC 现有基础设施 (Existing Infrastructure) 页面,然后单击相关 Hadoop 环境。

要更新连接,请单击更新 Ambari 连接 (Update Ambari Connection)。逐步执行向导以更新连接。

要移除连接,请选择更新 Ambari 连接 (Update Ambari Connection),然后选择移除连接 (Remove Connection),或单击停止监控 (Discontinue Monitoring),然后确认您要移除连接。移除连接也将使 MC 不再监控所有与此连接关联的 Vertica 数据库。如有需要,您可以之后重新导入数据库。

另请参阅:

Apache Hadoop 集成