单独的群集

对于单独的群集,Vertica 群集和 Hadoop 群集不共享节点。您应当在两个群集之间使用高带宽网络连接。

下图说明了分置群集的配置:

网络

网络是任何配置良好的群集的关键性能组件。当 Vertica 将数据存储到 HDFS 时,它可以通过网络写入和读取数据。

图中所示的布局需要两个网络,而添加第三个网络也能带来好处:

  • 数据库专用网络:Vertica 使用专用网络进行命令与控制和在各节点之间移动数据,以支持其数据库功能。在某些网络中,命令与控制和数据传递会拆分到两个网络。

  • 数据库/Hadoop 共享网络:每个 Vertica 节点必须能够连接到每个 Hadoop 数据节点和 NameNode。Hadoop 的最佳实践通常需要为 Hadoop 群集提供专用网络。这并不是一项技术要求,但专用网络可以提高 Hadoop 的性能。Vertica 和 Hadoop 应该共享专用 Hadoop 网络。

  • 可选客户端网络:外部客户端可以通过客户端网络访问群集网络。这并不是一项绝对需求,但使用支持通过客户端连接到 Vertica 或 Hadoop 的第三个网络能够提高性能。如果配置不支持客户端网络,那么客户端连接应使用共享网络。

Hadoop 配置参数

为获得最佳性能,请使用指定的最小值设置以下参数: