这是本节的多页打印视图。 点击此处打印.

返回本页常规视图.

监控系统资源

MC 的活动 (Activity) 页面可通过为您提供查询和用户活动、硬件和内存影响、表和投影使用情况、系统瓶颈和资源池使用情况的图形视图,提供对数据库运行状况中潜在问题区域的即时可视化见解。

从工具栏菜单中选择下列图表中的一个:

信息多久更新一次?

系统级别活动图表每五分钟自动更新一次,除非您清除了工具栏上的“自动刷新 (Auto Refresh)”选项。当您第一次访问该页面或更改您想查看的资源时,图表可能要一会时间才能显示出来,具体取决于您的系统状况。

图表查看选项

您可以为某些图表指定时间范围,这些图表会在其标题栏中显示日历图标。单击日历图标可指定相应模块的时间范围。

如果您已对数据库启用扩展监控,MC 可以在某些图表中显示更大范围的数据。请参阅扩展监控。如果图表正在使用扩展监控数据,则标题栏中会显示火箭飞船图标:

您可以展开一些图表,以在更大的窗口中查看它们。单击标题栏中的展开图标即可执行此操作:

1 - 监控查询活动

“查询 (Queries)”图表会显示查询并发性以及 CPU/内存、网络活动和磁盘 I/O 这些资源的平均利用率(以最大额定带宽为基数)。

将光标悬停在数据点上,以获取有关每种资源类型的利用率的详细信息。

如果您单击数据点,MC 会立刻打开该数据点的详细信息页面,其中汇总了用户查询和系统查询数量。此页面可以帮您确定长期运行的查询以及查询类型。您可以对表列进行排序并将报告导出到文件中。

监控关键事件

在主“查询 (Queries)”页面上,如果发生工作负载分析器或重新平衡操作等关键事件,MC 会通过将 Workload Analyzer(工作负载分析器)和/或 RBL(重新平衡)标签发布到图表的资源部分来报告这一情况。

筛选图表结果

默认查询并发性为过去一小时内的数据。图表每五分钟会自动刷新一次,除非您清除工具栏上的“自动刷新 (Auto Refresh)”选项。您可以过滤 1 个小时、1 天或最多 1 周的结果,以及对应的平均资源利用率。您还可以在图例中单击不同的资源来显示或隐藏这些资源。

要返回到主“查询 (Queries)”页面,请使用滑动条或单击 1 小时按钮。

查看更多详细信息

要放大以显示详细信息,请在图表上某个部分四周单击并拖动鼠标,或者使用图表底部的滑动选择条。显示详细信息区域后,请将光标悬停在数据点上,查看固定在该时间点的资源。

有关用户或系统查询的详细信息,请在某个峰值处单击数据点。此时会打开详细信息 (Detail) 页面,以表格格式提供关于查询的信息,包括查询类型、会话 ID、节点名称、查询类型、日期、时间和运行的实际查询。

页面底部指出了当前页面显示的查询数量,并提供了“上一页 (Previous)”和“下一页 (Next)”按钮来浏览各个页面。您可以对列进行排序并将表的内容导出到文件中。

要返回到主“查询 (Queries)”页面,请在导航栏中单击 <数据库名称> 活动 (<database name> Activity)

2 - 监控内部会话

“内部会话 (Internal Sessions)”图表提供了有关 Vertica 系统活动的信息(例如 Tuple Mover 和重新平衡群集操作),以及对应的系统资源(例如 CPU/内存、网络和磁盘 I/O 利用率)。

将光标悬停在条上,以获取更多详细信息。此时会出现一个对话框,并提供详细信息。

筛选图表结果

您可以通过为以下组件选择选项来过滤图表显示的内容。过滤时,请求的记录 (Records Requested) 数量会更改:

  • 类别:对图形中出现哪些内部会话类型(合并、重新平衡群集)进行筛选。括号内的数字表明了该操作上有多少会话正在运行。

  • 会话持续时间:为图形中出现的所有会话列出时间(以毫秒为单位)。可以过滤的最小/最大值(0 ms 至 n ms)表示当前显示在图形上的所有会话内的最小/最大经过时间。选择一个值后,图表会刷新,只显示大于或等于选定值的内部会话。

  • 请求的记录:表示应用“类别 (Category)”和“会话持续时间 (Session Duration)”筛选后的合并会话总数。

3 - 监控用户会话

“用户会话 (User Sessions)”图表为所有与 MC 建立的用户连接提供了关于 Vertica 用户活动的信息。

从数据库“活动 (Activity)”页面顶部的菜单中选择用户会话 (User Sessions) 来查看这些图表。

查看打开的会话

“打开的会话 (Open Sessions)”选项卡显示每个用户当前打开的会话表。您可以在此选项卡中关闭会话或取消查询,方法是从操作 (Actions) 列中选中相应的选项。

单击任意行以打开会话详细信息 (Session Details) 对话框,其中显示有关该会话的更多详细信息。

要配置“打开的会话 (Open Sessions)”页面显示,请执行以下操作:

  • 使用页面右上角的对用户排序 (Sort Users) 按钮按用户名或打开的会话数进行排序。

  • 使用页面右上角的切换列 (Toggle Columns) 按钮选择要显示的列。每个表按列显示会话信息,例如会话开始时间或

查看所有用户会话

“所有会话 (All Sessions)”选项卡在泳道图表中显示所有用户会话的历史记录。

图表中各种颜色的含义

用虚线勾勒的条表示当前正在运行的会话。

会话被分为两种颜色:黄色和蓝色。

  • 黄色条代表用户(系统)会话。如果单击黄色条,MC 会打开“详细信息 (Detail)”页面,显示过去运行的或在该会话中仍在运行的所有查询。

  • 蓝色条代表用户请求(会话内的事务)。如果在图形中单击蓝色条,MC 会打开“详细信息 (Detail)”页面,其中仅含该查询请求的信息。

    将光标悬停在事务条上时,对话框会提供有关该请求的摘要信息,例如哪个用户运行了查询、事务花费了多长时间才结束或者事务是否仍在运行。

筛选图表结果

极度繁忙的系统会在界面上显示很多活动,让您一眼看上去不知所措。您可以通过多种方式筛选图表结果:

  • **缩小。**页面底部的上下文图表以蓝色高亮显示您当前查看的“所有会话 (All Sessions)”图表中的部分。单击并向左或向右拖动蓝色框可查看之前或之后的用户会话。单击并拖动蓝色框的边缘可放大或缩小。

  • **选择几个用户。**单击页面顶部的筛选器图标 ()。下方将显示所有可用用户的菜单。取消选择要从图表中排除的用户。

  • 更改会话持续时间(会话运行的时间)。单击页面顶部的筛选器图标 ()。下方将显示按持续时间筛选会话和查询 (Filter sessions and queries by duration) 字段。输入要在图表上显示的最小会话长度(以秒为单位),然后单击更新 (Update)

  • 指定时间范围。单击页面顶部的“日历 (Calendar)”图标 (),以显示“开始日期 (From)”和“结束日期 (To)”字段。使用这些字段选择要在图表中显示的时间范围,然后单击更新 (Update)

4 - 监控系统内存使用情况

“内存利用率 (Memory Usage)”图表会显示随着时间的推移,系统内存在单个节点上的使用情况。图表显示的信息将根据超级用户可以配置的 数据收集器保留策略进行存储。请参阅配置数据保留策略

在您第一次访问“内存利用率 (Memory Usage)”图表时,MC 会显示群集中的第一个节点。MC 会记住您上次查看的节点,并当您再次访问“活动 (Activity)”页面时显示该节点。要选择不同的节点,请从图表底部的“节点 (Nodes)”下拉列表中选择一个节点。图表每五分钟会自动刷新一次,除非您禁用“自动刷新 (Auto Refresh)”选项。

系统内存类型

“内存利用率 (Memory Usage)”图表会显示以下内存类型的堆栈区域:

  • 切换

  • 空闲

  • fcache(文件缓存)

  • 缓冲

  • 其他(除了主 Vertica 进程之外,在系统中运行的所有其他进程(例如 MC 进程或 代理)使用的内存)

  • Vertica

  • rcache(Vertica ROS 缓存)

  • 编录

将光标悬停在数据点上时,一个对话框会显示选定节点在该时间段内使用的内存百分比。

5 - 监控系统瓶颈

“系统瓶颈 (System Bottlenecks)”图表帮助您在特定节点上快速找到性能瓶颈。在您第一次访问“活动 (Activity)”页面时,MC 会显示群集中的第一个节点。要选择不同的节点,请从图表底部的“节点 (Nodes)”下拉列表中选择一个节点。

“系统瓶颈 (System Bottlenecks)”图表报告了 MC 在给定时间间隔内发现的问题最大的资源。您可以使用此图表作为调查的起点。

MC 如何收集系统瓶颈数据

每隔 15 分钟,MC 都会获取各种系统资源的最大利用率数据,并据此绘制一条线,而线上的一个数据点代表在该时间点使用最多资源的组件。当另一个组件使用最多资源时,MC 会显示新的数据点并更改线条颜色,以便让资源变化变得更加明显。在非常繁忙的数据库中,使用资源最多的组件可能会频繁变化,以致于您会看到非常密集的图表活动。

在以下示例中,在 08:24,由磁盘 I/O 使用最多资源变为 CPU 使用最多资源。“系统瓶颈 (System Bottlenecks)”图表通过线条颜色从棕色变为绿色来表示这一变化。

MC 报告的组件

MC 会报告以下系统组件的最高利用率值:

  • 平均利用率 CPU 百分比

  • 内存利用率平均百分比

  • 磁盘 I/O 利用率最高百分比

  • 通过网络发送的数据百分比 (TX)

  • 通过网络接收的数据百分比 (RX)

MC 如何处理资源冲突

如果 MC 发现了具有相同最大百分比值的两个指标,它会随机选择一个进行显示。如果两个指标的值非常接近,MC 会显示两者中值较高的那个。

6 - 监控用户查询阶段

“用户查询阶段 (User Query Phases)”图表提供了有关查询在完成前经历的查询执行阶段的信息。查看此表可以帮您快速确定由于资源争用而可能造成延迟的查询。

灰框包围的每个条都代表一个查询。在查询内,不同的颜色代表了每个查询阶段。持续时间小于 4 秒时,图表不会显示查询各阶段。如下图所示,查询内的空白区域代表了等待时间。

将光标悬停在查询的一个阶段上,获取有关该阶段类型和持续时间的信息。

图表会显示过去 15 分钟运行的查询。图表每五分钟会自动刷新一次,除非您清除工具栏上的“自动刷新 (Auto Refresh)”选项。

筛选图表结果

您可以选择运行查询的用户、最低查询持续时间和最低阶段持续时间选项来过滤图表显示的内容。

查看更多详细信息

要放大以显示详细信息,请在图表上某个部分四周单击并拖动鼠标。单击图表右上角的“重置缩放 (Reset zoom)”,将图表恢复到原始视图。

有关详细信息,请单击查询条。此时会打开“详细信息 (Detail)”页面,以表格格式提供关于查询的信息,包括查询类型、会话 ID、节点名称、查询类型、日期、时间、运行的实际查询以及运行“说明计划 (Explain Plan)”或分析查询的选项。单击表列标题,按该类别对查询进行排序。

要将表内容导出到文件,请单击页面右上方的“导出 (Export)”。

要返回到主“查询 (Queries)”页面,请在导航栏中单击“活动 (Activity)”。

7 - 监控表利用率和投影

“表利用率 (Table Utilization)”活动页面有助于您监控数据库中各架构的表和投影。

表利用率 (Table Utilization) 图表列出了架构中的所有表,您可以对其进行筛选和排序;或按其在树形图可视化中的大小和使用情况查看这些表。通过这些图表,您可以确定所有表中的异常对象,例如较大或过度使用的异常对象。

投影摘要 (Projections Summary) 位于页面右侧,提供了架构中投影的概览。您可以使用此摘要来帮助确定投影是否在节点之间均匀分布。

可视化表

默认情况下,MC 会向您显示公共架构。要指定要查看的架构,请从活动页面顶部的架构 (Schemas) 菜单中选择一个架构。该架构中的表和投影的摘要将显示在页面上。

MC 将您可用的表按架构可视化为表图表树形图图表。从显示为 (Show As) 菜单中,选择表 (Table)(表格图表)或图 (Map)(树形图图表)。默认情况下,MC 显示表图表。

根据架构中表的数量情况,图表可能会很拥挤。要缩小图表范围,请使用页面顶部的仅显示 (Show Only) 筛选器,以仅显示最大的 100 个表、最小的 100 个表或外部表。

查看表图表

表图表是架构表数据的表格视图。使用表格视图可对任何列进行筛选或排序,并查看行计数和利用率的显式值。

这些列显示每个表的以下信息:

  • 表名称 (Table Name)。单击此名称可查看表详细信息 (Table Details) 页面。

  • 表类型 (Table Type):内部、使用外部数据HCatalog。(行计数和使用情况等详细信息不适用于外部类型和 HCatalog 类型。)

  • 行计数 (Row Count)

  • 查询中的使用情况 (Usage in Queries),按表查询次数的百分比。

  • 行计数和使用率 (Row count and Usage),可视化为条。条的长度表示行计数;颜色越深表示使用率越高。

  • 表定义 (Table Definition)。COPY 语句表定义,仅适用于外部表。

将鼠标悬停在图表中的任意行上可查看表的属性(在下面的屏幕截图中显示为 inventory_fact)。单击表名称可查看更具体的表详细信息 (Table Details) 页面。

查看树形图图表

在树形图可视化中,表以框表示,且根据大小进行嵌套,并根据使用率进行颜色分类。颜色越深表示表使用率越高。

将鼠标悬停在某个表上以查看更多详细信息,或单击以查看其表详细信息 (Table Details) 页面。

查看表详细信息

“表详细信息 (Table Details)”页面显示内部 Vertica 表的详细概述。(这不适用于外部表和 HCatalog 表。)在“表利用率活动 (Table Utilization Activity)”页面上单击某个表名称,以在新窗口中打开其“表详细信息 (Table Details)”页面。

您可以查看以下详细信息:

  • 表属性 (Table Properties)。表属性(例如行计数和所有者)。

  • 投影 (Projections)。表的列和投影的属性。

  • 各节点的存储 (Storage by Node)。各节点中表的存储利用率,以 MB 为单位。

  • # 各节点的已删除行 (# Deleted Rows by Node)。Vertica 为已删除行分配物理存储,直到其被 Tuple Mover 清除。

  • # 各节点的删除向量 (# Delete Vectors by Node)。当在表上运行 DELETE 或 UPDATE 语句时,Vertica 会创建称为删除向量的小型容器。大量删除向量会对性能产生不利影响。(请参阅删除标记合并。)

投影摘要

“投影摘要 (Projections Summary)”位于“表利用率 (Table Utilization)”页面右侧的侧栏中。它显示架构中所有投影的以下统计信息:

  • 投影总数 (Total projections)

  • 已分段投影数 (Segmented projections),即跨多个节点分段的投影数量。

  • 未分段投影数 (Unsegmented projections),即未跨多个节点分段的投影数量。

  • 证明分布倾斜的投影数 (Projections Showing Distribution Skew),即未跨节点均匀分布的投影数量。少于 1000 行的表不计算在内。移动滑块来配置按分布倾斜百分比的筛选器。

  • 各节点中具有 >= 容器的投影数。移动滑块来指定容器的最小数量。

  • 不安全投影数 (Unsafe Projections),即 K-safety 小于数据库 K-safety 的投影的数量。

  • 未使用投影数 (Unused Projections)

  • 非最新投影数 (Not Up to Date Projections)

单击某个投影编号,以查看指定投影及其属性的列表。有关投影的详细信息,请参阅投影

另请参阅

8 - 监控运行查询

查询监控 (Query Monitoring) 活动页面显示了最近和当前运行的查询的状态,以及用户和节点的资源信息。对于 Eon 模式数据库,您还可以按子群集显示查询的状态。您可以在此页面分析查询或取消正在运行的查询。

使用此页面检查查询状态,并迅速取消正在运行的或队列中的查询来释放系统资源。此页面可以帮您确定资源在什么地方使用,以及哪些查询、用户、节点或子群集使用了最多的资源。

查询监控 (Query Monitoring) 页面包含四个表,以选项卡形式显示:

  • 正在运行的查询

  • 队列中的查询

  • 已完成的查询

  • 失败的查询

操作 (Actions) 列中,您可以:

  • 取消 (Cancel)。取消正在运行或队列中的查询。

  • 关闭会话 (Close session)。关闭正在运行或队列中的查询的会话。

  • 解释 (Explain)。打开任意查询的查询计划 (Query Plan) 页面。

  • 分析 (Profile)。分析查询计划 (Query Plan) 页面中的任何查询。

页面底部的四个条形图显示了各节点或各用户的查询使用情况汇总。将光标悬停在条上以查看它的值。在按值排序时,每个图表最左侧的条代表了具有最高值的节点或用户。

默认情况下,“查询监控 (Query Monitoring)”页面每 20 秒刷新一次。要更改刷新间隔,请单击页面右上角的页面设置 (Page Settings) 按钮。此时会出现对话框。在文本框中键入新的刷新间隔(以毫秒为单位)。

按会话 ID 或客户端标签搜索查询或对其进行排序

“查询监控活动 (Query Monitoring Activity) > 运行查询 (Running Queries)”页面包含显示每个查询的会话 ID 和** 客户端标签** 的列。您可以按会话 ID 或客户端标签对查询进行排序,或者使用任一列下方的搜索字段来搜索具有特定会话 ID 或客户端标签的查询。

筛选图表结果

使用每列标题下方的搜索字段来缩小图表结果的范围。(例如,如果您在搜索查询 (Search Queries) 字段中输入文本 SELECT product_description,并在启动程序节点 (Initiator Node) 列中选择一个特定节点,图表将仅返回既包含该文本又在您指定的节点上启动的查询。)

单击列标题以对该类别的查询进行排序。

“已完成的查询 (Completed Queries)”和“失败的查询 (Failed Queries)”可能会生成大量结果。使用这两个选项卡顶部的自定义 (Customize) 部分来进一步筛选图表结果。对于任一选项卡,均可以为结果选择自定义日期和时间范围。

在“已完成的查询 (Completed Queries)”选项卡中,单击数据 (Data) 输入其他查询信息,以根据以下任意字段进行筛选:

  • 用户

  • 请求

  • 请求持续时间

  • 节点

  • 请求标签

查看更多详细信息

单击某个查询以查看整个查询。

失败的查询 (Failed Queries) 图表中,单击失败的查询旁边的加号 (+) 图标,以查看查询执行中涉及的每个节点的失败详细信息。

要导出某个查询监控 (Query Monitoring) 表中的数据,请单击该表的选项卡,然后单击页面右上角的导出 (Export) () 按钮。浏览器会将该表的数据下载为 .dat 文件。导出的数据包含在 MC 中可能看不到的列,包括内存、线程数和打开文件句柄数的最低值和最高值。

9 - 监控编录内存

“编录内存 (Catalog Memory)”活动页面显示每个节点的编录内存。使用此页面可检查编录内存的突然变化,或节点之间的内存分布差异。

“编录内存 (Catalog Memory)”页面显示以下内容:

  • **节点详细信息表。**该表列出了数据库中每个节点的详细信息,包括其当前的编录内存和总内存利用率。

  • **编录内存图表。**一个线图,可视化每个节点的编录内存利用率随时间的变化情况。每条线代表一个节点。图表底部的颜色图例表示每个节点线的颜色。

在下图中,所有三个节点的编录内存起始值均为 0GB。在接下来的 20 分钟内,第二个节点(橙色)的编录内存首先增加到 0.04GB,接下来是第一个节点(青色),最后是第三个节点(深蓝色)。请注意,从 16:55 开始,当所有三个节点的编录内存都相同时,三个重叠的节点线显示为一条线。

筛选图表结果

如果您的数据库中有多个节点,但您只想在编录内存图表中显示部分节点。您可以通过以下两种方式从图表中移除节点:

  • 在节点详细信息表中取消选中节点的复选框。

  • 在图表下方颜色图例中取消选择节点。

查看更多详细信息

将鼠标悬停在图表中的任意一条线上,以查看时间、节点名称和编录大小。

图表底部是一个摘要栏,其中显示了编录内存随时间的变化的快速概览。移动图表任一侧的滑块可放大图表中的特定时间范围。放大后,您可以使用滚动条及时向前或向后移动。