这是本节的多页打印视图。 点击此处打印.

返回本页常规视图.

在 MC 中监控数据库消息和警报

管理控制台会定期检查系统运行状况和性能。当发生重要事件或系统性能波动超出用户或系统定义的限制时,管理控制台会生成消息,向您发出有关系统状态的警报。在消息中心查看和管理警报。

消息警报通知

管理控制台可通过多种方法传达警报通知,以确保您立即发现任何可能需要注意的数据库更改。您会收到电子邮件通知消息,并可使用以下组件查看通知:

  • 邮件信封图标:此图标位于任何数据库特定页面右上角的 MC 帮助 (MC Help) 图标旁边。选择此图标将显示消息中心 (Message Center) 快速视图,执行存档、阅读和删除消息操作。有关消息操作和警报的详细信息,请参阅消息中心 (Message Center)

  • 未读消息(本周)(Unread Messages (This Week)) 小组件:在数据库概述 (Overview) 选项卡上,此小组件位于“快速统计数据 (Quick Stats)”侧栏中。它显示未读的高优先级消息。选择小组件中的编号(包括 0),转至消息中心 (Message Center)

预配置的警报

管理控制台提供预配置的警报以提供系统监控功能,无需手动设置。每个警报均具有预配置的阈值,用于定义可接受的性能限制,当数据库超过该阈值时,MC 将发送消息通知。

默认情况下,预配置的警报处于非活动状态,只需极少量初始设置。有关如何设置预配置的警报属性的详细信息,请参阅警报配置

节点运行状况

Vertica 提供以下预配置的警报来监控节点运行状况:

  • 节点 CPU

  • 节点内存

  • 节点磁盘使用情况

  • 节点磁盘 I/O

  • 节点 CPU I/O 等待

  • 节点重新启动速率

  • 节点状态更改

  • 节点编录内存

网络运行状况

Vertica 提供网络 I/O 错误预配置警报,以监控网络运行状况。

查询

Vertica 提供以下预配置的警报来监控查询:

  • 队列中的查询

  • 失败的数量

  • 查询的数量

  • 已溢出查询的数量

  • 已重试查询的数量

  • 查询的运行时间

许可证状态

Vertica 提供了许可证使用情况预配置警报来监控 Vertica 许可证的状态。

资源池

当单个资源池达到指定状态或使用级别时,MC 可以发送警报。有关资源池配置参数的详细信息,请参阅内置资源池配置

您可以将 MC 配置为发送以下资源池警报:

  • 达到允许的最长执行时间的查询 (Queries Reaching the Max Allowed Execution Time):当指定数量的查询达到资源池的 RUNTIMECAP 执行阈值时触发警报。如果资源池未设置 RUNTIMECAP 阈值或资源池包含辅助资源池,则无法设置此警报。

  • 存在资源拒绝的查询 (Queries With Resource Rejections):当在设置的时间段内指定数量的查询超出指定数量的 资源拒绝时触发警报。

  • 最小起始资源值 (Minimum Starting Resource Value):当资源池达到为 MEMORYSIZE 值分配的最小资源量时触发警报。

  • 允许的最大资源值 (Maximum Allowed Resource Value):当资源池达到 MAXMEMORYSIZE 值时触发警报。

  • 因排队时间超过限制而终止的查询 (Ended Query With Queue Time Exceeding Limit):当指定数量的已完成查询在时间范围内排队达到指定时长时触发警报。

  • 因运行时间超过限制而终止的查询 (Ended Query With Run Time Exceeding Limit):当指定数量的已完成查询在时间范围内运行达到指定时长时触发警报。

自定义警报

创建自定义警报以度量预配置警报未监控的系统性能指标。创建动态 SQL 查询,无论返回任何结果均触发警报。您可以配置生成警报的频率、警报优先级以及接收电子邮件警报的人员。例如,您可以创建自定义警报来监控以下数据:

  • 可配置时间段内的登录失败次数

  • 使用可配置时间限制的空闲 Vertica 用户会话数

  • 数据库节点故障

有关创建和管理自定义警报的详细信息(包括关于如何创建监控登录失败次数的自定义警报的教程),请参阅自定义警报

默认通知

管理控制台生成以下数据库相关消息,这些消息仅在消息中心 (Message Center) 显示:

  • 磁盘空间不足

  • 只读文件系统

  • K-safety 丢失

  • 当前容错能力处于临界水平

  • ROS 容器过多

  • 节点状态变更

  • 恢复错误

  • 恢复故障

  • 恢复锁定错误

  • 恢复投影检索错误

  • 刷新错误

  • 刷新锁定错误

  • 工作负载分析器操作

  • Tuple Mover 错误

  • 计时器服务任务错误

  • 上一个完好的时期 (LGE) 延迟

  • 许可证大小合规性

  • 许可证期限合规性

磁盘空间检查和清理

当管理控制台检查警报时,将生成结果集并将其保存到磁盘中。如果使用主动警报配置,结果集可能会占用大量磁盘空间。默认情况下,Vertica 预留 500MB 磁盘空间用于保存结果集。

Vertica 每天检查 2 次可用磁盘空间并清除超过 7 天的警报。如果可用磁盘空间不足,则禁用自定义警报。因磁盘空间不足而禁用警报时会生成通知和电子邮件。

/opt/console/vconsole/config/console.properties 文件包含这些设置。编辑以下值来配置 MC 如何管理您的磁盘空间:

1 - 消息中心 (Message Center)

消息中心 (Message Center) 会组织系统性能警报,可帮助您有效地监控数据库的状态。预配置自定义警报会在其测量的组件超过指定阈值时生成消息。

通过以下方式访问消息中心 (Message Center)

  • 在 MC 主页的 MC 工具 (MC Tools) 部分中选择消息中心 (Message Center)

  • 在特定于数据库的任意页面中,选择右上角的消息信封图标,然后在速览视图中选择消息中心 (Message Center)

  • 在数据库概览 (Overview) 选项卡中,选择未读消息(本周)(Unread Messages (This Week)) 小组件中的数字(包括 0)。

消息中心 (Message Center) 可以检索多达 10,000 条最新的数据库消息。默认情况下,它最多会列出前 1 周生成的 600 条消息。有关如何检索前 1 周之前的消息的详细信息,请参阅日期筛选

筛选消息网格

管理控制台 (Management Console) 提供了几个选项,用于按数据库、关键字、消息类型和日期筛选消息网格中的消息。使用其中一个或多个选项以仅查看您要管理的消息。

数据库筛选

选择显示 (Showing) 以列出与已登录用户帐户关联的数据库。选择特定数据库以仅查看该数据库的消息,或选择**(所有数据库)(All DBs)** 以查看和管理所有数据库中的消息。

关键字筛选

使用屏幕右上角的搜索栏列出包含输入文本的消息。例如,如果您输入 29,当您单击加号 (+) 图标展开消息行时,网格会列出所有消息标题或消息详细信息中包含这些字符的所有消息。

消息类型筛选

显示 (Showing) 中选择一个值后,针对该值的消息数量将在屏幕右上角附近的搜索栏下方按类型汇总和分组。这些消息类型使用 syslog 标准来定义严重级别。MC 消息类型定义如下:

  • 所有消息 (All Messages):未存档或未删除,且在前 1 周的 messageCenter.maxEntries 范围内的消息。

  • 高优先级 (High Priority):您在警报 (Alerts) 选项卡中为其分配了高优先级警报优先级的消息。这些消息对应于 syslog 级别 0 和 1。

  • 需要关注 (Need Attention):指示对应于 syslog 级别 2 和 3 的严重或错误消息。

  • 信息性 (Informational):对应于 syslog 级别 4、5、6 和 7 的警告、通知、信息性或调试消息。

要仅使用单个消息类型填充网格,请选择数字或消息类型描述。

日期筛选

选择检索更早的消息 (Retrieve Older Messages),输入开始日期 (From)结束日期 (To),以列出前 1 周之前生成的消息。Vertica 会存储 10,000 条最新的数据库消息,以便您可以在必要时检索较旧的消息。

消息组

消息中心 (Message Center) 将消息和通知分为最近的消息 (Recent Messages)阈值消息 (Threshold Messages)已存档消息 (Archived Messages)。所有消息组均使用以下优先级和颜色代码:

  • 严重(红色)

  • 警告(橙色)

  • 通知(绿色)

  • 信息(蓝色)

最近的消息和阈值消息

最近的消息包括前 1 周内生成的最新消息,在 messageCenter.maxEntries 值范围内。阈值消息包括当数据库超过预配置、自定义或默认警报阈值时生成的消息。

最近的消息和阈值消息按消息类型、数据库名称、消息描述以及生成消息的日期和时间列出。此外,还提供可折叠网格标头,按今天 (Today)昨天 (Yesterday)本周 (This Week) 对警报进行分组。

已存档消息

已存档消息是您手动保存以备将来使用的消息。当选中单个消息的复选图标或选择全部存档 (Archive All) 时,MC 会将消息标记为已读并将其存档。已存档消息的日期或 messageCenter.maxEntries 限制与最近的消息 (Recent Messages)阈值消息 (Threshold Messages) 不同。

已存档消息 (Archived Messages) 选项卡包含以下用于优化搜索结果筛选的工具:

  • 使用网格上方的开始日期 (From)结束日期 (To) 框来定义已存档消息的搜索时间范围。要合并多个时间范围,请选中不清除现有搜索结果 (Do not clear existing search results) 复选框。

  • 使用类型 (Type)数据库名称 (Database Name)描述 (Description)日期 (Date) 列进一步对消息进行排序或筛选。

消息操作

对所有、多条或单条消息执行操作。要同时对所有消息执行操作,请使用屏幕右上角搜索栏旁边的全选 (Select All)全部不选 (Select None) 按钮。

每个消息行都有一个复选框,以便您可以同时对一条或多条消息执行操作。选择加号 (+) 图标可展开消息行并显示以下消息详细信息:

  • 总结

  • 主机 IP

  • 出现时间

  • 此消息出现的次数

  • 描述

有关每条消息的更多信息,请查询 EVENT_CONFIGURATIONS

当选择 X 图标,或选择多条消息并单击删除消息 (Delete Msgs)全部删除 (Delete all) 按钮时,消息将被永久删除。

2 - 警报配置

为每个数据库启用和自定义预配置警报或自定义警报的设置。例如,您可以将节点磁盘使用率 (Node Disk Usage)阈值 (Threshold Value) 设为最低 20% 或最高 80%。如果任何节点超出这些任一阈值,MC 会生成消息,同时您会收到通知。对 消息中心 (Message Center) 中的警报采取操作。

要访问警报 (Alerts) 选项卡,请登录管理控制台,然后选择 转至数据库 (Go to database) > 设置 (Settings) > 警报 (Alerts)

可配置设置

要配置任何警报,必须将行左侧的开关切换到打开位置。节点状态更改 (Node State Change) 是唯一默认打开的预配置警报。默认情况下,自定义警报处于关闭状态。

预配置警报和自定义警报采用以下设置:

  • 查询变量 (Query variables):仅限自定义警报。查询变量是您在创建警报时添加的变量。必须为每个变量提供一个值。创建警报后不会验证查询变量。如果更新后的变量值会导致查询无效,将在下次执行期间静默禁用警报。
    要查看原始 SQL 查询,请将鼠标悬停在警报名称上以在工具提示中显示警报。

  • 阈值 (Threshold Value):仅限预配置的警报。您可以为组件添加可接受的操作值下限和上限。

  • 检查间隔 (Check Interval):此值决定 Vertica 对警报执行基础 SQL 查询的频率。

  • 警报优先级 (Alert Priority):您可以分配以下优先级标签之一,以确定警报分发方式:

    • 警报 (Alert)严重 (Critical):在概述 (Overview) 页面上使用消息警报通知机制显示消息,并在消息中心 (Message Center) 创建消息。

    • 警告 (Warning):在 消息中心 (Message Center) 中创建一条消息。

  • 警报电子邮件收件人 (Alert Email Recipients):配置触发警报时任意警报优先级的电子邮件通知。必须配置 SMPT。有关向警报添加电子邮件收件人的详细信息,请参阅自定义警报

  • 垂直省略号 (Vertical ellipses):对于自定义警报和新资源池警报,单击垂直省略号以删除警报。必须具备 MC ADMIN 角色权限才能删除警报。

配置资源池警报

资源池警报使用与其他警报相同的可配置设置,但可以为每个资源池设置警报。默认情况下,仅为 GENERAL 池设置预配置警报。

  1. 在标有资源池 (Resource Pool) 的顶部行中,选择行最右侧带有加号 (+) 的蓝色框。将鼠标悬停在按钮上时,按钮会展开并显示 添加资源池警报 + (Add Resource Pool Alert +)
    将打开新资源池警报 (New Resource Pool Alert) 窗口。

  2. 警报名称 (Alert Name) 中,选择要添加到资源池的警报。

  3. 资源池 (Resource Pool) 中,选择要添加此警报的资源池。

  4. 完成剩余设置的配置后,选择创建警报 (Create Alert)

与编辑其他警报一样,编辑检查间隔 (Check Interval)警报优先级 (Alert Priority) 和“警报电子邮件收件人 (Alert Email Recipients)”。有关指南,请参阅可配置设置自定义警报

要删除警报,请选择行右侧的垂直省略号,然后选择删除 (Delete)。必须具备 MC ADMIN 角色权限才能删除警报。

3 - 为电子邮件警报设置 SMTP

当数据库超过高优先级警报阈值时,管理控制台 (Management Console) 可以生成电子邮件通知。要接收电子邮件警报,您必须在 MC 中配置 SMTP 设置。

只有管理员可以提供 SMTP 设置。设置 MC 以发送电子邮件:

  1. 在“MC 设置 (MC Settings)”页面,选择电子邮件网关 (Email Gateway) 选项卡。

  2. 提供有关 SMTP 服务器的以下信息:

    • 电子邮件服务器(主机名)(Email Server (Hostname)):SMTP 服务器的主机名或 IP

    • 端口 (Port):SMTP 服务器的端口

    • 会话类型 (Session Type):要使用的连接类型(例如 SSL)

    • SMTP 用户名 (SMTP Username)(可选):用于连接服务器的用户名凭据

    • SMTP 密码 (SMTP Password)(可选):用于连接服务器的密码凭据

    • 发件人地址 (Sender Address):服务器发送电子邮件警报时所用的发件人地址

    • 信任 SSL 证书 (Trust SSL Certificate):是否自动信任 SMTP 服务器的证书

  3. 单击页面顶部的测试 (Test)。MC 会验证您的 SMTP 设置,并向您提供的电子邮件别名的收件箱发送一封测试电子邮件。

  4. 确认您已成功收到测试电子邮件。

  5. 单击页面右上方的应用 (Apply) 来保存设置。

为电子邮件设置 SMTP 后,您可以将 MC 配置为通过电子邮件发送高优先级阈值警报。有关详细信息,请参阅警报配置自定义警报

4 - 自定义警报

使用您自己的数据库架构和表创建基于事件的自定义警报,以跟踪节点运行状况、查询和资源池异常和性能波动。当数据库触发活动警报时,将根据警报优先级收到通知,并可在 消息中心 (Message Center) 中执行操作。

创建自定义警报

必须具备 MC ADMIN 角色权限才能创建自定义警报。

以下步骤可创建名为 X 时间段内的登录失败次数 (Failed logins within a X time period) 的自定义警报,以跟踪每个用户在前两个小时内登录失败的次数。此警报或许表示可能存在分布式拒绝服务 (DDoS) 攻击或应用程序运行不当。基础 SQL 查询使用变量创建动态阈值,您可以在创建警报后对阈值进行优化。

  1. 登录管理控制台,依次选择转至数据库 (Go to database) > 设置 (Settings) > 警报 (Alerts)

  2. 在页面顶部的自定义警报 (Custom Alerts) 行中,单击该行最右侧带有加号 (+) 的蓝色框。将鼠标悬停在按钮上时,按钮会展开并显示创建自定义警报 + (Create Custom Alert +)
    将显示创建自定义警报 (Create Custom Alert) 窗口。

  3. 警报名称 (Alert Name) 中,输入 X 时间段内的登录失败次数 (Failed logins within a X time period)

  4. SQL 查询 (SQL Query) 中,输入以下 SQL 查询:

    SELECT
      login_timestamp,
      user_name,
      node_name,
      client_hostname,
      reason
    FROM
      login_failures
    WHERE
      reason in ('INVALID USER', 'FAILED', 'INVALID DATABASE')
      AND login_timestamp > sysdate - INTERVAL '{{Time_Interval}}'
    

    前述查询的 AND 子句将名为 Time_Interval 的 String 类型变量括在花括号内,表示有效 SQL 语法元素。

    变量是在运行时评估的动态值,您可以在保存警报后进行配置。每个自定义警报最多可以添加 6 个变量。变量名称最多可以包含 14 个字母数字字符,包括下划线。验证变量是否使用正确的数据类型和格式。String 类型变量需要在花括号两侧添加单引号。

    如果 SQL 查询返回一行或多行,则会触发警报。根据需要使用 SQL 查询 (SQL Query) 框上方和右侧的格式化或全屏按钮。

  5. SQL 查询 (SQL Query) 框下方会显示一个框,其中包含与每个变量名称相对应的占位符文本。要测试警报,请在此框中输入 2 Hours

  6. 选择运行查询 (Run Query)查询结果 (Query Results) 部分将显示查询中返回的所有行。或者,您可能会遇到以下问题之一:

    • 如果使用的 SQL 语法无效,则会显示错误。

    • 如果查询返回 5 列或 100 行以上,则会显示警告。每个查询结果集都保存到磁盘,因此了解结果集的大小十分重要。有关详细信息,请参阅在 MC 中监控数据库消息和警报

  7. 如果对查询结果感到满意,选择创建警报 (Create Alert)
    将关闭创建自定义警报 (Create custom alert) 窗口,刚刚创建的警报将列入警报 (Alerts) 页面的自定义警报 (Custom Alerts) 部分。如果将鼠标指向查询名称,查询将显示在工具提示中。在查询名称下,显示与创建警报时添加的变量相对应的可编辑框。

  8. Time_Interval 变量框中,输入 2 Hours

  9. 检查间隔 (Check Interval) 选择值。默认设置为 10 分钟 (10 minutes)。此值决定执行查询的频率。

  10. 警报优先级 (Alert Priority) 选择值。默认情况下,会为警报分配临界 (Critical) 值优先级。

  11. (可选)选择警报电子邮件收件人 (Alert Email Recipients) 下的管理电子邮件 (Manage Emails) 图标,以便在触发警报时向特定用户发送电子邮件警报。要注册用户以接收电子邮件警报,请完成 为电子邮件警报设置 SMTP 中的步骤。

  12. 管理电子邮件收件人 (Manage Email Recipient) 窗口中完成以下步骤:

    1. 要将现有用户添加到警报,请单击现有 MC 用户旁边的复选框,或选择顶部的框以添加所有用户。对于不存在的 MC 用户,请在窗口底部输入用户的电子邮件地址。

    2. 电子邮件间隔 (Email Interval) 中,选择发送电子邮件的频率:

      • 立即 (Immediately)

      • 1 小时 (One hour):自发出警报时开始。

      • 1 天 (One day):用户会在您创建警报 24 小时后收到警报。

      例如,如果选择 1 小时 (One hour),则每小时发送一封电子邮件,即使这 1 小时内多次触发警报也是如此。

    3. 单击保存 (Save)

创建警报后,使用警报行最左侧的开关进行打开或关闭。

编辑自定义警报

必须具备 MC ADMIN 角色权限才能编辑自定义警报。

  1. 登录管理控制台,依次选择转至数据库 (Go to database) > 设置 (Settings) > 警报 (Alerts)

  2. 在页面顶部的自定义警报 (Custom Alerts) 行中,找到要编辑的自定义警报。

  3. 选择垂直省略号,然后选择编辑 (Edit)
    将打开编辑自定义警报 (Edit custom alert) 窗口,并显示之前保存的自定义警报值。

  4. 编辑警报。您可以编辑以下任何警报属性:

    • 警报名称

    • SQL 查询

    • 任何变量值

  5. 选择运行查询 (Run Query)查询结果 (Query Results) 部分将显示查询中返回的所有行。或者,您可能会遇到以下问题之一:

    • 如果使用的 SQL 语法无效,则会显示错误。

    • 如果查询返回 5 列或 100 行以上,则会显示警告。每个查询结果集都保存到磁盘,因此了解结果集的大小十分重要。有关详细信息,请参阅在 MC 中监控数据库消息和警报

  6. 如果对查询结果感到满意,选择更新警报 (Update Alert)

删除警报

要删除自定义警报,请选择行右侧的垂直省略号,然后选择删除 (Delete)。必须具备 MC ADMIN 角色权限才能删除警报。

5 - 导出 MC 管理的数据库消息和日志

您可以将数据库消息、日志详细信息、查询详细信息和 MC 用户活动的这些内容导出到文件。

这些信息直接来自 MC 界面。这就意味着,如果界面中显示最后五分钟的 vertica.log 信息,您可以将这五分钟的数据(而不是整个日志)保存到文件。筛选消息或日志时,MC 仅导出筛选后的结果。

导出消息时,您可以立即查看输出,或者指定文件保存位置,具体取决于所设置的浏览器首选项。系统生成的文件名含有时间戳,以确保唯一性。

下表按记录类型显示了包含您可以导出的内容的 MC 页面、系统生成的文件名以及该文件的输出包含的内容: