更新时间:2022-09-27 GMT+08:00

管理服务和主机监控

用户可以在日常使用中,可以在MRS Manager管理所有服务(含角色实例)和主机的状态及指标信息:

  • 状态信息,包括运行、健康、配置及角色实例状态统计。
  • 指标信息,各服务的主要监控指标项。
  • 导出监控指标。

用户可以选择页面自动刷新间隔的设置,也可以单击马上刷新。

支持三种参数值:

  • “每30秒刷新一次”:刷新间隔30秒。
  • “每60秒刷新一次”:刷新间隔60秒。
  • “停止刷新”:停止刷新。

管理服务监控

  1. 在MRS Manager,单击“服务管理”。

    服务列表中标题包含“服务”“操作状态”“健康状态”“配置状态”“角色数”“操作”

    • 服务操作状态描述如表1所示。
      表1 服务操作状态

      状态

      描述

      已启动

      服务已启动。

      已停止

      服务已停止。

      启动失败

      用户启动操作失败。

      停止失败

      用户停止操作失败。

      未知

      后台系统重启后,服务的初始状态。

    • 服务健康状态如表2所示。
      表2 服务健康状态

      状态

      描述

      良好

      该服务中所有角色实例正常运行。

      故障

      至少一个角色实例运行状态为“故障”或被依赖的服务状态不正常。

      未知

      该服务中所有角色实例状态为“未知”。

      正在恢复

      后台系统正在尝试自动启动服务。

      亚健康

      该服务所依赖的服务状态不正常,异常服务的相关接口无法被外部调用。

    • 服务配置状态如表3所示。
      表3 服务配置状态

      状态

      描述

      已同步

      系统中最新的配置信息已生效。

      过期

      参数修改后,最新的配置未生效。需重启相应服务生效最新配置信息。

      失败

      参数配置过程中出现通信或读写异常。尝试使用“同步配置”恢复。

      同步中

      参数配置进行中。

      未知

      无法获取当前配置状态。

    默认以“服务”列按升序排列,单击服务操作状态健康状态配置状态可修改排列方式。

  2. 单击列表中指定服务名称,查看服务状态及指标信息。
  3. 定制、导出监控图表。

    1. 在“图表”区域框中,单击“定制”自定义服务监控指标。
    2. 在“时间区间”选择查询时间,单击“查看”显示该时间段内的监控数据。
    3. 单击“导出”,导出当前查看的指标数据。

管理角色实例监控

  1. 在MRS Manager,单击“服务管理”,在服务列表中单击服务指定名称。
  2. 单击“实例”,查看角色状态。

    角色实例列表中包含实例信息的角色、主机名管理IP业务IP机架操作状态健康状态配置状态
    • 角色实例的状态如表4所示。
      表4 角色实例状态

      状态

      描述

      已启动

      角色实例已启动。

      已停止

      角色实例已停止。

      启动失败

      用户启动操作失败。

      停止失败

      用户停止操作失败。

      退服中

      角色实例正在退服。

      已退服

      角色实例已退服。

      入服中

      角色实例正在入服。

      未知

      后台系统重启后,角色实例的初始状态。

    • 角色实例的健康状态如表5所示。
      表5 角色实例健康状态

      状态

      描述

      良好

      该角色实例正常运行。

      恢复中

      后台系统正在尝试自动启动角色实例。

      故障

      该角色实例运行异常,如PID不存在,无法访问端口。

      未知

      角色实例所在主机与后台系统未连接。

      亚健康

      该角色实例部分正常运行

    • 角色实例的配置状态如表6所示。
      表6 角色实例配置状态

      状态

      描述

      已同步

      系统中最新的配置信息已生效。

      过期

      参数修改后,最新的配置未生效。需重启相应服务生效最新配置信息。

      失败

      参数配置过程中出现通信或读写异常。尝试使用“同步配置”恢复。

      同步中

      参数配置进行中。

      未知

      无法获取当前配置状态。

    默认以“角色”列按升序排列,单击角色、主机名、管理IP、业务IP、机架操作状态健康状态配置状态可修改排列方式。

    支持在“角色”筛选相同角色的全部实例。

    单击“高级搜索”,在角色搜索区域中设置搜索条件,单击“搜索”,查看指定的角色信息。单击“重置”清除输入的搜索条件。支持模糊搜索条件的部分字符。

  3. 单击列表中指定角色实例名称,查看角色实例状态及指标信息。
  4. 定制、导出监控图表。

    1. 在“图表”区域框中,单击“定制”自定义服务监控指标。
    2. 在“时间区间”选择查询时间,单击“查看”显示该时间段内的监控数据。
    3. 单击“导出”,导出当前查看的指标数据。

管理主机监控

  1. 在MRS Manager,单击“主机管理”,看所有主机状态。

    主机列表中包括主机名称、管理IP、业务IP、机架、网络速度、操作状态、健康状态、磁盘使用率、内存使用率、CPU使用率。

    • 主机操作状态如表7所示。
      表7 主机操作状态

      状态

      描述

      正常

      主机及主机上的服务角色正常运行。

      已隔离

      主机被用户隔离,主机上的服务角色停止运行。

    • 主机健康状态描述如表8所示。
      表8 主机健康状态

      状态

      描述

      良好

      主机心跳检测正常。

      故障

      主机心跳超时未上报。

      未知

      执行添加操作时,主机的初始状态。

    默认以“主机名称”列按升序排列,单击主机名称管理IP业务IP机架网络速度操作状态健康状态磁盘使用率内存使用率CPU使用率可修改排列方式。

    单击“高级搜索”,在搜索区域中,设置查询条件,单击“搜索”,查看指定的主机。单击“重置”清除输入的搜索条件。支持模糊搜索条件的部分字符。

  2. 单击列表中指定的主机名称,查看单个主机状态及指标。
  3. 定制、导出监控图表。

    1. 在“图表”区域框中,单击“定制”自定义服务监控指标。
    2. 在“时间区间”选择查询时间,单击“查看”显示该时间段内的监控数据。
    3. 单击“导出”,导出当前查看的指标数据。