监控机器与配置告警
CloudCanal 控制台可以直接查看机器的监控指标,并且在机器状态异常时发送报警。用户排查任务卡顿问题时可以查看机器监控来辅助排查。本文介绍如何查看机器监控指标,以及如何配置机器告警。
机器监控
- 点击 同步设置 > 同步机器。
- 点击集群列表右侧操作栏中的 机器列表,进入机器列表页,可查看机器当前的监控指标值,包括CPU、磁盘和内存等。
- 点击机器列表右上角的 图标,即可查看机器监控图表。
机器监控支持查看的指标如下:
指标名称 | 说明 |
---|---|
内存监控 | 查看总内存容量、空闲内存容量、已使用内存容量。Tips: 已使用内存,即任务已占用内存。创建任务时需选择任务规格,该规格指任务运行时占用的内存。一台机器上所有任务的规格总和即任务占用内存。 |
内存使用率 | 查看内存使用率。内存使用率指任务已占用内存 / 物理内存容量。 |
CPU 使用率 | 查看 CPU 使用率。 |
机器 load 值 | 机器负载,如果 load 值超过 CPU 核数过多,说明该机器负载过高,建议将这台机器上的任务调度到新的机器上。 |
硬盘监控 | 查看总硬盘容量、空闲硬盘容量、已使用硬盘容量。 |
硬盘使用率 | 查看硬盘使用率。硬盘使用率指已使用硬盘容量 / 总硬盘容量(物理磁盘容量)。 |
机器告警
当前仅支持机器状态异常时进行报警。操作步骤如下:
- 在系统部署时提前配置告警,具体操作步骤请参考 配置告警。
- 在机器列表页右下角勾选 存活性检查。当机器状态异常时会按照 CloudCanal 系统的告警配置发送报警信息。