通用监控指标
简述
CloudCanal 任务运行时,根据源对端数据源类型不同,展示不同的监控指标,这些差异性的监控指标(如有)可以参考官方文档 数据链路 > 源端数据源 下的文档。
除差异性的监控指标外,所有 CloudCanal 任务监控共享一些通用的监控指标,这些通用监控指标与任务的运行息息相关,本文介绍通用监控指标的含义与查看方式。
任务监控指标
指标名称 | 可查看指标的阶段 | 指标说明 |
---|---|---|
全量 RPS (Record Per Second) | 全量 | 全量阶段每秒处理记录数。在 CloudCanal 中一条记录主要指数据库表中的一行。 |
全量对端写入延迟 (ms) | 全量 | 写入对端的延迟,可以理解为写入对端的响应时间,用于衡量对端数据库是否存在写入瓶颈。 |
全量表级 RPS | 全量 | 全量阶段每张表每秒处理记录数。 |
全量表级迁移进度(%) | 全量 | 全量阶段表级别的迁移进度。 |
增量任务延迟 (ms) | 增量 | 增量任务对端相比源端的数据延迟,单位 ms。 |
增量 RPS | 增量 | 增量阶段每秒处理记录数。 |
增量对端写入延迟 (ms) | 增量 | 写入对端的延迟,可以理解为写入对端的响应时间,用于衡量对端数据库是否存在写入瓶颈。 |
写入队列等待时间 (ns) | 增量 | 增量阶段内部队列的写入延迟,需要结合其他指标共同查看确认问题。对端写入瓶颈或者内部处理慢都有可能导致队列发布延迟。 |
增量缓存 RPS | 增量 | 任务内部缓存队列每秒处理记录数。 |
增量缓存延迟 (ms) | 增量 | 任务内部缓存队列延迟。 |
内存队列数据个数 | 增量 | 任务内部队列中的数据个数。 |
校验速率 | 校验 | 校验每秒处理记录数。 |
订正速率 | 订正 | 订正每秒处理记录数。 |
任务 CPU 使用率(%) | 任意阶段 | 任务进程对 CPU 的使用率。 |
任务 JVM 堆内内存 (MB) | 任意阶段 | 任务进程堆内存占用大小。 |
任务 JVM 堆外内存 (MB) | 任意阶段 | 任务进程堆外内存占用大小。 |
任务 JVM GC 数 | 任意阶段 | 任务进程垃圾回收的个数,GC 次数多则会影响性能或者导致任务卡顿超时。需要考虑适当增大任务规格或者调节参数,减少内存中对象的个数。 |
任务 JVM GC 时间 (ms) | 任意阶段 | 任务进程 GC 的耗时,GC 耗时长则会影响性能,导致任务卡顿超时。需要考虑适当增大任务规格或者调节参数,减少内存中对象的个数。 |
操作步骤
CloudCanal 任务性能指标均在任务详情页以图表展示。具体请参考 监控任务。