健康概览
健康概览
使用场景:当平台的基础服务异常时,用户可以通过健康概览快速定位系统异常原因,节省运维成本。
使用角色:超级管理员。
功能描述:平台提供各服务运行状态监控,以服务架构形式展示,包括:平台自身相关服务、平台所使用的中间件服务,以及底层的数据库集群服务。
- 登录超管账号,进入健康概览界面,即可查看平台总体健康情况。
服务
平台的健康概览负责监控各服务运行状态,并以层级的形式进行展示,以便一目了然掌控服务状态及关键信息。
- 指示灯:正常的服务绿灯展示,异常服务红灯展示
- 版本号:展示当前平台各服务的版本号,避免运维、升级时因版本差异造成更新遗漏、异常
服务影响域
- 各服务若发生异常,可能造成相应影响域的功能运行异常,具体如下表:
服务名称 | 影响域 |
---|---|
网关服务 | 全局 |
用户服务 | 全局 |
系统服务 | 全局 |
数据集成服务 | 资源盘点、数据源管理、数据加工(导入导出节点) |
数据开放服务 | 数据开放、数据消费(API) |
数据安全服务 | 数据安全、数据消费(脱敏、水印) |
数据质检服务 | 数据质检、数据加工(质检节点) |
元数据服务 | 数据表管理、主数据、数据模型、文件夹管理、派生/复合指标、标签管理、数据服务 |
数据开发服务 | 数据加工(配置)、数据信道作业、指标加工、标签加工 |
任务调度服务 | 数据加工(调度、立即运行)、 数据信道作业(立即运行)、运维概览、调度管理 |
JobPool服务 | 作业周期调度 |
Argo服务 | 除实时同步作业外的所有作业运行 |
中间件
展示平台所使用中间件的健康情况,及中间件的全局使用情况。
- 指示灯:正常的中间件绿灯展示,异常中间件红灯展示
- 统计指标:展示Kafka、Minio、Redis、ZooKeeper,四类中间件当前时刻的使用情况
数据库集群
展示平台底层数据库集群的健康情况,及数据库集群的全局使用情况。
- 节点数量:一个IP表示一个节点,可直观查看当前部署了多少个节点
- 指示灯:正常的数据库集群绿灯展示,数据库集群中间件红灯展示
- 统计指标:展示数据库集群当前时刻的连接情况及磁盘使用情况