运维监控中心

✅ 系统正常
24h 原始告警
47
聚合为事件簇
3
ArkClaw 自动处理
31
待人工确认
2
GodEye 智能告警引擎将 47 条原始告警聚合为 3 个根因事件, 告警压缩比 93.6%,ArkClaw 自动处理了 66% 的事件。
CRITICAL

Core-01 → Core-02 光模块老化

关联告警:12首次发现:09:42:15影响设备:HW-CE12808-Core-01, HW-CE12808-Core-02, H3C-S12500-Dist-01
处理中
ArkClaw:已自动切换备用链路,BGP 已恢复
09:42:15HW-CE12808-Core-02100GE1/0/1 CRC 错误激增 (>10000/min)MAJOR
09:42:16HW-CE12808-Core-01光功率衰减至 -18.5 dBmMAJOR
09:42:18HW-CE12808-Core-01BGP Peer 10.1.0.2 DownCRITICAL
09:42:19H3C-S12500-Dist-01OSPF 邻居 10.1.0.1 LostMAJOR
MAJOR

Elasticsearch 节点内存不足

关联告警:5首次发现:08:18:30影响设备:ES-Node-03
ArkClaw 已处理
ArkClaw:已自动清理 30 天前冷数据,内存恢复至 72%
08:18:30ES-Node-03JVM Heap 使用率 95%MAJOR
08:20:15ES-Node-03索引写入延迟 > 5sWARNING
08:22:00ES-Node-03Circuit Breaker 触发MAJOR
WARNING

视频会议服务证书过期

关联告警:3首次发现:昨天 23:10影响设备:Meet-Server-01
待处理
ArkClaw:已生成续签工单 #TK-2025-0892
23:10:00Meet-Server-01SSL 证书将在 7 天内过期WARNING
23:10:01Meet-Server-01HTTPS 健康检查失败率 4.8%WARNING