运维监控中心
✅ 系统正常
24h 原始告警
47
聚合为事件簇
3
ArkClaw 自动处理
31
待人工确认
2
GodEye 智能告警引擎将 47 条原始告警聚合为 3 个根因事件, 告警压缩比 93.6%,ArkClaw 自动处理了 66% 的事件。
CRITICAL
Core-01 → Core-02 光模块老化
关联告警:12 条首次发现:09:42:15影响设备:HW-CE12808-Core-01, HW-CE12808-Core-02, H3C-S12500-Dist-01
ArkClaw:已自动切换备用链路,BGP 已恢复
| 09:42:15 | HW-CE12808-Core-02 | 100GE1/0/1 CRC 错误激增 (>10000/min) | MAJOR |
| 09:42:16 | HW-CE12808-Core-01 | 光功率衰减至 -18.5 dBm | MAJOR |
| 09:42:18 | HW-CE12808-Core-01 | BGP Peer 10.1.0.2 Down | CRITICAL |
| 09:42:19 | H3C-S12500-Dist-01 | OSPF 邻居 10.1.0.1 Lost | MAJOR |
MAJOR
Elasticsearch 节点内存不足
关联告警:5 条首次发现:08:18:30影响设备:ES-Node-03
ArkClaw:已自动清理 30 天前冷数据,内存恢复至 72%
| 08:18:30 | ES-Node-03 | JVM Heap 使用率 95% | MAJOR |
| 08:20:15 | ES-Node-03 | 索引写入延迟 > 5s | WARNING |
| 08:22:00 | ES-Node-03 | Circuit Breaker 触发 | MAJOR |
WARNING
视频会议服务证书过期
关联告警:3 条首次发现:昨天 23:10影响设备:Meet-Server-01
ArkClaw:已生成续签工单 #TK-2025-0892
| 23:10:00 | Meet-Server-01 | SSL 证书将在 7 天内过期 | WARNING |
| 23:10:01 | Meet-Server-01 | HTTPS 健康检查失败率 4.8% | WARNING |