运维监控中心
✅ 系统正常
ArkClaw
早上好!昨晚的告警我已经扫过一遍了,目前有 1 条 P1 需要关注。随时可以问我任何运维问题 🙌
核心交换机 HW-CE12808-Core-01 出现 BGP Peer Down 告警,帮我分析一下
ArkClaw
## 告警分析:BGP Peer Down
**设备信息**
- 设备:HW-CE12808-Core-01 (10.1.0.1)
- 告警时间:2025-01-15 09:42:18
- BGP Peer:10.1.0.2 (AS 65001)
**根因分析**
经过关联分析,发现以下关联事件:
1. ⚠️ 09:42:15 — 对端设备 HW-CE12808-Core-02 接口 100GE1/0/1 报 CRC 错误激增
2. ⚠️ 09:42:16 — 物理链路光功率衰减至 -18.5 dBm(阈值 -14 dBm)
3. ❌ 09:42:18 — BGP Hold Timer 超时,邻居关系断开
**结论**
根因为 Core-01 → Core-02 之间 100G 光模块老化导致光功率不足,建议更换端口 100GE1/0/1 光模块。
**建议操作**
- [ ] 派单更换光模块(优先级:P1)
- [ ] 临时切换至备用链路 100GE1/0/2
- [ ] 更换后验证 BGP 邻居恢复
帮我执行临时切换到备用链路
ArkClaw
## 操作确认
即将在 **HW-CE12808-Core-01** 上执行以下配置变更:
```
interface 100GE1/0/1
shutdown
#
interface 100GE1/0/2
undo shutdown
```
**风险评估**:低风险 — 备用链路已预配置 BGP,预计 30 秒内恢复邻居关系。
⏳ 等待审批... Rick 已批准,正在下发配置...
✅ 配置已下发成功。BGP 邻居 10.1.0.2 已在 22 秒后恢复 Established 状态。
ArkClaw · 演示模式