← 所有場景
事件處理 Runbook
runbook-incidentP0/P1 事件自動化步驟 + SLA 倒數 + 對外溝通
靈感: PagerDuty, incident.io, Grafana Oncall
同一場景 × 10 個產業上下文
P0 ACTIVEINC-2026-0417
出餐流程 異常 · 餐飲連鎖
開始 8 分鐘 · 顧客 影響面評估中
Runbook 執行進度
3 / 7
- T+0✓alertmgr自動偵測 + 告警規則引擎命中 → Slack #incident-restaurant + PagerDuty
- T+2✓阿明建立事件 War Room建立頻道 · 指派 Incident Commander + Scribe
- T+5✓IC影響面評估受影響 顧客: 計算中 · 已知 6 筆訂單
- T+84SRE緩解動作(1) rollback 最近部署 (2) 切換備援節點 (3) rate limit
- T+?5Comms對外溝通 (statuspage)每 30 分鐘更新 · 中英雙版
- T+?6SRE根因定位 + 修復診斷 → 修復 → 驗證
- T+24h7IC事後回顧 (Blameless PM)時間軸 + 根因 + 行動項, 14 天內 follow-up
SLA 剩餘 22 分·狀態更新每 5 分鐘·Slack #incident-restaurant · statuspage
P0 ACTIVEINC-2026-0417
診療流程 異常 · 診所醫療
開始 8 分鐘 · 病患 影響面評估中
Runbook 執行進度
3 / 7
- T+0✓alertmgr自動偵測 + 告警規則引擎命中 → Slack #incident-clinic + PagerDuty
- T+2✓李醫師建立事件 War Room建立頻道 · 指派 Incident Commander + Scribe
- T+5✓IC影響面評估受影響 病患: 計算中 · 已知 6 筆掛號
- T+84SRE緩解動作(1) rollback 最近部署 (2) 切換備援節點 (3) rate limit
- T+?5Comms對外溝通 (statuspage)每 30 分鐘更新 · 中英雙版
- T+?6SRE根因定位 + 修復診斷 → 修復 → 驗證
- T+24h7IC事後回顧 (Blameless PM)時間軸 + 根因 + 行動項, 14 天內 follow-up
SLA 剩餘 22 分·狀態更新每 5 分鐘·Slack #incident-clinic · statuspage
P0 ACTIVEINC-2026-0417
成交流程 異常 · 房仲物件
開始 8 分鐘 · 買方 影響面評估中
Runbook 執行進度
3 / 7
- T+0✓alertmgr自動偵測 + 告警規則引擎命中 → Slack #incident-realestate + PagerDuty
- T+2✓葉經理建立事件 War Room建立頻道 · 指派 Incident Commander + Scribe
- T+5✓IC影響面評估受影響 買方: 計算中 · 已知 6 筆物件
- T+84SRE緩解動作(1) rollback 最近部署 (2) 切換備援節點 (3) rate limit
- T+?5Comms對外溝通 (statuspage)每 30 分鐘更新 · 中英雙版
- T+?6SRE根因定位 + 修復診斷 → 修復 → 驗證
- T+24h7IC事後回顧 (Blameless PM)時間軸 + 根因 + 行動項, 14 天內 follow-up
SLA 剩餘 22 分·狀態更新每 5 分鐘·Slack #incident-realestate · statuspage
P0 ACTIVEINC-2026-0417
支援流程 異常 · B2B SaaS
開始 8 分鐘 · 客戶 影響面評估中
Runbook 執行進度
3 / 7
- T+0✓alertmgr自動偵測 + 告警規則引擎命中 → Slack #incident-saas + PagerDuty
- T+2✓Sam建立事件 War Room建立頻道 · 指派 Incident Commander + Scribe
- T+5✓IC影響面評估受影響 客戶: 計算中 · 已知 6 筆工單
- T+84SRE緩解動作(1) rollback 最近部署 (2) 切換備援節點 (3) rate limit
- T+?5Comms對外溝通 (statuspage)每 30 分鐘更新 · 中英雙版
- T+?6SRE根因定位 + 修復診斷 → 修復 → 驗證
- T+24h7IC事後回顧 (Blameless PM)時間軸 + 根因 + 行動項, 14 天內 follow-up
SLA 剩餘 22 分·狀態更新每 5 分鐘·Slack #incident-saas · statuspage
P0 ACTIVEINC-2026-0417
訂單履行 異常 · 電商品牌
開始 8 分鐘 · 買家 影響面評估中
Runbook 執行進度
3 / 7
- T+0✓alertmgr自動偵測 + 告警規則引擎命中 → Slack #incident-ecommerce + PagerDuty
- T+2✓選品組建立事件 War Room建立頻道 · 指派 Incident Commander + Scribe
- T+5✓IC影響面評估受影響 買家: 計算中 · 已知 6 筆商品
- T+84SRE緩解動作(1) rollback 最近部署 (2) 切換備援節點 (3) rate limit
- T+?5Comms對外溝通 (statuspage)每 30 分鐘更新 · 中英雙版
- T+?6SRE根因定位 + 修復診斷 → 修復 → 驗證
- T+24h7IC事後回顧 (Blameless PM)時間軸 + 根因 + 行動項, 14 天內 follow-up
SLA 剩餘 22 分·狀態更新每 5 分鐘·Slack #incident-ecommerce · statuspage
P0 ACTIVEINC-2026-0417
學習進度 異常 · 補習教育
開始 8 分鐘 · 學生 影響面評估中
Runbook 執行進度
3 / 7
- T+0✓alertmgr自動偵測 + 告警規則引擎命中 → Slack #incident-education + PagerDuty
- T+2✓林老師建立事件 War Room建立頻道 · 指派 Incident Commander + Scribe
- T+5✓IC影響面評估受影響 學生: 計算中 · 已知 6 筆課程
- T+84SRE緩解動作(1) rollback 最近部署 (2) 切換備援節點 (3) rate limit
- T+?5Comms對外溝通 (statuspage)每 30 分鐘更新 · 中英雙版
- T+?6SRE根因定位 + 修復診斷 → 修復 → 驗證
- T+24h7IC事後回顧 (Blameless PM)時間軸 + 根因 + 行動項, 14 天內 follow-up
SLA 剩餘 22 分·狀態更新每 5 分鐘·Slack #incident-education · statuspage
P0 ACTIVEINC-2026-0417
配送流程 異常 · 物流配送
開始 8 分鐘 · 收件人 影響面評估中
Runbook 執行進度
3 / 7
- T+0✓alertmgr自動偵測 + 告警規則引擎命中 → Slack #incident-logistics + PagerDuty
- T+2✓王司機建立事件 War Room建立頻道 · 指派 Incident Commander + Scribe
- T+5✓IC影響面評估受影響 收件人: 計算中 · 已知 6 筆包裹
- T+84SRE緩解動作(1) rollback 最近部署 (2) 切換備援節點 (3) rate limit
- T+?5Comms對外溝通 (statuspage)每 30 分鐘更新 · 中英雙版
- T+?6SRE根因定位 + 修復診斷 → 修復 → 驗證
- T+24h7IC事後回顧 (Blameless PM)時間軸 + 根因 + 行動項, 14 天內 follow-up
SLA 剩餘 22 分·狀態更新每 5 分鐘·Slack #incident-logistics · statuspage
P0 ACTIVEINC-2026-0417
會員旅程 異常 · 健身工作室
開始 8 分鐘 · 會員 影響面評估中
Runbook 執行進度
3 / 7
- T+0✓alertmgr自動偵測 + 告警規則引擎命中 → Slack #incident-fitness + PagerDuty
- T+2✓Ken建立事件 War Room建立頻道 · 指派 Incident Commander + Scribe
- T+5✓IC影響面評估受影響 會員: 計算中 · 已知 6 筆課程
- T+84SRE緩解動作(1) rollback 最近部署 (2) 切換備援節點 (3) rate limit
- T+?5Comms對外溝通 (statuspage)每 30 分鐘更新 · 中英雙版
- T+?6SRE根因定位 + 修復診斷 → 修復 → 驗證
- T+24h7IC事後回顧 (Blameless PM)時間軸 + 根因 + 行動項, 14 天內 follow-up
SLA 剩餘 22 分·狀態更新每 5 分鐘·Slack #incident-fitness · statuspage
P0 ACTIVEINC-2026-0417
審核流程 異常 · 數位銀行
開始 8 分鐘 · 帳戶持有人 影響面評估中
Runbook 執行進度
3 / 7
- T+0✓alertmgr自動偵測 + 告警規則引擎命中 → Slack #incident-bank + PagerDuty
- T+2✓系統建立事件 War Room建立頻道 · 指派 Incident Commander + Scribe
- T+5✓IC影響面評估受影響 帳戶持有人: 計算中 · 已知 6 筆交易
- T+84SRE緩解動作(1) rollback 最近部署 (2) 切換備援節點 (3) rate limit
- T+?5Comms對外溝通 (statuspage)每 30 分鐘更新 · 中英雙版
- T+?6SRE根因定位 + 修復診斷 → 修復 → 驗證
- T+24h7IC事後回顧 (Blameless PM)時間軸 + 根因 + 行動項, 14 天內 follow-up
SLA 剩餘 22 分·狀態更新每 5 分鐘·Slack #incident-bank · statuspage
P0 ACTIVEINC-2026-0417
入住流程 異常 · 飯店訂房
開始 8 分鐘 · 旅客 影響面評估中
Runbook 執行進度
3 / 7
- T+0✓alertmgr自動偵測 + 告警規則引擎命中 → Slack #incident-hospitality + PagerDuty
- T+2✓櫃檯建立事件 War Room建立頻道 · 指派 Incident Commander + Scribe
- T+5✓IC影響面評估受影響 旅客: 計算中 · 已知 6 筆訂房
- T+84SRE緩解動作(1) rollback 最近部署 (2) 切換備援節點 (3) rate limit
- T+?5Comms對外溝通 (statuspage)每 30 分鐘更新 · 中英雙版
- T+?6SRE根因定位 + 修復診斷 → 修復 → 驗證
- T+24h7IC事後回顧 (Blameless PM)時間軸 + 根因 + 行動項, 14 天內 follow-up
SLA 剩餘 22 分·狀態更新每 5 分鐘·Slack #incident-hospitality · statuspage