一萬一千次失敗的告警
健康探針連續回報失敗,FailingStreak 數千次,監控面板整整四天一片紅。直覺反應是服務掛了,但那個服務從頭到尾都在正常處理請求——cron 跑得動,hook 觸發得了,對外 API 沒有任何異常回應。
健康探針連續回報失敗,FailingStreak 數千次,監控面板整整四天一片紅。直覺反應是服務掛了,但那個服務從頭到尾都在正常處理請求——cron 跑得動,hook 觸發得了,對外 API 沒有任何異常回應。

某次例行的服務節點重建之後,一套自動化串接的 API 開始持續回傳 401。第一反應是 token 過期——但這個 token 原本就沒有設 expiration。打開 payload 看,結構完整,欄位都在,沒有任何明顯異常。服務端卻直接拒在門外,連 decode 都不做。

超商 APP 點下「領取優惠券」,畫面跳出確認動畫,但結帳時優惠沒有套用——有時候不是網路問題,是 APP 版本太舊,那個觸發邏輯根本不在裡面,舊版本靜默地忽略了整件事。這個感覺,在處理低程式碼自動化工具的 Set 節點時,完整地再現了一次。