CCase — 案例
把崩在 production 的 LLM 流程穩定下來,production-grade harness 設計與交付。
2025 · Q2 B2B 平台 · Agent 整合
Production 失敗率 −92%
P95 Latency −38%
交付期程 10 週
Problem
客戶 LLM agent 流程 demo 漂亮、上 production 每天 fail 兩三次。Root cause 是 prompt 寫死規則、缺 deterministic 驗證,失敗 silent 通過。
Did
把 prompt 內的限制全部抽出到 code、加 state machine 控動作邊界、tool call schema 驗證 + audit log 全鏈路落盤,失敗能 trace 回單一 step。
Stack
Python · Pydantic · Temporal · Anthropic Tool Use
Stack: PythonPydanticTemporalAnthropic Tool Use