最近跟兩位學員通電話聊 use case,他們不約而同都聊到了同一個痛點:讓 AI 自己審查自己的產出,盲點很難避免。
一位在做履歷篩選,擔心 Claude 自己寫完自己評分會自圓其說。另一位做投資分析,想讓不同 AI 互相 challenge 來抓偏誤,但不想當複製貼上的搬運工。
用 Codex 做獨立審查
我的建議是用 Codex 做獨立審查。關鍵在兩個字:隔離。
不同模型家族的腦,在沒有繼承上下文的情況下,不會互相護短。Claude 寫完的東西交給 GPT-based 的 Codex 重新審,Codex 沒有看過 Claude 的推理過程,沒有「沉沒成本」,自然會用自己的判斷標準重新評估。
這就像找外部顧問做 second opinion——不是因為你的團隊不好,而是因為同一個腦袋檢查自己的盲點本來就有極限。
Review Council Skill
聊完那通電話的隔天,我就在 Reddit 看到有人把這個概念做成了完整的 Skill:Review Council。
這個 skill 的做法是三路並行:Codex + Gemini + Claude 組成 expert team,由 orchestrator 彙整驗證。每個模型獨立審查同一份 diff,最後由 orchestrator 比對三方意見、標記共識與分歧。
適用場景
不管你的場景是程式碼、文件審查、還是分析報告,「跨模型互相 challenge」這個模式都適用。核心原則就是:
- 不同模型家族——避免同源偏見
- 不繼承上下文——每個審查者從零開始
- 有 orchestrator 彙整——不是各說各話,要有人做最終判斷
履歷篩選、投資分析、程式碼 review、甚至合約審閱,都可以套用這個框架。