跨模型互審——讓 AI 不再自己審自己

AI 自己審查自己的產出，盲點難以避免。用 Codex 做獨立審查、或用 Review Council skill 組三模型 expert team，是目前最務實的解法。

最近跟兩位學員通電話聊 use case，他們不約而同都聊到了同一個痛點：讓 AI 自己審查自己的產出，盲點很難避免。

一位在做履歷篩選，擔心 Claude 自己寫完自己評分會自圓其說。另一位做投資分析，想讓不同 AI 互相 challenge 來抓偏誤，但不想當複製貼上的搬運工。

用 Codex 做獨立審查

我的建議是用 Codex 做獨立審查。關鍵在兩個字：隔離。

不同模型家族的腦，在沒有繼承上下文的情況下，不會互相護短。Claude 寫完的東西交給 GPT-based 的 Codex 重新審，Codex 沒有看過 Claude 的推理過程，沒有「沉沒成本」，自然會用自己的判斷標準重新評估。

這就像找外部顧問做 second opinion——不是因為你的團隊不好，而是因為同一個腦袋檢查自己的盲點本來就有極限。

聊完那通電話的隔天，我就在 Reddit 看到有人把這個概念做成了完整的 Skill：Review Council。

這個 skill 的做法是三路並行：Codex + Gemini + Claude 組成 expert team，由 orchestrator 彙整驗證。每個模型獨立審查同一份 diff，最後由 orchestrator 比對三方意見、標記共識與分歧。

不管你的場景是程式碼、文件審查、還是分析報告，「跨模型互相 challenge」這個模式都適用。核心原則就是：

履歷篩選、投資分析、程式碼 review、甚至合約審閱，都可以套用這個框架。