這篇是把我在不同時間、針對「該用什麼模型」隨手留在 Threads 上的碎念整理成一篇。不是系統性評測,就是當下的原始想法按主題排一排。
Codex:解複雜 bug
用 Codex。Codex 解複雜 bug 真的是神。(但很慢)
Sonnet:文書類就夠
至於日常文書類的工作,最近有人在討論「該用什麼模型」,我的一句話回應是:文書類的 Sonnet 就好。
Haiku 4.5:全端開發
2026 最強炫智方式:用 Haiku 4.5 做完全端開發。不是逞強,是因為成本跟速度的組合現在只有 Haiku 撐得住「改一點、驗一點、再改一點」這種全端節奏。
DeepSeek:性價比最高的平替
主力之外要找平替的話,等他們算力到位之後還會繼續降價。說真的,除了合規要求以外,DeepSeek 應該是目前性價比最高的平替了。
Qwen 3.6 Plus:先觀望
另一個值得留意但我還在觀望的是 Qwen。在經歷核心人員出走的風波後,阿里巴巴在 OpenRouter 上發布了下一代模型 Qwen 3.6 Plus 的預覽版。官方表示強化了編程、Agentic、前端開發、複雜問題解決能力。不過目前的 preview 版會收集 prompt 跟 completion output,生產環境要謹慎。
小模型本地部署:看場景
如果是 3B 的話,最大的特色我猜是輕量加本地部署。畢竟很多 OCR 高敏感場景,資料是不能出去的。如果再搭配上聯邦學習架構就更好了。
Gemini 也支援 Skill 了:保持觀望
最後是 Gemini。現在 Gemini 也支援 Skill 了。不過以 Gemini 的尿性,我保持觀望。