Skip to content
Dustin's AI Lab
Go back

主力之外,各模型的定位:我在不同時間留下的選型碎念

把我在 Threads 上不同時間留下的選型碎念整理成一篇:Codex 解複雜 bug、Sonnet 做文書、Haiku 做全端、DeepSeek 當平替、Qwen 觀望、小模型本地部署、Gemini Skill 觀望。


這篇是把我在不同時間、針對「該用什麼模型」隨手留在 Threads 上的碎念整理成一篇。不是系統性評測,就是當下的原始想法按主題排一排。

Codex:解複雜 bug

用 Codex。Codex 解複雜 bug 真的是神。(但很慢)

Sonnet:文書類就夠

至於日常文書類的工作,最近有人在討論「該用什麼模型」,我的一句話回應是:文書類的 Sonnet 就好。

Haiku 4.5:全端開發

2026 最強炫智方式:用 Haiku 4.5 做完全端開發。不是逞強,是因為成本跟速度的組合現在只有 Haiku 撐得住「改一點、驗一點、再改一點」這種全端節奏。

DeepSeek:性價比最高的平替

主力之外要找平替的話,等他們算力到位之後還會繼續降價。說真的,除了合規要求以外,DeepSeek 應該是目前性價比最高的平替了。

Qwen 3.6 Plus:先觀望

另一個值得留意但我還在觀望的是 Qwen。在經歷核心人員出走的風波後,阿里巴巴在 OpenRouter 上發布了下一代模型 Qwen 3.6 Plus 的預覽版。官方表示強化了編程、Agentic、前端開發、複雜問題解決能力。不過目前的 preview 版會收集 prompt 跟 completion output,生產環境要謹慎。

小模型本地部署:看場景

如果是 3B 的話,最大的特色我猜是輕量加本地部署。畢竟很多 OCR 高敏感場景,資料是不能出去的。如果再搭配上聯邦學習架構就更好了。

Gemini 也支援 Skill 了:保持觀望

最後是 Gemini。現在 Gemini 也支援 Skill 了。不過以 Gemini 的尿性,我保持觀望。


Share this post on:

Previous Post
靜默連敗 8 天:launchd 照常觸發,卻什麼都沒發生
Next Post
讓 AI 看工程圖寫 CAD:單一視覺模型裸寫拓樸不可信