Skip to content
Dustin's AI Lab
Go back

拿教授朋友的論文 repo 試 Fable 的能力邊界

一覺醒來肥勃(Mythos 護欄版)上線,我拿教授朋友的論文 proposal、prompt、workflow 三份文檔去試它寫論文的邊界。


一覺醒來,肥勃(Mythos 的護欄版本)就上了。我趕緊呼叫我的教授朋友,請他把正在寫的論文 prompt 跟 repo 給我,讓我來測試一下它的能力邊界。只有幾天可以用訂閱額度,之後 API 調用價格高到堪比台灣國旅。

完全從頭,開始的只有三份文檔:proposal,也就是研究主題提案;prompt,規範模型怎麼做研究、怎麼寫論文;還有 workflow,把過去寫論文時做錯的大量教訓寫成負面約束。

結果照教授的原話:Opus 會漏幾條規則,Fable 完全不漏、一次過,Gemini 跟 GPT 是完全沒有在鳥的。

他做的是 federated learning 相關的題目,應該沒有碰到 guardrail。

至於 effort 開多少,reddit 上有網友說開 high 是不夠的,xhigh 才有明顯增益——這條留著之後自己驗。


Share this post on:

Previous Post
翻 Claude Fable 5/Mythos 5 系統卡,越看越像在讀科幻小說
Next Post
Claude Code 週年對話的幾個重點