當 AlphaGo 遇上 ChatGPT：第四章：另一種文明—

另一種文明——Transformer 與 LLM 的語言大腦

另一邊，Transformer / LLM 走的是完全不同的路線。

一位工程師問：

Transformer 是否可能學出「內在 MCTS」？
世界模型能否直接讓模型具備“物理直覺”？
LLM 的注意力層會不會自然出現 AlphaZero-style policy priors？

先回到基本盤：

LLM 的訓練任務其實只有一件事：

「給你一串文字，請你預測下一個 token 是什麼。」

但因為看過全世界的語料，
這個「下一個字」的遊戲玩到極致，就長出：

如果你只用 LLM（不加世界模型 / 搜尋），
它在「球會不會掉下斜坡？水會不會往下流？」這種題目上，
其實多半是在做「語意推論」——
知道大家都這樣寫，而不是在真實內部模擬物理軌跡。

粗暴比喻一下：

前者很會「算未來」，
後者很會「講道理」。

第五章：Chain of Thought、Tree of Thoughts：

========