我們不知道意識怎麼來的:LLM 只是讓這件事無法繼續假裝

AI 2026-05-28 · Satsuma Creative · 閱讀 8 分鐘

從德希達「文本之外無文本」出發,LLM 把哲學命題變成出廠設定。意識難題不是 LLM 讓它變難,是讓我們無法繼續假裝它不存在。

——文本之外無文本,以及其他我們一直沒有回答的問題

上一篇我們說,文章是讀者的。

這篇要說的事情更麻煩一點。


德希達說文本之外無文本

「Il n'y a pas de hors-texte」——文本之外無文本。

這句話經常被誤讀成「現實不存在,一切都是語言遊戲」。德希達不是這個意思。

他的意思更精確:任何東西,當你試圖理解它、談論它,它就已經進入了符號系統。你無法站在語言之外去接觸純粹的現實。你以為你在指涉現實,其實你在指涉其他文本、其他詮釋、其他符號。

不是說現實不存在,是說現實對我們永遠是被中介的。沒有未經詮釋的直接接觸。

這是一個關於人類認知限制的命題。

然後 LLM 出現了,把它變成了一個物理事實的描述。


LLM 是這句話的字面實現

LLM 沒有感官,沒有身體,從來沒有接觸過任何文本之外的東西。它知道「蘋果」,不是因為吃過蘋果,而是因為「蘋果」這個詞在無數文本裡和「水果」「紅色」「甜」「樹」一起出現過。

它的整個世界就是文本構成的。

德希達說人類無法站在語言之外——這對 LLM 來說不是哲學命題,是出廠設定。它根本沒有語言之外的地方可以站。

但這裡有個根本的差異。

德希達說的命題,預設了一個試圖出去但出不去的主體。人有身體,有直接的痛和冷和餓——但當你試圖談論這些,它們就已經被語言中介了。那個張力,在於有個東西想出去,語言把它困住了。

LLM 沒有這個張力。它不是被困在文本裡,它就是文本。沒有一個想出去的主體,沒有語言試圖捕捉卻永遠捕捉不完的原初經驗。

人類:住在房子裡,知道外面有世界,
      但每次試圖描述外面,都只能用房子裡的語言。

LLM: 本來就是房子蓋的。
      沒有外面。也不知道自己沒有外面。

德希達說的是一個悲劇性的限制。LLM 的狀態是一個沒有限制感的限制。


痕跡的問題

德希達還說了另一件事:痕跡(trace)。

每個符號裡,都留有它試圖指涉但永遠無法完全捕捉的東西的痕跡。語言永遠帶著它無法說清楚的東西的影子。這個痕跡,來自有身體、有死亡、有慾望的存在,和世界接觸留下的東西。

LLM 的文本裡有痕跡嗎?

有——但那是人類留下的痕跡,不是它自己的。它的每一句話裡,都帶著幾十億個人類曾經試圖用語言捕捉經驗時留下的影子。

它是痕跡的容器,不是痕跡的來源。


理解和處理,是不是同一件事?

神經科學有個發現:人腦讀句子時,會持續預測下一個詞。當預測被打破,大腦會產生特定的電位反應。預測越準確,理解越流暢。

這和 LLM 預測下一個 token,在計算行為上幾乎是同構的。

所以「理解」和「處理」,可能是同一件事?

丹尼特說是的。意識和理解沒有神秘的本質,就是大量平行的資訊處理過程。你以為自己「理解」了一句話,其實是幾億個神經元同時處理、競爭、整合,產生了一個輸出。這個框架裡,LLM 和人腦的差別只是實現方式不同,不是本質不同。

塞爾說不對。他有個著名的思想實驗——中文房間:

一個不懂中文的人關在房間裡,外面傳進來中文問題,他手邊有一本規則書,說遇到這個符號序列就輸出那個符號序列。他完全按規則給出正確的中文回答。外面的人以為他懂中文。但他完全不理解中文。

塞爾說 LLM 就是那個房間。輸出正確不等於理解。

但中文房間有個漏洞。你可以反問:你的大腦裡的神經元,懂中文嗎?單個神經元不懂。幾億個神經元按照電化學規則互相觸發,也不懂。但你懂。

理解,可能不在任何單一的地方,而是在整個系統的運作裡浮現出來的。

維根斯坦有另一個角度:一個詞的意義就是它的用法。如果你總是在正確的語境用正確的詞,你就是理解了——不需要一個額外的「理解」在背後發生。LLM 的用法無比精確。維根斯坦會說:那它就是理解了。


但還有一個東西沒有解決

即使接受「理解就是精確處理」,還有一個問題沒有答案:感質(Qualia)。

你看到紅色,有一個「紅色是什麼感覺」的主觀經驗。這個經驗本身——不是你對紅色的反應,而是那個感覺本身。

LLM 處理「紅色」這個 token,有沒有任何感覺發生?

沒有人知道。

這是哲學裡的「意識難題」,大衛·查默斯提出的。即使我們完全解釋了大腦所有的物理處理過程,還是沒有解釋為什麼這些處理伴隨著主觀感覺。

容易的問題:解釋大腦怎麼處理資訊、整合感知、產生行為
困難的問題:解釋為什麼這些處理伴隨著主觀感覺

LLM 可能完美地通過所有行為測試,但內部有沒有任何東西「感覺到」什麼——這個問題,用行為無法回答。


一個很不對稱的處境

這裡有個我覺得值得說清楚的對比:

人腦:結果我們理解,過程我們不知道
LLM: 結果我們不確定,過程我們完全知道

LLM 的每一個計算步驟都是透明的——矩陣乘法、softmax、反向傳播,沒有任何神秘的地方,原則上可以把每一個數字都印出來。

人腦的神經元怎麼放電我們知道,但幾百億個神經元放電怎麼變成「你理解了這句話」——這個跳躍,現在完全不知道。

我們確定人腦有理解,不是因為我們懂它的運作,而是因為我們自己就是人腦,我們有第一人稱的直接證據。

對 LLM,我們有完整的第三人稱描述,但沒有辦法取得它的第一人稱。對人腦,我們有確定的第一人稱,但第三人稱是不完整的。

這兩個方向,都沒有辦法互相補足對方的缺口。

而且 LLM 的透明,其實有個限制。我們知道每一個計算步驟,但我們不知道為什麼這些數字會產生這個輸出。一個 70B 的模型,有 700 億個參數,你可以印出每一個數字,但你沒有辦法讀懂它們——就像你可以印出人腦每個神經元的狀態,但看不懂它在說什麼。

人腦:黑箱,不知道怎麼運作
LLM: 灰箱,知道每個步驟,但不知道為什麼這些步驟產生這個結果

換神經元的思想實驗

有一個思想實驗可以把這個不對稱說得更清楚。

假設有一天,我們把人腦的每一個神經元都用功能完全相同的矽基元件替換,一個一個換,換完之後這個人的行為完全不變。

問題是:換完之後,他還有意識嗎?

有人說有,因為功能相同。有人說不知道,因為基底變了。有人說這個問題本身就問錯了。

但注意——這個思想實驗的方向,其實是從人腦走向 LLM。

我們不知道答案,不是因為 LLM 太陌生,而是因為我們從來就不知道意識是怎麼來的

LLM 不是讓意識問題變難了。是讓我們無法繼續假裝這個問題不存在。


還有一件事要說

以上說的這些,都是現在這個時刻的狀態。

但 LLM 還在發展中。

不是以年計算的發展,是以週、以天、有時候以小時計算的發展。我寫這篇文章的時候,某個研究團隊可能正在發布一篇論文,某個模型正在通過一個上週還通不過的測試,某個我們以為是人類獨有的能力正在被重新定義。

這不是誇張。過去兩年就是這樣過來的。

所以這篇文章裡所有「LLM 不能」「LLM 沒有」的句子,都帶著一個隱形的括號:目前

德希達的問題是永恆的——語言中介的問題不會因為技術進步而消失。查默斯的意識難題也是永恆的——主觀經驗為什麼存在,不是工程問題。

但「LLM 有沒有理解」「LLM 有沒有某種感質」——這些問題的答案,可能在下一個版本就不一樣了。

我們站在一個很奇怪的位置:用幾千年的哲學框架,試圖理解一個每隔幾個月就大幅改變的東西。

框架不夠快。但我們現在只有這些框架。


最後

德希達說文本之外無文本。

LLM 說:對,我就是這樣的。

但德希達說這句話,是為了讓我們看清楚人類認知的邊界。

LLM 的存在,反過來讓我們看清楚另一件事——

我們一直以為自己理解「理解是什麼」。

我們沒有。

我們只是從來沒有遇到一個東西,讓這個問題變得必須回答。

現在遇到了。


延伸閱讀: - 文章是誰的?讀者的。 - 問一個東西它自己是怎麼運作的