設萬維讀者為首頁 萬維讀者網 -- 全球華人的精神家園 廣告服務 聯繫我們 關於萬維
 
首  頁 新  聞 視  頻 博  客 論  壇 分類廣告 購  物
搜索>> 發表日誌 控制面板 個人相冊 給我留言
幫助 退出
張晉中的博客  
科技進展觀察。  
https://blog.creaders.net/u/34950/ > 複製 > 收藏本頁
網絡日誌正文
世界模型的本質:從康德、胡塞爾到自動駕駛的哲學與工程之路 2026-04-04 14:36:13

世界模型的本質:從康德、胡塞爾到自動駕駛的哲學與工程之路

你正開着一個看不見的內部世界

你坐在車裡,手握方向盤,腳下在油門和剎車之間輕輕切換。前方的道路在午後的光線里延伸,車流像一條緩慢流動的河,紅燈的數字在倒數,旁邊那輛卡車似乎有些猶豫。你並不會覺得自己正在做什麼複雜的事情,只是自然地開着車,甚至還能和同伴聊幾句無關緊要的話。

可如果把時間放慢,你會發現事情並沒有那麼簡單。在你抬頭看路、掃一眼儀錶盤、再瞥一眼後視鏡的短短幾秒鐘里,你的大腦已經完成了無數次預測。你在估計前車的速度,在判斷它是否會突然剎車,在揣測那輛卡車下一秒會不會切入你的車道。你甚至在心裡默默計算紅燈變綠的時間,而這一切發生得如此自然,以至於你根本意識不到自己正在運行一個龐大而精密的內部模型。這個模型,在今天的技術語境裡,有一個名字——世界模型

你以為自己在“看世界”,其實你是在用世界模型預測世界。

這種說法聽起來有些反直覺。我們習慣把感知理解為一種被動的過程,好像世界在那裡,我們只是把它“接收”進來。眼睛像攝像頭,耳朵像麥克風,大腦像一塊硬盤,把外界的信息原封不動地存下來。但越來越多的神經科學、心理學和認知科學研究表明,事實可能恰恰相反。我們並不是在接收一個完整的世界,而是在不斷生成一個對世界的猜測,然後用感官輸入去修正這個猜測。你看到的,並不是世界本身,而是一個被大腦實時構造出來的版本。

這就像你在黑暗中摸索一個物體的形狀。你伸出手,心裡先有一個大致的猜測——可能是圓的,可能是方的。當你觸碰到它的時候,手指傳來的感覺要麼證實你的猜測,要麼讓你修正它。你從來不會直接“知道”那是什麼,你只是在不斷地猜測、觸碰、調整、再猜測。日常的感知也是如此,只是速度快到讓你誤以為一切都是直接的。那個在你大腦中不斷被修正的猜測,就是你的世界模型。

先驗結構:世界在你“看見”之前就已經被組織好了

這個想法並不是現代科學的發明。幾百年前,就有人已經在思考類似的問題,只是他們沒有神經科學和計算機,只能用思辨去觸及這些邊界。

康德是其中走得最遠的人之一。他在十八世紀就指出,人類對世界的經驗並不是對“物自身”的直接接觸,而是世界在某種先天結構中的呈現。你之所以能看到遠近、前後、順序,是因為你的認知系統本身就帶着這些結構。空間、時間、因果,並不是從經驗中慢慢抽取出來的,它們更像是一種腳手架,讓經驗得以被組織起來。沒有這個腳手架,經驗就是一團無法分辨的混沌。這個腳手架,是“先天形式”,而在今天的語言裡,它可以被看作世界模型的底層架構。

你無法跳出這個結構,就像魚無法跳出水去理解水的存在。你出生時並不知道什麼是空間,但你看到的世界已經是有空間的。你沒有學過什麼是因果,但你會自然地認為“這個發生,是因為那個發生”。這些並不是你後天學會的結論,而是你認識世界的前提條件。康德把它們叫做“先驗形式”。放在今天的語境裡,這些先驗形式就可以被看作一個世界模型的底層架構——那些你不需要學習就已經擁有的、關於世界如何運作的基本假設。

想象一個嬰兒第一次睜開眼睛。他不會看到“一團光線在視網膜上投射出倒像”這樣的事,他直接就看到了一張臉,一個輪廓,一個在空間中存在的東西。這本身就是一個奇蹟:大腦已經把毫無結構的光信號,翻譯成了有遠近、有形狀、有邊界、有顏色的世界。這個翻譯過程不是後天學會的,而是神經系統天生就具備的能力。它就像一套預裝的軟件,在你第一次開機的時候就已經在那裡了。這個預裝的軟件,就是一個初始化的世界模型。

康德告訴我們,世界必須被放在某種結構之中才能被你“認識”。你沒有“先看到世界,再後來才有結構”,你是在結構中“看見”世界。你看到的,不是“世界本身”,而是“在先驗結構中的世界”。

意向性:意識從來不是空白,它總是指向某個對象

如果說康德告訴我們“世界必須被放在什麼樣的結構里”,那麼後來的一位哲學家胡塞爾則提醒我們另一個重要的事實:意識從來不是空白的。你不會只是“意識”,你總是“意識到某物”。你的注意、你的思考、你的感知,永遠帶着方向。你在開車時不會平均地關注整個世界,你的視線像一束光,總是落在前車、紅燈、行人、路口,而不是遠處的廣告牌或天上的雲。你可以試試看,當你刻意去關注那些無關緊要的細節時,你會發現你幾乎無法同時安全地駕駛。

這種“指向性”有一個專門的術語,叫做意向性。它不是說你有什麼意圖或目的,而是說意識的結構本身就是有方向的。就像磁針總是指向北方一樣,意識總是指向某個對象。你無法擁有一個“沒有對象”的意識,就像你無法擁有一個“不指向任何東西”的視線。即使你在發呆,你的意識也指向某種模糊的感受或飄忽的念頭。它永遠在指向什麼,永遠在關注什麼。在一個世界模型里,這種意向性對應着注意力機制——模型不會平等地處理所有輸入,它總是把計算資源集中在某些更重要的地方。

把康德的先驗結構和胡塞爾的意向性放在一起,你會得到一個相當完整的圖景:我們並不是被動地接收世界,而是在一個帶有固定結構、同時又具有方向性的系統中,與世界持續互動。結構決定了我們能看到什麼樣的世界,方向決定了我們此刻在看世界的哪個部分。這個系統,就是一個正在運行中的世界模型。

胡塞爾讓我們意識到,意識不是“空”,而是“有方向”。你不是在“看一個世界”,你是在“看向世界的某個部分”。

預測加工:世界在誤差最小化中被不斷生成

你把“先驗結構”和“意向性”放在一起,解釋了“世界必須被怎樣組織”“世界必須被怎樣指向”。但你還不知道這個系統具體是如何運轉的。結構是如何被使用的?方向是如何被執行的?大腦到底在做什麼?

直到現代神經科學提出“預測加工”這個框架,事情才變得可以計算、可以寫成算法。

預測加工的思想其實很樸素。大腦並不是在等待外界輸入然後被動反應,而是在主動生成對世界的預測。感官輸入的作用不是提供完整信息,而是用來糾正預測。大腦先假設“世界大概是這樣的”,然後從外界獲取一點信息,再去比較“實際”和“預測”之間的差距。如果差距很小,就說明預測還不錯,當前的模型可以繼續使用。如果差距很大,就說明需要調整模型,讓下一次的預測更准一些。

這個過程每時每刻都在發生。你走路的時候,大腦在預測下一步腳會踩到哪裡,地面的硬度是多少。你接住一個飛來的球,大腦在預測球的軌跡,你的手移動過去,並不是在追蹤球的位置,而是在奔向它將要出現的位置。你聽一個人說話,大腦在預測他接下來會說什麼詞,所以你才能在對方口齒不清的時候依然聽懂他的意思。所有這些預測,都依賴於你內心那個不斷更新的世界模型。

大腦並不是在“接收世界”,而是在用世界模型不斷修正自己對世界的預測。

當這一切被寫成工程語言時,它變得異常清晰。預測,是模型的輸出。輸入,是傳感器傳來的數據。預測誤差,是兩者之間的差值。學習,是讓這個差值變小的過程。整個系統的運作,本質上就是一個不斷優化的過程,一個讓內部世界模型越來越貼近外部世界的過程。

在人類的“認識機制”和 AI 的“學習機制”之間,預測加工搭起了一座橋:我們在兩個領域裡,都通過“預測-誤差-更新”這一流程,來進行對世界的認知與建模。

世界模型:從哲學概念到可運行的工程構件

就在這一刻,一個重要的轉變發生了。康德和胡塞爾提出的那些問題,本來是純粹的哲學問題,是關於認識、意識和世界關係的根本性問題。它們被討論了數百年,產生了無數流派和觀點,卻從未有過一個公認的答案。但一旦你接受了預測加工的框架,這些問題就可以被轉寫成工程問題。你不再需要回答“先驗結構從哪裡來”,你只需要在模型中引入合適的歸納偏置——比如卷積層假設空間局部性,循環層假設時間連續性。你不再需要解釋“意向性是什麼”,你只需要設計一個注意力機制,讓系統能夠動態地聚焦於輸入的某些部分。你不再需要討論“主體如何接觸世界”,你只需要讓模型在預測誤差的驅動下不斷更新自己的參數。

哲學問題沒有被解決,它們在某種意義上被形式化和轉寫成了另一種語言。而世界模型,就是這種轉寫之後的結果。

這正是近年來“世界模型”這個概念真正有意思的地方。在大語言模型之後,人們開始越來越多地談論世界模型。如果說大語言模型是在語言空間中進行模式匹配,那麼世界模型則試圖捕捉更一般的結構——空間、時間、物體、因果關係,以及這些結構如何在時間中持續演化。大語言模型知道“蘋果”後面經常出現“是紅色的”,但它並不真正理解蘋果從樹上掉下來會怎樣。世界模型試圖去理解的就是這種“物理的常識”。

你可以把世界模型理解為一個系統,它並不只是生成文本或識別圖像,而是試圖在內部構建一個關於“世界如何運作”的表示。它不僅要知道“人們通常怎麼說”,還要知道“東西通常怎麼動”。一個真正的世界模型應該能夠回答這樣的問題:如果我把這個杯子推到桌子邊緣,接下來會發生什麼?如果我鬆開手,這個球會往哪個方向落?如果前面的車突然剎車,我離它還有多遠?

這些問題聽起來簡單,但對於一個純粹從語言或圖像中學習的系統來說,它們並不簡單。因為這些問題涉及的不是統計規律,而是物理規律,是空間、時間和因果關係的深層結構。一個真正的世界模型,應該能夠在內部模擬這些過程,而不是僅僅記住一些常見的模式。這就是為什麼所有做自動駕駛、機器人和具身智能的實驗室,都在拼命構建更好的世界模型。

世界模型在自動駕駛中長成什麼樣子

在自動駕駛中,這一點表現得尤其直觀。當系統判斷一輛卡車是否會切入你的車道時,它並不是在調用某條固定的規則——“卡車變道需要打轉向燈”之類,而是在內部運行一個動態的世界模型。這個模型表示空間關係,追蹤物體運動,關注關鍵目標,並對未來幾秒鐘的軌跡做出預測。它的結構中包含某種“先驗”——比如物體不會憑空消失,運動是連續的,速度不會瞬間突變。它的計算中體現某種“意向性”——注意力被分配給了那些最可能影響自身安全的物體。它的優化目標則是不斷減少預測誤差,讓內部模型的預測儘可能貼近傳感器傳來的真實數據。

在結構上,哲學中的那些抽象概念,在這裡變成了可以運行的組件。先驗結構變成了網絡架構中的歸納偏置,意向性變成了注意力機制,預測加工變成了損失函數與反向傳播。一個神經網絡的一次前向計算,就像是一段被壓縮過的“認識論代碼”。它在一瞬間完成了康德和胡塞爾花了幾十年才描述清楚的那些過程。而所有這些組件組合在一起,就是我們今天所說的世界模型。

這並不意味着哲學已經被取代。相反,它意味着哲學的某些問題被搬到了一個不同的領域。過去,人們試圖通過思辨去理解“人是如何認識世界的”,寫下厚厚的著作,提出一個個概念和範疇。而現在,人們開始通過構建世界模型,讓機器表現出類似的認知能力。在這個過程中,我們不再執着於回答那些終極問題——比如“物自身是否存在”或者“意識如何產生”——而是先讓系統跑起來,再在運行中觀察它的行為和性質。這是一種完全不同的態度。哲學在追問“為什麼”,工程在追問“怎麼做”。

世界模型的哲學位置:從洞穴到“可計算的現實”

你坐在車裡,一腳油門,一腳剎車。你覺得自己在看路,在判斷,在決策。但也許更準確的說法是:你在不斷運行自己的世界模型,然後用感官輸入去修正這個模型。你的大腦在做這件事,你的車裡的計算系統也在做這件事。你們在做的事情,在結構上是相似的:都在用內部模型去模擬外部世界,都在把注意力分配給最相關的信息,都在不斷縮小預測和現實之間的差距。

這讓人想起一個古老的哲學比喻。柏拉圖說,我們像是被鎖在洞穴里的囚徒,只能看到牆上的影子,卻從未見過真正的光源。康德說,我們永遠無法直接接觸“物自身”,只能接觸到經過先驗形式加工過的“現象”。而今天,當我們談論世界模型的時候,我們其實在說另一件事:也許重要的不是影子還是實物,而是我們是否擁有一個足夠好的模型,讓我們在這個世界中安全地、有效地、有意義地行動。

在這一點上,哲學和工程走到了一起。哲學家通過思辨告訴我們,我們永遠無法直接觸及世界本身。工程師通過實踐告訴我們,也許我們並不需要。一個足夠好的世界模型,一個在不斷校準中越來越貼近外部世界的內部表徵,可能已經足夠了。我們不需要知道“真正的卡車”是什麼,我們只需要準確預測那輛卡車下一秒會去哪裡。

哲學並沒有結束,它只是換了一種形式繼續存在。當我們寫下一個模型結構,定義一個損失函數,設計一個注意力機制的時候,我們也許並沒有意識到,我們正在以另一種方式回應那些幾百年前提出的問題。只是這一次,我們不再試圖用語言去回答,而是用世界模型去逼近。我們不再爭論“先驗是否可能”,而是直接設計歸納偏置。我們不再辨析“意向性的本質”,而是直接實現注意力機制。我們把抽象的概念變成了具體的代碼,把思辨的命題變成了可運行的流程。

也許有一天,我們會重新回到那些問題:先驗究竟從何而來,意向性是否可以被完全還原,意識與世界之間到底是什麼關係。這些問題不會消失,它們是人類思想永遠的地平線。但在此之前,工程已經先走了一步。自動駕駛汽車在路上行駛,機器人在倉庫里搬運貨物,遊戲 AI 在虛擬世界裡與玩家互動。它們都在運行某種形式的世界模型,都在用預測去彌補感知的不足,都在用誤差來驅動學習。

我們不再只是思考世界,我們開始構造世界的模型。我們不再只是討論認知,我們開始實現某種可運行的認知過程。這是一個微妙但深刻的轉變。它意味着,認識論不再僅僅是哲學的一個分支,它同時成為了計算機科學和神經工程的一個研究領域。而世界模型,就是這個交叉地帶上最核心的概念。

在這個意義上,哲學並沒有結束。它只是,變成了工程。而工程本身,又反過來向我們提出了新的哲學問題:當一個系統的世界模型足夠好,好到它可以在複雜環境中像人一樣行動,我們是否應該認為它“理解”了這個世界?這個問題,康德沒有問過,胡塞爾也沒有問過。但現在,它擺在了每一個從事人工智能研究的人面前。

你坐在車裡,看着前方的道路延伸向遠方。你並不知道這輛車的自動駕駛系統內部正在運行着怎樣的世界模型,就像你並不完全清楚自己的大腦中正在發生什麼。但你知道一件事:無論是你還是它,都在努力讓那個內部的模型更貼近外部真實的世界。誤差被不斷縮小,預測被不斷校準,世界被不斷生成。

而我們,從未直接見過這個世界。我們只是帶着自己的世界模型,在黑暗中摸索,然後小心翼翼地、一次又一次地,讓自己更接近那個永遠無法真正抵達真實。


瀏覽(283) (0) 評論(0)
發表評論
我的名片
張晉中
註冊日期: 2024-12-16
訪問總量: 52,710 次
點擊查看我的個人資料
Calendar
最新發布
· 可控核聚變?還是算了吧
· 價值坍縮:AI時代的社會、財富與
· 緣起之心,硅基之腦:古老洞見對
· 從預測加工看禪宗公案:現代科學
· 當AI學會像康德那樣看世界:先驗
· 世界模型的本質:從康德、胡塞爾
· 理性之外的世界:從柏拉圖到 AI
分類目錄
【科技進展觀察】
· 可控核聚變?還是算了吧
· 價值坍縮:AI時代的社會、財富與
· 緣起之心,硅基之腦:古老洞見對
· 從預測加工看禪宗公案:現代科學
· 當AI學會像康德那樣看世界:先驗
· 世界模型的本質:從康德、胡塞爾
· 理性之外的世界:從柏拉圖到 AI
· 中醫,其實可以看成一個被訓練了
· 從柏拉圖到愛因斯坦:時空本體論
· 量子計算:遠在天邊還是近在眼前
存檔目錄
2026-04-04 - 2026-04-17
2026-03-08 - 2026-03-22
2026-02-01 - 2026-02-25
2026-01-29 - 2026-01-31
2025-09-02 - 2025-09-02
2025-08-02 - 2025-08-31
2025-07-24 - 2025-07-31
2025-06-10 - 2025-06-24
2025-03-04 - 2025-03-04
2025-02-19 - 2025-02-19
2025-01-03 - 2025-01-30
2024-12-16 - 2024-12-16
 
關於本站 | 廣告服務 | 聯繫我們 | 招聘信息 | 網站導航 | 隱私保護
Copyright (C) 1998-2026. Creaders.NET. All Rights Reserved.