-
謝耘:為什么要認真討論大語言模型的“理解”問題?
【文/觀察者網專欄作者 謝耘】
自今年初文生視頻大模型Sora引爆熱議后,本周美國軟件巨頭Adobe表示,將允許用戶在其旗下的視頻編輯軟件中使用包括OpenAI的Sora在內的第三方生成式人工智能工具。
另外,馬斯克旗下人工智能公司xAI于近日推出首個多模態模型 Grok-1.5 Vision。
xAI 表示:除文本功能外,Grok還可以處理各種各樣的視覺信息,包括文檔、圖表、圖表、屏幕截圖、照片,并能進行多學科推理。xAI重點展示了Grok-1.5V的7個示例,包括:將手繪圖表轉換成Python代碼、看食品標簽計算卡路里、根據孩子的繪畫講睡前故事、解釋梗圖等。
馬斯克xAI的多模態模型Grok-1.5V
Sora 可以在每次 API 調用中為自然語言提示創建最多三種視頻變體。
無論在語言領域還是在視頻領域,它們都給出了讓許多人感到驚奇的結果,于是便出現了大量聳人聽聞的說法。其中一個核心的話題就是有人認為這些模型已經具有了“理解”能力,它們能夠理解語言背后的邏輯,能夠理解物理世界的運動規律。
當談到“理解”的時候,有多少人知道自己心中的“理解”到底是什么?如果大家對于什么是“理解”都沒有共同認識的話,討論這些生成模型是否有“理解”能力就失去了意義。
“理解”是一個我們再熟悉不過的詞匯了,它同時也是智能意識領域中最基本與核心的問題之一。問題越基本,我們往往越熟視無睹,越覺得無需做什么解釋,其實把它說清楚就越困難。
從小到大,我們都在努力地去“理解”,也希望被別人理解。可是好像卻沒有誰講過到底什么是“理解”。在受教育的過程中,幾乎所有課程,都是講授需要我們去理解的知識內容,然后用考試來檢驗我們是否理解課程。但卻沒有一門普及性的課程教授我們應該如何去理解。“理解”似乎是一個如呼吸一樣的理所當然的、每個人都會自然而然地無師自通的能力。
然而事情遠非如此簡單。只要是生理正常的人都一樣地在正常呼吸,但是正常人之間的理解能力卻是有很大的差異。如同一個老師教授的學生可以有很不同的結果表現。
如果我們將人類的理性意識活動做簡化,可以得到下圖所示的基本過程示意。
人類理性活動的簡化示意
從這個過程中我們可以看到,理解是認知的結果也是行動的前提,是人類理性意識活動的核心環節。
所以對“理解”有一個清晰的認識,對于我們提升自己的理解能力,尋找意識活動的規律,包括人工智能在內的計算機應用這個人類的“外意識”,認識各種基于不同算法的“外意識”的能力邊界都具有極其重要又十分普遍的意義。
01. 機器學習獲得的“統計性理解”
在對人的理解做了一個比較全面的討論之后,我們來看一下人類創造出來的“外意識”在“理解”的道路上到底走了多遠,以及最終能走多遠。
2023年以ChatGPT為代表的大語言模型的出現,再次引發了對機器是否具有了意識或理解能力的大規模議論。
圖二 回歸關聯核心作用的示意
目前包括大語言模型在內的機器學習方法,接受的都是人類給其提供的用文字符號表達的內容,所以即使它有了某種“理解”,也僅僅是存在于文字符號這個抽象層面的,而做不到最為關鍵的回歸關聯理解。這被稱為人工智能的“符號落地”問題。基于多種傳感器構建“具身智能”的努力,包含了實現上圖中所示的回歸關聯的意圖。但是因為我們沒有關于意識活動的基礎科學理論來支撐這些努力,所以借助“具身智能”實現回歸關聯或“符號落地”這一目標能否實現以及能走多遠,都還有待于在實踐中去探索,難以做理論上的分析推斷。
我們目前能夠下的結論是,從人類理解的本質來講,基于對文字符號做信息處理的機器學習算法,還不具有與人類一樣的理解能力,因為它對這個世界是沒有自己實在感知的,無法實現回歸關聯。
那么,包括大語言模型在內的機器學習算法在抽象的文字符號層面實現了某種關聯嗎?答案顯然是肯定的。機器學習最著名的一點就是它能夠發現與建立信息之間的相關性,并且因為也僅此而已而遭到詬病。但是這種相關性關聯與人類在理解的時候依靠的反映客觀聯系的關聯有所不同。機器學習是基于對人類生成的內容做文字符號層面的統計相關處理,來確定文字符號之間的概率性關聯關系,然后據此給出相應的輸出結果。這種文字符號之間的相關性并非是人類思考的基點,而是人類因思考而產生的文字符號表達形式的一種派生特征。
圖源:CSDN
以生成式大語言模型為例,它是對用文字符號表達的內容在文字符號層面做概率性相關統計分析,進而通過文字符號之間的關聯關系,在概率的意義上掌握學習樣本所反映的文字符號的含義、語法規則和文字符號的組合習慣、及體現不同具體表述內容的組合方式等信息,或稱之為知識。最后模型以此為基礎通過自回歸的方式來完成內容生成的任務。
這種依靠統計獲得的文字符號之間的關聯關系,是一種語言層面的表象關聯。之所以說它是表象關聯,是因為文字符號的組合是其表述內容的外在形式,并不能簡單地等同于內容本身,所以才有“言外之意”“字面含義”等說法。因而依據它形成的關聯也并不能完全等價于基于內容的關聯。但同時,形式與內容終歸有著統一的一面。所以這種統計關聯,與人類在抽象知識層面依據內容與客觀邏輯形成的關聯有許多相通之處,但在一般的意義上也并不相同。
人類在做文字符號表達的時候,基本的邏輯是先做“構思”---捋清要表達的內容,確定要使用的表達的方式,然后根據文字符號所代表的現實意義,按照語法規則形成最后的表達形式。雖然這個過程常常包含了非邏輯化的潛意識過程,常常并沒有嚴格清晰的階段劃分,但是這個基本邏輯依然在起決定性作用。在這個過程中,“構思”是基礎與起點,最終形成的文字符號表達是結果。而且人類在這個過程中還有“反思”,它基于“構思”去斟酌修改已經形成的表述,讓其能夠更好地反映自己的初衷。
大語言模型是不存在“構思”這一關鍵環節的,當然也就不存在“反思”的過程。它是通過所謂的“自回歸”過程來產生輸出,即利用過去已形成的輸出及掌握的概率性關聯關系去推算下一步的輸出。這是它與人類在生成文字符號表述時的一個本質差異。
它以得到的輸入為起點,利用從學習樣本中學習到的各種概率性關聯關系,以“自回歸”的方式按照順序一步步組合出相應的輸出。在這個輸出中,文字符號的基本使用方式來自于對它從天量的學習樣本中學到的語言學知識,這使得其輸出在形式上可以很好地符合人類的表達習慣。同時根據其學習到的相關性關聯關系,在其輸出中還會含有許多來自其學習樣本中表達不同內容的文字符號組合方式。
所以雖然它沒有像人那樣的“構思”過程,可它也并不是在言之無物或憑空編造,而是通過關聯關系把其學習樣本中的許多內容有序地一步步組合在了一起。這是“自回歸”機制自己的“思考”方式。它從接受的問題出發,通過這種“思考”方式生成了看上去含義豐富內容完整的輸出。由此,它讓許多人以為它是以與人類類似甚至相同的思維方式生成了那些文字符號的表述。
如果僅僅從語言層面來看,大語言模型可以給出相當好的結果,其表達相當的順暢,說的都是人話;但是在其對答如流中,如果我們從深層含義的角度來看,情況就變得復雜了。它有時會給出令人滿意的答案,即它給出的結果比較好地符合人類的理解認知;有時則會出現困難,甚至給出的結果讓人感到莫名其妙,即出現所謂的“幻覺”。這種“幻覺”并非是因為它走了神,而是因為它“思考”的底層機制與人類思考的機制是基于很不相同的原理,所以它按照自己的機制給出的有些結果對人類而言如幻覺一般。即使對于一些我們看上去比較簡單的、但是沒有包含在其學習樣本中的問題或表達方式,它也可能出現根本性的混亂或錯誤。
比如曾有人問:“大象與貓哪個大?”大語言模型回答道:“大象大”;但當被問道:“大象與貓哪個不比另外一個大?”大語言模型則回復說:“它們哪個都不比另外一個大。” (“Stuart Russell專訪:關于ChatGPT,更多數據和更多算力不能帶來真正的智能”,聞菲,微信公眾號:“機器之心”,2023年2月20日)如果這個回答是人類做出的,我們會說這個人在回答問題時“沒走心”。這個例子很清楚地表明,因為大語言模型僅僅學到了文字符號層面的統計相關性關聯,在面對這個用不太常見的方式表述的問題時,它基于統計相關給出的文字表達便無法與人類的期望相應,即不符合人類的理解。
而且目前大家公認大語言模型的推理能力很弱,對于稍復雜一點的邏輯關系就無能為力。這正反映了它依靠文字符號層面的統計相關性關聯,僅僅能夠反映語言所表達的淺層含義,而卻很難體現出文字符號表達的內容所蘊含的復雜或深層一些的邏輯。
而它在什么問題上會出什么性質的錯誤,是我們難以預計的。原因就在于它在做關聯組合輸出時,僅僅是依據學習到的統計性關聯,而并不是像人類那樣基于內容含義去表述。對大語言模型能力與局限的分析,還是應該注重對底層機制的認識,不能僅僅依靠不完整的測試結果去論證。對于大語言模型而言,由于其面對問題的開放性,根本不存在對其做哪怕是比較充分測試的可能。
-
本文僅代表作者個人觀點。
- 責任編輯: 史岱君 
-
“知假買假”者惡意高額索賠,最高法發布司法解釋
2024-08-21 11:08 食品安全 -
學習時報:解放思想是個重大政治問題
2024-08-21 08:40 -
湖北:推行分管案件的縣紀委副書記異地交流任職后,反腐力度明顯加大
2024-08-21 08:17 廉政風暴 -
國家衛健委:將對授予護士處方權工作的必要性進行充分論證
2024-08-21 08:00 醫療改革 -
廣西北海多人趕海遭雷擊,官方通報:1人死亡
2024-08-21 07:42 -
放票秒沒、60元門票被炒到1600元,故宮回應
2024-08-21 07:29 -
巴黎長榮桂冠酒店拒絕懸掛中國國旗遭旅法僑界譴責,中使館發聲
2024-08-21 06:50 -
智障男子服刑近10年改判無罪后哥哥發聲:希望對相關法官追責
2024-08-20 21:50 疑案追蹤 -
習近平接見第33屆奧運會中國體育代表團
2024-08-20 19:37 -
習近平會見出席全國人大加入各國議會聯盟40周年紀念活動
2024-08-20 19:10 -
鄭州警方回應女子被男子壓身下毆打:男子精神分裂
2024-08-20 18:14 -
央視起底:氧氣放掉,用藥直接丟垃圾箱,工傷保險基金成“提款機”
2024-08-20 18:01 醫療改革 -
強降雨致300多名受災群眾被困,葫蘆島應急局出動三十多架救援直升機
2024-08-20 17:32 極端天氣 -
日媒中國籍播音員播報時說“釣魚島是中國”,最新后續
2024-08-20 16:30 日本 -
大搞數字政績與家族式腐敗,湖南省政協原副主席戴道晉被逮捕
2024-08-20 15:29 廉政風暴 -
多地農村地區離婚率上升引關注,機構和學者分析原因提出對策
2024-08-20 13:33 婚姻故事 -
受強降雨影響,遼寧葫蘆島4個村通信中斷
2024-08-20 12:55 極端天氣 -
足協競賽部原部長黃松因受賄罪一審被判七年
2024-08-20 08:53 廉政風暴 -
出廠價5萬賣給醫院12萬,國家醫保局問詢藥企
2024-08-20 06:59 -
寧夏一化工車間發生爆炸,5人遇難
2024-08-19 22:09 安全生產
相關推薦 -
“中國在非洲真正贏得了民心,就連斯威士蘭…” 評論 48“日企抱團是絕望之舉,中國工廠效率質量都是第一” 評論 101“她下月訪華,盡管特朗普團隊表達了擔憂” 評論 50“中國有能力讓夢想照進現實,將贏得史詩般競爭” 評論 116美國政府“逃過一劫” 評論 126最新聞 Hot
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團是絕望之舉,中國工廠效率質量都是第一”
-
“中國有能力讓夢想照進現實,將贏得史詩般競爭”
-
被災民暴罵到當場破防,馬克龍發飆:你該慶幸你在法國!
-
美高校敦促國際學生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調”
-
澳大利亞來了,中國就得走人?澳總理這么回應
-
美媒感慨:基建狂魔發力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報復來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-
還在扯皮中國,“涉華條款全刪了”
-
中國“光伏OPEC”發文嚴厲質問央企,怎么回事?
-
“最后一道貿易障礙,中國解除了!”
-