国产白领丝袜办公室在线视频,亚洲无码中文字幕电影,国产精品女人一区二区三区

APP下載

掃一掃

下載觀察者APP

謝耘：為什么要認(rèn)真討論大語言模型的“理解”問題？
- 謝耘清華大學(xué)電子工程系博士，正高級(jí)工程師，國家科技進(jìn)步二等獎(jiǎng)獲得者
分享到：

2024-08-21 13:16:03 字號(hào)：A- A A+ 來源：觀察者網(wǎng)

或許有人會(huì)說，人同樣要犯各種錯(cuò)誤，大語言模型犯一些錯(cuò)誤有什么大不了的？這里面有兩方面的問題。一個(gè)就是我們對(duì)自己創(chuàng)造的工具犯錯(cuò)誤的不可預(yù)測(cè)性可以接收到什么程度？另外一個(gè)是人確實(shí)會(huì)犯錯(cuò)誤，但是人犯錯(cuò)誤具有相當(dāng)?shù)目深A(yù)測(cè)性。比如一個(gè)在某個(gè)領(lǐng)域的高水平專家，他在這個(gè)領(lǐng)域中犯簡(jiǎn)單低級(jí)錯(cuò)誤的概率必然非常小。可預(yù)期性對(duì)于人類來講是非常重要的。

通過上面的分析，我們可能就比較容易理解下面這句話的含義了：“It is a language model, not a ‘truth’ model. That’s its primary limitation: we want ‘truth’, but we only get language that was structured to seem correct.”（第8頁，《What Are ChatGPT and Its Friends?》， Mike Loukides著，O’Reilly Media, Inc. 出版，2023年3月第一版）。

如果一定要把這種基于統(tǒng)計(jì)的人工智能在文字符號(hào)層面建立的這種關(guān)聯(lián)，與原本僅為人類（或許還應(yīng)該包括一些其他高級(jí)生命）的內(nèi)意識(shí)所獨(dú)有的“理解”聯(lián)系在一起的話，我們應(yīng)該可以合理地稱之為對(duì)抽象知識(shí)的“統(tǒng)計(jì)性理解”。

放在人類的智能這個(gè)參照系中來看，這種基于對(duì)文字符號(hào)做統(tǒng)計(jì)性相關(guān)分析而獲得“理解”的過程，大體相當(dāng)于人類“以文解文”的“望文生義”。這樣比喻并非是簡(jiǎn)單的貶低。因?yàn)閷?duì)于相對(duì)簡(jiǎn)單直白的表述而言“望文”是可以正確地“生義”的，所以大語言模型產(chǎn)生了驚人的效果。當(dāng)然對(duì)于那些比較復(fù)雜的表述或包含比較深的“義”的表述，僅僅靠“望文”就會(huì)出現(xiàn)偏差，甚至是南轅北轍。這是“統(tǒng)計(jì)性理解”在對(duì)文字符號(hào)所表達(dá)的內(nèi)容的“理解”上，難以跨越的一個(gè)縱向深度上的局限。這個(gè)局限是由其“統(tǒng)計(jì)性理解”的基本機(jī)制帶來的，所以恐怕難以靠繼續(xù)提升模型與學(xué)習(xí)樣本的規(guī)模去超越。

統(tǒng)計(jì)性理解的另外一個(gè)橫向廣度的局限就是在前一章對(duì)統(tǒng)計(jì)算法做分析時(shí)指出的，它無法超越學(xué)習(xí)樣本所蘊(yùn)含的信息，即統(tǒng)計(jì)方法是“就事論事”。這是由信息的本質(zhì)與統(tǒng)計(jì)方法所依靠的基本計(jì)算機(jī)制決定的。提升模型與學(xué)習(xí)樣本的規(guī)模是可以不斷擴(kuò)大“就事論事”的范圍，但是依然不可能獲得學(xué)習(xí)樣本外的新信息。

從記憶結(jié)構(gòu)的角度看“知道”、“了解”與“理解”的差異示意

與人相對(duì)照，機(jī)器學(xué)習(xí)的“統(tǒng)計(jì)性理解”基本處于上圖中間的“了解”狀態(tài)。兩者相比有兩個(gè)出入。機(jī)器學(xué)習(xí)對(duì)知識(shí)的理解是基于表層相關(guān)性關(guān)聯(lián)，缺少人類可以利用的深層邏輯性關(guān)聯(lián)；但是機(jī)器學(xué)習(xí)可以在很多不同知識(shí)之間建立起關(guān)聯(lián)，不存在孤島問題。所以與上圖中人的“了解”狀態(tài)相比，機(jī)器學(xué)習(xí)的深度不足但廣度占優(yōu)，而兩者同樣都缺少理解中最為關(guān)鍵的回歸關(guān)聯(lián)。所以可以認(rèn)為它們彼此大體相當(dāng)。

從這個(gè)角度來看，“外意識(shí)”在理解這條路上，確實(shí)已經(jīng)取得了驚人的進(jìn)步。它依靠基于暴力計(jì)算的統(tǒng)計(jì)方法成功地跨越了人類意義上的從“知道”到“了解”這個(gè)鴻溝。但下一個(gè)鴻溝---從“了解”到“理解”的挑戰(zhàn)可能有數(shù)量級(jí)的提升。就好像人類登上月球與走出太陽系是有天壤之別的難度的。

與“統(tǒng)計(jì)性理解”相對(duì)而言，人類的理解屬于“本質(zhì)性理解”---它包括了基于被理解對(duì)象本質(zhì)的各種不同性質(zhì)的關(guān)聯(lián)。這種理解不是望文生義的產(chǎn)物，而是深思熟慮的結(jié)晶。事實(shí)證明從實(shí)際應(yīng)用效果上看，這兩者是有很大交集的。在相交的部分，人工智能給出的結(jié)果與人類的理解相一致。這也符合人類的經(jīng)驗(yàn)：在比較簡(jiǎn)單的問題上，我們很難看出“望文生義”與“深思熟慮”的不同。這就是生成式大語言模型引起巨大反響的原因。但是畢竟兩者的基本機(jī)制不同，面對(duì)復(fù)雜的問題時(shí)兩者的差異就會(huì)越來越明顯地顯現(xiàn)出來。所以我們不能因?yàn)樗鼈冊(cè)谛Ч嫌薪患桶褍烧吆?jiǎn)單地等同起來混為一談。

對(duì)數(shù)字及加減法的理解過程

如前面幾節(jié)的分析，文字符號(hào)表達(dá)蘊(yùn)含的意義，在本質(zhì)上存在于它們與實(shí)在感知的關(guān)聯(lián)之中。目前的“外意識(shí)”不論采用什么樣的統(tǒng)計(jì)算法，還都是在上圖之中的文字符號(hào)層面做表面性的文章，所以不論它給出來的結(jié)果看上去如何精妙，它其實(shí)都沒有真正從整體的角度理解文字符號(hào)所要表達(dá)的人類認(rèn)知層面的意義。所以有學(xué)者說“大語言模型不懂概念，只懂概率；不懂邏輯推理，只懂概率計(jì)算”。這個(gè)說法有些過于簡(jiǎn)單化，或許下面這個(gè)表達(dá)更準(zhǔn)確一些：“它是依靠相關(guān)性概率去把握概念，用相關(guān)性概率計(jì)算去‘?dāng)M合’邏輯推理”。我們不能脫離文字符號(hào)及其組合的真實(shí)含義，認(rèn)為語言表現(xiàn)出來的概率性相關(guān)關(guān)系便代表了它的一切、包括它所攜帶的本質(zhì)含義。

由于生成式大語言模型給出的是自然語言回答，所以它輸出的內(nèi)容，并不總是簡(jiǎn)單地對(duì)錯(cuò)分明，還包括大量的模棱兩可或是似而非的說法。這必然導(dǎo)致每個(gè)人對(duì)大語言模型的“理解”能力會(huì)有很不相同的評(píng)價(jià)。我們不難理解，這種個(gè)體性評(píng)價(jià)將大概率地與一個(gè)人自己的理解能力呈負(fù)相關(guān)。而理解屬于意識(shí)活動(dòng)，我們還沒有辦法設(shè)計(jì)一個(gè)完全客觀可行的測(cè)試方法，來測(cè)試不論是人還是機(jī)器的理解能力。圖靈提出的人工智能“圖靈測(cè)試”，也僅僅是一個(gè)主觀評(píng)價(jià)的方法。

有人根據(jù)2024年初出現(xiàn)的視頻生成器Sora的一些輸出結(jié)果，便下結(jié)論說它已經(jīng)從對(duì)視頻的統(tǒng)計(jì)分析中掌握了物理定律。如果這不是商業(yè)炒作的話，則典型地反映了評(píng)價(jià)者自己在理解能力上的局限。僅僅靠對(duì)視頻圖像的“望文”應(yīng)該無法生出深藏在其背后的物理定律之“義”的，否則以牛頓為代表的那些偉大物理學(xué)家們貢獻(xiàn)的價(jià)值就要被打上大大的問號(hào)了。

文生視頻界面圖源：36氪

或許有人會(huì)說：既然機(jī)器學(xué)習(xí)可以從文字符號(hào)的表達(dá)中相當(dāng)完整準(zhǔn)確地學(xué)到其背后的語言規(guī)則，那它為什么不可以從圖像所反映的真實(shí)過程中學(xué)到其背后的物理規(guī)律？文字符號(hào)的表述直接基于語言規(guī)則，文字符號(hào)之間的關(guān)系直接反映了語言規(guī)則；但是視頻圖像的變化與背后的物理定律之間的關(guān)系則有一條復(fù)雜的多重因果作用鏈，并非是單純地直接耦合在一起。所以即使圖像信息完整地反映了真實(shí)過程，從圖像要素之間的統(tǒng)計(jì)關(guān)聯(lián)中恐怕也是無法推斷出在其背后發(fā)揮作用的各種物理規(guī)律。這需要透過重重現(xiàn)象看到背后本質(zhì)的卓越能力，即上一章講過的與統(tǒng)計(jì)很不一樣的“洞察”能力。正因?yàn)槿绱耍ｎD他們的貢獻(xiàn)才彌足珍貴。

有人強(qiáng)調(diào)，機(jī)器沒有必要按照人的思維方式去思考，完全可以有自己的思維方式、自己的“理解”、自己的邏輯等等。事實(shí)上，人類創(chuàng)造的工具在很多情況下，都是按照與自然不同的方式在工作的。在物質(zhì)性工具的時(shí)代便是如此，最為經(jīng)典的例子就是車輪的發(fā)明。而計(jì)算機(jī)從一開始做的很多事情的方式也都與人類不同，人類大腦中就不存在一個(gè)關(guān)系型數(shù)據(jù)庫。所以“外意識(shí)”有自己獨(dú)特的不同于人的方式，這既不是問題、更是早已存在的事實(shí)。

發(fā)現(xiàn)萬有引力定律的牛頓

但是問題在于，我們創(chuàng)造的工具是服務(wù)于人類的，所以我們必然要關(guān)注它用自己的方式產(chǎn)生的結(jié)果是否滿足人類的需求。而在這個(gè)問題上，理解它運(yùn)行方式的基本機(jī)理就變得重要，我們不能僅僅看它已經(jīng)給出的結(jié)果。因?yàn)槲覀冃枰男袨樵谖磥砭哂锌深A(yù)測(cè)性，我們才能放心地使用它。

曾經(jīng)這完全不是問題。那時(shí)“外意識(shí)”完全按照人類設(shè)計(jì)的顯性邏輯循規(guī)蹈矩地去運(yùn)轉(zhuǎn)。但是當(dāng)AI 技術(shù)在暴力計(jì)算的支撐下發(fā)展到了“不可解釋”的階段后，這變成了一個(gè)必須面對(duì)的大問題。如果我們無法預(yù)計(jì)一個(gè)工具在什么時(shí)候、什么問題上出現(xiàn)什么樣的與我們期望不同的結(jié)果，每一次都是要等結(jié)果出來才能判斷是否符合我們需求的話，它就是一個(gè)無法讓人放心使用的工具了，甚至可以說失去了工具傳統(tǒng)的基本價(jià)值。

比如，如果我們期待“外意識(shí)”具有理解能力，這個(gè)期待中固有的假設(shè)就是它理解的結(jié)果與人類是一致的。即機(jī)器的理解過程可以與人的不同，但是在結(jié)果的意義上必須是等價(jià)的。否則它就無法滿足人類的這種期待。要想證明這個(gè)等價(jià)，則必須去理解它的“理解”過程，而不能僅僅靠其產(chǎn)出的已有結(jié)果通過枚舉法來確認(rèn)。而從本章的分析可以看出，目前機(jī)器學(xué)習(xí)“望文生義”的“理解”與人類“深思熟慮”的理解是無法完全等價(jià)的，僅僅在一些產(chǎn)出上可以有相同或類似的結(jié)果。

而部分結(jié)果的相同，并不能構(gòu)成我們“放任”機(jī)器學(xué)習(xí)在自己與人類不同的“理解”道路上一路狂奔的理由。比如一個(gè)AI系統(tǒng)如果給出的很多答案，其邏輯在人看來無法理喻，即使你能證明它非常符合AI自己的“理解”，這樣的系統(tǒng)輸出對(duì)于人類來說也沒有多大意義。

首頁上一頁 1 2 3 4 下一頁余下全文
|

舉報(bào)
- 違反法律法規(guī)
- 垃圾信息、廣告
- 色情、淫穢信息
- 人身攻擊
- 謠言、不實(shí)信息
- 冒充，冒用信息
- 破壞社區(qū)秩序
- 其他
- 涉未成年人有害信息
觀察者網(wǎng)舉報(bào)制度規(guī)范
確定取消
標(biāo)簽機(jī)器學(xué)習(xí)ChatGPT Sora 大模型理解大語言模型文生視頻 aigc
- 責(zé)任編輯: 史岱君
- “知假買假”者惡意高額索賠，最高法發(fā)布司法解釋
  
  2024-08-21 11:08 食品安全
- 學(xué)習(xí)時(shí)報(bào)：解放思想是個(gè)重大政治問題
  
  2024-08-21 08:40
- 湖北：推行分管案件的縣紀(jì)委副書記異地交流任職后，反腐力度明顯加大
  
  2024-08-21 08:17 廉政風(fēng)暴
- 國家衛(wèi)健委：將對(duì)授予護(hù)士處方權(quán)工作的必要性進(jìn)行充分論證
  
  2024-08-21 08:00 醫(yī)療改革
- 廣西北海多人趕海遭雷擊，官方通報(bào)：1人死亡
  
  2024-08-21 07:42
- 放票秒沒、60元門票被炒到1600元，故宮回應(yīng)
  
  2024-08-21 07:29
- 巴黎長(zhǎng)榮桂冠酒店拒絕懸掛中國國旗遭旅法僑界譴責(zé)，中使館發(fā)聲
  
  2024-08-21 06:50
- 智障男子服刑近10年改判無罪后哥哥發(fā)聲：希望對(duì)相關(guān)法官追責(zé)
  
  2024-08-20 21:50 疑案追蹤
- 習(xí)近平接見第33屆奧運(yùn)會(huì)中國體育代表團(tuán)
  
  2024-08-20 19:37
- 習(xí)近平會(huì)見出席全國人大加入各國議會(huì)聯(lián)盟40周年紀(jì)念活動(dòng)
  
  2024-08-20 19:10
- 鄭州警方回應(yīng)女子被男子壓身下毆打：男子精神分裂
  
  2024-08-20 18:14
- 央視起底：氧氣放掉，用藥直接丟垃圾箱，工傷保險(xiǎn)基金成“提款機(jī)”
  
  2024-08-20 18:01 醫(yī)療改革
- 強(qiáng)降雨致300多名受災(zāi)群眾被困，葫蘆島應(yīng)急局出動(dòng)三十多架救援直升機(jī)
  
  2024-08-20 17:32 極端天氣
- 日媒中國籍播音員播報(bào)時(shí)說“釣魚島是中國”，最新后續(xù)
  
  2024-08-20 16:30 日本
- 大搞數(shù)字政績(jī)與家族式腐敗，湖南省政協(xié)原副主席戴道晉被逮捕
  
  2024-08-20 15:29 廉政風(fēng)暴
- 多地農(nóng)村地區(qū)離婚率上升引關(guān)注，機(jī)構(gòu)和學(xué)者分析原因提出對(duì)策
  
  2024-08-20 13:33 婚姻故事
- 受強(qiáng)降雨影響，遼寧葫蘆島4個(gè)村通信中斷
  
  2024-08-20 12:55 極端天氣
- 足協(xié)競(jìng)賽部原部長(zhǎng)黃松因受賄罪一審被判七年
  
  2024-08-20 08:53 廉政風(fēng)暴
- 出廠價(jià)5萬賣給醫(yī)院12萬，國家醫(yī)保局問詢藥企
  
  2024-08-20 06:59
- 寧夏一化工車間發(fā)生爆炸，5人遇難
  
  2024-08-19 22:09 安全生產(chǎn)
搜索

   觀察者頭條查看全部

挪用學(xué)生餐補(bǔ)、欠薪欠保…審計(jì)署發(fā)布報(bào)告涉5380多億評(píng)論 49

全國最大！哈密百萬千瓦“光熱+光伏”項(xiàng)目并網(wǎng)發(fā)電評(píng)論 55

“中國在非洲真正贏得了民心，就連斯威士蘭…” 評(píng)論 90

“日企抱團(tuán)是絕望之舉，中國工廠效率質(zhì)量都是第一” 評(píng)論 141

“她下月訪華，盡管特朗普?qǐng)F(tuán)隊(duì)表達(dá)了擔(dān)憂” 評(píng)論 54

   風(fēng)聞 · 24小時(shí)最熱查看全部

   最新視頻查看全部
最新聞 Hot
快訊

久久久久精品免费福利电影,国产又黄又大又粗视频,A级毛片免费播放无码,人人妻人人爽人人澡欧美一区

謝耘：為什么要認(rèn)真討論大語言模型的“理解”問題？

“知假買假”者惡意高額索賠，最高法發(fā)布司法解釋

學(xué)習(xí)時(shí)報(bào)：解放思想是個(gè)重大政治問題

湖北：推行分管案件的縣紀(jì)委副書記異地交流任職后，反腐力度明顯加大

國家衛(wèi)健委：將對(duì)授予護(hù)士處方權(quán)工作的必要性進(jìn)行充分論證

廣西北海多人趕海遭雷擊，官方通報(bào)：1人死亡

放票秒沒、60元門票被炒到1600元，故宮回應(yīng)

巴黎長(zhǎng)榮桂冠酒店拒絕懸掛中國國旗遭旅法僑界譴責(zé)，中使館發(fā)聲

智障男子服刑近10年改判無罪后哥哥發(fā)聲：希望對(duì)相關(guān)法官追責(zé)

習(xí)近平接見第33屆奧運(yùn)會(huì)中國體育代表團(tuán)

習(xí)近平會(huì)見出席全國人大加入各國議會(huì)聯(lián)盟40周年紀(jì)念活動(dòng)

鄭州警方回應(yīng)女子被男子壓身下毆打：男子精神分裂

央視起底：氧氣放掉，用藥直接丟垃圾箱，工傷保險(xiǎn)基金成“提款機(jī)”

強(qiáng)降雨致300多名受災(zāi)群眾被困，葫蘆島應(yīng)急局出動(dòng)三十多架救援直升機(jī)

日媒中國籍播音員播報(bào)時(shí)說“釣魚島是中國”，最新后續(xù)

大搞數(shù)字政績(jī)與家族式腐敗，湖南省政協(xié)原副主席戴道晉被逮捕

多地農(nóng)村地區(qū)離婚率上升引關(guān)注，機(jī)構(gòu)和學(xué)者分析原因提出對(duì)策

受強(qiáng)降雨影響，遼寧葫蘆島4個(gè)村通信中斷

足協(xié)競(jìng)賽部原部長(zhǎng)黃松因受賄罪一審被判七年

出廠價(jià)5萬賣給醫(yī)院12萬，國家醫(yī)保局問詢藥企

寧夏一化工車間發(fā)生爆炸，5人遇難

“沙特曾多次警告德國提防嫌疑人”

特朗普最新任命！這次包括火箭隊(duì)老板、真人秀制作人

巴勒斯坦三個(gè)政治派別發(fā)表聯(lián)合聲明

“中國在非洲真正贏得了民心，就連斯威士蘭…”

“日企抱團(tuán)是絕望之舉，中國工廠效率質(zhì)量都是第一”

“中國有能力讓夢(mèng)想照進(jìn)現(xiàn)實(shí)，將贏得史詩般競(jìng)爭(zhēng)”

被災(zāi)民暴罵到當(dāng)場(chǎng)破防，馬克龍發(fā)飆：你該慶幸你在法國！

美高校敦促國際學(xué)生抓緊回來：萬一把中印拉黑名單呢

美國政府“逃過一劫”

“澤連斯基要求歐盟新外長(zhǎng)：對(duì)華批評(píng)要降調(diào)”

澳大利亞來了，中國就得走人？澳總理這么回應(yīng)

美媒感慨：基建狂魔發(fā)力，我們又要被超越了

英國剛公布新任大使，特朗普顧問就痛罵：傻X

“來自中國的老大哥能確保我們…”

俄羅斯的報(bào)復(fù)來了

澤連斯基罵普京“傻子”，俄方怒斥