-
孫凝暉:拼算法還是拼新型基礎設施?中國如何選擇智能計算發展道路
智能計算發展的第四階段是大模型計算系統(2020年)。在人工智能大模型技術的推動下,智能計算邁向新的高度。2020年,AI從“小模型+判別式”轉向“大模型+生成式”,從傳統的人臉識別、目標檢測、文本分類,升級到如今的文本生成、3D數字人生成、圖像生成、語音生成、視頻生成。大語言模型在對話系統領域的一個典型應用是OpenAI公司的ChatGPT,它采用預訓練基座大語言模型GPT-3,引入3000億單詞的訓練語料,相當于互聯網上所有英語文字的總和。其基本原理是:通過給它一個輸入,讓它預測下一個單詞來訓練模型,通過大量訓練提升預測精確度,最終達到向它詢問一個問題,大模型產生一個答案,與人即時對話。在基座大模型的基礎上,再給它一些提示詞進行有監督的指令微調,通過人類的<指令,回復>對逐漸讓模型學會如何與人進行多輪對話;最后,通過人為設計和自動生成的獎勵函數來進行強化學習迭代,逐步實現大模型與人類價值觀的對齊。
大模型的特點是以“大”取勝,其中有三層含義,(1)參數大,GPT-3就有1700億個參數;(2)訓練數據大,ChatGPT大約用了3000億個單詞,570GB訓練數據;(3)算力需求大,GPT-3大約用了上萬塊V100 GPU進行訓練。為滿足大模型對智能算力爆炸式增加的需求,國內外都在大規模建設耗資巨大的新型智算中心,英偉達公司也推出了采用256個H100芯片,150TB海量GPU內存等構成的大模型智能計算系統。
大模型的出現帶來了三個變革。
一是技術上的規模定律(Scaling Law),即很多AI模型的精度在參數規模超過某個閾值后模型能力快速提升,其原因在科學界還不是非常清楚,有很大的爭議。AI模型的性能與模型參數規模、數據集大小、算力總量三個變量成“對數線性關系”,因此可以通過增大模型的規模來不斷提高模型的性能。目前最前沿的大模型GPT-4參數量已經達到了萬億到十萬億量級,并且仍在不斷增長中;
二是產業上算力需求爆炸式增長,千億參數規模大模型的訓練通常需要在數千乃至數萬GPU卡上訓練2-3個月時間,急劇增加的算力需求帶動相關算力企業超高速發展,英偉達的市值接近兩萬億美元,對于芯片企業以前從來沒有發生過;
三是社會上沖擊勞動力市場,北京大學國家發展研究院與智聯招聘聯合發布的《AI大模型對我國勞動力市場潛在影響研究》報告指出,受影響最大的20個職業中財會、銷售、文書位于前列,需要與人打交道并提供服務的體力勞動型工作,如人力資源、行政、后勤等反而相對更安全。
人工智能的技術前沿將朝著以下四個方向發展。
第一個前沿方向為多模態大模型。從人類視角出發,人類智能是天然多模態的,人擁有眼、耳、鼻、舌、身、嘴(語言),從AI視角出發,視覺,聽覺等也都可以建模為token②的序列,可采取與大語言模型相同的方法進行學習,并進一步與語言中的語義進行對齊,實現多模態對齊的智能能力。
第二個前沿方向為視頻生成大模型。OpenAI于2024年2月15日發布文生視頻模型SORA,將視頻生成時長從幾秒鐘大幅提升到一分鐘,且在分辨率、畫面真實度、時序一致性等方面都有顯著提升。SORA的最大意義是它具備了世界模型的基本特征,即人類觀察世界并進一步預測世界的能力。世界模型是建立在理解世界的基本物理常識(如,水往低處流等)之上,然后觀察并預測下一秒將要發生什么事件。雖然SORA要成為世界模型仍然存在很多問題,但可以認為SORA學會了畫面想象力和分鐘級未來預測能力,這是世界模型的基礎特征。
第三個前沿方向為具身智能。具身智能指有身體并支持與物理世界進行交互的智能體,如機器人、無人車等,通過多模態大模型處理多種傳感數據輸入,由大模型生成運動指令對智能體進行驅動,替代傳統基于規則或者數學公式的運動驅動方式,實現虛擬和現實的深度融合。因此,具有具身智能的機器人,可以聚集人工智能的三大流派:以神經網絡為代表的連接主義,以知識工程為代表的符號主義和控制論相關的行為主義,三大流派可以同時作用在一個智能體,這預期會帶來新的技術突破。
第四個前沿方向是AI4R(AI for Research)成為科學發現與技術發明的主要范式。當前科學發現主要依賴于實驗和人腦智慧,由人類進行大膽猜想、小心求證,信息技術無論是計算和數據,都只是起到一些輔助和驗證的作用。相較于人類,人工智能在記憶力、高維復雜、全視野、推理深度、猜想等方面具有較大優勢,是否能以AI為主進行一些科學發現和技術發明,大幅提升人類科學發現的效率,比如主動發現物理學規律、預測蛋白質結構、設計高性能芯片、高效合成新藥等。因為人工智能大模型具有全量數據,具備上帝視角,通過深度學習的能力,可以比人向前看更多步數,如能實現從推斷(inference)到推理(reasoning)的躍升,人工智能模型就有潛力具備愛因斯坦一樣的想象力和科學猜想能力,極大提升人類科學發現的效率,打破人類的認知邊界。這才是真正的顛覆所在。
最后,通用人工智能③(Artificial General Intelligence,簡稱AGI)是一個極具挑戰的話題,極具爭論性。曾經有一個哲學家和一個神經科學家打賭:25年后(即2023年)科研人員是否能夠揭示大腦如何實現意識?當時關于意識有兩個流派,一個叫集成信息理論,一個叫全局網絡工作空間理論,前者認為意識是由大腦中特定類型神經元連接形成的“結構”,后者指出意識是當信息通過互連網絡傳播到大腦區域時產生的。2023年,人們通過六個獨立實驗室進行了對抗性實驗,結果與兩種理論均不完全匹配,哲學家贏了,神經科學家輸了。通過這一場賭約,可以看出人們總是希望人工智能能夠了解人類的認知和大腦的奧秘。從物理學的視角看,物理學是對宏觀世界有了透徹理解后,從量子物理起步開啟了對微觀世界的理解。智能世界與物理世界一樣,都是具有巨大復雜度的研究對象,AI大模型仍然是通過數據驅動等研究宏觀世界的方法,提高機器的智能水平,對智能宏觀世界理解并不夠,直接到神經系統微觀世界尋找答案是困難的。人工智能自誕生以來,一直承載著人類關于智能與意識的種種夢想與幻想,也激勵著人們不斷探索。
中國:人工智能企業以AI“國家隊”和創業獨角獸為主,其中“國家隊”多綜合布局技術與應用領域,創業獨角獸多深耕垂直技術與應用市場
美國:人工智能廠商較多,軟硬實力兼具,大型廠商多綜合布局AI產業,創業公司遍布基礎層、技術層和應用層
03 人工智能的安全風險
人工智能的發展促進了當今世界科技進步的同時,也帶來了很多安全風險,要從技術與法規兩方面加以應對。
首先是互聯網虛假信息泛濫。這里列舉若干場景:
一是數字分身。AI Yoon是首個使用 DeepFake 技術合成的官方“候選人”,這個數字人以韓國國民力量黨候選人尹錫悅(Yoon Suk-yeol)為原型,借助尹錫悅 20 小時的音頻和視頻片段、以及其專門為研究人員錄制的 3000 多個句子,由當地一家 DeepFake 技術公司創建了虛擬形象 AI Yoon,并在網絡上迅速走紅。實際上 AI Yoon 表達的內容是由競選團隊撰寫的,而不是候選人本人。
二是偽造視頻。尤其是偽造領導人視頻引起國際爭端,擾亂選舉秩序,或引起突發輿情事件,如偽造尼克松宣布第一次登月失敗,偽造烏克蘭總統澤連斯基宣布“投降”的信息,這些行為導致新聞媒體行業的社會信任衰退。
三是偽造新聞。主要通過虛假新聞自動生成牟取非法利益,使用ChatGPT生成熱點新聞,賺取流量,截至2023年6月30日全球生成偽造新聞網站已達277個,嚴重擾亂社會秩序。
四是換臉變聲,用于詐騙。如由于AI語音模仿了企業高管的聲音,一家香港國際企業因此被騙3500萬美元。
五是生成不雅圖片,特別是針對公眾人物。如影視明星的色情視頻制作,造成不良社會影響。因此,迫切需要發展互聯網虛假信息的偽造檢測技術。
其次,AI大模型面臨嚴重可信問題。這些問題包括:(1)“一本正經胡說八道”的事實性錯誤;(2)以西方價值觀敘事,輸出政治偏見和錯誤言論;(3)易被誘導,輸出錯誤知識和有害內容;(4)數據安全問題加重,大模型成為重要敏感數據的誘捕器,ChatGPT將用戶輸入納入訓練數據庫,用于改善ChatGPT,美方能夠利用大模型獲得公開渠道覆蓋不到的中文語料,掌握我們自己都可能不掌握的“中國知識”。因此,迫切需要發展大模型安全監管技術與自己的可信大模型。
除了技術手段外,人工智能安全保障需要相關立法工作。2021年科技部發布《新一代人工智能倫理規范》,2022年8月,全國信息安全標準化技術委員會發布《信息安全技術機器學習算法安全評估規范》,2022-2023年,中央網信辦先后發布《互聯網信息服務算法推薦管理規定》《互聯網信息服務深度合成管理規定》《生成式人工智能服務管理辦法》等。歐美國家也先后出臺法規,2018年5月25日,歐盟出臺《通用數據保護條例》,2022年10月4日,美國發布《人工智能權利法案藍圖》,2024年3月13日,歐洲議會通過了歐盟《人工智能法案》。
我國應加快推進《人工智能法》出臺,構建人工智能治理體系,確保人工智能的發展和應用遵循人類共同價值觀,促進人機和諧友好;創造有利于人工智能技術研究、開發、應用的政策環境;建立合理披露機制和審計評估機制,理解人工智能機制原理和決策過程;明確人工智能系統的安全責任和問責機制,可追溯責任主體并補救;推動形成公平合理、開放包容的國際人工智能治理規則。
- 原標題:人工智能與智能計算的發展 本文僅代表作者個人觀點。
- 責任編輯: 史岱君 
-
韓國宇宙航空廳正式成立
2024-05-27 16:15 航空航天 -
丁薛祥出席2024年全國科技活動周暨北京科技周主場活動
2024-05-26 20:12 -
我國首艘海島(礁)綜合地質調查船正式列裝
2024-05-25 07:22 南海局勢 -
猶如“火車變軌”,全球首例古潛山裸眼側鉆分支井技術成功應用
2024-05-19 19:37 能源戰略 -
我國種豬有了“國產芯”!打破高度依賴國外局面
2024-05-18 15:02 聚焦三農 -
北京:擬探索分體式飛行汽車城際通勤+城內擺渡應用新業態
2024-05-16 18:03 -
我國量子計算機重大突破!這根“線”一度被日本壟斷…...
2024-05-16 10:15 科技前沿 -
世界最長海底高鐵隧道怎么建?要攻克三大難題
2024-05-16 10:10 超級工程 -
“超級顯微鏡”升級!上海光源線站工程通過國家驗收
2024-05-15 17:02 科技前沿 -
谷歌放大招,AI搜索引擎來了
2024-05-15 08:41 大公司 -
硬剛!“中企起訴美國防部”
2024-05-14 17:34 -
“類人速度”新模型來了,AI進入《她》時代?
2024-05-14 10:02 人工智能 -
刷新紀錄!我國科研團隊破解工程建設哥德巴赫猜想
2024-05-12 20:24 超級工程 -
“中國天眼”發現迄今最遠中性氫星系
2024-05-11 16:27 -
高鐵崇明站預計年內開工建設
2024-05-11 13:56 高鐵世紀 -
小模型技術是中國企業率先導入裝備中,大模型也不會例外
2024-05-09 08:42 -
國際首次!“量子模擬的圣杯之一”,我國科學家取得重大進展
2024-05-06 12:12 科技前沿 -
嫦娥六號成功發射!開啟人類首次月球背面取樣之旅
2024-05-03 17:19 航空航天 -
環環相扣、步步關鍵!嫦娥六號月背出差之旅日程表
2024-05-03 16:22 航空航天 -
今天上午太陽爆發強耀斑,對我國上空電離層產生影響
2024-05-03 14:09 天文
相關推薦 -
受中國影響,澳企要在稀土加工業務上發力了 評論 31全國最大!哈密百萬千瓦“光熱+光伏”項目并網發電 評論 64“中國在非洲真正贏得了民心,就連斯威士蘭…” 評論 94“日企抱團是絕望之舉,中國工廠效率質量都是第一” 評論 144最新聞 Hot
-
“沙特曾多次警告德國提防嫌疑人”
-
特朗普最新任命!這次包括火箭隊老板、真人秀制作人
-
巴勒斯坦三個政治派別發表聯合聲明
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團是絕望之舉,中國工廠效率質量都是第一”
-
“中國有能力讓夢想照進現實,將贏得史詩般競爭”
-
被災民暴罵到當場破防,馬克龍發飆:你該慶幸你在法國!
-
美高校敦促國際學生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調”
-
澳大利亞來了,中國就得走人?澳總理這么回應
-
美媒感慨:基建狂魔發力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報復來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-