-
張偉強:如何應對AI內生安全風險,避免淪為“硅基文明”的奴隸
當前,全球人工智能技術快速發展,對經濟社會發展和人類文明進步產生深遠影響,給世界帶來巨大機遇。與此同時,人工智能技術也帶來難以預知的各種風險和復雜挑戰。
觀察者網就進入“無人區”的人工智能倫理難題,AGI的可能性等一系列話題,與北京瑞萊智慧科技有限公司AI治理研究院院長張偉強先生展開了深度對話。
觀察者網:張院長您好。近年來,在OpenAI、谷歌等國際巨頭的推動下,大模型不斷朝著萬億、十萬億參數發展。目前AI大模型在千行百業中萬物競發,有批評者擔憂大模型會進入劣質競爭模式,對算力、能源會帶來浪費。同時“小模型”也正在尋找明星賽道。您如何看待大模型和小模型目前的競合態勢?
張偉強:這里所說的大模型其實更適合稱之為基座模型,我們對它進行訓練、再利用它進行推理,進而為我們提供生成式人工智能的基本能力。可以打個比方,高中畢業時候的知識和能力可以代表一個基座模型,特點是廣而淺。如果要在專業領域開展工作,就一定要進一步接受專業教育。經過專業學習后,模型就可以稱為某個領域的垂類模型了,特點是專而精。相較于基座模型,垂類模型在體量上相對較小。
基座模型和垂類模型之間的發展并不矛盾。一個提供基礎能力,另一個提供專業能力,分別滿足不同的應用場景。至于二者之間的競合態勢,我認為很大程度上并不取決于二者本身,而是取決于市場需求。市場需求在演化過程中會刻畫二者的份額,也會在實踐中實現優勝劣汰。畢竟,人工智能作為新質生產力建設的重要引擎,重在能夠用得上、用得好。
觀察者網:以市場為導向,競爭力不足的會被淘汰掉,這其實也提供了市場出清的渠道。
張偉強:是的。關于你提到的算力和能源問題,我記得劉慈欣說過一句話,談人類最后會不會被人工智能反噬,認為人類在能源方面的無能反而會救了人類,因為我們沒辦法提供滿足人工智能持續增長的能源需求。目前,我們國家注重綠色算力中心的建設,從需求和投入看,我認為是處在良性發展模式當中的。
未來對于算力資源的利用,可以從兩個方面進行優化:一是通過管理方式提高資源利用效率,二是通過技術方式提高資源利用效能。算力也是市場導向的,一定要先看到需求,再稍作前瞻性地提前布局供給。要循序漸進形成需求與供給之間的有效互動、良性循環,疊加技術能力,使算力能夠高質量支撐人工智能長遠發展。
觀察者網:您之前也有多篇文章和報道,談到了AI帶來的新型風險,其中包括“模型本身的幻覺”、“魯棒性不足”、“不可解釋性”等這些問題,對一般讀者來說可能有些難以理解,可否再具體闡釋一下?
張偉強:談這個問題之前,我們可以先聊幾個科幻電影,比如《終結者》、《黑客帝國》等。這些科幻電影的題材,就涉及人類向智能社會發展后,人與人工智能之間如何相處的問題。
我在一些演講中始終強調一個觀點,人工智能將是人類創造出來最接近自己的工具,與其他工具相比,這是它最特殊的地方。從歷史長河看,人類對于工具的追求始終孜孜不倦,但凡有新的技術出現,我們總會把它轉變成更優秀的工具。但是,人工智能這個工具和之前的蒸汽機、電甚至互聯網還不太一樣,它將更接近于我們自身。于是,我們第一次可以和自己的工具用自然語言進行對話,我們第一次對自己的工具提出了倫理要求等等,這些都是前所未有的。所以,人工智能將逐漸地、必然地成為我們人類社會中某種新的角色,參與到我們的社會生產、日常生活當中。在這種情況下,我們未來智能社會的整體安全系數里面,人工智能就會占據非常大的分量。
電影《黑客帝國》與“天網”
人工智能的安全性如何呢?比較遺憾的是,截至目前,人工智能本身的安全性是很差的,這同它的技術底層機理有直接關系。
中科院院士、清華大學人工智能研究院名譽院長,也是瑞萊智慧首席科學家張鈸是我國人工智能領域奠基人之一。他一直強調,人工智能到目前為止還沒有一個扎實的基礎理論。我們看到,和計算機的馮·諾依曼結構、互聯網的TCP/IP協議等確定性技術架構相比,人工智能目前的“深度學習+數據驅動”模式仍舊是在摸著石頭過河。就像現在的生成式人工智能,好像有了一定程度的智力且開始符合人類的預期,但未來是不是就一定沿著既有技術路線走下去,實際上也是未知的。
基礎理論的缺乏使我們對人工智能沒有十足的把控力,人工智能目前范式使得底層決策邏輯和鏈路存在天然不確定性,魯棒性、可解釋性都很差,這使得人工智能本身存在巨大的內生安全風險。
這種情況下,我們一方面要大力發展人工智能,因為其正成為人類新一代生產力的重要組成,也是全球科技競爭的新錨點。另一方面,也要高度重視人工智能安全,從理論攻堅到技術治理,盡可能提高人工智能的安全性。
首先,最核心的,是如何找尋到如同力學三定律一樣扎實簡潔的人工智能技術理論,這是提升人工智能安全的最根本方法。第二,需要提高對人工智能模型的安全測評能力。記得小說《三體》里,“面壁者”提出“思想鋼印”的設想,原本意圖是強制鎖定大腦對事情的判斷,讓人類堅信勝利。不過,小說中的“破壁人”卻說,“思想鋼印”數以億計的代碼如果改幾個正負號,很難被發現吧,結果這個系統就變成了讓人類堅信不會勝利的設置。
隨著人工智能系統越來越深入地與社會生產、人們生活相融合,可以預見,一方面,人類社會在可承受范圍內將越來越多地讓渡控制權給人工智能,例如,指揮、生產、服務等等。另一方面,人類也將越來越高地采信人工智能生成輸出的結果,例如決策研判、人事管理等等。這些重要領域在運用人工智能先進性能的同時,也必然需要承擔人工智能的安全風險。
人工智能系統復雜且龐大,想透徹地在代碼層面審計它的安全性是非常困難的。所以,我們需要通過攻防對抗等方式,對人工智能模型進行安全測評,以掌握人工智能產品安全性是否合格。而且,各應用場景對人工智能系統安全閾值的要求還是不同的,比如調度指揮、工業生產、醫療健康等等,有的要求達到99.9%,有的要求達到90%就可以,這些細分領域的安全需求差異也是我們需要重點關注的。
第三,需要應對AI偽造技術造成的新型信息安全挑戰。目前廣泛存在的AI信息偽造技術,如深度偽造(Deepfake)、AIGC偽造等,可通過面部替換、表情驅動、聲音偽造、文生圖片、文生視頻等方式,打破傳統“眼見為實”的鐵律,使人類肉眼喪失對數字世界信息真偽的判斷能力。
AI偽造技術,一是會成為新型AI詐騙的高性能工具,包括破解銀行等遠程身份驗證系統、制作不良視頻實施敲詐勒索、以偽造形象進行財產詐騙等。二是成為網絡內容生態治理新風險,通過偽造政治軍事人物、專家企業家以及其他公眾人物等多模態信息,發表不負責任言論或詆毀人物形象,造成輿論烈度。三是對權威信息造成挑戰,導致真實信息需要“自證清白”,辟謠信息更需要技術佐證。四是對執法、司法工作中,數字證據的采信等造成全新挑戰。
瑞萊智慧多年來深耕AI偽造檢測技術,形成成熟檢測產品,既包括應對遠程身份驗證(人臉識別)偽造的防火墻產品RealGuard,也包括針對視頻、圖片、音頻、文本等全類型文件開展AI偽造檢測的產品DeepReal。檢測維度既可針對深度偽造(Deepfake)技術,也可針對最新的AIGC偽造技術。
觀察者網:在7月初舉辦的世界人工智能大會上,我在現場也接觸到不少服務器運維、算力租賃服務商等,其中很多需要用到受到出口限制的高端AI加速卡。目前,在AI算力“卡脖子”問題上,您有什么看法?
張偉強:瑞萊智慧聯合螞蟻、百度風投孵化了一家企業——生數科技,4月底在中關村論壇上發布了文生長視頻大模型Vidu,性能可對標OpenAI的Sora。有關文生長視頻的技術路線,生數科技提出的U-ViT架構,論文發表時間比OpenAI的DiT架構還要早2到3個月,更早探索出了底層技術,這也是我們在人工智能細分領域實現技術引領的一個縮影。至于算力芯片領域,雖然我們目前有一些落后,但我相信通過一段時間的持續攻堅,一定會取得實質性的突破。
-
本文僅代表作者個人觀點。
- 責任編輯: 武守哲 
-
這個新機構領導班子都是高規格,有何深意?
2024-08-01 07:46 改革進行時 -
我國科學家取得全固態鋰電池研究新突破
2024-07-31 22:16 車市快訊 -
又邁出一步!中方“地球巨眼”中頻天線結構出廠發運
2024-07-31 11:14 天文 -
世界首位且唯一被授予馮·卡門獎的女航天科技專家吳美蓉逝世
2024-07-31 10:28 航空航天 -
鴻海將首次在印度生產iPhone 16 Pro與Pro Max
2024-07-30 11:12 -
“無疆生成,有界行者”——心智觀察所首屆線下沙龍探討AI下一個爆點
2024-07-30 08:27 心智觀察所 -
CrowdStrike絕非“弱雞”,它在美國反華背景下成長壯大
2024-07-29 14:57 心智觀察所 -
專稿|比比看,大洋兩岸誰能先摘取能源“圣杯”
2024-07-28 08:53 心智觀察所 -
我國科研團隊提出實時監測鼻咽癌治療療效新方法
2024-07-27 07:32 -
千億規模!上海三大先導產業母基金發布
2024-07-26 20:54 -
歐盟港停滿中國車?“產能過剩”不背鍋
2024-07-26 14:51 心智觀察所視頻 -
統一生態:鴻蒙如何踩著諾基亞和三星的“尸體”前進
2024-07-26 14:22 心智觀察所視頻 -
專稿|“藍屏網災”暴露三大悖論,“純血鴻蒙”另辟蹊徑
2024-07-25 15:01 心智觀察所 -
打破認知局限!我國科學家研發出這一新型材料
2024-07-25 09:39 科技前沿 -
歐盟的反補貼調查,到底圖中國啥?
2024-07-24 13:56 心智觀察所視頻 -
鴻蒙系統與安卓“割席”,未來勝算幾何?
2024-07-24 13:41 心智觀察所視頻 -
“慢就是快”的啟示:中國無人駕駛憑什么后來居上?
2024-07-24 09:49 心智觀察所 -
“7月24日至25日地球可能出現地磁暴過程”
2024-07-23 21:54 天文 -
我國科學家在月壤中首次發現分子水
2024-07-23 18:19 嫦娥奔月 -
代表人工智能第三次浪潮的快速發展,這是中國人的原創
2024-07-23 15:07 心智觀察所
相關推薦 -
受中國影響,澳企要在稀土加工業務上發力了 評論 31全國最大!哈密百萬千瓦“光熱+光伏”項目并網發電 評論 64“中國在非洲真正贏得了民心,就連斯威士蘭…” 評論 94“日企抱團是絕望之舉,中國工廠效率質量都是第一” 評論 144最新聞 Hot
-
“沙特曾多次警告德國提防嫌疑人”
-
特朗普最新任命!這次包括火箭隊老板、真人秀制作人
-
巴勒斯坦三個政治派別發表聯合聲明
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團是絕望之舉,中國工廠效率質量都是第一”
-
“中國有能力讓夢想照進現實,將贏得史詩般競爭”
-
被災民暴罵到當場破防,馬克龍發飆:你該慶幸你在法國!
-
美高校敦促國際學生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調”
-
澳大利亞來了,中國就得走人?澳總理這么回應
-
美媒感慨:基建狂魔發力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報復來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-