-
金鐘:OpenAI大內斗,對中國AI大模型發展有哪些啟示?
【文/觀察者網專欄作者 金鐘】
相信大家這幾天已經吃飽了關于美國科技新星企業OpenAI內部人事斗爭的大瓜了。短短幾天內,公司創始人阿爾特曼被董事會開除,跳槽入職微軟,最后再勝利歸來,驅逐了其他董事會成員。劇情一波三折,演員表現自然,臺詞真情投入,好萊塢大片也不過如此。
11月23日又有爆料稱,阿爾特曼被解雇之前,幾名研究人員向公司董事會發出了一封信,警告一項被稱為“Q*”的人工智能可能威脅到人類。這封信件也是促使董事會罷免Altman的原因之一。對此,阿爾特曼和OpenAI公司還沒有回應,相信未來我們還會看到更多的幕后故事。
拋開八卦不提,OpenAI內部激烈的權力斗爭背后是今年以來狂熱的AI市場迅猛發展,各方都已經認準了這個利益廣闊的投資風口,才導致對行業當前的領頭羊企業的控制權進行如此激烈的爭奪。
在OpenAI的人事斗爭背景下,AI淘金熱潮中最關鍵的“賣鏟子”的芯片企業英偉達發布第三季度財報,在AI芯片和游戲芯片需求高漲的推動下,英偉達三季度收入達到去年同期的3倍。但是美國政府最新的芯片禁運命令,將導致相當一部分以前可以出售給中國的芯片將無法繼續賣給國內企業。
美國政府從去年開始對國內的芯片禁運已經升級過好幾輪了,雖然每一次英偉達等歐美芯片企業都會研發出一些針對中國需求的特供版芯片,以此繞過禁運措施,但是這些特供版芯片和歐美科技企業拿到的AI芯片,在性能上有著相當大的差距。直觀的說,AI芯片的性能關系到運行大語言模型時候的計算能力,算力的差距直接帶來的就是運算時間和運算所需要的能源消耗之間的差距。這也是美國芯片禁運的主要目的,阻礙國內企業訓練、發展自己AI大語言模型的速度。
那么美國禁運AI芯片,對AI大語言模型在國內的應用到底影響有多大呢?
根據當前已知的AI大語言模型應用情況,我們可以粗略地將大語言模型的應用分成兩類,一類是“to B”即企業應用場景,另一類則是“to C”即通用消費者應用場景。
目前大語言模型在企業應用場景中最有前途的用途是什么?我們還是可以從今天最受追捧的“賣AI鏟子”的企業英偉達身上找答案。
在10月底到11月初美國電子電氣工程師學會(Institute of Electrical and Electronics Engineers,IEEE)的一個國際會議上,英偉達首席科技官在主題演講中詳細描述了英偉達是如何開發一個公司內部專用的大語言模型。
英偉達自用的大語言模型,數據來源于自身過去30年積累的代碼、程序文檔、芯片設計文檔、測試結果、糾錯報告以及內部技術討論的通訊記錄等等,而發展自用AI模型,則是希望通過訓練大語言模型達到三個目的:
第一是建立一個面對年輕工程師的內部機器人,通過理解年輕工程師的提問并從過去的資料數據中尋找答案,讓年輕工程師可以從內部機器人這里獲得大部分技術問題的正確解答,減輕有經驗的資深工程師答疑的負擔,從而讓那些經驗豐富的工程師可以更多的將工作時間集中在開發新產品這些更有創造性的工作上。
第二個目的則是簡化芯片設計流程,減少在芯片設計和測試時編寫復雜代碼的需要。
第三個目的則是簡化在芯片測試過程中的報錯和糾錯分析報告,讓以往長達幾十頁的復雜報錯報告簡化成幾個自然段,并針對技術人員和管理人員提供不同的測試報告總結。
英偉達的AI芯片目前是各家AI模型研發不可或缺的基建產品,這家公司對于如何應用大語言模型來提高企業生產力的決策和選擇,對于其他企業思考如何在內部工作中應用大語言模型有著很大的啟示意義。
簡單總結一下,我們可以發現當前水平下,大語言模型對于提高那些知識密集型行業或者企業的生產力,效果是最好的。這個提高生產力的關鍵點就是幫助知識型企業內部更有效率地分配最重要的資源率,而這個最重要的資源就是知識企業中核心技術人員的工作時間,讓這些核心技術精英們可以花費更多的時間在設計新產品架構和攻克新技術難關這些最有價值的工作上,那些耗時過長并且回報較小的工作則交給AI來完成。
英偉達不是唯一發現類似的AI“to B”應用場景的企業,不少其他美國大科技企業也都發現,目前AI大語言模型最有效果的應用,就是幫助開發者減輕處理繁雜瑣碎工作的難度和節省這些時間。比如說在開發一個新的軟件功能模塊時,通過公司自用的大語言模型,從過去浩如煙海的技術文檔中尋找、總結相關的代碼說明和需求分析,這樣可以更快更準確地將新軟件開發需求確定下來,效果好的時候可以縮短三分之一的項目開發時間。
當然,知識密集型企業不僅限于IT科技公司,法律、金融、生物醫藥甚至現在許多高端制造企業都可以歸入其中,而大語言模型對于英偉達提高生產效率的作用,恐怕也可以同樣作用于這些行業的企業身上。
而對于這些行業來說,他們在應用AI時很有一些共性。
比如說企業訓練AI模型的數據往往來自于企業內部,而且格式和語言類型相對標準固定。律師事務所日常面對的法律條款和法律文書,金融企業面對的各種財務報表,IT企業面對的程序代碼和技術文檔等等,這些數據往往有著相當標準的格式和大量反復使用、定義明確的專業名詞。因此,單個企業自身的業務數據庫從數據量到語言復雜程度上,都遠遠小于整個互聯網上幾十億網民創造出來的繁雜內容。
另一個應用特點則是企業內部用戶向AI模型提問的問題類型也相對嚴肅集中,基本局限在技術和業務方面的疑問,不像廣大網民對網上已經公布的通用型AI大語言模型五花八門的提問,天南海北無所不包,甚至有人專門選擇偏僻晦澀的知識點和邏輯復雜的問題來找樂子。
以上應用場景的差別也帶來了一個“to B”和“to C”之間的重要區別:訓練數據庫之間的量級差距。面向通用場景下的ChatGPT 4大語言模型共有1750億個參數,訓練數據庫據說有13萬億個離散文本單元(token)。而英偉達的內部大語言模型公司訓練數據則只包含了240億個token,規模只有ChatGPT 4的0.2%左右。
據說國內目前幾個公開測試的大語言模型,訓練數據庫規模也大多在萬億token以上,已經遠遠超越英偉達這樣的業界龍頭企業的需求了。而除了幾個互聯網平臺企業之外,國內大部分企業自身產品研發過程積累的數據量,恐怕沒有英偉達這么多。
數據規模和復雜程度在很大程度上決定了訓練模型所需算力的多少,而算力需求又很大程度上決定了對于硬件設備尤其是芯片性能的需求。所以,企業內部自用的AI模型所需的算力和芯片性能,也遠遠不如類似ChatGPT 4這樣的通用型模型那么夸張。
國內的AI芯片雖然因遭到禁運而落后于歐美先進水平,導致在運算成本和時間上都比國外訓練AI模型花費更高,但是國內企業已經進口的現有AI芯片,包括國內自主設計、制造的AI芯片,已經足以完成這些針對企業內部提高生產效率的專門AI大語言模型的訓練和應用。用一個比喻來描述這個現象,游戲玩家們必須要買最新的4090顯卡來流暢運行最新的3A大作,因為老顯卡往往帶不動這些游戲。但如果只是玩一些如仙劍奇俠傳1這樣的老游戲,顯卡對于游戲運行流暢度的影響就不那么重要了,玩家們也沒必要一定要去血拼4090。
從英偉達這樣的龍頭科技企業的投入方向來看,目前AI模型對于生產力刺激最明顯最有效的應用方向,依舊是應用在企業內部的這些場景項目。而這些方向也恰恰是用國內算力完全可以實現,受到國外芯片禁運影響最小的應用場景。
當然,這并不是說國內和國外在企業內部AI應用上就沒有差距了,從大語言模型軟件的開發和調試,以及企業內部數據、知識的整理和將AI模型應用與實際科研結合這些問題上,國內知識密集型企業大多還是落后一些距離,但是相比“to C”的通用消費者應用上,這個方向受到的硬件制約最少,追上國際先進水平的阻力最小,而產生的潛在經濟回報卻最大。
與“to B”領域的相對樂觀前景不同,由于起步晚、財力有限,再加上芯片禁運的影響,國內在大語言模型“to C”的通用性應用上差距更大,短期追趕難度也更高。當OpenAI在剛剛結束的開發者大會上提出要搞應用商店平臺,類似十幾年前移動互聯網剛開始發展時候的蘋果應用商城,在形成產業生態和搶占商業應用市場方面占了先河。國內的通用型大語言模型在技術上還落后OpenAI一至兩代,加上硬件受限嚴重,短期內雖然可以搶占國內市場,但是依然無力在國際市場上與國外的廠商進行競爭。
在“to C”領域,目前最現實的策略依然是盡量緊緊跟隨,從國外探索驗證過的通用領域里面選擇商業最成熟的模式再進行投入,這樣可以最好發揮有限資本的使用效果。
面對現實,在繼續推動國內自身半導體軟硬件和設備研發國產化的同時,在知識密集型企業中推動利用專門的AI模型來提高研發效率,是符合中國經濟挑戰的最有效應對策略。一方面中國產業升級和向高端產品攻關的重任恰好落在這些知識密集型企業身上,如果AI模型的應用可以提升企業研發和生產效率,這就有助于國內加速突破外部封鎖,完成產業升級的主要戰略目標。另一方面,這些企業開發適合自身的AI模型,本身也會為國內半導體軟硬件廠商提供寶貴的需求和產品驗證的機會,這和美國各個科技大廠向英偉達下單,為英偉達的產品持續升級換代提供了大量資金是一個道理。
因此,目前在AI產業化的進程上,中國還處在追趕世界先進水平的地位上。面對外部封堵持續升級的現狀,最現實有效的從AI發展中獲益的方式,恐怕就是加快推動研發AI模型在企業層面的應用落地,切實利用AI促進實體經濟的生產力進步,為AI大語言模型的應用從PPT上落地到實際生產研發過程中尋找突破口,這反過來也可以支持AI領域更快更好的發展。
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平臺觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閱讀趣味文章。
-
本文僅代表作者個人觀點。
- 責任編輯: 小婷 
-
首只全流程國產克隆貓降生!克隆技術全流程國產化意味著什么?
2023-11-24 06:54 -
顏寧回應當選中科院院士
2023-11-23 15:25 -
名單公布!46人當選2023年兩院外籍院士
2023-11-23 13:41 -
2023年兩院院士增選結果揭曉:顏寧入選中科院院士
2023-11-22 17:19 -
華為:已為全球9000萬偏遠地區人口提供聯接能力
2023-11-21 18:02 觀網財經-科創 -
可承受幾十萬次折疊!我國首條,正式投產
2023-11-20 22:45 科技前沿 -
世界首創!雄安“地下城”用上了
2023-11-20 14:30 雄安新區 -
我國首只全流程國產化培育的克隆貓誕生
2023-11-20 11:50 科技前沿 -
約270萬行代碼!我國自主研發地球系統模式發布
2023-11-18 14:50 -
中國高能同步輻射光源成功升能加速 增強器束流能量達60億電子伏特
2023-11-17 20:18 能源戰略 -
北斗系統正式加入,今后可全球民航通用
2023-11-16 08:49 航空航天 -
?李彥宏:不斷重復開發基礎大模型是對社會資源的極大浪費
2023-11-15 21:27 觀網財經-科創 -
0.015毫米!世界最薄,中企成功軋制
2023-11-14 11:35 -
300個上榜!工信部公示《2023年5G工廠名錄》
2023-11-14 10:37 5G -
中國“機器化學家”成功創制火星產氧電催化劑
2023-11-14 06:49 科技前沿 -
世界互聯網大會十周年,商湯科技元蘿卜AI下棋機器人引圍觀
2023-11-13 15:43 -
全球首條!我國開通1.2T超高速下一代互聯網主干通路
2023-11-13 11:51 -
痛悼!他走了,享年89歲
2023-11-12 22:11 -
正式揭牌!預計明年投用
2023-11-12 20:34 科技前沿 -
又一大國重器!全球最大18兆瓦直驅海上風電機組下線
2023-11-11 16:00 中國精造
相關推薦 -
馬克龍:歐洲AI落后了,得砸錢追上中美 評論 114巴西對X平臺下禁令,盧拉喊話馬斯克 評論 55遭遇“沉重打擊”后,烏克蘭撤職空軍司令 評論 268“一個西方關鍵盟友要倒向俄羅斯” 評論 148最新聞 Hot
-
馬克龍:歐洲AI落后了,得砸錢追上中美
-
巴西對X平臺下禁令,盧拉喊話馬斯克
-
全球AI換臉色情人物一半是韓國人!韓方找法方:要和“電報”談
-
委內瑞拉遭遇全國性停電,“反對派干的”?
-
柯文哲被當庭逮捕
-
遭遇“沉重打擊”后,烏克蘭撤職空軍司令
-
柯文哲被帶走調查,住所遭搜查數小時,走時說“我非常坦蕩”
-
“金磚鼓舞非洲:勇于挑戰西方霸權,不要怕被制裁”
-
馬科斯聲稱:重要時刻
-
“若我當選,會讓共和黨人入閣”
-
“塞爾維亞軍隊首次裝備西方戰機”,向歐盟靠攏?武契奇回應
-
《中美科技合作協定》第二次到期,還能否續簽?
-
他拒絕參會后,韓國政府緊急增加6名女性嘉賓
-
“一個西方關鍵盟友要倒向俄羅斯”
-
空襲美國救援組織車輛致5死,以軍解釋了…
-
英國首相訪問德法,卻遭警告:不能繞過歐盟
-