-
余亮:與谷歌翻譯小別勝新婚之后,看清中國人工智能到底和谷歌比什么
關鍵字: 谷歌翻譯人工智能翻譯軟件語音識別百度翻譯技術論劍
產(chǎn)品體驗容易學,技術積累更是苦功夫。我相信技術人自己是絕不會只為段子翻譯傳神而沾沾自喜的。在自然語言處理方面,各家巨頭都在比拼。
谷歌自不用說,2016年,谷歌人在《Nature》、《PNAS》、《JAMA》三大頂級科學期刊驚人地發(fā)表了218篇論文,絕大多數(shù)都關于人工智能領域。簡直就是要爭創(chuàng)“雙一流”。
去年微軟亞洲研究院的秦濤和他的團隊,在機器翻譯領域提出“對偶學習法”,聽起來很有創(chuàng)意。目的是:利用沒有標注的數(shù)據(jù)。要知道,一般機器學習需要人類標注過的數(shù)據(jù)。比如一張貓的圖片需要人工打上“cat”文字標簽,然后拿去訓練機器。但是人工標注成本高,探求如何讓機器自主學習就成了未來發(fā)展方向。
秦濤團隊認為:很多人工智能的應用涉及兩個互為對偶的任務,例如從中文到英文翻譯和從英文到中文的翻譯互為對偶、語音識別和語音合成互為對偶、基于圖像生成文本和基于文本生成圖像互為對偶、搜索引擎中給檢索詞查找相關的網(wǎng)頁和給網(wǎng)頁生成關鍵詞互為對偶等等。這些互為對偶的任務可以形成一個閉環(huán),使從沒有標注的數(shù)據(jù)中進行學習成為可能。通過設定一個精巧的原始任務模型,對偶任務可以自反饋自學習。(有興趣讀者可以參考微軟亞洲研究院主頁上的這篇文章)
在自然語言的自主學習領域,最近百度也搞了個大新聞。余昊男、張海超、徐偉發(fā)表了一篇論文,提出了一個新的框架,把視覺識別和自然語言處理技術結合起來,讓AI機器人在沒有先驗知識的情況下,自己學會理解人的命令并在迷宮中導航并定位物體。
他們把初始機器人稱做嬰兒智能體,用無數(shù)回合來迭代訓練。在每個回合,只給出極少的像素和語言指令,通過梯度下降,端到端地從零開始訓練,讓AI在實驗中自主學習環(huán)境的視覺表示,語言的句法和語義,以及如何在環(huán)境中給自己導航。比如要求智能體能夠推廣解釋從未見過的命令和詞匯。
我認為這是一項了不起的探索。為什么?前面我說人類進入了過度符號化世界,其實略有遺憾。過度符號化意味著脫離現(xiàn)實和實踐。而這篇論文A Deep Compositional Framework for Human-like Language Acquisition in Virtual Environment旨在把AI從符號世界放入物理世界,認為只有物理世界的反饋才能讓AI真正智能。研究團隊認為:
有必要重溫吳恩達的話:人工智能領域,很多創(chuàng)新都是中國人搞出來的。
那么中國企業(yè)還缺什么?古人云,做人要“世事洞明,人情練達”,改一下就可以送給中國AI企業(yè):“技術洞明,產(chǎn)品練達”。技術好,還要轉(zhuǎn)化為產(chǎn)品的體貼和話語的高度。當然,中國人總是與最好的比,要求很高,動力很足。
我聽到百度基層的工程師朋友夸谷歌翻譯好,我覺得,這是正確的態(tài)度。“翻譯”乃國之重器,文明重器。想想嚴復當年對進化論的曲解翻譯是如何影響中國救亡運動的?技術人或許也需要這樣的高度。
附詩詞對比答案:左邊為百度寫詩機器人的作品,右邊為宋代詩人葛紹體所作
(文章原載于虎嗅網(wǎng),經(jīng)作者修改并授權觀察者網(wǎng)刊發(fā))
- 原標題:與谷歌翻譯小別勝新婚之后,看清中國人工智能到底和谷歌比什么 本文僅代表作者個人觀點。
- 責任編輯:馬密坤
-
最新聞 Hot
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團是絕望之舉,中國工廠效率質(zhì)量都是第一”
-
“中國有能力讓夢想照進現(xiàn)實,將贏得史詩般競爭”
-
被災民暴罵到當場破防,馬克龍發(fā)飆:你該慶幸你在法國!
-
美高校敦促國際學生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調(diào)”
-
澳大利亞來了,中國就得走人?澳總理這么回應
-
美媒感慨:基建狂魔發(fā)力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報復來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-
還在扯皮中國,“涉華條款全刪了”
-
中國“光伏OPEC”發(fā)文嚴厲質(zhì)問央企,怎么回事?
-
“最后一道貿(mào)易障礙,中國解除了!”
-