-
谷歌發布“最強AI模型”,AI搜索引擎來了
雖然被OpenAI搶在前面發布了重磅新品演示,但谷歌后發制人,做到了OpenAI還沒能做到的事,率先發布人工智能(AI)搜索引擎,捍衛搜索領域的王者地位,同時對壘OpenAI新發布的旗艦模型GPT-4o,以升級版的最強大AI模型Gemini迎戰。
從北京時間5月15日凌晨1點開始,谷歌在山景城總部附近的海岸線圓形劇場,召開了長達兩個小時的年度I/O開發者大會Keynote演講。
與預期一致,谷歌的這場發布會基本都是在談AI、AI、AI、AI和AI。根據發布會最后的官方統計,整場Keynote的演講稿里總共提了120次AI。
谷歌CEO Sundar Pichai表示,谷歌所有的工作都圍繞生成式AI模型Gemini來做,“我們希望每個人都能從Gemini所做的事中受益?!盇I搜索正是Pichai提到的Gemini融入谷歌多種服務之一。
同時谷歌搜索也將具備多步驟推理能力,可以一次性處理帶有多個限制條件的長問題,并支持“拍視頻”搜索解決方案的新搜索形式。
另外以上下文窗口“長”聞名的Gemini 1.5 Pro大模型,在今年晚些時候將會把100萬Tokens的窗口,進一步擴大至200萬Tokens,拓展同步處理多模態信息的邊界。而對于一些需要快速響應的場景,谷歌也推出了Gemini 1.5 Flash模型。今年2月剛剛問世的Gemma開源模型,也將在下個月迎來參數量更大的Gemma 2。在多模態領域,谷歌也發布了文生圖工具Imagen 3、與Youtube&音樂家合作的“AI音樂沙盒”,以及最新的視頻生成模型Veo。而多模態Gemini Nano模型也將在今年晚些時候登陸Pixel手機,這是在本地運行的機載模型。
值得注意的是,谷歌的發布會上也有一些與昨日OpenAI發布會“雷同”的地方——實時AI助手。從今年夏天開始,Gemini也將支持語音實時交互,同時今年晚些時候還將上線實時視頻交互。未來幾個月內,谷歌也將推出類似于GPTs的自定義AI助手功能,叫做Gems,能夠與整套“谷歌全家桶”聯動。
硬件方面,谷歌宣布了第六代TPU芯片Trillium,并透露能夠在明年初用上英偉達最新的Blackwell架構GPU。另外,液冷、光纜等中國股民可能會感興趣的題材也在發布會上出現。
Gemini 1.5 Pro上下文窗口200萬token 全球最長
谷歌稱,推出號稱有史以來最強大AI模型Gemini Advanced三個月內。從本周二起,谷歌在Gemini Advanced中加入新模型成員Gemini 1.5 Pro,稱它擁有的上下文窗口在全球消費類聊天機器人中最長,窗口起始就有100萬個token。Gemini 1.5 Pro將向150 多個國家地區的Gemini Advanced訂閱者提供,支持超過35 種語言。
Pichai稱,Gemini 1.5 Pro“提供了迄今為止所有基礎模型中最長的上下文窗口。” 他介紹,Gemini 1.5 Pro將擁有200 萬個token的上下文窗口,是當前模型100萬個token窗口的兩倍。
Gemini新語音對話功能Live定制版Gemini
谷歌稱,今年夏季將擴展 Gemini 的多模態功能,包括增加用語音進行深入雙向對話的能力,該功能被稱為 Live。通過 Gemini Live,用戶可以與 Gemini 交談,并可以從各種自然的聲音中選擇它回應的聲音。 用戶甚至可以按照自己的節奏說話,或者在回答過程中打斷并澄清問題,就像在任何人類對話中一樣。
谷歌稱,今年夏季,將在Gemini Advanced 中添加新的旅行規劃功能。借助考慮時間和空間方面物流的先進推理,Gemini將能夠創建個性化的行程,節省用戶的工作時間。
未來幾周,谷歌將在Gemini Advanced中添加新的數據分析功能。用戶只需上傳電子表格,Gemini 就可以分析數據、制作圖表,并更快地發掘見解。
谷歌將推出被稱為Gem的Gemini的定制版本。Gemini Advanced 訂閱者將很快可以獲得更個性化的體驗,根據自己的需要創建Gemini,只需描述用戶希望 Gem 做什么以及希望它如何響應,就可以讓它化身健身伙伴、主廚幫手、編代碼的拍檔或者創意寫作指南。
Project Astra回答手機所拍物問題 安卓端側Gemini增加多模態功能
谷歌官宣推出新的多模態AI項目Project Astra,它可以為用戶解釋智能手機拍到的東西。在谷歌展示的視頻中,只要將手機攝像頭對準某個物體,Gemini就可以識別它,比如一個紅蘋果,還可以回答諸如鏡頭中什么東西是可以發聲的這種問題。
谷歌稱,將很快為模型Gemini Nano添加多模式功能。這意味著,用戶的手機可以通過文本、圖像、聲音和口語,按照用戶理解的方式理解世界。
谷歌稱,端側安卓系統手機版的Gemini Nano將更有幫助,更有上下文的意識。今年,安卓手機的用戶將可以將生成的圖像拖放到Google Messages 和 Gmail 中,并可以直接在手機上提出有關YouTube視頻和 PDF文件的問題,得到解答。
谷歌稱,今年晚些時候,Gemini Nano的輔助功能TalkBack將增強。圖像描述將更加清晰和豐富,幫助弱視用戶和盲人用戶通過語音反饋,更好地指示他們的手機。
全場發布會回顧
發布會開始,Alphabet&谷歌CEO桑達爾·皮查伊登上舞臺。
皮查伊表示,現在已經有超過150萬開發者正在使用谷歌的人工智能Gemini,今天將展示一系列有關搜索、圖片、工作套件、安卓系統等等與人工智能有關的案例。
皮查伊宣布,能夠總結谷歌搜索引擎結果的“AI概覽”(AI Overviews)功能,將于本周在美國推出。
---基于Gemini支持,谷歌圖片(Google Photos)將支持用戶存儲圖片的AI搜索,例如“告訴我,我的車牌號碼是多少?”——這個名為Ask Photos的功能將于今年夏天推出。
皮查伊宣布,最新版本的Gemini 1.5 Pro(在多項核心功能方面均較最初發布版本有所提高)現在向全球所有開發者開放。從今天開始,支持100萬tokens上下文窗口的Gemini 1.5 Pro將在Gemini Advanced功能下向用戶開放,支持35種語言。
谷歌同時面向開發者推出支持200萬tokens的Gemini 1.5 Pro模型的預覽,并表示最終的目標將是“無限上下文”。
谷歌AI業務總負責人、DeepMind的首席執行官杰米斯·哈薩比斯登臺,宣布推出Gemini 1.5 Flash大模型。這個模型兼具速度與效率,和多模態推理能力,以及長達100萬tokens的上下文窗口。開發者將能夠申請體驗200萬tokens的上下文窗口的Gemini 1.5 Flash。
谷歌展示“未來的人工智能助手”——名為“Astra”的項目。哈薩比斯表示,這樣的AI助手需要像人類一樣理解這個動態且復雜的世界。需要記得住它看到的東西,這樣才能理解對話并付諸于行動。同時它也得能積極主動接受教導,以及自然、無延遲地進行交流。在演示視頻中,谷歌的AI助手能夠通過攝像頭視頻,識別“什么東西能發出聲音”、“現在身處何地”等指令。
谷歌宣布了一系列與圖像、音樂、視頻有關的生成式AI工具。包括文生圖工具Imagen 3、與Youtube以及音樂家合作的“AI音樂沙盒”,以及最新的視頻生成模型Veo。
其中最受關注的視頻生成模型Veo,能夠根據文字、圖片和視頻的提示,生成高質量1080p視頻。
哈薩比斯離場,皮查伊重回舞臺,發布第六代TPU芯片Trillium,較上一代芯片的算力表現翻4.7倍,云用戶從今年下半年開始可以用上新芯片。同時谷歌云將在2025年初,用上英偉達的最新Blackwell架構GPU。
皮查伊開始介紹自家的AI超級計算機,比起用戶自己買相同的硬件和芯片,谷歌的架構能使得效能翻倍,其中有部分功勞來自于液冷系統。皮查伊表示,谷歌部署液冷系統的數據中心已經達到1GW,而且還在不斷增長中。
皮查伊表示,谷歌投資了200萬英里的地面和海底光纖,比第二名的云服務商翻了十倍。液冷、光纜,應該都是股民們會感興趣的東西。
谷歌搜索業務負責人Liz Reid開始具體介紹AI Overviews功能。Reid表示,在進行搜索時,搜素引擎具備多步驟推理的能力,例如尋找一個瑜伽教室,同時展示新手優惠報價,和距離特定位置的步行時間。這個AI搜索引擎助手,還能介紹食譜、安排行程,以及接受視頻形式的提問(例如視頻中的相機怎么使用)。
在辦公套件Workspace方面,谷歌將逐步推出總結、郵件Q&A,以及智能回復等功能。
谷歌Gemini總經理Sissie Hsiao介紹了Gemini App的更新。與周一的OpenAI一樣,從今年夏天開始,Gemini也將支持語音實時交互,同時今年晚些時候還將上線實時視頻交互功能。未來幾個月內,谷歌也將推出類似于GPTs的自定義AI助手功能,叫做Gems。這個AI助手的亮點,將是能與“谷歌全家桶”進行交互。
Hsiao再次強調了Gemini的長上下文窗口——能夠一次性處理整整1500頁的文件,或3萬行代碼、1小時視頻。不同的載體也能混同一起提交給聊天機器人。她再次強調,今年晚些時候上下文窗口將翻倍至200萬Tokens。
安卓生態系統的負責人Sameer Samat登臺,他將討論今年安卓系統實現的“三大突破”,分別是“畫圈圈搜索”、Gemini手機AI助手,第三是在手機本地運行的AI。
谷歌表示,今年晚些時候,能夠在本地運行的多模態Gemini Nano模型將登陸Pixel手機,意味著手機將能通過文字、圖片、視頻、音頻,理解用戶的世界。舉例而言,在聽到“幫你把錢轉到安全賬戶”這樣的詐騙電話時,手機會自動彈出詐騙警告。整個過程都是在本地運行,不會引發隱私泄露。
谷歌披露大模型API的最新定價,其中Gemini 1.5 Pro定價為7美元/100萬Tokens,12.8K上下文窗口的版本定價為3.5美元/100萬Tokens;而Gemini 1.5的起售價為0.35美元/100萬Tokens。
對于在今年二月剛剛推出的輕量級開源模型Gemma,谷歌宣布推出視頻語言模型PaliGemma,并將會在6月推出Gemma 2。相較于第一代模型只有20億和70億的參數量,第二代開源Gemma的參數量能達到270億。
作為發布會最后的彩蛋,谷歌CEO皮查伊最后用Gemini總結了今天的發布會稿子里總共提了多少次AI——120次。當然,這并不包括皮查伊問完這個問題后,又喚了幾遍AI。
截至當地時間5月14日收盤,谷歌報171.93美元,漲幅0.6%,市值2.1萬億美元。
- 原標題:谷歌放大招,AI搜索引擎來了,發布最強AI模型!發布會現場:總共提了120次AI、視頻模型登場......
- 責任編輯: 房佶宜 
-
硬剛!“中企起訴美國防部”
2024-05-14 17:34 -
“類人速度”新模型來了,AI進入《她》時代?
2024-05-14 10:02 人工智能 -
刷新紀錄!我國科研團隊破解工程建設哥德巴赫猜想
2024-05-12 20:24 超級工程 -
“中國天眼”發現迄今最遠中性氫星系
2024-05-11 16:27 -
高鐵崇明站預計年內開工建設
2024-05-11 13:56 高鐵世紀 -
小模型技術是中國企業率先導入裝備中,大模型也不會例外
2024-05-09 08:42 -
國際首次!“量子模擬的圣杯之一”,我國科學家取得重大進展
2024-05-06 12:12 科技前沿 -
嫦娥六號成功發射!開啟人類首次月球背面取樣之旅
2024-05-03 17:19 航空航天 -
環環相扣、步步關鍵!嫦娥六號月背出差之旅日程表
2024-05-03 16:22 航空航天 -
今天上午太陽爆發強耀斑,對我國上空電離層產生影響
2024-05-03 14:09 天文 -
嫦娥六號任務首選窗口瞄準今日17時27分發射
2024-05-03 07:39 航空航天 -
嫦娥六號計劃5月3日發射
2024-05-01 18:26 航空航天 -
準備就緒!嫦娥六號完成發射前最后一次系統間全區合練
2024-05-01 15:52 航空航天 -
幣安創始人趙長鵬被判4個月監禁
2024-05-01 10:10 瘋狂比特幣 -
中美研究合作:核聚變實驗實現兩方面關鍵技術突破
2024-04-30 07:33 科技前沿 -
全球運營商最大單體智算中心投產:2萬張卡國產化率超85%
2024-04-28 15:14 觀網財經-科創 -
“5臺ASML極紫外光刻機就相當于2022年歐盟對華葡萄酒出口總額”
2024-04-27 09:01 觀網財經-海外 -
刷新紀錄!這一國產芯片交付
2024-04-26 09:13 科技前沿 -
?華為官宣:盤古大模型5.0將和“純血鴻蒙”一同亮相
2024-04-25 10:37 觀網財經-科創 -
楊利偉獲得錢學森最高成就獎
2024-04-24 15:36 航空航天
相關推薦 -
“中國在非洲真正贏得了民心,就連斯威士蘭…” 評論 20“日企抱團是絕望之舉,中國工廠效率質量都是第一” 評論 81“她下月訪華,盡管特朗普團隊表達了擔憂” 評論 46“中國有能力讓夢想照進現實,將贏得史詩般競爭” 評論 110美國政府“逃過一劫” 評論 125最新聞 Hot
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團是絕望之舉,中國工廠效率質量都是第一”
-
“中國有能力讓夢想照進現實,將贏得史詩般競爭”
-
被災民暴罵到當場破防,馬克龍發飆:你該慶幸你在法國!
-
美高校敦促國際學生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調”
-
澳大利亞來了,中國就得走人?澳總理這么回應
-
美媒感慨:基建狂魔發力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報復來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-
還在扯皮中國,“涉華條款全刪了”
-
中國“光伏OPEC”發文嚴厲質問央企,怎么回事?
-
“最后一道貿易障礙,中國解除了!”
-