-
DeepSeek推出App版本,使用V3大模型,網(wǎng)友:終于等到了
-
連政gczhewanxgun
近期,許多用戶發(fā)現(xiàn),中國(guó)初創(chuàng)公司深度求索在蘋果應(yīng)用商店上架了自己的大模型應(yīng)用“DeepSeek”,其下方評(píng)論中就有網(wǎng)友表示,用了一年的網(wǎng)頁(yè)端,終于等到了App。
該App的商店頁(yè)面顯示,這是DeepSeek官方推出的AI助手,可“免費(fèi)體驗(yàn)與全球領(lǐng)先AI模型的互動(dòng)交流”。其使用開(kāi)源的 DeepSeek-V3 大模型,多項(xiàng)性能指標(biāo)對(duì)齊海外頂尖模型,可以用更快的速度、更加全面強(qiáng)大的功能答疑解惑,助力高效美好的生活。
App Store 頁(yè)面截圖。
上個(gè)月(12月26日),深度求索正式對(duì)外發(fā)布 DeepSeek-V3大模型,據(jù)其介紹,該模型在多個(gè)方面超越、追平各種開(kāi)源、閉源大模型。而在DeepSeek開(kāi)源社區(qū)收獲的廣泛好評(píng),顯示出開(kāi)發(fā)者們已經(jīng)用腳進(jìn)行了投票。
首先是百科知識(shí)上,V3的知識(shí)類任務(wù)(MMLU, MMLU-Pro, GPQA, SimpleQA)水平相比前代 DeepSeek-V2.5 (下稱V2.5)顯著提升,接近當(dāng)前表現(xiàn)最好的模型 Claude-3.5-Sonnet-1022。長(zhǎng)文本測(cè)評(píng)方面,在DROP、FRAMES 和 LongBench v2 上,V3 平均表現(xiàn)超越其他模型。
此外,V3 在算法類代碼場(chǎng)景(Codeforces),遠(yuǎn)遠(yuǎn)領(lǐng)先于市面上已有的全部非o1類模型,并在工程類代碼場(chǎng)景(SWE-Bench Verified)逼近 Claude-3.5-Sonnet-1022。
值得注意的是,V3在中文和數(shù)學(xué)相關(guān)基準(zhǔn)測(cè)試中表現(xiàn)尤為突出。在中文能力上,V3 與 Qwen2.5-72B 在教育類測(cè)評(píng) C-Eval 和代詞消歧等評(píng)測(cè)集上表現(xiàn)相近,但在事實(shí)知識(shí) C-SimpleQA 上更為領(lǐng)先。而在美國(guó)數(shù)學(xué)競(jìng)賽(AIME 2024, MATH)和全國(guó)高中數(shù)學(xué)聯(lián)賽(CNMO 2024)上,V3大幅超過(guò)了所有開(kāi)源閉源模型。
Deepseek-V3與多個(gè)國(guó)內(nèi)外大模型的測(cè)試數(shù)據(jù)對(duì)比。“Deepseek”公眾號(hào)
公開(kāi)資料顯示,在DeepSeek背后是量化私募巨頭幻方(High-Flyer Quant),也是大廠外唯一一家儲(chǔ)備上萬(wàn)張英偉達(dá) A100芯片的公司。幻方成立于2008年,總部位于中國(guó)杭州,專注于利用數(shù)學(xué)、統(tǒng)計(jì)學(xué)和計(jì)算機(jī)技術(shù)進(jìn)行金融市場(chǎng)的量化分析和交易。2024年5月,DeepSeek-V2發(fā)布,幻方量化成功轉(zhuǎn)型為人工智能先驅(qū),其超低價(jià)格甚至引發(fā)了國(guó)內(nèi)大模型的價(jià)格戰(zhàn),DeepSeek也被迅速冠以“AI界拼多多”之稱。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 連政 
-
小紅書官宣與央視春晚再度合作
2025-01-13 11:25 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
影石360創(chuàng)始人怒斥友商“斷指計(jì)劃”:三倍薪水挖人,三個(gè)月開(kāi)除
2025-01-11 13:59 -
全球首例!噸級(jí)風(fēng)冷液氫動(dòng)力eVTOL試飛成功
2025-01-10 17:51 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
連續(xù)虧損中,寒武紀(jì)市值突破3000億
2025-01-10 16:57 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
全球首座300兆瓦級(jí)壓氣儲(chǔ)能示范工程全容量并網(wǎng)發(fā)電
2025-01-10 15:02 能源戰(zhàn)略 -
手機(jī)銀行轉(zhuǎn)賬,一天最多2000元?
2025-01-10 14:41 金融觀察 -
全球首個(gè)端到端抓取大模型發(fā)布,國(guó)產(chǎn)機(jī)器人攻克大瓶頸?
2025-01-10 11:51 人工智能 -
鴻蒙原生版微信正式上架,騰訊公布開(kāi)發(fā)歷程
2025-01-09 21:35 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
全球三分之二iPad、超億臺(tái)手機(jī)都是“川渝造”
2025-01-09 17:02 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
中國(guó)航司正迅速填補(bǔ)西方空缺
2025-01-09 16:57 航空航天 -
債務(wù)是中性的,既不是魔鬼也不是靈丹妙藥
2025-01-09 15:50 問(wèn)診2025中國(guó)經(jīng)濟(jì) -
小米、聯(lián)想、華為小折疊擠進(jìn)全球前五,蘋果也快入局了?
2025-01-09 15:14 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
微信被美國(guó)移出“惡名市場(chǎng)名單”,多家中國(guó)企業(yè)仍在列
2025-01-09 11:10
相關(guān)推薦 -
-
“形勢(shì)十分嚴(yán)峻”,洛杉磯奧運(yùn)會(huì)危? 評(píng)論 36TikTok案,能指望特朗普嗎? 評(píng)論 79腦機(jī)接口競(jìng)賽:又一場(chǎng)典型的中美模式較量 評(píng)論 18看待中企出海,不能停留在能否守住“世界工廠”的層次 評(píng)論 103拜登小人之心:中俄當(dāng)然愿意看到美國(guó)陷進(jìn)去 評(píng)論 167最新聞 Hot
-
“形勢(shì)十分嚴(yán)峻”,洛杉磯奧運(yùn)會(huì)危?
-
他承認(rèn)“站錯(cuò)隊(duì)了”
-
憑啥他家屹立不倒?
-
為何不重返白宮?她回應(yīng)了
-
美國(guó)網(wǎng)友一邊抗議一邊沖小紅書一邊告別:我會(huì)像復(fù)聯(lián)中那樣…
-
“成為美國(guó)人?不稀罕”
-
最后一周,特朗普班子“拉清單”
-
美國(guó)鋼企CEO瘋狂吐槽:日本更邪惡,把中企教壞了
-
特朗普再表態(tài):我能贏它有功,再等等看
-
“即使人生能夠重來(lái)一次,還是會(huì)選擇成為蘇聯(lián)間諜”
-
敏感時(shí)刻,他要來(lái)中國(guó)
-
沙利文又潑臟水:中國(guó)這么做很危險(xiǎn),特朗普得盯著點(diǎn)
-
拜登小人之心:中俄當(dāng)然愿意看到美國(guó)陷進(jìn)去
-
“美國(guó)再不加把勁,這1750億美元就都朝中國(guó)去了…”
-
英偉達(dá)直說(shuō)了:美國(guó)打著“反華”幌子下黑手,只會(huì)反噬
-
馬斯克改變特朗普對(duì)華態(tài)度?中國(guó)學(xué)者提到美國(guó)炸日本…
快訊- 拜登政府將把古巴從“支持恐怖主義國(guó)家”名單中移除
- 韓國(guó)公調(diào)處再次試圖逮捕尹錫悅,正嘗試通過(guò)山道進(jìn)入總統(tǒng)官邸
- 年度盤點(diǎn):2024年深化調(diào)整的白酒行業(yè)面臨重塑?
- “干一些老百姓能看見(jiàn)的,久久為功的事我不干“
- 中方:將7家美企列入不可靠實(shí)體清單
- 一系列重大找礦成果集中發(fā)布!10個(gè)億噸級(jí)油田、19個(gè)千億方級(jí)氣田...
- 1月14日《新聞聯(lián)播》主要內(nèi)容
- 聯(lián)想印度高管:計(jì)劃將當(dāng)?shù)禺a(chǎn)量翻倍
-