0
本文作者: 陳彩嫻 | 2023-03-16 16:36 |
今天,OpenAI 正式官宣 GPT-4,其中值得關(guān)注的點(diǎn)有兩個(gè):
第一點(diǎn)是,對比 ChatGPT,GPT-4 的智能水平有了進(jìn)一步的提升。
AI 在特定領(lǐng)域超越人類專家,在模擬律師考試中,ChatGPT 排名末尾 10%,但 GPT-4 在短短時(shí)間內(nèi)卻進(jìn)步到 Top 10%。現(xiàn)場演講中,OpenAI 甚至展示了 GPT-4 處理稅收問題的能力,假設(shè) Alice 與 Bob 結(jié)婚后,收入 XXX,問 2018 年標(biāo)準(zhǔn)扣稅額是是多少,GPT-4 能快速得到準(zhǔn)確答案。
另一點(diǎn)是,OpenAI 在 GPT-4 的論文中強(qiáng)調(diào)了 AI 基礎(chǔ)設(shè)施的開發(fā)與優(yōu)化。OpenAI 的官方博客闡明,GPT-4 是在微軟 Azure AI 超級(jí)計(jì)算機(jī)上訓(xùn)練的。為了 GPT-4 能觸達(dá)全球用戶,Azure 云平臺(tái)的基建專門進(jìn)行了 AI 方向的優(yōu)化。
繼 ChatGPT 之后,GPT-4 的發(fā)布,讓 AI 與云的關(guān)系更進(jìn)了一步。
AI 越火,以ChatGPT 為代表的大模型越火,云服務(wù)的任務(wù)就越急迫。GPT-4 的發(fā)布,短期內(nèi)會(huì)加劇這一局面,從長期來看,AI 與云的配合、算力、算法、數(shù)據(jù)的協(xié)同,才是留給國內(nèi)投身智能計(jì)算的廠商需要打磨的地方。
GPT-4 的推出,對于「中國的 ChatGPT」們(尤其是即將發(fā)布的「文心一言」)來說自然是搶跑;但如果將 AI 視為一場長跑,我們只要跑起來就有機(jī)會(huì)——在國外友商推出一項(xiàng)從 0 到 1 的技術(shù)后,把這項(xiàng)技術(shù)玩出「花」來,實(shí)現(xiàn)從 1 到 100 的跨越是國內(nèi)廠商們的強(qiáng)項(xiàng);而這一切的關(guān)鍵,則取決于我們的基礎(chǔ)技術(shù)建設(shè),是否足夠消化這項(xiàng)技術(shù)。
而細(xì)究緣由,這是行業(yè)所趨,也是技術(shù)發(fā)展的客觀規(guī)律。
一、AI「三分天下」,云成為分水嶺
生物學(xué)上,靈長類動(dòng)物大腦皮層的神經(jīng)元數(shù)量與通用智能水平成正比;人類的神經(jīng)元數(shù)量為 163 億個(gè),約為大猩猩的 1.8 倍,恒河猴的 9.6 倍,前者在認(rèn)知與理解世界的智能層面明顯高于高兩者。
一項(xiàng)研究(如下)也表明,當(dāng)模型的規(guī)模達(dá)到一定程度后,大量的智能能力才具備「涌現(xiàn)」的基礎(chǔ)?;谝酝难芯浚珹I 界對大模型的研究將繼續(xù)往規(guī)模拓展上努力。盡管越往后、邊際效益愈加遞減,但行業(yè)普遍的共識(shí)是:大模型的開發(fā)還遠(yuǎn)遠(yuǎn)沒有到頭。
換言之,以大模型驅(qū)動(dòng)的 AI,會(huì)是接下來五年、甚至十年的 AI 主題。
圖源:谷歌論文「Emergent Abilities of Large Language Models」
基于這個(gè)前提,我們就不得不聚焦于大模型研究的高門檻:如果說深度學(xué)習(xí)的基石是數(shù)據(jù)、算法與算力三駕馬車,那么大模型則是大數(shù)據(jù)、精算法與大算力三駕航母,成本高、技術(shù)刁、工程難。能玩得起大模型的,必須是有人、有錢、有時(shí)間。因此,小企業(yè)與創(chuàng)業(yè)團(tuán)隊(duì)基本無法「自研」,類 ChatGPT 的鑰匙只會(huì)握在資源雄厚的大廠手中。
GPT-3 剛出現(xiàn)時(shí),大模型的這一特質(zhì)還被行業(yè)詬病。但從去年 8 月 Stable Diffusion 、Midjourney 與百度「文心一格」等掀起的文生圖熱浪開始,由大廠帶頭推動(dòng) AI 生態(tài)建設(shè)的聲音開始出現(xiàn)。有行業(yè)人士開始改口,認(rèn)為科技巨頭的入局有利于推動(dòng)底層模型的進(jìn)一步優(yōu)化。同時(shí),越來越多的創(chuàng)業(yè)團(tuán)隊(duì)也放棄了「自研」大模型,轉(zhuǎn)而希望像 OpenAI 依傍微軟一樣,與國內(nèi)的 AI 大廠(如百度、阿里、華為等等)建立合作。
在這種情況下,國內(nèi)以語言大模型為中心的智能時(shí)代,在起步階段就出現(xiàn)了「三分天下」的局面:
首先是以百度、阿里等為代表的互聯(lián)網(wǎng)大廠,因?yàn)樵谏疃葘W(xué)習(xí)的 AI 研究基礎(chǔ)上有雄厚積累,同時(shí)從2020年 GPT-3 出現(xiàn)后就開始加注大模型,有人才、又燒得起錢(如百度過去十年的研發(fā)投入是1000億),因此被 ChatGPT 的觀望者們視為國產(chǎn)大模型開發(fā)的領(lǐng)軍力量,以及大模型服務(wù)的「供應(yīng)商」。
其次是希望站在開源大模型的肩膀上的行業(yè)團(tuán)隊(duì)。這當(dāng)中,又可以分為兩類團(tuán)隊(duì):一是懂大模型開發(fā)、但沒有足夠資源的 AI 公司,他們最終會(huì)像 OpenAI 一樣與大廠合作;二是不懂大模型開發(fā)、但懂行業(yè)痛點(diǎn)的非技術(shù)團(tuán)隊(duì),他們希望用 ChatGPT 相關(guān)的技術(shù)去解決行業(yè)問題,如售前售后、私人家教、論文翻譯與解讀等等。這一類,是大模型的「淘金者」。
最后是間接受益于大模型的 B/C 端用戶。ChatGPT 與其他的 AI 大模型(如決策、視覺、多模態(tài))會(huì)為他們的生產(chǎn)與生活帶來智能提升。以百度「文心一格」等 AI 作畫產(chǎn)品為例,AI 小白用戶也能通過輸入簡單的一句話 Prompt(提示)「召喚」AI 快速畫出質(zhì)量高的圖像,豐富了數(shù)字圖像內(nèi)容創(chuàng)作的方法??梢韵胂?,國內(nèi)若推出類 ChatGPT (如百度即將發(fā)布的「文心一言」)產(chǎn)品也將為用戶獲取信息、優(yōu)化工作流程等帶來極大的便利。而大模型在與行業(yè)結(jié)合、與個(gè)人用戶交流的過程中,又會(huì)獲取更多高質(zhì)量的數(shù)據(jù),變得更智能。
換言之,大模型驅(qū)動(dòng)下,AI 時(shí)代的模型與算法會(huì)成為像核電、煤電、風(fēng)電一樣的資源。發(fā)電廠不會(huì)把發(fā)電的能力賣給用電的人;用電的人也沒必要自己買一個(gè)發(fā)電機(jī),因?yàn)榘l(fā)電廠供電又穩(wěn)定又安全。而在這種情況下,只有「云+API」的方式才能形成強(qiáng)者愈強(qiáng)的馬太效應(yīng)。
有行業(yè)人士就分析:
各巨頭公司應(yīng)該會(huì)各自為戰(zhàn),利用好自己的資源優(yōu)勢,構(gòu)建自己的服務(wù)能力,以 API 的方式賣給中小企業(yè)和政府做應(yīng)用開發(fā)(像現(xiàn)在的云和以前的水電),同時(shí)自己的垂域產(chǎn)品也會(huì)做相應(yīng)升級(jí),確保對應(yīng)的營收和用戶規(guī)模持續(xù)增長。
也就是說,在 ChatGPT 的淘金熱中,科技巨頭不僅是「淘金者」,還是「賣鏟人」。
當(dāng)穩(wěn)健安全可控、低成本高效率的 AI 模型服務(wù)成為巨頭們要占領(lǐng)的下一個(gè)商業(yè)摩天嶺,如何提升「云」的智能計(jì)算水平成為關(guān)鍵;其背后的基礎(chǔ)設(shè)施,如芯片、框架、算法及應(yīng)用,直接關(guān)乎成本與效率,也成為兵家必爭之地。
二、AI 時(shí)代,云要「智能」
由于大模型的研究特征,計(jì)算的「智能」需求也是必然趨勢,類 ChatGPT 的商業(yè)角逐最終也落在了云的競爭上。
OpenAI 曾有一個(gè)很有意思的數(shù)據(jù)統(tǒng)計(jì):2016 年,OpenAI 員工總數(shù) 52 人,平均年薪不到百萬人民幣,云計(jì)算一欄的支出是 232.9 萬美元左右;但到 2019 年,OpenAI 的員工整體薪酬仍遠(yuǎn)低于市場價(jià),云計(jì)算的支出卻已經(jīng)增加到了 3100 萬美元,翻了 13 倍之多。
這說明,在 AI 的研究發(fā)展中,基礎(chǔ)設(shè)施比人貴,云計(jì)算的需求增速更快、商業(yè)空間無可限量。同時(shí),在新的十年,誰能為 AI 支持算力,誰就能成為下一個(gè)領(lǐng)跑者。
在這一戰(zhàn)中,百度智能云是最早在云上布局 AI 能力、將 AI 與云捆綁售賣的云廠商之一。而由于十多年在 AI 領(lǐng)域的持續(xù)研發(fā)投入,在 ChatGPT 開啟的新 AI 時(shí)代中,AI 的底層能力似乎也開始反向助推百度在云計(jì)算服務(wù)上的優(yōu)勢,扭轉(zhuǎn)國內(nèi)現(xiàn)有的云布局。
2012年深度學(xué)習(xí)席卷時(shí),百度是國內(nèi)最早注意到這個(gè)風(fēng)向的科技公司。當(dāng)年,「深度學(xué)習(xí)之父」Geoffrey Hinton 開公司拍賣,有四家企業(yè)在競標(biāo)中窮追猛打,其中一家、也是唯一的一家中國公司,就是百度(另外三家分別是谷歌、微軟與DeepMind)。
2013年,百度建立了中國第一個(gè)深度學(xué)習(xí)研究院(IDL)。作為國內(nèi)最早進(jìn)入深度學(xué)習(xí)領(lǐng)域的互聯(lián)網(wǎng)大廠,百度在 AI 上十年投入 1000 億,2016年開源出首個(gè)國產(chǎn)深度學(xué)習(xí)框架PaddlePaddle(飛槳),是國內(nèi)至今唯一能與國際兩大主流框架 TensorFlow 和 PyTorch 正面交鋒的深度學(xué)習(xí)框架;大模型上,2021年發(fā)布百億參數(shù)中英雙語大模型 PLATO-X、千億參數(shù)大模型「百度·文心」,2022年又發(fā)布知識(shí)增強(qiáng)大模型 Ernie……
由于很早開始訓(xùn)練深度學(xué)習(xí)模型,百度在計(jì)算資源的布局上也極早考慮到了 AI 的需求。
據(jù)了解,2012年,百度就在李彥宏的老家山西陽泉建了一個(gè)計(jì)算中心,2014年開始分批投入使用,2018年全部交付。百度陽泉計(jì)算中心擁有600多項(xiàng)自主研發(fā)技術(shù)專利,包含「冰山」冷存儲(chǔ)服務(wù)器和 X-MAN 超級(jí) AI 計(jì)算平臺(tái)等自研計(jì)算系統(tǒng),每秒可以完成 2000 萬億次深度神經(jīng)網(wǎng)絡(luò)計(jì)算。
建成后,百度在陽泉的計(jì)算中心一直是只跑百度自己的業(yè)務(wù),比如搜索、網(wǎng)盤、自動(dòng)駕駛、生物計(jì)算等,在各種 AI 場景下均有磨練。2022 年 12 月底,百度正式將陽泉計(jì)算中心升級(jí)為「智算中心」后,開始對外提供 AI 的智算需求服務(wù)。據(jù)了解,目前百度智算中心在現(xiàn)有千卡并行環(huán)境下可以實(shí)現(xiàn)加速比90%,做到單機(jī)群萬卡規(guī)模,有效支持大規(guī)模訓(xùn)練場景。
百度陽泉智算中心
目前國內(nèi)多個(gè)智算中心里,阿里烏蘭察布智算中心的算力為 3 EFLOPS,商湯上海臨港計(jì)算中心的峰值算力為 3.74 EFLOPS,而百度陽泉智算中心的算力可達(dá)到 4 EFLOPS。
內(nèi)部消息,百度即將發(fā)布的「文心一言」一部分也是在陽泉智算中心計(jì)算。陽泉智算中心專門搭建了一個(gè)機(jī)房去支持「文心一言」的運(yùn)行,目前正在封閉壓力測試中,即將上線。此前,陽泉已支持文心大模型、文心一格等 AI 產(chǎn)品的計(jì)算需求。
目前,陽泉智算中心也是亞洲最大的單體智算中心。在多項(xiàng)自研制冷技術(shù)的加持下,百度陽泉智算中心的 PUE 值降到了 1.08,排名全國第一。更低的能耗意味著更低的成本,價(jià)格的優(yōu)勢也最終體現(xiàn)在對外的云服務(wù)上。雷峰網(wǎng)
更值得一提的是,百度智能云在 2022 年推出了端到端的 AI 基礎(chǔ)設(shè)施——「AI 大底座」,可以提供 AI 模型開發(fā)的全棧服務(wù)。在百度的「AI 大底座」上,企業(yè)不用有很高的 AI 開發(fā)能力,也無需投入大量成本建設(shè)企業(yè)的 AI 基礎(chǔ)設(shè)施,只需把精力和成本放在自身業(yè)務(wù)場景的打磨上,AI開發(fā)的全流程都可以交給百度“AI大底座”來完成。
傳統(tǒng)來說,AI 算法的開發(fā)部署需要經(jīng)過四大環(huán)節(jié):數(shù)據(jù)處理、算法訓(xùn)練、芯片適配計(jì)算與應(yīng)用開發(fā),其中,訓(xùn)練算法的框架與芯片是壁壘環(huán)節(jié)。百度的「AI 大底座」在芯片環(huán)節(jié)布置了自研的昆侖芯、框架環(huán)節(jié)布置了飛槳,模型層則有文心大模型等,頂層應(yīng)用還開發(fā)出 AI 數(shù)字人、AI 質(zhì)檢等應(yīng)用,打通了 AI 開發(fā)一整套流程,且每一環(huán)單獨(dú)拿出來都很扛打。
圖注:百度 AI 大底座架構(gòu)圖
ChatGPT 出來后,大家的關(guān)注點(diǎn)集中在算力的數(shù)量與成本上,這一點(diǎn)毋庸置疑。但長期來看,大模型與 ChatGPT 最終必然會(huì)沉淀到行業(yè)中去解決實(shí)際問題。這時(shí)候,「模型即(商品)服務(wù)」的概念下,將 AI 模型包裝成易用可得的商品的能力就成為決勝關(guān)鍵。
而「AI 大底座」猶如方塊拼湊,設(shè)計(jì)的靈活度就恰到好處。
如果小模型時(shí)代,AI 的智能是一年級(jí)學(xué)生的水平,那么大模型時(shí)代,AI 的智能則相當(dāng)于高中生。不同的智能水平,必然驅(qū)動(dòng)不同的應(yīng)用需求,未來的 AI 應(yīng)用場景與 AI 開發(fā)流程也將很可能發(fā)生巨變。也就是說,ChatGPT、乃至 AGI 的應(yīng)用開發(fā)面臨極大的不確定性。
百度在芯片、框架、算法與應(yīng)用方面,均有 AI 能力,能應(yīng)對產(chǎn)業(yè)的更多需求:
?面向有一定 AI 開發(fā)團(tuán)隊(duì)的大企業(yè),百度可以提供「AI 大底座」中的其中一環(huán)或多環(huán)能力,如飛槳+昆侖,或飛槳+文心,或昆侖+文心;
?面對 AI 基礎(chǔ)設(shè)施較差的傳統(tǒng)行業(yè),百度的「AI 大底座」可以提供全流程、端到端的 AI 開發(fā)服務(wù)。加上百度有 EasyDL 的全自動(dòng)開發(fā)實(shí)踐,此前基于大底座,百度智能云已經(jīng)積累了 11 個(gè)行業(yè)大模型的訓(xùn)練與計(jì)算經(jīng)驗(yàn),可以幫助客戶定制場景服務(wù)。雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
據(jù)了解,百度智能云的戰(zhàn)略是「云智一體,深入產(chǎn)業(yè)」,強(qiáng)調(diào)云與 AI 能力的結(jié)合,并深入產(chǎn)業(yè)的具體場景,用云與 AI 解決產(chǎn)業(yè)生產(chǎn)環(huán)節(jié)中的實(shí)際問題,幫助企業(yè)實(shí)現(xiàn)智能化轉(zhuǎn)型,而不是簡單提供存儲(chǔ)與計(jì)算能力。雷峰網(wǎng)
雷峰網(wǎng)觀察到,百度在 2021 年年底打磨出文心大模型后,就開始對產(chǎn)業(yè)輸出。百度的輸出模式是:首先服務(wù)行業(yè)大客戶,通過解決大客戶的棘手難題積累數(shù)據(jù)與經(jīng)驗(yàn),沉淀到「AI 大底座」的模型層中;然后,將已經(jīng)實(shí)踐過的行業(yè)大模型能力復(fù)制到行業(yè)內(nèi)的其他客戶場景中,實(shí)現(xiàn)模型的泛化。
這套模式在大模型時(shí)代尤其具有商業(yè)可行性。
舉個(gè)例子,百度與國家電網(wǎng)合作巡檢項(xiàng)目,通過無人機(jī)搜集山頭電線桿的圖像后返回?cái)?shù)據(jù)中臺(tái)進(jìn)行處理與算法優(yōu)化,新訓(xùn)練的「電力大模型」算法識(shí)別準(zhǔn)確率能提升 30%、效率提升 5 倍。在小模型時(shí)代,一個(gè) AI 算法在東北三省也許適用,但遷移到南方就需要重新訓(xùn)練;但在大模型時(shí)代,遷移到另一個(gè)地方時(shí),只需要在當(dāng)?shù)夭杉倭繑?shù)據(jù)進(jìn)行低成本調(diào)優(yōu),「電力大模型」就可以直接上崗。
大模型打磨地越多,復(fù)制成本越低,后面的客戶就越用越好。在智能時(shí)代,云的定義發(fā)生了改變:以前云是資源,按需索??;現(xiàn)在,云需要搭載 AI 技術(shù)變成生產(chǎn)力,解決企業(yè)招聘部分崗位難、降低企業(yè)用人成本等,轉(zhuǎn)化為可見的效率。
細(xì)數(shù)國內(nèi)云廠商的 AI 能力,隨著「云+AI」的模式逐漸占據(jù)主流,過往在 AI 研發(fā)上投入不足的云廠商正在智能計(jì)算的奔跑中退后。百度智能云起步晚、市場占有率低,但改變了戰(zhàn)斗方式,逐步體現(xiàn)出了 AI 時(shí)代的差異化競爭優(yōu)勢,將自己打造成智算時(shí)代最接近用戶需求的一朵云。
ChatGPT 的風(fēng)波,在云的市場,分流出了一條新的路:云智一體,勢不可擋。在這次 AI 時(shí)代的搶跑中,百度確實(shí)迎來了新的機(jī)遇。
三、「賣鏟人」也是「淘金者」
據(jù)了解,百度大模型為其內(nèi)部產(chǎn)品的效果提升做出了肉眼可見的貢獻(xiàn)。
一個(gè)數(shù)據(jù)統(tǒng)計(jì)是,在百度文心大模型的加持下,百度搜索的問題分類準(zhǔn)確率提升 4.5%,新聞去重召回率提升 8%,視頻推薦召回率提升 10%,小度的意圖理解準(zhǔn)確率提升了3.1%。
百度既是「淘金者」,也是賣淘金工具的人。只有了解淘金的難點(diǎn),才能賣好工具。
消息稱,百度發(fā)布文心一言后,將通過百度智能云對外提供服務(wù),逐步將文心一言的能力落地到生產(chǎn)的實(shí)際場景中。未來,不管是 API 的調(diào)用,還是場景的定制,都是通過云去統(tǒng)一對外輸出。
從前,云廠商之間的競爭主要體現(xiàn)在比較誰能夠在最短的時(shí)間內(nèi)響應(yīng)客戶需求。算力越精準(zhǔn),客戶的成本越低。但人工智能時(shí)代來臨后,AI 會(huì)衍生出許多生態(tài)的問題,光比彈性已經(jīng)意義不大。未來,客戶需要的也不再只是一張能訓(xùn)練 AI 的GPU,而是一整套 AI 解決方案。
ChatGPT 打造了云的分水嶺,這一戰(zhàn),百度能否勝出?
時(shí)間會(huì)告訴我們答案。
參考鏈接:
?https://arxiv.org/pdf/2206.07682.pdf
?https://openai.com/product/gpt-4
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。