0
作者丨何思思
編輯丨林覺民
周鴻祎:你為什么不廢掉劉嬋取而代之呢?劉備不也同意你這么做嗎?
360 AI數(shù)字人:夫天下之事非一人之所能獨(dú)為。雖君父有命,亮亦不忍背之。況劉氏托名漢室,實(shí)為一邦之主。亮豈敢以私怨而王大義哉...
在前段時(shí)間剛結(jié)束的認(rèn)知型通用大模型360智腦發(fā)布會上,360集團(tuán)創(chuàng)始人周鴻祎與360 AI數(shù)字人角色進(jìn)行多輪對話后,現(xiàn)場響起了一陣又一陣的掌聲。
時(shí)隔兩個多月的時(shí)間,周鴻祎攜4.0版本的360智腦大模型亮相,同時(shí)還發(fā)布了核心創(chuàng)新產(chǎn)品——AI數(shù)字人。
雷峰網(wǎng)了解到,360 AI數(shù)字人目前擁有200多個角色,分為數(shù)字名人和數(shù)字員工兩類。其中數(shù)字名人包括歷史人物、偶像明星等,具有較強(qiáng)的可玩性。數(shù)字員工強(qiáng)調(diào)的則是高可用性,致力于解決企業(yè)的實(shí)際問題,可成為企業(yè)員工的知識助手和辦公助手。
與傳統(tǒng)數(shù)字人相比,360 AI數(shù)字人最大的特點(diǎn)在于有靈魂、有記憶、有人設(shè),能夠復(fù)刻人類的思維方式和經(jīng)歷。周鴻祎表示,數(shù)字人是未來大模型最重要應(yīng)用入口,360將依托360智腦大模型能力,重新定義“數(shù)字人”。
可以說360 AI數(shù)字人是周鴻祎對AI認(rèn)知的具象表現(xiàn)。在他看來,AI應(yīng)該以人為本,無論做多么強(qiáng)大的AI,都是在為人類做有史以來最好的工具。
百模大戰(zhàn)、千模大戰(zhàn),比拼的是多模態(tài)的能力
目前國內(nèi)大模型呈遍地開花之勢,幾乎到了每個人都可以做出一個大模型的階段。
周鴻祎認(rèn)為,一個完整的AI大模型一定要具備多模態(tài)能力,包括文字處理、圖像處理、語音處理、視頻處理四大能力。同時(shí)他形象的比喻道,AI大模型是一個從只有眼睛,到有耳朵、鼻子、嘴巴的蛻變過程。
這從360 AI大模型的發(fā)展路徑中也可以看出來,3月29日360推出大模型1.0,當(dāng)時(shí)只能和搜索結(jié)合,還不支持多輪對話;4月26日2.0版本上線,具備了多輪對話的能力;5月18日發(fā)布多模態(tài)文生圖的應(yīng)用“360鴻圖”,同時(shí)迭代到了2.5版本;5月31日發(fā)布智腦視覺大模型,并迭代到了3.0版本。
而近日發(fā)布的360智腦大模型不僅升級到了4.0版本,還加入了多模態(tài)的能力。
緣何這么做?
周鴻祎告訴雷峰網(wǎng)(公眾號:雷峰網(wǎng)),GPT1和GPT2都是以文字處理為主,GPT3擴(kuò)大了參數(shù)量,GPT4展露了一小部分多模態(tài)的能力,但之后再也沒有新的成果發(fā)布。所以我預(yù)測,GPT5一定會全面支持多模態(tài)。
反觀國內(nèi)自研的大模型基本能力已經(jīng)成熟,甚至很多方面都趕超了GPT3.5。所以下一步的重點(diǎn)不是文字能力的較量,而是多模態(tài)能力的比拼。
對此,周鴻祎還進(jìn)一步解釋道,大模型訓(xùn)練到一定水平后,人類的知識會愈發(fā)不夠用。以GPT4為例,其學(xué)習(xí)的Token數(shù)目接近4千萬種圖書,而人類有史以來的圖書不足1億本,所以當(dāng)大模型具備了多模態(tài)能力后,它獲得知識的途徑不再局限于文字,也可以是圖片,亦或視頻。
這也是周鴻祎把多模態(tài)融入到360智腦大模型的重要原因,目前也成了其最重要的組成部分。
雷峰網(wǎng)了解到,360智腦大模型已經(jīng)具備了生成與創(chuàng)作、多輪對話、書寫代碼、文本分類、文本改寫、閱讀理解、邏輯與推理、知識問答、多模態(tài)、多語言翻譯等十大能力,200多種細(xì)分的子能力。
“2015年360就成立了AI研究院,2018年開始多模態(tài)的探索。我們未來會發(fā)布插件平臺,我們要讓大模型不僅僅停留在大腦層次,多模態(tài)可以給它增加眼睛、耳朵、鼻子、嘴巴,插件可以讓它有手和腳的能力,這樣大模型的能力才能發(fā)揮出來,”周鴻祎補(bǔ)充道。
構(gòu)建大模型的關(guān)鍵:數(shù)據(jù)、用戶反饋、安全
多模態(tài)可以說是進(jìn)階版的大模型,但就目前國內(nèi)大模型發(fā)展來看,很多企業(yè)仍處于起步階段,討論的更多的還是如何做大模型?門檻高不高等問題。
對此業(yè)界可謂眾說紛紜,一部分人更是極端地把大模型描繪成了“曼哈頓計(jì)劃”,像原子彈一樣高精尖的技術(shù)。
但周鴻祎卻持否定態(tài)度,他表示,做大模型一是找一個類似Transformer架構(gòu)的基礎(chǔ)模型,二是給大模型灌知識,即無監(jiān)督學(xué)習(xí)或者預(yù)訓(xùn)練的知識,三是刷題訓(xùn)練,即有監(jiān)督的微調(diào)。
此外,還需要在用戶場景中不斷反饋優(yōu)化。過程中,用什么樣的數(shù)據(jù)做預(yù)訓(xùn)練,用什么樣的題海戰(zhàn)術(shù)做有監(jiān)督的微調(diào),以及用戶的使用反饋都對大模型的持續(xù)訓(xùn)練起著至關(guān)重要的作用。
360在這方面就顯得輕松地多。
首先,360以搜索業(yè)務(wù)起家,這意味著其在自然語言理解方面有豐富的技術(shù)積累。雷峰網(wǎng)了解到,360每天在全球會抓取1.4億的網(wǎng)站數(shù)據(jù),2.8億的專業(yè)文獻(xiàn),1.2億的行業(yè)數(shù)據(jù)。其中,包括數(shù)十種語言、圖片、視頻等多種形式的基礎(chǔ)材料。
其次,360還具備清洗能力,對全網(wǎng)數(shù)據(jù)清洗后,仍會留下10T級優(yōu)質(zhì)的規(guī)模數(shù)據(jù),更重要的是這個過程還會產(chǎn)生高質(zhì)量的問題,比如用戶每天在搜索引擎里有1億次的使用,用戶搜索的這些問題就是高質(zhì)量的問題,這就會更加了解用戶在想什么,從而有的放矢地做知識的標(biāo)注。
“搜索能力對大模型不僅會影響數(shù)據(jù)積累,也會影響結(jié)果的真實(shí)性?!?/strong>
對此,周鴻祎解釋道,大模型最大的短板是數(shù)據(jù)更新不及時(shí),甚至有時(shí)候會產(chǎn)生幻覺。而搜索恰恰可以補(bǔ)足,我們可以通過搜索最新的內(nèi)容,讓GPT隨時(shí)訓(xùn)練到最新的事實(shí)內(nèi)容,同時(shí)把結(jié)果通過搜索做內(nèi)容的校正,這個能力還在不斷研發(fā)。
除數(shù)據(jù)和用戶反饋外,360還非常重視安全問題,周鴻祎談到,大模型如果只一味地講發(fā)展不講安全,這個大模型肯定是走不遠(yuǎn)的。
目前360已經(jīng)啟動安全團(tuán)隊(duì)專門做人工智能安全方面的研究,具體分為兩部分:一是用安全加強(qiáng)大模型的能力;二是用安全使大模型在安全方面更加可控。
所謂道高一尺,魔高一丈,周鴻祎更是形象地把自家的安全手段比喻為:以其人之道反制其人之身,即通過全球的網(wǎng)絡(luò)攻擊大數(shù)據(jù),安全行業(yè)的智能大腦,幫助企業(yè)更好地辨別黑客的攻擊,網(wǎng)上隱藏的攻擊,從而增強(qiáng)安全防衛(wèi)能力。
當(dāng)然,在周鴻祎看來,研發(fā)大模型不能把大模型當(dāng)成一個黑盒子,而是要了解它的來龍去脈、工作原理,才能從根本上解決大模型的安全問題,為此,360首創(chuàng)了大模型安全風(fēng)險(xiǎn)的評估體系“AISE”,為全球大模型提供安全保障。
基于此,360提出了“一體雙翼”的發(fā)展戰(zhàn)略,并重發(fā)展和安全,此外,為了切實(shí)解決千行百業(yè)的實(shí)際問題,包括360安全瀏覽器、360搜索以及安全衛(wèi)士等在內(nèi)的產(chǎn)品已經(jīng)全面接入360智腦大模型。
可以預(yù)見的是百模大戰(zhàn)、千模大戰(zhàn)的戰(zhàn)火會愈演愈烈,對于大模型廠商來說,只有不斷增強(qiáng)大模型的能力,提供差異化的服務(wù),才能在這場戰(zhàn)爭中保持優(yōu)勢。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。