丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給何思思
發(fā)送

0

對(duì)話值得買(mǎi)科技CTO王云峰:大模型最大的掣肘不是算力、經(jīng)費(fèi)或場(chǎng)景,而是缺人丨AGI十人談

本文作者: 何思思 2023-08-28 17:53
導(dǎo)語(yǔ):錢(qián)可以解決算力,但很難解決人才短缺的問(wèn)題

對(duì)話值得買(mǎi)科技CTO王云峰:大模型最大的掣肘不是算力、經(jīng)費(fèi)或場(chǎng)景,而是缺人丨AGI十人談

作者丨何思思

編輯丨林覺(jué)民

從一個(gè)博客到一家集團(tuán)型公司,值得買(mǎi)科技已走過(guò)了13年的時(shí)間。

2010年,秉持著為中國(guó)消費(fèi)者推薦優(yōu)質(zhì)商品和服務(wù)的初心,值得買(mǎi)科技創(chuàng)始人、董事長(zhǎng)隋國(guó)棟搭建了自己的個(gè)人博客,在博客快速發(fā)展的過(guò)程中,隋國(guó)棟深刻地感受到僅憑一己之力很難滿足消費(fèi)者的差異化需求,因此隋國(guó)棟選擇擴(kuò)張團(tuán)隊(duì),“什么值得買(mǎi)”也由一個(gè)博客發(fā)展成一個(gè)平臺(tái),并培養(yǎng)了一批專業(yè)的消費(fèi)編輯團(tuán)隊(duì)。

而后面對(duì)內(nèi)容重塑消費(fèi)產(chǎn)業(yè)格局的大背景,值得買(mǎi)科技在保障“什么值得買(mǎi)”主營(yíng)業(yè)務(wù)正常運(yùn)行的情況下,開(kāi)始探索多種創(chuàng)新業(yè)務(wù),最終形成了“消費(fèi)內(nèi)容+營(yíng)銷服務(wù)+消費(fèi)數(shù)據(jù)”的多元業(yè)務(wù)格局,由單一業(yè)務(wù)成為了擁有多元業(yè)務(wù)的科技集團(tuán)。

回首過(guò)往13年,值得買(mǎi)科技的業(yè)務(wù)在不斷擴(kuò)大,但不變的是其使命和愿景,即讓每一次消費(fèi)產(chǎn)生幸福感,和成為全球最懂消費(fèi)的科技公司,創(chuàng)造消費(fèi)信息自由流動(dòng)的美好世界。

如今,進(jìn)入大模型時(shí)代,一向以“科技驅(qū)動(dòng)消費(fèi)進(jìn)步”作為slogan的值得買(mǎi)科技,也選擇積極擁抱這項(xiàng)新技術(shù)。其實(shí)談到AI,早在2017年其主營(yíng)業(yè)務(wù)“什么值得買(mǎi)”就開(kāi)始嘗試通過(guò)算法和機(jī)器的方式生產(chǎn)內(nèi)容,2022年,此類內(nèi)容的占比已高達(dá)20.31%。

“值得買(mǎi)有消費(fèi)內(nèi)容、營(yíng)銷服務(wù)、消費(fèi)數(shù)據(jù)三大核心業(yè)務(wù),對(duì)我們而言,大模型對(duì)業(yè)務(wù)的挑戰(zhàn)是很大的?,F(xiàn)在業(yè)界有一個(gè)說(shuō)法:未來(lái)互聯(lián)網(wǎng)上百分之90%的內(nèi)容是由AI生成的。”談到大模型給公司業(yè)務(wù)帶來(lái)的沖擊時(shí),值得買(mǎi)科技CTO王云峰如是說(shuō)。

雷峰網(wǎng)了解到,為了應(yīng)對(duì)此次沖擊,值得買(mǎi)今年年初從原來(lái)的各Team中抽調(diào)出一部分人,成立了AI Lab團(tuán)隊(duì),并率先開(kāi)展了內(nèi)容應(yīng)用層面的研究。據(jù)王云峰透露,值得買(mǎi)在文、圖、短視頻、直播領(lǐng)域都在推進(jìn)產(chǎn)品的開(kāi)發(fā),相應(yīng)的應(yīng)用也會(huì)陸續(xù)開(kāi)始面對(duì)消費(fèi)者和客戶。

談及為何這么做?

王云峰表示,一項(xiàng)新技術(shù)的出現(xiàn)會(huì)伴有大量的不確定性因素,這個(gè)不確定性是需要通過(guò)預(yù)研的方式消弭的,也就是說(shuō)一個(gè)新東西到來(lái),你不知道誰(shuí)比誰(shuí)的好,也不知道最終應(yīng)用的路徑是什么樣的,這時(shí)就需要有專門(mén)的資源做對(duì)應(yīng)的研究和嘗試。

據(jù)王云峰介紹,在模型訓(xùn)練層,值得買(mǎi)已經(jīng)在60億參數(shù)的模型基座上完成了全參數(shù)的Post-Training,正在130億參數(shù)的模型基座上開(kāi)展全參數(shù)的訓(xùn)練;應(yīng)用層面,則主要圍繞多模態(tài)的內(nèi)容識(shí)別和生成、智能的用戶畫(huà)像和推薦、智能的營(yíng)銷策略三個(gè)方向開(kāi)展研究。

“其實(shí)對(duì)于大模型而言,相比算力、經(jīng)費(fèi)和場(chǎng)景,更缺的是人才”王云峰補(bǔ)充道。

對(duì)此,雷峰網(wǎng)還了解到,為了解決人才短缺的問(wèn)題,除了抽調(diào)原Team內(nèi)的成員外,值得買(mǎi)還積極和國(guó)內(nèi)高等院校和創(chuàng)業(yè)公司展開(kāi)合作。

以下是雷峰網(wǎng)和王云峰的對(duì)話:

AI概念早就有,大模型不是萬(wàn)能的,還不能解決垂類問(wèn)題

雷峰網(wǎng):大模型今年一下就在國(guó)內(nèi)火了?速度還是很驚人的。

王云峰:其實(shí)AI不是一個(gè)新概念了,AI技術(shù)的發(fā)展已經(jīng)有60多年,GPT也可以叫做生成式AI——AIGC,算是一個(gè)相對(duì)新的概念。

雷峰網(wǎng):那GPT和之前的AI有什么不同?

王云峰:之前AI的功能是classification的概念更多一點(diǎn),當(dāng)然它也是AI的一部分,但更傾向于識(shí)別領(lǐng)域,新的AI技術(shù)其實(shí)更多的是生成式AI。

例如之前的MGC,即機(jī)器生成內(nèi)容,機(jī)器生成也會(huì)用到大量的AI技術(shù),主要是做前期的一些處理,但是它的生成過(guò)程不是靠AI,而是靠機(jī)器基于某些規(guī)則的方式來(lái)做。

去年年底國(guó)外的生成式AI確實(shí)給人們帶來(lái)了一個(gè)很驚艷的感覺(jué)。最早的生成式AI走了兩條不同的技術(shù)路線,以GPT為代表的這條技術(shù)線,去年年底真正“涌現(xiàn)”了出來(lái)。

雷峰網(wǎng):其實(shí)現(xiàn)在人們對(duì)大模型還是非??春玫??

王云峰:對(duì),現(xiàn)在大家更多的是把它當(dāng)成一個(gè)很驚艷的東西看,認(rèn)為它有無(wú)限的可能。實(shí)際上,還沒(méi)有完全弄清這個(gè)東西最終的應(yīng)用限制會(huì)在哪里。大模型通用的學(xué)習(xí)和適應(yīng)能力還是很強(qiáng)的。

但是它也有一定的局限,比如我們和GPT或國(guó)內(nèi)模型對(duì)話時(shí),舉個(gè)例子,比如問(wèn)怎么挑選茶葉的問(wèn)題,它只會(huì)泛泛的告訴你要注意什么?很多時(shí)候,輸出的內(nèi)容并沒(méi)有能夠真正幫助消費(fèi)者去決策。

現(xiàn)實(shí)生活中,和賣(mài)茶葉的導(dǎo)購(gòu)對(duì)話,他通常會(huì)很細(xì)致的回答你的問(wèn)題,也會(huì)通過(guò)和你的對(duì)話來(lái)了解你的需求。但模型本身的特性,就意味著這個(gè)模型原始的語(yǔ)料是什么樣的,學(xué)到的知識(shí)就是什么樣的。這些知識(shí)它沒(méi)有學(xué)過(guò),所以有時(shí)候在某些領(lǐng)域的效果并不是很理想。

現(xiàn)在各種公眾號(hào)喜歡舉例的都是一些富有創(chuàng)造力、想象力的領(lǐng)域的東西,是那種說(shuō)出來(lái)后沒(méi)有所謂對(duì)錯(cuò),看上去很新奇的內(nèi)容,所以大模型可以很好地發(fā)揮,一旦落到非常垂直的領(lǐng)域,它的表現(xiàn)并不像其他領(lǐng)域那么理想。

雷峰網(wǎng):為什么解決不了實(shí)際問(wèn)題?畢竟很多人都認(rèn)為大模型是萬(wàn)能的。

王云峰:單純的用現(xiàn)有的模型來(lái)構(gòu)建應(yīng)用,就是既沒(méi)有微調(diào),也沒(méi)有自己做進(jìn)一步的預(yù)訓(xùn)練,用的都是別人的東西,但是因?yàn)樗膮?shù)很大,所以看上去很智能。

問(wèn)題是某些垂直領(lǐng)域的原始知識(shí),現(xiàn)有的大模型根本覆蓋不到,所以沒(méi)辦法做很成型的應(yīng)用,比如問(wèn)一些行業(yè)的問(wèn)題,可能輸出的答案看著不錯(cuò),但實(shí)際上會(huì)有錯(cuò)誤。如果問(wèn)它一些原始語(yǔ)料中不能覆蓋的,且相對(duì)聚焦的問(wèn)題,它的效果遠(yuǎn)沒(méi)有預(yù)期的好。

雷峰網(wǎng):那應(yīng)該怎么解決?

王云峰:一種是在別家大模型的基礎(chǔ)上做進(jìn)一步的訓(xùn)練,相當(dāng)于把自己服務(wù)的行業(yè)內(nèi)的知識(shí)灌進(jìn)去再做訓(xùn)練。我們知道大模型最開(kāi)始是通過(guò)預(yù)訓(xùn)練的方式學(xué)習(xí)知識(shí),然后通過(guò)微調(diào)的方式讓它產(chǎn)生某種風(fēng)格。這是一種做法。

蒸餾法訓(xùn)練垂類模型,應(yīng)用層三條線齊頭并進(jìn)

雷峰網(wǎng):大模型火了之后,值得買(mǎi)內(nèi)部有哪些調(diào)整?

王云峰:我們成立了AI lab,其實(shí)成立AI lab 的核心原因在于,我們知道一項(xiàng)新技術(shù)的出現(xiàn)會(huì)伴有大量的不確定性因素,這個(gè)不確定性是需要通過(guò)預(yù)研的方式消弭。意思是一個(gè)新東西到來(lái),你不知道誰(shuí)比誰(shuí)的好,也不知道這個(gè)東西最終應(yīng)用的路徑是什么樣的,這時(shí)就需要有專門(mén)的資源做對(duì)應(yīng)的研究。

所以今年年初我們從原來(lái)各team 里抽調(diào)出一部分人,成立了AI Lab這個(gè)新組織,目的是隔離資源,針對(duì)當(dāng)下的新技術(shù)做預(yù)研,給出一個(gè)可使用的路徑。

雷峰網(wǎng):對(duì)大模型對(duì)業(yè)務(wù)的沖擊,值得買(mǎi)有哪些應(yīng)對(duì)措施?

王云峰:現(xiàn)在業(yè)界有一個(gè)說(shuō)法:未來(lái)互聯(lián)網(wǎng)上百分之90%的內(nèi)容是由AI生成的。所以我們必須提前做好應(yīng)對(duì)。其實(shí)從今年年初時(shí)候,我們就開(kāi)始研究生成式 AI 方面的應(yīng)用了。最開(kāi)始是用Prompt的方式來(lái)用,就是我不對(duì)模型本身做額外訓(xùn)練,我只是告訴它用某種方式幫我總結(jié)這段話的意思,這段文字看上去像是人寫(xiě)的。在這種情況下,對(duì)原來(lái)的內(nèi)容生產(chǎn)方式就有一個(gè)很大的沖擊了,所以我們很早就在內(nèi)容生產(chǎn)方面開(kāi)始嘗試了。

但是我們做的更深入一點(diǎn),我們訓(xùn)練自己的模型。除了語(yǔ)言模型,有一些“多模態(tài)”的工作,比如直播的支持、短視頻的生成工作,我們也都在做。應(yīng)對(duì)措施就是擁抱它,趕緊投入力量來(lái)做,腳踏實(shí)地地做。

雷峰網(wǎng):具體有哪幾個(gè)項(xiàng)目?

王云峰:對(duì)于“多模態(tài)”的話,一是圖生圖的模型,包括圖片批量生成,比如換背景圖,換主圖,其實(shí)都可以用自動(dòng)生成的方式;我們內(nèi)部搭了一個(gè)服務(wù)已經(jīng)開(kāi)始在用了。以及文生圖的模型也在實(shí)際應(yīng)用。

二是短視頻腳本的生成。短視頻腳本生成比較容易,然后就是短視頻的自動(dòng)生成;這個(gè)項(xiàng)目的難度要大一些,耗時(shí)也會(huì)更長(zhǎng)。

三是直播數(shù)字人,月底數(shù)字人直播應(yīng)該會(huì)先發(fā)一個(gè)內(nèi)部的Demo。

雷峰網(wǎng):為什么數(shù)字人直播難度大?對(duì)模型的要求高?

王云峰:數(shù)字人直播包含兩個(gè)技術(shù),一是形象,二是驅(qū)動(dòng)。形象技術(shù)已經(jīng)非常成熟了,難點(diǎn)在驅(qū)動(dòng)方面。

在設(shè)計(jì)直播數(shù)字人時(shí),你不可能讓主播單純地不停地說(shuō)同一件事,直播間是要互動(dòng)的,比如有人問(wèn)你玉米口感怎么樣?為什么這么貴?你是要回答問(wèn)題的,有時(shí)候還有在直播間聊天的,你還要把他拉回來(lái),這就要靠大腦驅(qū)動(dòng)完成,這個(gè)大腦是要專門(mén)訓(xùn)練的。你不僅要了解產(chǎn)品,背后還要有一個(gè)對(duì)應(yīng)的知識(shí)庫(kù)做支撐,這個(gè)模型就是主播的大腦。

所以形象加上背后的大腦才是完整的數(shù)字人直播。形象基本是靠成熟的技術(shù),也有很多供應(yīng)商,后面的大腦就要自己訓(xùn)練了。

雷峰網(wǎng):所以這三部分是在同時(shí)做?還是分步做?

王云峰:我們?cè)谕阶?,因?yàn)槊總€(gè)產(chǎn)品的難度不一樣,所以推出的順序也不太一樣?,F(xiàn)在有些東西已經(jīng)開(kāi)始逐步露出了,下一步可能會(huì)把某些能力包裝成獨(dú)立的產(chǎn)品。

過(guò)段時(shí)間會(huì)放開(kāi)評(píng)論區(qū)對(duì)話機(jī)器人,到時(shí)候可以和機(jī)器人直接對(duì)話,但是也需要灌大量的數(shù)據(jù)做訓(xùn)練,數(shù)據(jù)越多,效果就越好。

雷峰網(wǎng):除應(yīng)用層外,大模型方面有什么成果了嗎?

王云峰:我們通過(guò)灌自己的數(shù)據(jù)、歷史長(zhǎng)文、歷史攻略等做對(duì)應(yīng)的訓(xùn)練動(dòng)作,這個(gè)訓(xùn)練周期會(huì)比較長(zhǎng)。因?yàn)槭谴怪鳖I(lǐng)域,所以我們采用了蒸餾的方法。

雷峰網(wǎng):選的哪家的大模型?

王云峰:像垂類模型的訓(xùn)練我們嘗試了不少的方案,但在實(shí)際過(guò)程中發(fā)現(xiàn)基礎(chǔ)模型對(duì)結(jié)果的影響確實(shí)很大。

國(guó)內(nèi)用的是GLM6B開(kāi)源的60億參數(shù)的模型,凍結(jié)了一些層,訓(xùn)練出了自己的一個(gè)模型,用于垂類消費(fèi)內(nèi)容的生產(chǎn)?,F(xiàn)在正在做的是基于百川發(fā)布的13B的模型做訓(xùn)練。

雷峰網(wǎng):至于選哪家大模型,有評(píng)測(cè)標(biāo)準(zhǔn)嗎?

王云峰:我們有一套標(biāo)準(zhǔn)的測(cè)試集,根據(jù)測(cè)試結(jié)果打分,然后再看整體分?jǐn)?shù)。

雷峰網(wǎng):沒(méi)有嘗試國(guó)外的模型嗎?畢竟現(xiàn)在國(guó)外的水平要高于國(guó)內(nèi)的。

王云峰:國(guó)內(nèi)外的都用過(guò),包括Meta開(kāi)源的Llama系列都嘗試過(guò)。但最終還是選了國(guó)內(nèi)的,因?yàn)槲覀冇X(jué)得中文支持這件事是非常重要的。

雷峰網(wǎng):具體訓(xùn)練出來(lái)的參數(shù)量有多大?

王云峰:目前已經(jīng)訓(xùn)練出了一個(gè)60億參數(shù)的模型,正在訓(xùn)練130億參數(shù)的模型。

算力可以用錢(qián)解決,人才是最大的難點(diǎn)

雷峰網(wǎng):做模型訓(xùn)練包括應(yīng)用層產(chǎn)品的研發(fā),消耗的算力大嗎?

王云峰:如果推理的話,類似3090的卡就能跑起來(lái),訓(xùn)練的話,對(duì)卡的要求就比較高了。

雷峰網(wǎng):算力是難點(diǎn)嗎?好像現(xiàn)在大家都挺樂(lè)觀的?

王云峰:對(duì),我覺(jué)得算力問(wèn)題會(huì)被逐步解決,但需要時(shí)間。其實(shí)算力分為兩部分:一是訓(xùn)練,二是推理。推理用低端的卡能跑的動(dòng)就行,訓(xùn)練的算力要求就很高了,但是從目前來(lái)看,我們自己儲(chǔ)備的訓(xùn)練的算力還是比較理想的。

雷峰網(wǎng):解決算力主要看芯片嗎?還是?

王云峰:我覺(jué)得最大的問(wèn)題不在于芯片,而是生態(tài)問(wèn)題。從長(zhǎng)遠(yuǎn)看,算力問(wèn)題一定會(huì)被解決,只是在目前它仍舊是個(gè)問(wèn)題。但是生態(tài)問(wèn)題就比較復(fù)雜,比如英偉達(dá)的A100或者H100,它本身就有一套自己的開(kāi)發(fā)包c(diǎn)uda,有完整的生態(tài)。國(guó)內(nèi)雖然也有卡,但問(wèn)題在于沒(méi)有構(gòu)建起完整的生態(tài)體系。

比如現(xiàn)在要在國(guó)內(nèi)的卡上跑模型,是要做很多的所謂的“算子”的適配的。也就是說(shuō),想在N卡之外的卡上跑是要遷移的,且遷移成本還挺高的。我們現(xiàn)在也在和國(guó)內(nèi)的合作伙伴,一起做國(guó)內(nèi)的卡的適配。

雷峰網(wǎng):對(duì)值得買(mǎi)來(lái)說(shuō)算力消耗的不大,那主要困難是什么?

王云峰:主要是人力不夠,為了彌齊人才短板,我們除了從各Team抽調(diào)外,還和大量的外部機(jī)構(gòu)合作,比如和人民大學(xué)的高瓴人工智能學(xué)院一起在做多模態(tài)的工作。

因?yàn)楝F(xiàn)在大部分人不僅選擇文字交互,還可能用圖片、視頻等交互方式。像消費(fèi)領(lǐng)域,有很多內(nèi)容也是用視頻這樣的方式來(lái)承載的,所以我們選擇和人大合作,預(yù)計(jì)9月份第一版的模型結(jié)果會(huì)出來(lái)。

所以我們是通過(guò)兩種途徑補(bǔ)足AI Lab的能力,一是從各Team里抽調(diào),二是和外部的創(chuàng)業(yè)公司或者高校實(shí)驗(yàn)室合作。

雷峰網(wǎng):所以最大的挑戰(zhàn)是人才?

王云峰:對(duì),算力是能用錢(qián)解決的,但是人才問(wèn)題不是用錢(qián)就能解決的了的。過(guò)了算力這關(guān)你會(huì)發(fā)現(xiàn)有算力也沒(méi)用,因?yàn)橄胍玫揭粋€(gè)好的結(jié)果,這個(gè)過(guò)程應(yīng)該怎么訓(xùn)練,用什么樣的方式訓(xùn)練是需要人去選擇的。

大模型的應(yīng)用有幾種方式:一是純粹的Prompt的方式,二是在大模型基礎(chǔ)上做訓(xùn)練,三是把大模型作為框架中的一部分,再加上自己的邏輯框架。

其實(shí)是有一些框架的,比如把大模型作為前面的交互入口,后面掛一個(gè)知識(shí)庫(kù),這個(gè)知識(shí)庫(kù)不是純粹的像MySQL一樣的知識(shí)庫(kù),它可能是一個(gè)知識(shí)圖譜、一個(gè)向量數(shù)據(jù)庫(kù)、一個(gè)基于embedding 的數(shù)據(jù)等等。那你究竟用什么方式、怎么串聯(lián)起來(lái),才能克服幻覺(jué)的問(wèn)題拿到好的結(jié)果,這些都不是算力能解決的問(wèn)題,是需要人去做選擇的。

比如我們做的對(duì)話機(jī)器人就有很多選擇:第一種,直接和大模型對(duì)話,通過(guò)提示的方式,把問(wèn)題給到大模型,但是這個(gè)過(guò)程中,你會(huì)發(fā)現(xiàn)大模型的輸出能力是有限的,每秒鐘也只能輸出幾十個(gè)TOKEN ,一次交互下來(lái) 30 秒出去了,用戶肯定接受不了;

第二種,比如現(xiàn)在有一些對(duì)話框架的,就實(shí)際上它自身是一個(gè)框架,再外掛一個(gè)模型做識(shí)別,以保證交互的效率;

第三種,把模型本身做入口,然后做一個(gè)插件,通過(guò)這個(gè)插件返回外部的數(shù)據(jù)庫(kù)拿到事實(shí)后再進(jìn)行內(nèi)容輸出。

究竟哪種方式可以,哪種是未來(lái)的趨勢(shì)和方向是需要思考和判斷的。

雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng)):也就是說(shuō)大家還在試驗(yàn)階段,還不清楚哪種方式更適合?

王云峰:對(duì),這確實(shí)是個(gè)問(wèn)題,或者說(shuō)不同的場(chǎng)景下,用什么方式還沒(méi)有范式。比如我們和合作伙伴溝通,有的建議先搭好大模型的框架,然后做插件,這樣就可以利用大模型泛化的能力解決問(wèn)題。但也有不同的意見(jiàn),究竟哪個(gè)更好,現(xiàn)在誰(shuí)也不知道,需要根據(jù)自己的實(shí)際情況判斷,所以最后看的還是人才。

大模型市場(chǎng)越來(lái)越繁榮,是好事也是壞事

雷峰網(wǎng):從年初到現(xiàn)在對(duì)大模型(GPT)有沒(méi)有改觀?

王云峰:能力越來(lái)越強(qiáng),進(jìn)化速度越來(lái)越快了。主要是工程能力和智能能力變化的非常快,每天都有新的東西出現(xiàn),但是我覺(jué)得還在發(fā)展中,還沒(méi)有完全定型。

雷峰網(wǎng):隨著大模型的火熱,國(guó)內(nèi)外做大模型的越來(lái)越多,您怎么看?

王云峰:是好事也是壞事,好事是有很多選擇,壞事是選擇實(shí)在太多了。

雷峰網(wǎng):為什么這么說(shuō)?

王云峰:我覺(jué)得國(guó)內(nèi)大模型還處在早期階段,還沒(méi)有形成固定的格局。從服務(wù)能力上看,國(guó)內(nèi)的模型,當(dāng)下和ChatGPT還是有很大差距的,這是大家都承認(rèn)且沒(méi)辦法的事情。另外,因?yàn)殚_(kāi)源模型可以直接用,所以開(kāi)源模型已經(jīng)霸屏了,都在搶宣傳位。

雷峰網(wǎng):那國(guó)內(nèi)的您比較看好哪家?

王云峰:我可能比較看好一些創(chuàng)業(yè)型公司,我會(huì)覺(jué)得大廠之外的大模型公司可能更純粹一些,機(jī)會(huì)也更多一些,包袱比較小,完全可以用創(chuàng)新的方式去做,比如百川。其次是高校,中國(guó)高校發(fā)展的比較早,確實(shí)搶占了先機(jī),雖然目前偏重研究而不是工程,但我覺(jué)得其實(shí)只要適當(dāng)?shù)刈龅窖芯砍晒こ袒臀磥?lái)可期了,比如智譜。

雷峰網(wǎng):大廠中有沒(méi)有比較看好的,或者是有潛力的?

王云峰:我比較看好華為,華為其實(shí)屬于大模型另外一個(gè)賽道里的玩家,從一定程度上講,華為是有大模型積累的,它既有算力、有硬件、有軟件,也有自己的模型,它完全可以給行業(yè)做深度服務(wù),所以我覺(jué)得華為比較厲害。

垂類模型比拼的是算力、人才和行業(yè)

雷峰網(wǎng):通用模型和垂類模型哪個(gè)更容易商業(yè)化推廣?

王云峰:我覺(jué)得垂類模型可能場(chǎng)景更聚焦一點(diǎn)。各有自己的市場(chǎng)。但是垂類模型的難度并不比通用模型小,因?yàn)榇诡愵I(lǐng)域的要求更高。

雷峰網(wǎng):難在哪里?做垂類模型比拼的是什么?

王云峰:比拼的是大家對(duì)行業(yè)的理解,如果你正常設(shè)計(jì)一個(gè)直播數(shù)字人的話,如果沒(méi)有行業(yè)的理解,很有可能是一個(gè)端莊,顏值很高,說(shuō)話語(yǔ)氣很舒緩、手部有一些簡(jiǎn)單的動(dòng)作的產(chǎn)品,事實(shí)上直播完全不是這樣的。

所以你必須知道大家平均在直播間停留的時(shí)間有多長(zhǎng)、必須知道直播有忙時(shí)有閑時(shí)、必須知道什么時(shí)候全身出鏡什么時(shí)候半身出鏡、必須知道直播間里的人的分工和配比,背后的模型,也就是大腦的訓(xùn)練是要結(jié)合主播的語(yǔ)氣、主播的風(fēng)格,甚至要跟這個(gè)行業(yè)相匹配的方式做對(duì)應(yīng)的串聯(lián),這樣才能保證大家看到的是一個(gè)真實(shí)的東西。否則就會(huì)設(shè)計(jì)出來(lái)一個(gè)傻傻的主播。

很多專業(yè)領(lǐng)域也一樣,要知道哪個(gè)環(huán)節(jié)是容錯(cuò)率高的,哪個(gè)環(huán)節(jié)是容錯(cuò)率低的,這樣才能保證是一個(gè)好的應(yīng)用,否則就是一個(gè)泛泛的、拉平的東西。

雷峰網(wǎng):所以咱們的產(chǎn)品剛設(shè)計(jì)出來(lái)也是這樣的?

王云峰:對(duì),我們的產(chǎn)品最初設(shè)計(jì)出來(lái)就是這樣的(笑),極傻。所以我認(rèn)為,大模型本身需要人才,但如果做垂類的話,除了模型本身外,還要了解行業(yè)Know-How,否則是做不出來(lái)的。

雷峰網(wǎng):聽(tīng)下來(lái)感覺(jué)做一個(gè)應(yīng)用并不比做大模型簡(jiǎn)單?

王云峰:其實(shí)是這樣的,大模型也是經(jīng)過(guò)很長(zhǎng)時(shí)間才突破到現(xiàn)在這個(gè)程度的,突破之前沒(méi)有人知道它是誰(shuí)。我們觀察發(fā)現(xiàn)現(xiàn)在國(guó)內(nèi)還沒(méi)有一個(gè)特別成功的應(yīng)用出現(xiàn)。為什么?中國(guó)缺聰明人嗎?不缺。中國(guó)缺場(chǎng)景嗎?不缺。中國(guó)缺錢(qián)嗎?不缺。那是為什么?只能說(shuō)明一件事,大模型的應(yīng)用也的確有難度。


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

分享:
相關(guān)文章

工業(yè)口編輯

關(guān)注新基建,聚焦工業(yè)互聯(lián)網(wǎng)領(lǐng)域 網(wǎng)絡(luò)安全丨微信:15230152798
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)