丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
業(yè)界 正文
發(fā)私信給張進
發(fā)送

0

獨家對話智譜高管:開源的大模型越來越多,但智譜不著急

本文作者: 張進 2023-11-30 15:29
導(dǎo)語:?智譜會堅持開源。

【雷峰網(wǎng)(公眾號:雷峰網(wǎng))】作為當(dāng)前國內(nèi)最受歡迎的開源大模型之一,智譜AI開源非常早,是國內(nèi)大模型的開源先鋒。

2022年,在國內(nèi)還沒有多少人相信大模型的時候,智譜就將其開發(fā)的高精度雙語千億模型GLM-130B進行了開源,ChatGPT爆火后又緊跟著開源了60億參數(shù) ChatGLM-6B,早于國內(nèi)的大多數(shù)同行。

GLM-130B是智譜在2022年7月自主研發(fā)的千億模型。當(dāng)時,中國對大模型的理解還普遍較弱,智譜剛在 GitHub 上開源 GLM-130B 時,鮮少為人問津,過了一個月才勉強攢夠 1000 顆星,“很多人不會用(大模型),問題也超級多”。

而智譜對開源的理解也比較領(lǐng)先,在7月訓(xùn)練出 GLM-130B后,8月就開始招人做開源運營,專門推廣 GLM-130B 的開源生態(tài)。

GLM-130B開源的目的主要是為向外界普及大模型。但那時候,全國懂大模型的研究員加起來也不過百來人,他們當(dāng)時是在大模型的低谷期去推廣 GLM-130B,其艱難程度可見一斑。

ChatGPT 爆火后,大模型破圈,大家才開始關(guān)注到這位國產(chǎn)大模型尖子生:GLM-130B 在 GitHub 上的星數(shù)隨之暴漲。同時,ChatGPT 發(fā)布后、智譜只用了兩個月就成功重現(xiàn)了 ChatGLM,并重新訓(xùn)練了一個 60 億參數(shù)的模型 ChatGLM-6B 并進行開源,智譜在大模型開源上很快領(lǐng)先。

近日,智譜公開了ChatGLM-6B系列模型在所有開源社區(qū)的開源數(shù)據(jù):一代和二代達(dá)ChatGLM-6B模型達(dá)到1000萬+下載,累計四周Hugging face趨勢榜第一,GitHub 5w+stars。

上半年,智譜的 GLM 在開源上一騎絕塵,這主要歸因于其早早布局的先發(fā)優(yōu)勢,又抓住了 3 月 ChatGPT 在國內(nèi)爆火的關(guān)鍵時機進行開源。

但在 7 月,Llama 2 開源免費可商用,成為新的話題。彼時,智譜To B的路線已經(jīng)漸成共識,關(guān)于智譜是否會開源其百億模型的討論也在圈內(nèi)不脛而走,而智譜一直沒有公布其下一步開源路線。

直到上個月27號,在2023中國計算機大會(CNCC)上,智譜推出了全自研的第三代基座大模型ChatGLM 3,智譜AI CEO張鵬在會上宣布開源了ChatGLM3-6B。

在ChatGLM 3 系列模型發(fā)布后,智譜成為了目前國內(nèi)唯一一個對標(biāo)OpenAI全模型產(chǎn)品線的公司。

對標(biāo)OpenAI但不模仿,OpenAI堅持閉源,智譜選擇開源先行,開源與閉源同時存在的打法來擴大自己的生態(tài)。

開源讓智譜的 GLM 系列收獲了大量關(guān)注,成為最早突圍的大模型公司。隨之變化的不僅有智譜的名聲,還有智譜的估值:短短半年多時間,智譜的估值從10億人民幣飆升到140億,成為中國第一家估值超過百億的大模型創(chuàng)業(yè)公司。

近日,AI科技評論分別跟智譜AI CEO張鵬、智譜AI新晉首席生態(tài)官劉江聊了聊智譜對開源的布局和認(rèn)知,以及他們對行業(yè)的一些認(rèn)知。談到開源對智譜、對整個行業(yè)的意義,張鵬承諾開源也是智譜未來會一直堅持的事情;以及他們對大模型To C、To B的看法。

還聊到開源對商業(yè)化的影響,現(xiàn)在大模型已經(jīng)進入第二場——加速商業(yè)化時代到來,劉江認(rèn)為開源其實是占領(lǐng)用戶。

在Llama2搶占國外開源生態(tài)的同時,以智譜為首的一眾基礎(chǔ)大模型廠商不斷在開源上發(fā)力、奉獻,隨著開源大模型越來越多,也為國內(nèi)大模型開源生態(tài)注入源源不斷的新生力量,促使國內(nèi)大模型開源生態(tài)逐漸擴大、完善。

在日益激烈的競爭中,智譜正在通過各種方式不斷完善自己的大模型生態(tài),以此來做大整個產(chǎn)業(yè),這也是智譜作為排頭兵的責(zé)任,希望未來同行都能在不斷做大的大模型盤子中找到自己的位置,而開源生態(tài)便是智譜生態(tài)中的重要一環(huán)。

以下是AI科技評論與智譜AI CEO張鵬、智譜AI新晉首席生態(tài)官劉江的對話:

開源版本與商業(yè)版本的區(qū)別

AI科技評論:最近在忙什么?

張鵬:市場、客戶。我現(xiàn)在的主要精力都放在To B市場和研發(fā)這兩件事上。

AI科技評論:內(nèi)部怎么看待開源?

張鵬:開源是智譜重要的事情,最新成果都是以開源的方式放出來,再有商業(yè)的版本。符合開源先行的理念。

AI科技評論:最初為什么會選擇開源?

張鵬:開源其實就幾個事情:第一、將我們的大模型開源出去,讓大家知道智譜在做什么。第二、開源以后,可以讓更多的人參與進大模型,用社區(qū)的方式、匯集大家的熱情一起來推動大模型發(fā)展,這是開源最重要的一件事。

并不是說要用開源去贏得市場或者為了追求商業(yè)上的利益,要不然就不會選擇開源了,這是智譜一直以來對開源的定位。

AI科技評論:如何看待開源與商業(yè)的關(guān)系?

張鵬:開源的目的和商業(yè)不要混為一談,開源和商業(yè)化是整個生態(tài)版圖里很重要的兩塊,這兩塊是有連接的,可以說開源充當(dāng)著商業(yè)化的橋梁。

AI科技評論:是否會考慮開源12B或者更大的ChatGLM?

張鵬:對于是否開源12b,內(nèi)部曾有討論,結(jié)論是其實 12B 開不開源差別不大,12B 和 6B 之間的性能差異并不是兩倍,只是參數(shù)是兩倍。

我們覺得開源主要還是為了研究、推進技術(shù)的演化和創(chuàng)新,ChatGLM-6B主要面向研究者、個人開發(fā)者。所以在這個目標(biāo)上,6B跟更大參數(shù)的模型沒有本質(zhì)上的差別。

AI科技評論:開源模型越來越多,對智譜有哪些影響?

張鵬:開源的多了,大家就多了一些選擇??梢圆挥蒙逃玫陌姹?,客戶直接用開源的版本就好了,但這件事有好有壞。

好處就是說可以低成本、快速地切入使用上大模型,但開發(fā)者也知道社區(qū)支持這個事情永遠(yuǎn)是一個雷,開源大模型在安全性、穩(wěn)定性等方面很難得到保障,這也是商業(yè)版本能夠與開源版本并存的原因。商業(yè)版本可以提供更多的服務(wù),更多的保障以及更多后續(xù)的服務(wù),這些開源版本不一定有。

AI科技評論:對于開源和閉源大模型,用戶應(yīng)該如何選擇?

張鵬:得看他的目的是什么。如果他只是想做一些實驗和嘗試,那選開源模型沒問題,如果想要在上面做一些商業(yè)化應(yīng)用,我覺得大部分人還是會選擇商業(yè)化版本,因為有保障,能夠提供更好的服務(wù)。

AI科技評論:未來大模型開源會一家獨大嗎?

張鵬:不會,未來開源一定會百花齊放。

AI科技評論:如何看待未來開源與閉源的競爭?

張鵬:兩者天生不是矛盾對立的,也不是競爭的關(guān)系。對于整個大模型行業(yè)來說,兩者其實是互為補充的。

開源是為了保持社區(qū)的繁榮和多樣性,能夠保證技術(shù)、產(chǎn)品能夠源源不斷補充新鮮的血液和產(chǎn)生新的變化,閉源的商業(yè)化的版本肯定是用來滿足商業(yè)化的需求,商業(yè)化的需求是什么呢?是安全、低成本、高效、持續(xù)有價值的服務(wù)。因為對比商業(yè)版本,開源版本一定是滯后的,包括技術(shù)的迭代、維護等等。所以兩者的優(yōu)勢并不在同一個位置,就競爭來說,一定是同位的才會有競爭。

從這個角度來看,開源和閉源大模型兩者是相互彌補的。

更聚焦于 To B 商業(yè)化

AI科技評論:行業(yè)里前段時間一直在討論開源和閉源更適合To C還是To B,那智譜對大模型To C、To B的規(guī)劃是怎樣的?

張鵬:我們團隊其實大部分的人都是To B經(jīng)驗更豐富一些,今年才加入了一個專門做C端產(chǎn)品的團隊,我們整個的商業(yè)化重心都在To B上。

To C其實是一個很好地聚攏用戶,達(dá)成所謂的“用戶-數(shù)據(jù)”飛輪閉環(huán)的事情。但在中國,C端用戶付費意愿一直不高,在中國C端收費經(jīng)常是個很大的陷阱,很多人踩進去就起不來了,再多的用戶好像都沒有什么太大的作用。

AI科技評論:您覺得大模型領(lǐng)域,To C、To B哪條路更難走?

張鵬:對我們團隊來說是To C,但也在慢慢補齊C端團隊。

AI科技評論:C端產(chǎn)品主要就是智譜清言,內(nèi)部還有沒有ABC幾條產(chǎn)品線同時在做?

張鵬:暫時沒有,我們還是希望做的事情更聚焦于商業(yè)付費用戶這塊,而付費用戶還是B端客戶更多。To C目前還是以免費的方式在推動。

AI科技評論:To B客戶主要聚焦哪些行業(yè)?

張鵬:現(xiàn)在我們會選擇一些行業(yè)去做,這個主要還是看市場、看客戶的情況。首先得看行業(yè)是否具備基本的條件,比如說像基礎(chǔ)設(shè)施是否發(fā)展完備。其次大模型這件事的成本并不便宜,要看客戶的預(yù)算投入是否支撐得了。

AI科技評論:如何獲客?

張鵬:一種是直營,我們自己的銷售團隊、市場團隊去獲取的,第二種就是依賴生態(tài),有我們的渠道,還有合作伙伴、代理商等等,主要是這兩種方式。

AI科技評論:做To B時碰到友商次數(shù)最多的是誰?

張鵬:沒太注意,應(yīng)該都碰到過,大廠、創(chuàng)業(yè)企業(yè)都碰到過。

AI科技評論:在To B、To C遇到過哪些挑戰(zhàn)?

張鵬:兩者遇到的挑戰(zhàn)肯定不一樣,但有一些共性的挑戰(zhàn)。首先是技術(shù)上的挑戰(zhàn),無論如何現(xiàn)在大家前面都擺著GPT-4,不管是B端還是C端,大家都會有意無意去拿這個標(biāo)尺去量你。

客戶都不傻,他們也會自己測試,去看國內(nèi)最好的大模型水平能達(dá)到什么程度,這也是智譜最重視的。

你可以想想,如果我們某一天真正能夠做到GPT-4的水平,甚至趕超,那么現(xiàn)在面臨的很多問題都能迎刃而解,例如客戶說的價格太貴、不好用等等。甚至可以連商業(yè)模式都不用考慮,只提供API就行,目前大模型本質(zhì)上就是技術(shù)上的挑戰(zhàn)。

第二是商業(yè)模式上的挑戰(zhàn),這塊我們做了很多的探索,也有自己的的想法、理念和突破。比如在To B,智譜給出了三種不同的商業(yè)落地解決方案,其實就是解決不同類型用戶在不同成本條件下的落地情況,在這一點上我覺得我們智譜應(yīng)該走的比較靠前。

AI科技評論:這三種解決方案是什么?

張鵬:我們一直在跟大家講的,我們有三種大模型的使用方法。

第一種就是直接用我們的API就行了,但大家都一樣,API都是一樣的,能力也都是標(biāo)準(zhǔn)化的。

第二就是當(dāng)標(biāo)準(zhǔn)化的版本還不能滿足需求的時候,例如客戶需要做一些模型側(cè)的微調(diào)優(yōu)化、數(shù)據(jù)隔離、專屬的算力支持等等,智譜就會提供在線的云端私有化方案。

第三種就是完全私有化,這也是最具中國特色的B端解決方案。

AI科技評論:哪一種方案占比較多?

張鵬:沒有一個占絕對優(yōu)勢,但我們判斷未來主流會逐漸轉(zhuǎn)向云端私有化。

AI科技評論:云端私有化,客戶會有安全性的考慮吧?

張鵬:這就要看客戶如何平衡了。我們也會充分考慮這件事,會從技術(shù)側(cè)提出解決方案。

AI科技評論:商業(yè)化上遇到哪些挑戰(zhàn)?

張鵬:目前最大的挑戰(zhàn)是叫好不叫座??赡茉S多人提到智譜會很認(rèn)同我們,但是提到付費購買,大家卻猶豫不決,開始打退堂鼓。

AI科技評論:您認(rèn)為這是為什么?

張鵬:我覺得是因為大家對大模型這件事的認(rèn)知還沒那么深。有時候包括我們自己在內(nèi)都在疑惑,大模型到底能干什么?能給大家創(chuàng)造什么樣的價值?早期的時候確實很難想明白,像今年年初ChatGPT發(fā)布之前,我們跟投資人聊的最多的就是問怎么商業(yè)化?誰會買它?

3月ChatGPT徹底出圈后,大家不再問這些問題,覺得這些都不是問題,但現(xiàn)在大家又開始回過頭去問這些問題。

AI科技評論:現(xiàn)在為什么又開始問這些問題?

張鵬:GPT爆火一下子把天花板捅破了,大家就會覺得商業(yè)化落地這個事情就找到了一個巨大的出口,但它只是技術(shù)上的一個出口,但大家就會腦補,把期望值拉得特別高。

一旦整個行業(yè)熱情勢能爆發(fā),但模型能力的發(fā)展并不能持續(xù)支撐這種勢能,大家就會冷靜下來,回頭看ChatGPT好像也很難商業(yè)化,真正到B端應(yīng)用時光靠chat類產(chǎn)品好像也不夠。就沖過頭了嘛,大家就會回過頭來再問這個問題。

AI科技評論:那智譜有答案了嗎?

張鵬:我也不知道這個答案最終是什么??赡芤矝]有人能給答案去評一個分,或者設(shè)定一個標(biāo)準(zhǔn)答案。我們一直在和我們的合作伙伴、行業(yè)用戶一起去探索這件事的答案。但我們比較自信的是,智譜有很多優(yōu)勢,由于我們對底層技術(shù)的全盤掌握和資源的深入掌握,認(rèn)知會更深刻一些。

AI科技評論:能舉個例子說明嗎?

張鵬:比如模型擅長什么,未來發(fā)展趨勢,我們積累的算法這些技術(shù)優(yōu)勢在商業(yè)化方面的優(yōu)勢,以及在用戶的特別苛刻的情況下智譜如何去配合模型,即配合系統(tǒng)、配合應(yīng)用開發(fā)去滿足用戶苛刻的指標(biāo)要求。

這些事情我相信只有對核心技術(shù)掌握得特別清楚的團隊,研究特別深的團隊才能做到。這也是使用開源版本和完全自研的商用版本的差異。

AI科技評論:智譜未來的重心?

張鵬:就兩條腿走路,一條腿是繼續(xù)追求技術(shù)上的領(lǐng)先,另一條腿是持續(xù)商業(yè)化落地。

AI科技評論:相對于其他創(chuàng)業(yè)公司,智譜最大的特色是什么?

張鵬:我覺得我們最大的特色就是從核心技術(shù)出發(fā)到整個商業(yè)化落地過程,我們都有自己的想法,是自主可控的核心技術(shù),以生態(tài)為主的商業(yè)化落地的打法。技術(shù)上比較簡單,我們就對標(biāo)全球最好的,商業(yè)化落地的目標(biāo)是把生態(tài)做的更大。

AI科技評論:以生態(tài)為主的商業(yè)化落地的打法怎么講?

張鵬:這是我最近感觸非常深的一件事。其實從商業(yè)化落地的角度來講,很多時候大家看到的都是天花板以下的,假設(shè)市場就那么大,那我們要做的就是搶到更多份額,但在搶的過程中就會忽略掉蛋糕是不是可以做的更大,這樣大家存活的空間就會更大,我們就在思考有沒有可能實現(xiàn)共贏?

現(xiàn)在我們商業(yè)化的思路會偏向于生態(tài)共創(chuàng),就是說我們不是殺到某個行業(yè)中去搶蛋糕,而是拿著我們的技術(shù)、工具、產(chǎn)品去賦能客戶,去給客戶創(chuàng)造價值,賦能我們的合作伙伴,希望在這個產(chǎn)業(yè)中我們的合作伙伴越來越多,最后跟合作伙伴一起把整個市場做大,把蛋糕做大,收益也就更大。

AI科技評論:具體到大模型行業(yè)怎么做呢?

張鵬:我們會告訴大家智譜的定位就是做基礎(chǔ)大模型,那么對于上層應(yīng)用,貼近用戶側(cè)的事情交給合作伙伴去做,如果大家愿意跟智譜一起合作,加入到智譜的生態(tài)中來用新的生態(tài)的方式去做,智譜很歡迎。

目的是希望用了智譜的大模型以后,能夠一起改變了整個產(chǎn)業(yè)原來的生產(chǎn)流程或者生產(chǎn)的范式,就等于提升了整個產(chǎn)業(yè)的天花板,收益的是生態(tài)里面的所有人。

這是我以前跟國外的創(chuàng)業(yè)者聊天交流時感受到的最大的一個不同,他們的商業(yè)化的思路更open,他們看到的是全球。他們的視野很廣大,想的不只是身邊的市場,更多考慮的是怎么把整個市場的天花板提升。

AI科技評論:什么時候有這種感悟的?

張鵬:也就今年的事兒,To B的前期,我們真正做這個事情的時候才發(fā)現(xiàn)確實是這樣,大家考慮問題的方式確實不太一樣。

看誰能率先追上 GPT-4

今年10月原智源副院長劉江宣布加入智譜擔(dān)任智譜首席生態(tài)官,智譜的核心團隊再迎來新面孔。

AI科技評論:為什么會選擇智譜?

劉江:從美團出來時,我想的是中國哪個地方更像OpenAI我就去哪里,所以去了智源,后來想著不如跟老王出來一起打造一個“中國的OpenAI”,但現(xiàn)在覺得智譜優(yōu)勢更大,所以來到了智譜。

AI科技評論:首席生態(tài)官主要是做哪些事情?

劉江:大模型賽道處于早期,雖然熱鬧,但競爭其實不明顯,所以在發(fā)展早期,把產(chǎn)業(yè)做大才是最重要的。做大就是生態(tài)的問題。怎么把大模型產(chǎn)業(yè)發(fā)展起來,我的角色就是要對外去找到大模型有價值的合作伙伴,讓大家把大模型真正用起來。

AI科技評論:這里頭涉及哪些方面?

劉江:主要包括三個方面:

一是,比如把大模型理解為一個云平臺或一個操系統(tǒng)這樣非常基礎(chǔ)的能力的話,那它上面比如工具鏈,所謂說的中間層,要通過中間層用上大模型,其實門檻還挺高的,那么如何降低整個門檻,在各行各業(yè)中去落地。

二是,怎么把開源生態(tài)團結(jié)起來。

三是,學(xué)術(shù)上,除了清華實驗室的老師,還要讓更多高校的老師參與進來。

團結(jié)一切力量,把蛋糕做大,這是智譜的一個規(guī)劃。

AI科技評論:您對開源怎么看?

劉江:之前我有一個觀察,開源實際上是一種以副價格推廣產(chǎn)品的方式,就是我們收錢,而且我還送代碼。所以它的目的其實是占領(lǐng)用戶,至少讓更多人知道你,熟悉你的一個方式。

開源就是一種技術(shù)實力的驗證,技術(shù)實力一定要強。某種意義上可以說只要敢開源,至少它還有一定的技術(shù)底氣的。就像智譜最新的6B就是技術(shù)實力的證明。

AI科技評論:您覺得開源面臨哪些阻力?

劉江:在歐美技術(shù)公司,開源也是一種主流打法,但在中國,開源的商業(yè)模式還沒有被驗證?,F(xiàn)在大模型領(lǐng)域,大家都是開一個小的版本,然后靠更大的版本來變現(xiàn)。

AI科技評論:智譜在B端、C端有什么規(guī)劃?

劉江:C端肯定不能放棄,這會是一場硬仗,可能最后最重要的戰(zhàn)場還是聚集在C端,所以未來智譜的挑戰(zhàn)很大。放長遠(yuǎn)來看,在中國B端、C端都有很大的機會,智譜現(xiàn)在B端有優(yōu)勢,創(chuàng)業(yè)公司做C端可能有優(yōu)勢,但都沒那么厲害,沒那么扎實。所以大家都有機會。

AI科技評論:對比一眾大模型公司,智譜的優(yōu)勢是什么?

劉江:人才和研發(fā)、組織模式特殊,這是很大的優(yōu)勢。

AI科技評論:怎么講?

劉江:智譜現(xiàn)在的組織方式不是大廠模式,屬于產(chǎn)學(xué)研,能很好地發(fā)揮清華的優(yōu)勢。因為本質(zhì)上大模型的科研屬性依然非常強。

AI科技評論:整個行業(yè)本質(zhì)上還是比拼什么?

劉江:大模型這件事是重資產(chǎn), 燒錢,根本上還是一個科研項目,雖然現(xiàn)在有很多企業(yè)參與進來,但最后還是要拼技術(shù)實力、看哪個團隊能把AGI干成了,其他商業(yè)化都是副產(chǎn)品。

AI科技評論:您覺得未來大模型領(lǐng)域的一個關(guān)鍵節(jié)點是什么?

劉江:現(xiàn)在主要看誰能趕上或者超過GPT4。很有可能很多人都過不去,因為我觀察的一個細(xì)節(jié)就是 Llama 當(dāng)時做出來以后,其實它在一些指標(biāo)上也接近 3.5 了,那么 Llama 2 立項的時候他們肯定是想一定要超過 GPT-3.5 的,但實際上最后沒做到。所以大模型技術(shù)門檻還是很高。這對國內(nèi)很多團隊都是一個考驗。


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說