獨家對話智譜高管：開源的大模型越來越多，但智譜不著急

本文作者：張進

2023-11-30 15:29

導(dǎo)語：?智譜會堅持開源。

【雷峰網(wǎng)(公眾號：雷峰網(wǎng))】作為當(dāng)前國內(nèi)最受歡迎的開源大模型之一，智譜AI開源非常早，是國內(nèi)大模型的開源先鋒。

2022年，在國內(nèi)還沒有多少人相信大模型的時候，智譜就將其開發(fā)的高精度雙語千億模型GLM-130B進行了開源，ChatGPT爆火后又緊跟著開源了60億參數(shù) ChatGLM-6B，早于國內(nèi)的大多數(shù)同行。

GLM-130B是智譜在2022年7月自主研發(fā)的千億模型。當(dāng)時，中國對大模型的理解還普遍較弱，智譜剛在 GitHub 上開源 GLM-130B 時，鮮少為人問津，過了一個月才勉強攢夠 1000 顆星，“很多人不會用（大模型），問題也超級多”。

而智譜對開源的理解也比較領(lǐng)先，在7月訓(xùn)練出 GLM-130B后，8月就開始招人做開源運營，專門推廣 GLM-130B 的開源生態(tài)。

GLM-130B開源的目的主要是為向外界普及大模型。但那時候，全國懂大模型的研究員加起來也不過百來人，他們當(dāng)時是在大模型的低谷期去推廣 GLM-130B，其艱難程度可見一斑。

ChatGPT 爆火后，大模型破圈，大家才開始關(guān)注到這位國產(chǎn)大模型尖子生：GLM-130B 在 GitHub 上的星數(shù)隨之暴漲。同時，ChatGPT 發(fā)布后、智譜只用了兩個月就成功重現(xiàn)了 ChatGLM，并重新訓(xùn)練了一個 60 億參數(shù)的模型 ChatGLM-6B 并進行開源，智譜在大模型開源上很快領(lǐng)先。

近日，智譜公開了ChatGLM-6B系列模型在所有開源社區(qū)的開源數(shù)據(jù)：一代和二代達(dá)ChatGLM-6B模型達(dá)到1000萬+下載，累計四周Hugging face趨勢榜第一，GitHub 5w+stars。

上半年，智譜的 GLM 在開源上一騎絕塵，這主要歸因于其早早布局的先發(fā)優(yōu)勢，又抓住了 3 月 ChatGPT 在國內(nèi)爆火的關(guān)鍵時機進行開源。

但在 7 月，Llama 2 開源免費可商用，成為新的話題。彼時，智譜To B的路線已經(jīng)漸成共識，關(guān)于智譜是否會開源其百億模型的討論也在圈內(nèi)不脛而走，而智譜一直沒有公布其下一步開源路線。

直到上個月27號，在2023中國計算機大會（CNCC）上，智譜推出了全自研的第三代基座大模型ChatGLM 3，智譜AI CEO張鵬在會上宣布開源了ChatGLM3-6B。

在ChatGLM 3 系列模型發(fā)布后，智譜成為了目前國內(nèi)唯一一個對標(biāo)OpenAI全模型產(chǎn)品線的公司。

對標(biāo)OpenAI但不模仿，OpenAI堅持閉源，智譜選擇開源先行，開源與閉源同時存在的打法來擴大自己的生態(tài)。

開源讓智譜的 GLM 系列收獲了大量關(guān)注，成為最早突圍的大模型公司。隨之變化的不僅有智譜的名聲，還有智譜的估值：短短半年多時間，智譜的估值從10億人民幣飆升到140億，成為中國第一家估值超過百億的大模型創(chuàng)業(yè)公司。

近日，AI科技評論分別跟智譜AI CEO張鵬、智譜AI新晉首席生態(tài)官劉江聊了聊智譜對開源的布局和認(rèn)知，以及他們對行業(yè)的一些認(rèn)知。談到開源對智譜、對整個行業(yè)的意義，張鵬承諾開源也是智譜未來會一直堅持的事情；以及他們對大模型To C、To B的看法。

還聊到開源對商業(yè)化的影響，現(xiàn)在大模型已經(jīng)進入第二場——加速商業(yè)化時代到來，劉江認(rèn)為開源其實是占領(lǐng)用戶。

在Llama2搶占國外開源生態(tài)的同時，以智譜為首的一眾基礎(chǔ)大模型廠商不斷在開源上發(fā)力、奉獻，隨著開源大模型越來越多，也為國內(nèi)大模型開源生態(tài)注入源源不斷的新生力量，促使國內(nèi)大模型開源生態(tài)逐漸擴大、完善。

在日益激烈的競爭中，智譜正在通過各種方式不斷完善自己的大模型生態(tài)，以此來做大整個產(chǎn)業(yè)，這也是智譜作為排頭兵的責(zé)任，希望未來同行都能在不斷做大的大模型盤子中找到自己的位置，而開源生態(tài)便是智譜生態(tài)中的重要一環(huán)。

以下是AI科技評論與智譜AI CEO張鵬、智譜AI新晉首席生態(tài)官劉江的對話：

開源版本與商業(yè)版本的區(qū)別

AI科技評論：最近在忙什么？

張鵬：市場、客戶。我現(xiàn)在的主要精力都放在To B市場和研發(fā)這兩件事上。

AI科技評論：內(nèi)部怎么看待開源？

張鵬：開源是智譜重要的事情，最新成果都是以開源的方式放出來，再有商業(yè)的版本。符合開源先行的理念。

AI科技評論：最初為什么會選擇開源？

張鵬：開源其實就幾個事情：第一、將我們的大模型開源出去，讓大家知道智譜在做什么。第二、開源以后，可以讓更多的人參與進大模型，用社區(qū)的方式、匯集大家的熱情一起來推動大模型發(fā)展，這是開源最重要的一件事。

并不是說要用開源去贏得市場或者為了追求商業(yè)上的利益，要不然就不會選擇開源了，這是智譜一直以來對開源的定位。

AI科技評論：如何看待開源與商業(yè)的關(guān)系？

張鵬：開源的目的和商業(yè)不要混為一談，開源和商業(yè)化是整個生態(tài)版圖里很重要的兩塊，這兩塊是有連接的，可以說開源充當(dāng)著商業(yè)化的橋梁。

AI科技評論：是否會考慮開源12B或者更大的ChatGLM？

張鵬：對于是否開源12b，內(nèi)部曾有討論，結(jié)論是其實 12B 開不開源差別不大，12B 和 6B 之間的性能差異并不是兩倍，只是參數(shù)是兩倍。

我們覺得開源主要還是為了研究、推進技術(shù)的演化和創(chuàng)新，ChatGLM-6B主要面向研究者、個人開發(fā)者。所以在這個目標(biāo)上，6B跟更大參數(shù)的模型沒有本質(zhì)上的差別。

AI科技評論：開源模型越來越多，對智譜有哪些影響？

張鵬：開源的多了，大家就多了一些選擇?？梢圆挥蒙逃玫陌姹?，客戶直接用開源的版本就好了，但這件事有好有壞。

好處就是說可以低成本、快速地切入使用上大模型，但開發(fā)者也知道社區(qū)支持這個事情永遠(yuǎn)是一個雷，開源大模型在安全性、穩(wěn)定性等方面很難得到保障，這也是商業(yè)版本能夠與開源版本并存的原因。商業(yè)版本可以提供更多的服務(wù)，更多的保障以及更多后續(xù)的服務(wù)，這些開源版本不一定有。

AI科技評論：對于開源和閉源大模型，用戶應(yīng)該如何選擇？

張鵬：得看他的目的是什么。如果他只是想做一些實驗和嘗試，那選開源模型沒問題，如果想要在上面做一些商業(yè)化應(yīng)用，我覺得大部分人還是會選擇商業(yè)化版本，因為有保障，能夠提供更好的服務(wù)。

AI科技評論：未來大模型開源會一家獨大嗎？

張鵬：不會，未來開源一定會百花齊放。

AI科技評論：如何看待未來開源與閉源的競爭？

張鵬：兩者天生不是矛盾對立的，也不是競爭的關(guān)系。對于整個大模型行業(yè)來說，兩者其實是互為補充的。

開源是為了保持社區(qū)的繁榮和多樣性，能夠保證技術(shù)、產(chǎn)品能夠源源不斷補充新鮮的血液和產(chǎn)生新的變化，閉源的商業(yè)化的版本肯定是用來滿足商業(yè)化的需求，商業(yè)化的需求是什么呢？是安全、低成本、高效、持續(xù)有價值的服務(wù)。因為對比商業(yè)版本，開源版本一定是滯后的，包括技術(shù)的迭代、維護等等。所以兩者的優(yōu)勢并不在同一個位置，就競爭來說，一定是同位的才會有競爭。

從這個角度來看，開源和閉源大模型兩者是相互彌補的。

更聚焦于 To B 商業(yè)化

AI科技評論：行業(yè)里前段時間一直在討論開源和閉源更適合To C還是To B，那智譜對大模型To C、To B的規(guī)劃是怎樣的？

張鵬：我們團隊其實大部分的人都是To B經(jīng)驗更豐富一些，今年才加入了一個專門做C端產(chǎn)品的團隊，我們整個的商業(yè)化重心都在To B上。

To C其實是一個很好地聚攏用戶，達(dá)成所謂的“用戶-數(shù)據(jù)”飛輪閉環(huán)的事情。但在中國，C端用戶付費意愿一直不高，在中國C端收費經(jīng)常是個很大的陷阱，很多人踩進去就起不來了，再多的用戶好像都沒有什么太大的作用。

AI科技評論：您覺得大模型領(lǐng)域，To C、To B哪條路更難走？

張鵬：對我們團隊來說是To C，但也在慢慢補齊C端團隊。

AI科技評論：C端產(chǎn)品主要就是智譜清言，內(nèi)部還有沒有ABC幾條產(chǎn)品線同時在做？

張鵬：暫時沒有，我們還是希望做的事情更聚焦于商業(yè)付費用戶這塊，而付費用戶還是B端客戶更多。To C目前還是以免費的方式在推動。

AI科技評論：To B客戶主要聚焦哪些行業(yè)？

張鵬：現(xiàn)在我們會選擇一些行業(yè)去做，這個主要還是看市場、看客戶的情況。首先得看行業(yè)是否具備基本的條件，比如說像基礎(chǔ)設(shè)施是否發(fā)展完備。其次大模型這件事的成本并不便宜，要看客戶的預(yù)算投入是否支撐得了。

AI科技評論：如何獲客？

張鵬：一種是直營，我們自己的銷售團隊、市場團隊去獲取的，第二種就是依賴生態(tài)，有我們的渠道，還有合作伙伴、代理商等等，主要是這兩種方式。

AI科技評論：做To B時碰到友商次數(shù)最多的是誰？

張鵬：沒太注意，應(yīng)該都碰到過，大廠、創(chuàng)業(yè)企業(yè)都碰到過。

AI科技評論：在To B、To C遇到過哪些挑戰(zhàn)？

張鵬：兩者遇到的挑戰(zhàn)肯定不一樣，但有一些共性的挑戰(zhàn)。首先是技術(shù)上的挑戰(zhàn)，無論如何現(xiàn)在大家前面都擺著GPT-4，不管是B端還是C端，大家都會有意無意去拿這個標(biāo)尺去量你。

客戶都不傻，他們也會自己測試，去看國內(nèi)最好的大模型水平能達(dá)到什么程度，這也是智譜最重視的。

你可以想想，如果我們某一天真正能夠做到GPT-4的水平，甚至趕超，那么現(xiàn)在面臨的很多問題都能迎刃而解，例如客戶說的價格太貴、不好用等等。甚至可以連商業(yè)模式都不用考慮，只提供API就行，目前大模型本質(zhì)上就是技術(shù)上的挑戰(zhàn)。

第二是商業(yè)模式上的挑戰(zhàn)，這塊我們做了很多的探索，也有自己的的想法、理念和突破。比如在To B，智譜給出了三種不同的商業(yè)落地解決方案，其實就是解決不同類型用戶在不同成本條件下的落地情況，在這一點上我覺得我們智譜應(yīng)該走的比較靠前。

AI科技評論：這三種解決方案是什么？

張鵬：我們一直在跟大家講的，我們有三種大模型的使用方法。

第一種就是直接用我們的API就行了，但大家都一樣，API都是一樣的，能力也都是標(biāo)準(zhǔn)化的。

第二就是當(dāng)標(biāo)準(zhǔn)化的版本還不能滿足需求的時候，例如客戶需要做一些模型側(cè)的微調(diào)優(yōu)化、數(shù)據(jù)隔離、專屬的算力支持等等，智譜就會提供在線的云端私有化方案。

第三種就是完全私有化，這也是最具中國特色的B端解決方案。

AI科技評論：哪一種方案占比較多？

張鵬：沒有一個占絕對優(yōu)勢，但我們判斷未來主流會逐漸轉(zhuǎn)向云端私有化。

AI科技評論：云端私有化，客戶會有安全性的考慮吧？

張鵬：這就要看客戶如何平衡了。我們也會充分考慮這件事，會從技術(shù)側(cè)提出解決方案。

AI科技評論：商業(yè)化上遇到哪些挑戰(zhàn)？

張鵬：目前最大的挑戰(zhàn)是叫好不叫座?？赡茉S多人提到智譜會很認(rèn)同我們，但是提到付費購買，大家卻猶豫不決，開始打退堂鼓。

AI科技評論：您認(rèn)為這是為什么？

張鵬：我覺得是因為大家對大模型這件事的認(rèn)知還沒那么深。有時候包括我們自己在內(nèi)都在疑惑，大模型到底能干什么？能給大家創(chuàng)造什么樣的價值？早期的時候確實很難想明白，像今年年初ChatGPT發(fā)布之前，我們跟投資人聊的最多的就是問怎么商業(yè)化？誰會買它？

3月ChatGPT徹底出圈后，大家不再問這些問題，覺得這些都不是問題，但現(xiàn)在大家又開始回過頭去問這些問題。

AI科技評論：現(xiàn)在為什么又開始問這些問題？

張鵬：GPT爆火一下子把天花板捅破了，大家就會覺得商業(yè)化落地這個事情就找到了一個巨大的出口，但它只是技術(shù)上的一個出口，但大家就會腦補，把期望值拉得特別高。

一旦整個行業(yè)熱情勢能爆發(fā)，但模型能力的發(fā)展并不能持續(xù)支撐這種勢能，大家就會冷靜下來，回頭看ChatGPT好像也很難商業(yè)化，真正到B端應(yīng)用時光靠chat類產(chǎn)品好像也不夠。就沖過頭了嘛，大家就會回過頭來再問這個問題。

AI科技評論：那智譜有答案了嗎？

張鵬：我也不知道這個答案最終是什么?？赡芤矝]有人能給答案去評一個分，或者設(shè)定一個標(biāo)準(zhǔn)答案。我們一直在和我們的合作伙伴、行業(yè)用戶一起去探索這件事的答案。但我們比較自信的是，智譜有很多優(yōu)勢，由于我們對底層技術(shù)的全盤掌握和資源的深入掌握，認(rèn)知會更深刻一些。

AI科技評論：能舉個例子說明嗎？

張鵬：比如模型擅長什么，未來發(fā)展趨勢，我們積累的算法這些技術(shù)優(yōu)勢在商業(yè)化方面的優(yōu)勢，以及在用戶的特別苛刻的情況下智譜如何去配合模型，即配合系統(tǒng)、配合應(yīng)用開發(fā)去滿足用戶苛刻的指標(biāo)要求。

這些事情我相信只有對核心技術(shù)掌握得特別清楚的團隊，研究特別深的團隊才能做到。這也是使用開源版本和完全自研的商用版本的差異。

AI科技評論：智譜未來的重心？

張鵬：就兩條腿走路，一條腿是繼續(xù)追求技術(shù)上的領(lǐng)先，另一條腿是持續(xù)商業(yè)化落地。

AI科技評論：相對于其他創(chuàng)業(yè)公司，智譜最大的特色是什么？

張鵬：我覺得我們最大的特色就是從核心技術(shù)出發(fā)到整個商業(yè)化落地過程，我們都有自己的想法，是自主可控的核心技術(shù)，以生態(tài)為主的商業(yè)化落地的打法。技術(shù)上比較簡單，我們就對標(biāo)全球最好的，商業(yè)化落地的目標(biāo)是把生態(tài)做的更大。

AI科技評論：以生態(tài)為主的商業(yè)化落地的打法怎么講？

張鵬：這是我最近感觸非常深的一件事。其實從商業(yè)化落地的角度來講，很多時候大家看到的都是天花板以下的，假設(shè)市場就那么大，那我們要做的就是搶到更多份額，但在搶的過程中就會忽略掉蛋糕是不是可以做的更大，這樣大家存活的空間就會更大，我們就在思考有沒有可能實現(xiàn)共贏？

現(xiàn)在我們商業(yè)化的思路會偏向于生態(tài)共創(chuàng)，就是說我們不是殺到某個行業(yè)中去搶蛋糕，而是拿著我們的技術(shù)、工具、產(chǎn)品去賦能客戶，去給客戶創(chuàng)造價值，賦能我們的合作伙伴，希望在這個產(chǎn)業(yè)中我們的合作伙伴越來越多，最后跟合作伙伴一起把整個市場做大，把蛋糕做大，收益也就更大。

AI科技評論：具體到大模型行業(yè)怎么做呢？

張鵬：我們會告訴大家智譜的定位就是做基礎(chǔ)大模型，那么對于上層應(yīng)用，貼近用戶側(cè)的事情交給合作伙伴去做，如果大家愿意跟智譜一起合作，加入到智譜的生態(tài)中來用新的生態(tài)的方式去做，智譜很歡迎。

目的是希望用了智譜的大模型以后，能夠一起改變了整個產(chǎn)業(yè)原來的生產(chǎn)流程或者生產(chǎn)的范式，就等于提升了整個產(chǎn)業(yè)的天花板，收益的是生態(tài)里面的所有人。

這是我以前跟國外的創(chuàng)業(yè)者聊天交流時感受到的最大的一個不同，他們的商業(yè)化的思路更open，他們看到的是全球。他們的視野很廣大，想的不只是身邊的市場，更多考慮的是怎么把整個市場的天花板提升。

AI科技評論：什么時候有這種感悟的？

張鵬：也就今年的事兒，To B的前期，我們真正做這個事情的時候才發(fā)現(xiàn)確實是這樣，大家考慮問題的方式確實不太一樣。

看誰能率先追上 GPT-4

今年10月原智源副院長劉江宣布加入智譜擔(dān)任智譜首席生態(tài)官，智譜的核心團隊再迎來新面孔。

AI科技評論：為什么會選擇智譜？

劉江：從美團出來時，我想的是中國哪個地方更像OpenAI我就去哪里，所以去了智源，后來想著不如跟老王出來一起打造一個“中國的OpenAI”，但現(xiàn)在覺得智譜優(yōu)勢更大，所以來到了智譜。

AI科技評論：首席生態(tài)官主要是做哪些事情？

劉江：大模型賽道處于早期，雖然熱鬧，但競爭其實不明顯，所以在發(fā)展早期，把產(chǎn)業(yè)做大才是最重要的。做大就是生態(tài)的問題。怎么把大模型產(chǎn)業(yè)發(fā)展起來，我的角色就是要對外去找到大模型有價值的合作伙伴，讓大家把大模型真正用起來。

AI科技評論：這里頭涉及哪些方面？

劉江：主要包括三個方面：

一是，比如把大模型理解為一個云平臺或一個操系統(tǒng)這樣非常基礎(chǔ)的能力的話，那它上面比如工具鏈，所謂說的中間層，要通過中間層用上大模型，其實門檻還挺高的，那么如何降低整個門檻，在各行各業(yè)中去落地。

二是，怎么把開源生態(tài)團結(jié)起來。

三是，學(xué)術(shù)上，除了清華實驗室的老師，還要讓更多高校的老師參與進來。

團結(jié)一切力量，把蛋糕做大，這是智譜的一個規(guī)劃。

AI科技評論：您對開源怎么看？

劉江：之前我有一個觀察，開源實際上是一種以副價格推廣產(chǎn)品的方式，就是我們收錢，而且我還送代碼。所以它的目的其實是占領(lǐng)用戶，至少讓更多人知道你，熟悉你的一個方式。

開源就是一種技術(shù)實力的驗證，技術(shù)實力一定要強。某種意義上可以說只要敢開源，至少它還有一定的技術(shù)底氣的。就像智譜最新的6B就是技術(shù)實力的證明。

AI科技評論：您覺得開源面臨哪些阻力？

劉江：在歐美技術(shù)公司，開源也是一種主流打法，但在中國，開源的商業(yè)模式還沒有被驗證?，F(xiàn)在大模型領(lǐng)域，大家都是開一個小的版本，然后靠更大的版本來變現(xiàn)。

AI科技評論：智譜在B端、C端有什么規(guī)劃？

劉江：C端肯定不能放棄，這會是一場硬仗，可能最后最重要的戰(zhàn)場還是聚集在C端，所以未來智譜的挑戰(zhàn)很大。放長遠(yuǎn)來看，在中國B端、C端都有很大的機會，智譜現(xiàn)在B端有優(yōu)勢，創(chuàng)業(yè)公司做C端可能有優(yōu)勢，但都沒那么厲害，沒那么扎實。所以大家都有機會。

AI科技評論：對比一眾大模型公司，智譜的優(yōu)勢是什么？

劉江：人才和研發(fā)、組織模式特殊，這是很大的優(yōu)勢。

AI科技評論：怎么講？

劉江：智譜現(xiàn)在的組織方式不是大廠模式，屬于產(chǎn)學(xué)研，能很好地發(fā)揮清華的優(yōu)勢。因為本質(zhì)上大模型的科研屬性依然非常強。

AI科技評論：整個行業(yè)本質(zhì)上還是比拼什么？

劉江：大模型這件事是重資產(chǎn)，燒錢，根本上還是一個科研項目，雖然現(xiàn)在有很多企業(yè)參與進來，但最后還是要拼技術(shù)實力、看哪個團隊能把AGI干成了，其他商業(yè)化都是副產(chǎn)品。

AI科技評論：您覺得未來大模型領(lǐng)域的一個關(guān)鍵節(jié)點是什么？

劉江：現(xiàn)在主要看誰能趕上或者超過GPT4。很有可能很多人都過不去，因為我觀察的一個細(xì)節(jié)就是 Llama 當(dāng)時做出來以后，其實它在一些指標(biāo)上也接近 3.5 了，那么 Llama 2 立項的時候他們肯定是想一定要超過 GPT-3.5 的，但實際上最后沒做到。所以大模型技術(shù)門檻還是很高。這對國內(nèi)很多團隊都是一個考驗。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

張進

主筆

發(fā)私信

當(dāng)月熱門文章

獨家對話智譜高管：開源的大模型越來越多，但智譜不著急

獨家對話智譜高管：開源的大模型越來越多，但智譜不著急