0
作為 AI 世界的領(lǐng)頭羊,OpenAI 發(fā)布的 SearchGPT 再次給 AI 搜索加了一把火。
這把火原本由 Perplexity 引燃,在美國燒及 Google 和微軟,在中國引發(fā)了百度、360 的追隨,又帶動一批創(chuàng)業(yè)者跟上,已然成為當(dāng)下最時髦的熱詞。如果大模型之爭能夠被稱為百模大戰(zhàn)的話,那么 AI 搜索之爭,就可以步其后塵,稱之為“百搜大戰(zhàn)”了。
在這場競賽中,AI 搜索和搜索引擎的區(qū)別涇渭分明:
Perplexity 類產(chǎn)品的橫空出世,對于搜索引擎似乎已經(jīng)形成了莫大的威脅。對于大廠派而言,內(nèi)部的組織慣性、競價排名商業(yè)模式帶來的變革阻力,以及用戶流失到新的 AI 搜索產(chǎn)品上,成為了他們不被看好的幾個話題點。
但在與多家公司交流后,雷峰網(wǎng)認(rèn)為,AI 搜索是產(chǎn)品驅(qū)動的先鋒,但搜索引擎也決不是被動挨打的對象。
勝也推理,敗也推理
提及 AI 搜索,第一印象,當(dāng)然是 Perplexity 所自稱的“我們不是AI搜索,我們是答案引擎”的自信。用戶提出問題,對話框下面直接給出答案,而且還提供了引用來源,給出聯(lián)想問題,與用戶形成進一步的延伸互動。
許多人都對這一問題百思不得其解:AI 搜索有何特殊之處?為什么不管是像 Perplexity 這樣的創(chuàng)業(yè)公司,還是夸克這種原本做傳統(tǒng)搜索引擎的公司,都將 AI 搜索視作新目標(biāo)?
首先,AI 搜索引擎做到了傳統(tǒng)搜索引擎所不能做到的事情——更加智能。
用戶使用搜索引擎是為了滿足自己的求知需求,每問出一個問題,都希望得到一個明確而具體的答案,而不是傳統(tǒng)搜索引擎所給出的相關(guān)文檔、網(wǎng)頁鏈接等。只是在技術(shù)條件達不到的時代,退而求其次,接受搜索引擎將大量網(wǎng)頁送到面前,供我們挑選最滿意的結(jié)果。
但挑選畢竟效率低下。而且用戶的需求,不一定恰好有網(wǎng)頁可以滿足。大模型的出現(xiàn)改變了這一切。
相較于搜索引擎,Perplexity 創(chuàng)始人 Aravind Srinivas更愿意將其描述為一個“答案引擎”——當(dāng)用戶提出問題,它會給出一個簡潔、明確的答案,且所有的答案都標(biāo)明了來源。
之所以做出這樣的產(chǎn)品,是因為Aravind Srinivas認(rèn)為,當(dāng)前世界中存在海量信息,在信息過載的噪音中,需要有一個平臺來為用戶提供精準(zhǔn)答案。他信奉Google創(chuàng)始人拉里佩奇的一句產(chǎn)品哲學(xué)——在人機交互的過程中,用戶永遠不會犯錯。
在我們的調(diào)研中,不少業(yè)界人士都向雷峰網(wǎng)表示,目前 Perplexity 被認(rèn)為是美國大模型 ToC 產(chǎn)品中最好用的兩款產(chǎn)品之一,另一個是 Character.AI。
國內(nèi)的 AI 搜索類產(chǎn)品,比如秘塔科技、Kimi 等,本質(zhì)上也是直接通過對話形式給出答案,填補的是傳統(tǒng)搜索引擎搜索結(jié)果相關(guān)度不高、專業(yè)知識難以尋找、無法圍繞一個問題進行探討的缺陷。
搜索引擎的 AI 化,則是在原有搜索結(jié)果的基礎(chǔ)上,增加了一部分通過模型能力生成的答案。百度、夸克都是這種做法,在某些搜索場景中,將生成式答案置頂,后面接續(xù)原有的搜索結(jié)果。
這兩者的區(qū)別是,無論是秘塔還是Kimi,所有的答案都是完全基于大模型技術(shù)原生出來的內(nèi)容。而加入大模型技術(shù)的搜索引擎,將搜索詞(query)分為兩類,一類是可以從網(wǎng)上得到標(biāo)準(zhǔn)答案和足夠內(nèi)容的搜索詞,一類是可能包含有進一步需求、無法被網(wǎng)上現(xiàn)有內(nèi)容滿足的搜索詞。
比如用 Kimi 和夸克同時輸入“地球直徑”這個搜索詞,得到的結(jié)果是這樣的:
Kimi 是完全通過推理生成得到的答案,夸克則直接引用了百科的答案。
如果輸入變?yōu)椤暗厍蛑睆绞嵌嗌佟保玫降慕Y(jié)果也發(fā)生了變化:
夸克通過對搜索詞分析,判斷這兩次搜索時的實際需求是不一樣的,前者可能只是想了解一個數(shù)值,后者可能是想要更多的詳細知識。
推理計算是有成本的,尤其是面臨著 C 端用戶不可計數(shù)的需求時,這個成本就很可觀了。假設(shè)推理成本降低到百分之一,搜索需求增長到一千倍,那這個成本還是要增加為原來的十倍。
搜索引擎的優(yōu)勢就是,他們已經(jīng)積攢了大量的搜索數(shù)據(jù),對用戶的需求有了分析和分類,所以他們能夠降低這個成本。這是傳統(tǒng)搜索引擎多年的布局,新入局的AI搜索工具目前還無法跨越。
AI 搜索是“0”,搜索引擎是“1”
AI 搜索沒有門檻。Perplexity 被稱為“套殼產(chǎn)品”,因為它的推理能力來自于 ChatGPT,搜索能力則是靠接入 Google 和 Bing 的 API 來實現(xiàn)的。
蜂擁而至的同類產(chǎn)品在證明,這里確實誰都能來摻合一把。大模型時代的這些新公司,要走的是一條從零到一的道路。他們沒有用戶,沒有數(shù)據(jù),既沒有搜索歷史的負(fù)擔(dān),也沒有搜索歷史的積累優(yōu)勢,想要突出重圍,只能另尋辦法。
既然技術(shù)上找不到差異,那么那些在產(chǎn)品上有獨到思維和差異化能力的,如 Perplexity 的一句話搜索、Kimi 的長文本總結(jié)能力等,才能跟其他產(chǎn)品產(chǎn)生用戶心智上的差異,讓用戶記住,爭取到一定的生存空間。其他的產(chǎn)品,如果產(chǎn)品的特征仍然是聚焦在類 GPT-4 的對話答案生成中,是沒有競爭力的。
與初創(chuàng)企業(yè)或是傳統(tǒng)搜索廠商不同的是,秘塔科技主要是靠做法律起家。
一位接觸秘塔科技的投資人形容秘塔AI搜索是“一個神奇的項目”,原本秘塔所在的法律賽道就算做透了也就只有一兩個億的收入,并不被看好。融資過程中碰壁的秘塔認(rèn)清這一點后,開始尋找新出路,由于秘塔的能力在于知識整理與搜索,這其實與AI搜索一脈相承,于是團隊轉(zhuǎn)向搜索,推出秘塔AI搜索,沒想到踩中了風(fēng)口,一炮而紅。
傳統(tǒng)的搜索公司,產(chǎn)品形態(tài)早已經(jīng)穩(wěn)定下來,這阻礙了他們的產(chǎn)品進化和創(chuàng)新。
但是從另一面來說,這些歷史包袱帶來的也不僅僅是阻礙,還有一些寶貴的財富。傳統(tǒng)搜索公司的長處不在于產(chǎn)品,而在于他們的歷史數(shù)據(jù)。比如從前文所述的搜索案例中,他們可以通過不同的關(guān)鍵詞來預(yù)測用戶真實的需求;或者通過一個用戶的搜索數(shù)據(jù)和使用歷史,去建立用戶的個性化標(biāo)簽,了解用戶想要什么。
此外,大模型的技術(shù)特點是“預(yù)訓(xùn)練”,即擅長記憶與背誦。AI搜索產(chǎn)品如 Perplexity、Kimi 都會遇到 1 個問題,就是 Perplexity 的一句話搜索會吸引的用戶也是習(xí)慣用一句話搜索的用戶,而無法吸引長文本分析搜索的專業(yè)用戶,Kimi 也會更吸引長文本用戶,但對有更多搜索需求的用戶吸引力可能不大,造成用戶繭房的現(xiàn)象。
了解用戶、提升結(jié)果的精準(zhǔn)度,搜索引擎在 AI 時代是跑在前頭的。Perplexity 或者是 Kimi,這些新玩家暫時還沒有這樣的能力。
StatCounter 數(shù)據(jù)顯示,2024 年 1 月,微軟搜索市場份額為 3.43%,Google 搜索為 91.46%,而去年同期,兩者分別占 3.03%、92.9%,微弱的增長并沒有達到微軟預(yù)期,Google 霸主地位依然穩(wěn)固。
谷歌也在伺機反擊。
去年 5 月,谷歌內(nèi)測開放生成式搜索平臺 SGE,今年 5 月,又添加可生成摘要呈現(xiàn)在搜索結(jié)果頂部的新功能——AI Overviews。對此,谷歌搜索副總裁 Liz Reid 的解釋是,“有時你想要一個快速的答案,但并沒有時間去拼湊出所需要的所有信息,那么通過 AI Overviews 就可以幫你完成任務(wù)。”
但一位投資人告訴雷峰網(wǎng),他認(rèn)為谷歌對 Perplexity 的反擊似乎有些“敷衍”,只是將 Gemini 集成到搜索引擎中,添加些許 AI 功能,但使用時和傳統(tǒng)谷歌搜索并沒太大區(qū)別。
Perplexity 的一頓拳打腳踢也引起了非搜索領(lǐng)域廠商的興趣。今年 4 月,有報道稱蘋果想要將 Perplexity 收入麾下,為下一代蘋果旗艦手機做準(zhǔn)備,不過也有業(yè)內(nèi)人士分析稱,Perplexity 現(xiàn)在更可能的買家是 Meta 和 Amazon。
技術(shù)驅(qū)動與用戶驅(qū)動
雖然初創(chuàng)企業(yè)、傳統(tǒng)搜索廠商紛紛爭相入局做AI搜索,但在整體的探索路徑上,大致可以概括為兩種流派,一種是聊天機器人式AI問答搜索引擎,另一種是基于傳統(tǒng)搜索引擎的對話框升級。
AI 搜索新生代中,又分為兩類,一類是如 kimi 般“先技術(shù)后產(chǎn)品”,一類是如 Perplexity 般“先產(chǎn)品后技術(shù)”。
在技術(shù)上,Perplexity走的是典型的“先做產(chǎn)品再做技術(shù)”路線,Aravind Srinivas曾豪言“擁有十萬用戶的套殼產(chǎn)品,比擁有自有模型卻沒有用戶更有意義。”,所以Perplexity的“套殼”之說甚囂塵上,引發(fā)業(yè)界臧否。其實Perplexity確實使用的是第三方模型,但團隊也在調(diào)用大模型時基于產(chǎn)品需求做微調(diào),并打造出更適合需求的模型。
據(jù)了解,Perplexity模型用到的大模型有 Mistral AI 的 mistral 系列,以及 Meta 的 llama 系列等,并基于 mistral-7b、llama2-70b進行微調(diào),打造出兩款自己的大模型:pplx-7b-online 和 pplx-70b-online。
而除了大模型,Perplexity 的核心技術(shù)還包括傳統(tǒng)的 RAG(檢索增強生成技術(shù)),通過增強現(xiàn)有生成模型,使其能夠訪問外部信息源,提高答案的準(zhǔn)確性和可靠性。這項技術(shù)的使用,確保了 Perplexity 在處理用戶問題時,能夠?qū)崟r搜索互聯(lián)網(wǎng)并提供準(zhǔn)確的最新信息,同時附加可靠來源引用。
而傳統(tǒng)搜索引擎代表往往具有強烈的用戶驅(qū)動意識,如夸克搜索。
傳統(tǒng)的搜索引擎,更像是在用戶的需求中不斷“縫縫補補”。推薦引擎時代來了,要加上推薦引擎,所以手機百度的首頁上,要出現(xiàn)文章feed流。大模型時代來了,要加上 AI 能力,所以就要在搜索結(jié)果上面加上生成式的內(nèi)容。
新的技術(shù)變革再出現(xiàn)后,搜索引擎還會有新的變化,至于這些變化能不能跟之前的功能相結(jié)合,會不會消弭掉產(chǎn)品的特色,可能他們自身也沒有想清楚。
AI 搜索是技術(shù)驅(qū)動的產(chǎn)品,意味著更大的想象空間,有望催生更多更有趣的 AI native 應(yīng)用。而用戶驅(qū)動的產(chǎn)品或許有著更大的確定性,但是想象空間呢?沒人知道。
另一個更關(guān)鍵的問題是,在用戶認(rèn)知與市場圈地下,AI 搜索的商業(yè)化前景如何?
多位穿越互聯(lián)網(wǎng)周期的業(yè)內(nèi)人士告訴雷峰網(wǎng)(公眾號:雷峰網(wǎng)),他們認(rèn)為:互聯(lián)網(wǎng)時代,由谷歌開啟、字節(jié)抖音達到巔峰的依靠流量賣廣告的商業(yè)模式已經(jīng)成為歷史,AI 時代的蛋糕要有新的模式誕生。而 AI 搜索如未能擺脫過去的產(chǎn)品認(rèn)知,也無法成為新時代最大的商業(yè)飛地。
所以,技術(shù)驅(qū)動誕生的 AI 搜索,在產(chǎn)品形態(tài)創(chuàng)新與用戶開拓的雙重擠壓下,仍面臨較大的不確定性。
結(jié)語
AI 搜索公司缺乏經(jīng)驗和數(shù)據(jù)積累,但他們有更大的想象空間,能夠源源不斷帶來創(chuàng)新的功能和應(yīng)用。
傳統(tǒng)搜索公司在產(chǎn)品創(chuàng)新與技術(shù)實力上略有遜色,但他們有豐富的搜索數(shù)據(jù)與用戶習(xí)慣認(rèn)知,了解用戶想要什么。
但是在短時間內(nèi),我們認(rèn)為,Perplexity 是很難替代谷歌的,Kimi 和秘塔也是很難取代百度和夸克的??淇诉@樣的搜索引擎可以重新訓(xùn)練了一個全棧自研、千億參數(shù)的夸克大模型,建立底層的分布式架構(gòu),專門為搜索產(chǎn)品服務(wù)。他們瞄準(zhǔn)的用戶是傳統(tǒng)的、仍然有 80% 的需求是確定性答案的搜索用戶。而 Perplexity、Kimi 等公司現(xiàn)在要做的,是從傳統(tǒng)搜索引擎所無法覆蓋的 20% 的市場份額中搶蛋糕。而這個蛋糕,Google 他們也在搶。
鹿死誰手,尚未可知。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。