0
本文作者: Nemo | 2025-06-16 17:22 |
AI要用起來,“最后一公里”的問題是老生常談。
用AI重做千行百業(yè),交付是重中之重:都知道,用戶找PPT模板,不只為模板,而是為了產(chǎn)出工作、學(xué)習(xí)用的PPT;用戶拍照,不只為拍照,而是為了記錄、修圖、發(fā)朋友圈;用戶掃描文件,不只為掃描,而是為了存儲、檢查文件……
當(dāng)下的AI賽道,人們早就發(fā)現(xiàn)了“最后一公里”的重要性,誰能一站式地用AI為用戶完成更多的需求,誰就能更早用AI實(shí)現(xiàn)“超級生產(chǎn)力”,占上AI“超級入口”的山頭。
道理都懂,但要走好這“最后一公里”,今天卻還有許多阻礙。
一個(gè),是當(dāng)下紛繁復(fù)雜、功能各異的AI能力、智能體缺乏整合。
用戶想要把AI用好,就不得不在各個(gè)產(chǎn)品、平臺之間來回切換,消費(fèi)—?jiǎng)?chuàng)作—再創(chuàng)作的各個(gè)環(huán)節(jié)被繁多的壁壘所割裂。
另一個(gè),是現(xiàn)有不少AI產(chǎn)品,完成交付能力仍然存在瓶頸。
用戶對交付的需求,往往既有圖文、又有PPT、圖表、音視頻等多模態(tài)格式,甚至是上述諸多形式的組合。而大部分的AI產(chǎn)品,給用戶交付的要么只有干癟的文字,要么就是一些半成品,還需要用戶重新進(jìn)入Ps、Pr等工具中再次編輯。
怎么解決這兩大痛點(diǎn),百度文庫和網(wǎng)盤是有想法的。
AI要無所不能、無處不在,關(guān)鍵不僅要AI更聰明、更能干活,還得要多個(gè)智能體可以協(xié)同解決問題,給用戶更完整的交付。
其中的重中之重,用三個(gè)字概括,就是“全模態(tài)”。
4月25日,在百度Create 2025大會上,文庫和網(wǎng)盤雙劍合璧,首發(fā)了“滄舟OS”——一個(gè)可以實(shí)現(xiàn)全模態(tài)輸入—處理—輸出的AI技術(shù)底座。
輸入層,文庫網(wǎng)盤支持全模態(tài)輸入,無論從什么設(shè)備、什么客戶端,用戶都可以向大模型輸入文字、語音、圖片視頻、Html等多種模態(tài)的內(nèi)容,省去一步格式轉(zhuǎn)化的操作,就大幅降低了使用大模型的復(fù)雜度,讓用戶體驗(yàn)提升了一個(gè)量級。
百度文庫和網(wǎng)盤的全模態(tài)輸入,值得多提一句。百度副總裁,文庫事業(yè)部、網(wǎng)盤事業(yè)部負(fù)責(zé)人 王穎提到,要做好全模態(tài)的輸入,讓用戶和AI的交互能不受文件模態(tài)、格式的限制,百度是早有預(yù)謀。
“過去,AI鍵盤我們一直在做,AI麥克風(fēng)我們也完成了一部分;今年,我們最主要的工作,是完成了百度網(wǎng)盤的AI相機(jī)——這樣,文字、語音、圖像、視頻幾個(gè)大模塊的全模態(tài)輸入基本就做完了?!蓖醴f如是說道。
處理層,滄舟OS有著更智能高效的調(diào)度中樞,如同指揮塔拆解任務(wù)、發(fā)號施令,旗下多智能體精誠合作、各展所長,讓AI的交付速度和效果均有提升。
文庫是圖文生產(chǎn)的起點(diǎn),工具鏈完整打通,內(nèi)容創(chuàng)作平臺的定位也就能立得住。網(wǎng)盤要做除了圖文、視頻之外的全模態(tài)生產(chǎn)和消費(fèi),比如視頻生成、混剪,網(wǎng)盤過去沒有,百度下半年也要給用戶這種能力。
AI產(chǎn)品的功能要越來越全,Agent也越來越多,MCP(模型上下文協(xié)議)以其更簡單、更通用的標(biāo)準(zhǔn),讓AI Agent介入產(chǎn)品的門檻被大大降低,成了今天AI圈的“金手指”。
文庫專精圖文處理,網(wǎng)盤則擅長視頻、圖像等富媒體處理,兩者本就互補(bǔ),要在滄舟OS上完成全模態(tài)的全流程處理,文庫和網(wǎng)盤不僅必須強(qiáng)強(qiáng)聯(lián)手,而且還要廣納天下“英才”,一起豐富滄舟OS的生態(tài)——這就不得不提到MCP。
王穎說,MCP對于百度文庫、網(wǎng)盤來說,是恰逢其時(shí):“一開始我們做產(chǎn)品的時(shí)候,用的就是MOE(混合專家模型)架構(gòu),與MCP的設(shè)計(jì)就有相似性。在設(shè)計(jì)架構(gòu)、做分層的時(shí)候,模型之間要互相通訊,我們內(nèi)部就是希望通訊可以標(biāo)準(zhǔn)化——圍繞著這個(gè)理念,我們轉(zhuǎn)向MCP十分順利?!?/p>
滄舟OS,要做到“無所不能”、就不能自己親手打磨每一個(gè)能力,這樣不僅不經(jīng)濟(jì),也不能持續(xù)擴(kuò)大規(guī)模。“我們希望更多Agent可以由行業(yè)共創(chuàng),以前共創(chuàng)沒有很好的協(xié)同機(jī)制,MCP則很好地補(bǔ)充了這一點(diǎn)?!蓖醴f解釋道。
而要做到無處不在,MCP對滄舟OS來說同樣意義重大。在不同用戶的場景中,多硬件、多App的生態(tài),給AI應(yīng)用的開發(fā)也帶來了很多麻煩。而在MCP盛行的今天,越來越多手機(jī)廠商對其的態(tài)度也越發(fā)開放,滄舟OS的場景覆蓋也就有了更多可能。
在全模態(tài)、多場景的高性能處理之外,背靠網(wǎng)盤的私域授權(quán)數(shù)據(jù),和文庫的公域?qū)I(yè)數(shù)據(jù),滄舟OS還會對用戶的使用習(xí)慣與過往使用經(jīng)歷進(jìn)行整理,為每個(gè)用戶創(chuàng)造一個(gè)專有的記憶庫,讓AI可以更懂用戶,讓人機(jī)溝通變得更容易。
“猜你喜歡”奠定了上一代互聯(lián)網(wǎng)的財(cái)富格局,而到了人機(jī)交互形式、用戶需求更多樣、更深層次的大模型時(shí)代,AI要怎樣理解用戶,從而才能真正“想用戶所想”呢?
AI對用戶使用習(xí)慣的記憶,和人腦本身的記憶方式差不多。
百度文庫產(chǎn)品負(fù)責(zé)人鐘昊介紹,他們AI記憶庫中的記憶可以分為三層:
短時(shí)記憶,對應(yīng)AI的上下文記憶;
長期記憶,對應(yīng)用戶在文庫、網(wǎng)盤上的存儲、下載、搜索、使用記錄,在授權(quán)下被整理成用戶專屬的長時(shí)、全模態(tài)記憶庫;
抽象記憶,對應(yīng)技術(shù)側(cè)和產(chǎn)品側(cè),百度對用戶交互模式的解析和調(diào)優(yōu)。
“過去,我們的算法推薦是基于群體的角度來看待用戶,于是才有了使用標(biāo)簽、畫像去給用戶歸類的操作。
“今天,我們對用戶的理解更個(gè)人,每個(gè)人都有自己的記憶庫,甚至我們未來有計(jì)劃把這個(gè)記憶庫顯性化,讓用戶自己編輯和調(diào)整,這是很大的不同?!辩婈徽f道。
談完了處理層,輸出層,滄舟OS也支持端到端的完整交付,輸出的內(nèi)容格式同樣支持全模態(tài),能夠涵蓋工作學(xué)習(xí)、生活?yuàn)蕵返榷喾N場景,幫助用戶滿足更多元的需求。
全模態(tài)的系統(tǒng)化完整交付能力,對于AI產(chǎn)品有多大的價(jià)值?王穎如此解答道:
“隨著Agent、場景、能力在市場上越變越多,我們不希望用戶浪費(fèi)大量時(shí)間,在各種產(chǎn)品上跳來跳去。本質(zhì)上,我們希望用戶能夠不用換場景,能在滄舟OS的操作系統(tǒng)里,迅速得到解決方案。”
要支撐滄舟OS,技術(shù)才是最底層的能力保證。剛剛過去的Create大會,文庫和網(wǎng)盤本就吸睛無數(shù);一個(gè)多月過去,百度的“雙子星”還在給市場和用戶帶來全新的驚喜。
剛剛提到的“AI相機(jī)”,是百度網(wǎng)盤新上的重點(diǎn)能力。
市面上,AI相機(jī)類的產(chǎn)品,自從妙鴨相機(jī)之后就層出不窮,不少中廠大廠也紛紛入局,引得市場好不熱鬧,好不擁擠——百度網(wǎng)盤的AI相機(jī),牛X在哪?
首先,背靠網(wǎng)盤,百度網(wǎng)盤的AI相機(jī)天然擁有存儲功能,殺死了傳統(tǒng)手機(jī)相機(jī)“存儲空間不足”帶來的兩難境地——“刪”和“不刪”再也不成問題——也同樣簡化了拍照后上傳的步驟,一鍵拍攝,直傳云端。
其次,網(wǎng)盤的AI相機(jī),特點(diǎn)在于“全”。
全,不僅指網(wǎng)盤AI相機(jī)的功能全,智能美顏、風(fēng)格濾鏡、掃描文檔、物品識別、試題整理、合同審核等等實(shí)用功能一應(yīng)俱全;全,也是網(wǎng)盤AI相機(jī)覆蓋了圖像拍攝、處理的全流程,拍照、修圖、存儲、使用、管理、分享可以一站式完成,甚至還能打印到家,省去了用戶在多個(gè)產(chǎn)品、平臺上的“反復(fù)橫跳”。
如此“全能”,才能配得上網(wǎng)盤心中“全場景、可沖印、能回憶”的“真·AI相機(jī)”。
百度網(wǎng)盤的AI相機(jī)之外,百度文庫的“超能搭子”GenFlow也在近期正式公布了2.0版本的升級。
市場最關(guān)心的,是GenFlow僅僅發(fā)布了一個(gè)月,百度怎么如此迅速地更新了2.0版本?
先揭曉答案:為了提升交付的質(zhì)量和速度,GenFlow2.0完成的是產(chǎn)品底層架構(gòu)的全面升級。
對當(dāng)下的AI產(chǎn)品、工作流,用戶有哪些訴求?百度文庫產(chǎn)品負(fù)責(zé)人鐘昊收集了不少,他說:
“有用戶反饋,做一個(gè)研究報(bào)告半個(gè)多小時(shí),AI還卡在收集信息那兒;AI對著年中總結(jié)輸出,憋了兩個(gè)小時(shí),最后生成失敗了;還有一個(gè)朋友是深度AI工具收集,自己收藏了幾十個(gè)工具,大部分都在吃灰,偶爾在用的就是普通的大模型或者是代碼工具?!?/p>
“需求描述難”“交付結(jié)果差”“等待時(shí)間長”,共同組成了AI生產(chǎn)力交付的“三座大山”。
為了讓GenFlow更懂用戶,解決用戶描述需求的困難,百度把剛剛提到的用戶記憶庫能力,植入到了GenFlow當(dāng)中,讓用戶可以根據(jù)自己過往的使用經(jīng)歷與AI交流(比如用自己小朋友的照片定制生成繪本),讓人機(jī)交流“心有靈犀”。
提升交付效果上,前面提到的全模態(tài)處理、輸出的能力,GenFlow也全都用上了,鐘昊舉例,一個(gè)物理老師想要為學(xué)生備課,不僅需要整理教案、測驗(yàn)、PPT,甚至還想要一個(gè)可以實(shí)時(shí)互動(dòng)的Html課件。用上GenFlow,這些在百度文庫,全都可以一鍵生成。
而要生成這么多內(nèi)容,AI自古“保質(zhì)保量不能兩全”——時(shí)間問題怎么破?百度文庫還有黑科技。
一直以來,AI的思考結(jié)構(gòu)都是“串型結(jié)構(gòu)”,和人腦一樣,一次只能完成一件任務(wù),思維是“線性的”。一旦如此,任務(wù)就必須排隊(duì)——一排隊(duì),效率肯定就高不了。
這次百度文庫GenFlow2.0的架構(gòu)升級,主要就升級在這里:類似人腦多任務(wù)處理的方式,GenFlow也可以在任務(wù)的隊(duì)列里,高速地掃過多個(gè)任務(wù),像一個(gè)掃描儀,在高速的信號切換當(dāng)中,保證多任務(wù)的并發(fā)。
也是如此,剛剛提到的,物理老師的數(shù)種教輔材料,用上GenFlow,可以完成分鐘級交付,把不可用的AI,變成了實(shí)打?qū)嵉纳a(chǎn)力。
結(jié)語:
老面孔,新朋友。百度文庫和網(wǎng)盤,這對“雙子星”的AI重構(gòu)之路,放眼行業(yè),走得也相當(dāng)靠前。
“從文庫網(wǎng)盤的視角來看,在AI領(lǐng)域,我們要去做先鋒的地位,”王穎如是說道,“希望我們能夠有幸走出一條自己想走的路?!?/p>
在先進(jìn)AI能力的加持下,文庫AI月活用戶則達(dá)到了9700萬;網(wǎng)盤在服務(wù)超10億用戶基礎(chǔ)上,AI月活用戶也超過了8000萬。
大量的用戶選擇文庫和網(wǎng)盤,作為他們今天AI生活的有力幫手,道理其實(shí)很簡單:這兩款產(chǎn)品,能用AI實(shí)打?qū)嵉亟鉀Q他們遇到的問題,幫他們走完了AI交付的“最后一公里”。
AI內(nèi)容創(chuàng)作,文庫和網(wǎng)盤可以做到全模態(tài)高質(zhì)量輸出;內(nèi)容消費(fèi),兩款產(chǎn)品同樣背靠巨大用戶基礎(chǔ),有著成熟的社交潛質(zhì);個(gè)人定制的知識庫,更是在技術(shù)產(chǎn)品的領(lǐng)域領(lǐng)先行業(yè),把用戶體驗(yàn)又拔高了一個(gè)層次。
當(dāng)下正火的深度思考,本身其實(shí)并不創(chuàng)造價(jià)值——能夠走完交付的“最后一公里”,才是成為一款國民級“AI超級生產(chǎn)力”的必要條件。
一騎絕塵的百度文庫和百度網(wǎng)盤,則正在用他們強(qiáng)大的交付能力,旗幟鮮明地告訴全世界:
“用AI,來文庫網(wǎng)盤就夠了。”
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。