0
本文作者: Nemo | 2025-06-16 17:22 |
AI要用起來,“最后一公里”的問題是老生常談。
用AI重做千行百業(yè),交付是重中之重:都知道,用戶找PPT模板,不只為模板,而是為了產(chǎn)出工作、學習用的PPT;用戶拍照,不只為拍照,而是為了記錄、修圖、發(fā)朋友圈;用戶掃描文件,不只為掃描,而是為了存儲、檢查文件……
當下的AI賽道,人們早就發(fā)現(xiàn)了“最后一公里”的重要性,誰能一站式地用AI為用戶完成更多的需求,誰就能更早用AI實現(xiàn)“超級生產(chǎn)力”,占上AI“超級入口”的山頭。
道理都懂,但要走好這“最后一公里”,今天卻還有許多阻礙。
一個,是當下紛繁復雜、功能各異的AI能力、智能體缺乏整合。
用戶想要把AI用好,就不得不在各個產(chǎn)品、平臺之間來回切換,消費—創(chuàng)作—再創(chuàng)作的各個環(huán)節(jié)被繁多的壁壘所割裂。
另一個,是現(xiàn)有不少AI產(chǎn)品,完成交付能力仍然存在瓶頸。
用戶對交付的需求,往往既有圖文、又有PPT、圖表、音視頻等多模態(tài)格式,甚至是上述諸多形式的組合。而大部分的AI產(chǎn)品,給用戶交付的要么只有干癟的文字,要么就是一些半成品,還需要用戶重新進入Ps、Pr等工具中再次編輯。
怎么解決這兩大痛點,百度文庫和網(wǎng)盤是有想法的。
AI要無所不能、無處不在,關鍵不僅要AI更聰明、更能干活,還得要多個智能體可以協(xié)同解決問題,給用戶更完整的交付。
其中的重中之重,用三個字概括,就是“全模態(tài)”。
4月25日,在百度Create 2025大會上,文庫和網(wǎng)盤雙劍合璧,首發(fā)了“滄舟OS”——一個可以實現(xiàn)全模態(tài)輸入—處理—輸出的AI技術底座。
輸入層,文庫網(wǎng)盤支持全模態(tài)輸入,無論從什么設備、什么客戶端,用戶都可以向大模型輸入文字、語音、圖片視頻、Html等多種模態(tài)的內(nèi)容,省去一步格式轉(zhuǎn)化的操作,就大幅降低了使用大模型的復雜度,讓用戶體驗提升了一個量級。
百度文庫和網(wǎng)盤的全模態(tài)輸入,值得多提一句。百度副總裁,文庫事業(yè)部、網(wǎng)盤事業(yè)部負責人 王穎提到,要做好全模態(tài)的輸入,讓用戶和AI的交互能不受文件模態(tài)、格式的限制,百度是早有預謀。
“過去,AI鍵盤我們一直在做,AI麥克風我們也完成了一部分;今年,我們最主要的工作,是完成了百度網(wǎng)盤的AI相機——這樣,文字、語音、圖像、視頻幾個大模塊的全模態(tài)輸入基本就做完了?!蓖醴f如是說道。
處理層,滄舟OS有著更智能高效的調(diào)度中樞,如同指揮塔拆解任務、發(fā)號施令,旗下多智能體精誠合作、各展所長,讓AI的交付速度和效果均有提升。
文庫是圖文生產(chǎn)的起點,工具鏈完整打通,內(nèi)容創(chuàng)作平臺的定位也就能立得住。網(wǎng)盤要做除了圖文、視頻之外的全模態(tài)生產(chǎn)和消費,比如視頻生成、混剪,網(wǎng)盤過去沒有,百度下半年也要給用戶這種能力。
AI產(chǎn)品的功能要越來越全,Agent也越來越多,MCP(模型上下文協(xié)議)以其更簡單、更通用的標準,讓AI Agent介入產(chǎn)品的門檻被大大降低,成了今天AI圈的“金手指”。
文庫專精圖文處理,網(wǎng)盤則擅長視頻、圖像等富媒體處理,兩者本就互補,要在滄舟OS上完成全模態(tài)的全流程處理,文庫和網(wǎng)盤不僅必須強強聯(lián)手,而且還要廣納天下“英才”,一起豐富滄舟OS的生態(tài)——這就不得不提到MCP。
王穎說,MCP對于百度文庫、網(wǎng)盤來說,是恰逢其時:“一開始我們做產(chǎn)品的時候,用的就是MOE(混合專家模型)架構(gòu),與MCP的設計就有相似性。在設計架構(gòu)、做分層的時候,模型之間要互相通訊,我們內(nèi)部就是希望通訊可以標準化——圍繞著這個理念,我們轉(zhuǎn)向MCP十分順利?!?/p>
滄舟OS,要做到“無所不能”、就不能自己親手打磨每一個能力,這樣不僅不經(jīng)濟,也不能持續(xù)擴大規(guī)模?!拔覀兿M郃gent可以由行業(yè)共創(chuàng),以前共創(chuàng)沒有很好的協(xié)同機制,MCP則很好地補充了這一點?!蓖醴f解釋道。
而要做到無處不在,MCP對滄舟OS來說同樣意義重大。在不同用戶的場景中,多硬件、多App的生態(tài),給AI應用的開發(fā)也帶來了很多麻煩。而在MCP盛行的今天,越來越多手機廠商對其的態(tài)度也越發(fā)開放,滄舟OS的場景覆蓋也就有了更多可能。
在全模態(tài)、多場景的高性能處理之外,背靠網(wǎng)盤的私域授權數(shù)據(jù),和文庫的公域?qū)I(yè)數(shù)據(jù),滄舟OS還會對用戶的使用習慣與過往使用經(jīng)歷進行整理,為每個用戶創(chuàng)造一個專有的記憶庫,讓AI可以更懂用戶,讓人機溝通變得更容易。
“猜你喜歡”奠定了上一代互聯(lián)網(wǎng)的財富格局,而到了人機交互形式、用戶需求更多樣、更深層次的大模型時代,AI要怎樣理解用戶,從而才能真正“想用戶所想”呢?
AI對用戶使用習慣的記憶,和人腦本身的記憶方式差不多。
百度文庫產(chǎn)品負責人鐘昊介紹,他們AI記憶庫中的記憶可以分為三層:
短時記憶,對應AI的上下文記憶;
長期記憶,對應用戶在文庫、網(wǎng)盤上的存儲、下載、搜索、使用記錄,在授權下被整理成用戶專屬的長時、全模態(tài)記憶庫;
抽象記憶,對應技術側(cè)和產(chǎn)品側(cè),百度對用戶交互模式的解析和調(diào)優(yōu)。
“過去,我們的算法推薦是基于群體的角度來看待用戶,于是才有了使用標簽、畫像去給用戶歸類的操作。
“今天,我們對用戶的理解更個人,每個人都有自己的記憶庫,甚至我們未來有計劃把這個記憶庫顯性化,讓用戶自己編輯和調(diào)整,這是很大的不同。”鐘昊說道。
談完了處理層,輸出層,滄舟OS也支持端到端的完整交付,輸出的內(nèi)容格式同樣支持全模態(tài),能夠涵蓋工作學習、生活娛樂等多種場景,幫助用戶滿足更多元的需求。
全模態(tài)的系統(tǒng)化完整交付能力,對于AI產(chǎn)品有多大的價值?王穎如此解答道:
“隨著Agent、場景、能力在市場上越變越多,我們不希望用戶浪費大量時間,在各種產(chǎn)品上跳來跳去。本質(zhì)上,我們希望用戶能夠不用換場景,能在滄舟OS的操作系統(tǒng)里,迅速得到解決方案?!?/p>
要支撐滄舟OS,技術才是最底層的能力保證。剛剛過去的Create大會,文庫和網(wǎng)盤本就吸睛無數(shù);一個多月過去,百度的“雙子星”還在給市場和用戶帶來全新的驚喜。
剛剛提到的“AI相機”,是百度網(wǎng)盤新上的重點能力。
市面上,AI相機類的產(chǎn)品,自從妙鴨相機之后就層出不窮,不少中廠大廠也紛紛入局,引得市場好不熱鬧,好不擁擠——百度網(wǎng)盤的AI相機,牛X在哪?
首先,背靠網(wǎng)盤,百度網(wǎng)盤的AI相機天然擁有存儲功能,殺死了傳統(tǒng)手機相機“存儲空間不足”帶來的兩難境地——“刪”和“不刪”再也不成問題——也同樣簡化了拍照后上傳的步驟,一鍵拍攝,直傳云端。
其次,網(wǎng)盤的AI相機,特點在于“全”。
全,不僅指網(wǎng)盤AI相機的功能全,智能美顏、風格濾鏡、掃描文檔、物品識別、試題整理、合同審核等等實用功能一應俱全;全,也是網(wǎng)盤AI相機覆蓋了圖像拍攝、處理的全流程,拍照、修圖、存儲、使用、管理、分享可以一站式完成,甚至還能打印到家,省去了用戶在多個產(chǎn)品、平臺上的“反復橫跳”。
如此“全能”,才能配得上網(wǎng)盤心中“全場景、可沖印、能回憶”的“真·AI相機”。
百度網(wǎng)盤的AI相機之外,百度文庫的“超能搭子”GenFlow也在近期正式公布了2.0版本的升級。
市場最關心的,是GenFlow僅僅發(fā)布了一個月,百度怎么如此迅速地更新了2.0版本?
先揭曉答案:為了提升交付的質(zhì)量和速度,GenFlow2.0完成的是產(chǎn)品底層架構(gòu)的全面升級。
對當下的AI產(chǎn)品、工作流,用戶有哪些訴求?百度文庫產(chǎn)品負責人鐘昊收集了不少,他說:
“有用戶反饋,做一個研究報告半個多小時,AI還卡在收集信息那兒;AI對著年中總結(jié)輸出,憋了兩個小時,最后生成失敗了;還有一個朋友是深度AI工具收集,自己收藏了幾十個工具,大部分都在吃灰,偶爾在用的就是普通的大模型或者是代碼工具?!?/p>
“需求描述難”“交付結(jié)果差”“等待時間長”,共同組成了AI生產(chǎn)力交付的“三座大山”。
為了讓GenFlow更懂用戶,解決用戶描述需求的困難,百度把剛剛提到的用戶記憶庫能力,植入到了GenFlow當中,讓用戶可以根據(jù)自己過往的使用經(jīng)歷與AI交流(比如用自己小朋友的照片定制生成繪本),讓人機交流“心有靈犀”。
提升交付效果上,前面提到的全模態(tài)處理、輸出的能力,GenFlow也全都用上了,鐘昊舉例,一個物理老師想要為學生備課,不僅需要整理教案、測驗、PPT,甚至還想要一個可以實時互動的Html課件。用上GenFlow,這些在百度文庫,全都可以一鍵生成。
而要生成這么多內(nèi)容,AI自古“保質(zhì)保量不能兩全”——時間問題怎么破?百度文庫還有黑科技。
一直以來,AI的思考結(jié)構(gòu)都是“串型結(jié)構(gòu)”,和人腦一樣,一次只能完成一件任務,思維是“線性的”。一旦如此,任務就必須排隊——一排隊,效率肯定就高不了。
這次百度文庫GenFlow2.0的架構(gòu)升級,主要就升級在這里:類似人腦多任務處理的方式,GenFlow也可以在任務的隊列里,高速地掃過多個任務,像一個掃描儀,在高速的信號切換當中,保證多任務的并發(fā)。
也是如此,剛剛提到的,物理老師的數(shù)種教輔材料,用上GenFlow,可以完成分鐘級交付,把不可用的AI,變成了實打?qū)嵉纳a(chǎn)力。
結(jié)語:
老面孔,新朋友。百度文庫和網(wǎng)盤,這對“雙子星”的AI重構(gòu)之路,放眼行業(yè),走得也相當靠前。
“從文庫網(wǎng)盤的視角來看,在AI領域,我們要去做先鋒的地位,”王穎如是說道,“希望我們能夠有幸走出一條自己想走的路?!?/p>
在先進AI能力的加持下,文庫AI月活用戶則達到了9700萬;網(wǎng)盤在服務超10億用戶基礎上,AI月活用戶也超過了8000萬。
大量的用戶選擇文庫和網(wǎng)盤,作為他們今天AI生活的有力幫手,道理其實很簡單:這兩款產(chǎn)品,能用AI實打?qū)嵉亟鉀Q他們遇到的問題,幫他們走完了AI交付的“最后一公里”。
AI內(nèi)容創(chuàng)作,文庫和網(wǎng)盤可以做到全模態(tài)高質(zhì)量輸出;內(nèi)容消費,兩款產(chǎn)品同樣背靠巨大用戶基礎,有著成熟的社交潛質(zhì);個人定制的知識庫,更是在技術產(chǎn)品的領域領先行業(yè),把用戶體驗又拔高了一個層次。
當下正火的深度思考,本身其實并不創(chuàng)造價值——能夠走完交付的“最后一公里”,才是成為一款國民級“AI超級生產(chǎn)力”的必要條件。
一騎絕塵的百度文庫和百度網(wǎng)盤,則正在用他們強大的交付能力,旗幟鮮明地告訴全世界:
“用AI,來文庫網(wǎng)盤就夠了?!?/p>
雷峰網(wǎng)版權文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。