0
剛剛無縫接入文心 4.5、文心 X1 和 滿血版 DeepSeek-R1 的文小言,轉(zhuǎn)身又整出了新動作。
3 月 31 日,文小言迎來了一次全面升級,上新了多模型融合調(diào)度、全新語音大模型、圖片問答、拍題講解等多種新功能。
新功能聽起來很厲害,但實際使用效果又如何?不多贅述,AI 科技評論先替大家實測一波。
據(jù)透露,文小言目前已經(jīng)集齊了市場上的最強模型,擁有了更強大的“大腦”。
這一點體現(xiàn)在了這次升級中的多模型融合調(diào)度功能上,而所謂的融合調(diào)用,其實就是在面對不同類型的問題時,文小言可以自己選擇能夠提供最優(yōu)解的模型,從而保證用戶的使用體驗。
實測階段,我先是丟給了它幾張鸚鵡的圖片,并問它圖中鸚鵡的性別,這個問題對于我來說,難度不亞于“憑鳥腿斷品種”的難度,而文小言卻輕松回答,并且給出了判斷依據(jù)。之后我又讓資深養(yǎng)鳥發(fā)燒友也看了一遍,最終的答案和文小言給出的答案完全一致。
后續(xù)我又翻出來了兩張衣服吊牌的圖片給它,并讓它幫我分析一下圖中的衣服哪件的面料更適合徒步。緊接著的一連串的推理分析中,它不僅分析了面料的透氣性和耐磨性,甚至連吸水性都考慮了進去,有些暖心了。
除了分析衣服面料,我還把幾張護膚品的成分表扔給了文小言,讓它幫我挑一個適合敏感肌在春天使用的款式。我本以為它會把所有拗口的成分全都羅列出來分析一遍,沒想到它只是對每個產(chǎn)品的優(yōu)缺點進行了展示分析,直接明了的對比了不同產(chǎn)品可能帶來的使用效果,最后給出了明確的對比結(jié)果。簡單直接又通俗易懂。
同理,我還用它測試了一下醬油的配料表,讓它幫我挑一個健康的醬油。不出所料,分析過程十分詳細,還把每種元素的多少所對應的適應人群給分析出來了,細節(jié)拿捏的很好。
測試到這,其實我就已經(jīng)對文小言的“更強大腦”有了一些認同感,但又覺得這可能并不是極限,于是翻出了一張之前的驗血報告甩給它,讓它用大白話幫我分析一下報告中顯示的身體狀況,并給出一些后續(xù)的保養(yǎng)意見。不得不說,它最終給出的答案,確實是大白話,也確實挺準確。
除了擅長推理分析,文小言還能看圖識景,只需給它一張圖片,就能精準識別圖片中的景點,哪怕是只有一條河亦或是一座山,都能被它“一眼看穿”
更為復雜的人文風光也同樣不在話下,根據(jù)建筑風格和自然景觀輕松識別出正確答案。
除此之外,我還上傳了一張英文菜單,并命令文小言在有限的預算內(nèi),結(jié)合我的飲食習慣,幫我翻譯并規(guī)劃如何點菜。雖然最終的結(jié)果并沒有將中英文菜名一一對應展示,但給出的結(jié)果還是比較符合常理,如果真的在日常生活中使用到的話,屬于是比較好用的一個功能了。
文小言除了能化身集翻譯、預算控制為一體的點單神器外,在拍照解題方面也是一把好手,例如在解決一些簡單的數(shù)學問題上,也不再是列出冗長且較為晦澀的解題過程,而是直接亮出真人解題視頻,簡單又直接。
更會說的“嘴巴”
當然,文小言這波升級,不僅有了更強大的“大腦”,還有了更會說的“嘴巴”,即更強大的語音大模型功能。實測下來,感覺文小言的語音功能反應速度很快,而且還是個“捧哏”選手,永遠不會讓話落在地上,感覺可以和豆包有一拼了。
測語音功能時,我用的還是第一個鸚鵡分公母的問題,這次我直接用語音問它,問題前腳剛問完,僅僅過了兩秒鐘,文小言就開始侃侃而談,而且還有很多語氣助詞,很貼合日常生活中人與人之間那種對話的感覺,而且問題解答得也很透徹,還支持互動交流,體感拉滿了屬于是。
除了答得快、答得好,文小言的語音互動甚至還支持用方言回答,雖然有些語調(diào)還稍微欠缺點“人味”,但整體聽起來并沒有那么違和,方言這塊雖然讓我很驚喜,但是覺得還是有可以提升的空間。
語音這塊,還有一點讓我覺得很有意思的是,文小言竟然還是個“帶娃高手”,可以快速接收小用戶的需求并且迅速反應調(diào)整輸出的內(nèi)容。例如,當小朋友文小言講故事,但它講的故事小朋友都表示聽過的時候,文小言還能快速反應,找到更多的故事講給小朋友聽,不給他留下一點哭鬧的機會,“帶娃高手”實錘。
整體來看,文小言的語音大模型還是非常亮眼的,這一切都要歸功于百度發(fā)布的業(yè)界首個基于全新互相關注意力( Cross-Attention )端到端語音語言大模型,它在實現(xiàn)了超低時延的情況下也實現(xiàn)了超低的成本,在相關問答場景中,調(diào)用的成本比行業(yè)均值下降了50%-90%。
從目前的表現(xiàn)來看,百度在語言模型技術(shù)上已經(jīng)取得了顯著的領先優(yōu)勢,但更值得關注的是,百度的領先并不僅限于技術(shù)層面。事實上,它在應用生態(tài)和產(chǎn)業(yè)布局上也展現(xiàn)出全面的優(yōu)勢,這種多維度的突破正在重新定義行業(yè)競爭的格局。
縱觀百度近期這一系列密集的動作,不難發(fā)現(xiàn)文小言只是其中的關鍵一環(huán),而百度此番操作的內(nèi)核,實則是圍繞用戶價值精心打造并全力揮出的一套組合拳。
3 月 16 日,百度正式發(fā)布了文心大模型 4.5 及文心大模型 X1,并提供免費使用服務。在此之前,百度宣布推出文心大模型 4.5,還計劃在未來幾個月內(nèi)迅速推出文心大模型 5.0,并于 6 月 30 日起正式開源。
時間再往前倒一個月,2 月 16 日晚,百度搜索和文心智能體平臺宣布全面接入 DeepSeek 和文心大模型最新的深度搜索功能。
2 月 13 日,文小言宣布自 4 月 1 日 0 時起全面免費,使所有 PC 端和 APP 端用戶都能體驗到文心系列最新模型及其功能,如超長文檔處理、專業(yè)檢索增強、高級AI繪畫、多語種對話等。
然而,并非所有大廠都愿意接入 DeepSeek,一些大廠可能出于多方面的考慮,對是否接入DeepSeek持謹慎態(tài)度。
例如從技術(shù)競爭角度來看,部分公司可能擔心接入 DeepSeek 后,會在一定程度上削弱自身在技術(shù)方面的獨特優(yōu)勢,從而影響其在市場中的競爭力。在商業(yè)利益方面,他們也需要評估接入 DeepSeek 對其自身商業(yè)利益的影響。例如,接入 DeepSeek 后可能會改變現(xiàn)有的市場格局和競爭態(tài)勢,對公司原有的市場份額和盈利模式產(chǎn)生沖擊等。
但百度在這一戰(zhàn)略抉擇中展現(xiàn)出差異化的格局 —— 作為中文互聯(lián)網(wǎng)領域少有的具備全棧 AI 能力的企業(yè),這種底氣不僅體現(xiàn)在日均千億級真實需求的算法錘煉,更植根于二十多年中文語義理解的場景沉淀。
整體來看,在大模型的開放浪潮中,百度一直緊跟行業(yè)風向標,以自身的實際行動,不斷的推動著行業(yè)的發(fā)展和變革。它通過這一系列緊密相連的舉措,不僅在技術(shù)上與國內(nèi)外領先水平保持同步,更在用戶服務和市場布局上展現(xiàn)出了獨有的競爭力。
這種以用戶價值為核心,以開放創(chuàng)新為驅(qū)動的發(fā)展模式,不僅為它在 AI 領域的未來發(fā)展奠定了基礎,也為 AI 技術(shù)向著更加開放,更加惠普、更加智能化的方向發(fā)展,為用戶創(chuàng)造更多價值。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))認為大模型開放是大勢所趨,行業(yè)領軍者都在主動開放,而百度早已身在其中。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。