0
本文作者: 梁丙鑒 | 2025-04-14 16:47 |
雷峰網(wǎng)訊 用自然語(yǔ)言直接向BI軟件提問(wèn),查詢(xún)數(shù)據(jù),甚至指揮它進(jìn)行數(shù)據(jù)分析,是BI行業(yè)的愿景,但過(guò)去十余年來(lái)未見(jiàn)成功者。直到大模型的出現(xiàn)降低了自然語(yǔ)言查詢(xún)數(shù)據(jù)的技術(shù)門(mén)檻,這一目標(biāo)終于具有可行性。以智能化的數(shù)據(jù)分析服務(wù)Chat BI為切口,BI行業(yè)找到了AI技術(shù)落地的具體場(chǎng)景。
作為BI+AI理念下的融合產(chǎn)品,Chat BI支持用戶(hù)在業(yè)務(wù)應(yīng)用中的任何時(shí)刻喚起一個(gè)聊天助手,用自然語(yǔ)言詢(xún)問(wèn)各種經(jīng)營(yíng)數(shù)據(jù),并即時(shí)得到回答。運(yùn)營(yíng)方在查看靜態(tài)報(bào)表的同時(shí),也可以就數(shù)據(jù)變化向AI助手提問(wèn),拆解現(xiàn)象背后的原因。從BI到Chat BI,企業(yè)在數(shù)據(jù)運(yùn)營(yíng)方面的緊迫性需求、探索性想法將被更好地回應(yīng)。
在AI科技評(píng)論與衡石科技創(chuàng)始人兼CEO劉誠(chéng)忠的訪(fǎng)談中,他向我們介紹了Chat BI的應(yīng)用場(chǎng)景與技術(shù)路徑。2022年大模型浪潮興起以來(lái),BI行業(yè)對(duì)于Chat BI落地的技術(shù)路徑存在NL2SQL和NL2DSL兩種思路。前者在數(shù)據(jù)庫(kù)表的基礎(chǔ)上直接對(duì)接大模型進(jìn)行問(wèn)答,后者將用戶(hù)的問(wèn)題調(diào)用BI結(jié)構(gòu)化的查詢(xún)接口,由BI下發(fā)相應(yīng)查詢(xún)。
受訪(fǎng)者供圖
作為新一代BI公司,衡石在產(chǎn)品構(gòu)建階段對(duì)已有的BI產(chǎn)品進(jìn)行了調(diào)研,從微軟Power BI和Looker的經(jīng)驗(yàn)中發(fā)現(xiàn)語(yǔ)義層是BI產(chǎn)品數(shù)據(jù)分析能力的基礎(chǔ),決定將工程團(tuán)隊(duì)的精力集中在加強(qiáng)語(yǔ)義層能力上。而語(yǔ)義層通過(guò)定義業(yè)務(wù)友好的術(shù)語(yǔ)和概念,為DSL的構(gòu)建提供簡(jiǎn)化的數(shù)據(jù)視圖,DSL可以基于該視圖來(lái)設(shè)計(jì)更貼近業(yè)務(wù)的語(yǔ)法和語(yǔ)義。
AI時(shí)代到來(lái)后,BI側(cè)的語(yǔ)義層能力和AI側(cè)的大模型完成了雙向奔赴。大模型不需要把自然語(yǔ)言翻譯成SQL層次的底層語(yǔ)言,在問(wèn)數(shù)場(chǎng)景中,只需要與中間的語(yǔ)義層進(jìn)行交互。衡石基于自身語(yǔ)義層的優(yōu)勢(shì),降低對(duì)大模型提出的要求,走通了NL2DSL的技術(shù)路徑。
隨著模型分析能力的提升,未來(lái)Chat BI還將幫助用戶(hù)生成分析報(bào)告,針對(duì)數(shù)據(jù)的走勢(shì)、關(guān)聯(lián)關(guān)系以及數(shù)字背后隱藏的洞察,提供更清晰的解讀。劉誠(chéng)忠判斷,大模型對(duì)數(shù)據(jù)趨勢(shì)進(jìn)行預(yù)測(cè)和解讀的能力,可能在今年晚一些時(shí)候或明年被大幅增強(qiáng)。
以下是AI科技評(píng)論與劉誠(chéng)忠的對(duì)話(huà)全文,為方便閱讀,進(jìn)行了不改變?cè)獾奈淖终{(diào)整。
為什么選擇做BI
AI科技評(píng)論:為什么選擇做BI產(chǎn)品?這個(gè)賽道有哪些選手?
劉誠(chéng)忠:BI更有成為標(biāo)準(zhǔn)化產(chǎn)品的潛力。BI 本質(zhì)上是一個(gè)用于統(tǒng)計(jì)分析的大數(shù)據(jù)產(chǎn)品,而且對(duì)分析數(shù)據(jù)的種類(lèi)并不限制。企業(yè)的數(shù)據(jù)分為幾個(gè)板塊,財(cái)務(wù)、ERP、marketing、sales和HR,每個(gè)業(yè)務(wù)都可以用。在BI賽道,主流廠(chǎng)商包括微軟、Tableau、帆軟、永洪科技、思邁特軟件、觀遠(yuǎn)數(shù)據(jù)、衡石科技等等公司。
AI科技評(píng)論:衡石的BI有什么不同?
劉誠(chéng)忠:我們產(chǎn)品的核心特點(diǎn)是開(kāi)放架構(gòu),比較像一個(gè)BI引擎,可以服務(wù)直客,但更多地作為嵌入式產(chǎn)品面向應(yīng)用軟件廠(chǎng)商。這種以嵌入集成為主的產(chǎn)品形態(tài)和合作方向,使衡石在BI賽道具有一定的差異化定位,因此在國(guó)內(nèi)幾乎沒(méi)有競(jìng)爭(zhēng)對(duì)手??蛻?hù)傾向于將衡石定義成BI Engine或 BI PaaS,本質(zhì)上都是在形容衡石的定位。
AI科技評(píng)論:除了衡石,國(guó)內(nèi)SaaS廠(chǎng)商在嵌入式BI產(chǎn)品方面還有什么選擇?
劉誠(chéng)忠:除了衡石,國(guó)內(nèi)SaaS廠(chǎng)商的選擇通常是自研。軟件廠(chǎng)商的工程師們對(duì)于BI功能往往忍不住會(huì)自研,但數(shù)據(jù)分析和 BI 的自研成本其實(shí)非常高,因此許多客戶(hù)都在都是自研上吃了大虧后找到我們。
自研的必然結(jié)果,就是雖然可以做出來(lái),但它會(huì)是一個(gè)非常輕量的東西。通常自研 BI 需要的團(tuán)隊(duì)規(guī)模為5~10 人,周期1~2年。BI的基礎(chǔ)工程較為容易,可以在這個(gè)條件下完成,但后續(xù)建模分析、數(shù)倉(cāng)對(duì)接權(quán)限控制等精細(xì)、復(fù)雜工程所需的進(jìn)一步投入會(huì)給研發(fā)投入造成巨大壓力。很多公司會(huì)發(fā)現(xiàn)做到這兒的時(shí)候,開(kāi)發(fā)投入已經(jīng)跟自己主業(yè)需要的水平差不太多了,那就顯得不合理。一個(gè)做 ERP 的公司,投一堆人做BI,但事實(shí)上 BI 這樣的數(shù)據(jù)類(lèi)基礎(chǔ)工具軟件的投入就是未必低于 ERP。
AI科技評(píng)論:有企業(yè)自研 BI 成功的案例嗎?
劉誠(chéng)忠:全球范圍看也是幾乎沒(méi)有的,就算軟件巨頭如谷歌、Salesforce需要這部分能力也不會(huì)自研,會(huì)直接發(fā)起并購(gòu)。國(guó)內(nèi)看到阿里自研BI產(chǎn)品比較成功。他們的產(chǎn)品可以在阿里云上服務(wù)自己的電商群體,這部分群體同時(shí)也在滋養(yǎng)產(chǎn)品,所以阿里對(duì)產(chǎn)品的打磨可以得到市場(chǎng)反饋。產(chǎn)品是靠市場(chǎng)反饋推著走的,如果一家企業(yè)BI產(chǎn)品的反饋來(lái)自于自身業(yè)務(wù)部門(mén),不能代表市場(chǎng)的反饋,也就無(wú)法形成市場(chǎng)競(jìng)爭(zhēng)力。
Chat BI:BI+AI融合之旅
AI科技評(píng)論:大模型的發(fā)展會(huì)擠壓BI廠(chǎng)商的生存空間嗎?
劉誠(chéng)忠:基本上從2022年底開(kāi)始,所有的BI廠(chǎng)商都在第一時(shí)間關(guān)注大模型。因?yàn)槿绻竽P鸵怀霈F(xiàn)就把toSQL的問(wèn)題解決得很好,那BI廠(chǎng)商就很危險(xiǎn),大家擔(dān)心要被折疊了。差不多24年大家才發(fā)現(xiàn),基于BI去做AI在數(shù)據(jù)分析上的落地是更務(wù)實(shí)的,BI這一層應(yīng)該沒(méi)有辦法被替代,BI+AI這種合作慢慢地才多起來(lái)。25年開(kāi)始,合作的線(xiàn)索和機(jī)會(huì)開(kāi)始成數(shù)倍的增加。
對(duì)BI廠(chǎng)商來(lái)說(shuō),23年是觀察的一年,24年是共識(shí)形成的一年,25年應(yīng)該就是快速成長(zhǎng)兌現(xiàn)共識(shí)的一年。
受訪(fǎng)者供圖
AI科技評(píng)論:BI產(chǎn)品怎么和AI技術(shù)結(jié)合?有哪些應(yīng)用場(chǎng)景?
劉誠(chéng)忠:做智能化的問(wèn)數(shù)助手,給企業(yè)提供智能化的數(shù)據(jù)分析服務(wù)。衡石從為SaaS軟件市場(chǎng)提供BI,升級(jí)為提供 Chat BI。后者支持用戶(hù)在業(yè)務(wù)應(yīng)用中的任何時(shí)候喚起一個(gè)聊天助手,用自然語(yǔ)言詢(xún)問(wèn)各種經(jīng)營(yíng)數(shù)據(jù),并即時(shí)得到回答。在數(shù)據(jù)運(yùn)營(yíng)方面,這種隨時(shí)可以問(wèn)到某一個(gè)數(shù)據(jù)的服務(wù)是之前不存在的。用戶(hù)需要詢(xún)問(wèn)分析師,分析師制作報(bào)表,再進(jìn)行調(diào)整,這是一個(gè)很低效的過(guò)程。現(xiàn)在可以用Chat BI解決一些緊迫的隨需而變的探索問(wèn)題,這種ad-hoc的需求是很旺盛的。
另外用 BI 工具做出靜態(tài)報(bào)表給運(yùn)營(yíng)方看的時(shí)候,Chat BI會(huì)有一個(gè)AI助手。運(yùn)營(yíng)方可以在看報(bào)表的同時(shí),隨時(shí)提一些探索性的想法。比如他看到報(bào)表的某個(gè)數(shù)據(jù)上升了,就會(huì)問(wèn)是哪個(gè)維度上增加了什么東西導(dǎo)致的。這個(gè)現(xiàn)象分解出來(lái),原因具體在哪里,這些探索可以馬上進(jìn)行,實(shí)時(shí)的反饋。
AI科技評(píng)論:不同的大模型對(duì)Chat BI有區(qū)別嗎?
劉誠(chéng)忠:區(qū)別很大,問(wèn)數(shù)的核心就是大模型能不能準(zhǔn)確理解問(wèn)題,有的大模型更準(zhǔn),有的就不準(zhǔn)。GPT-4o效果很好,DeepSeek和千問(wèn)也不錯(cuò)。但對(duì)接大模型的過(guò)程相對(duì)來(lái)說(shuō)是標(biāo)準(zhǔn)化的,因?yàn)榇竽P蛯?duì)外暴露的接口就是prompt。不管這個(gè)模型是不是開(kāi)源的,Chat BI把query給它,它以語(yǔ)義層的語(yǔ)法返回,由BI平臺(tái)再翻譯成SQL,完成對(duì)數(shù)據(jù)的查詢(xún),把聚合的結(jié)果反饋給客戶(hù)。
AI科技評(píng)論:未來(lái)Chat BI的產(chǎn)品形態(tài)會(huì)是Agent嗎?
劉誠(chéng)忠:衡石現(xiàn)在的Chat BI還是面向真人,比如通過(guò)報(bào)表旁邊的聊天窗口,或者向飛書(shū)里的bot提問(wèn)。但未來(lái)有很多情況下會(huì)是一個(gè)Agent或者AI來(lái)和衡石對(duì)話(huà),所以我們對(duì)外要提供for Agent的一層,使它可以被別的Agent所識(shí)別、辨認(rèn)和調(diào)用。
我們以后對(duì)外就是一個(gè)企業(yè)級(jí)的 BI Agent。衡石已經(jīng)和Dify集成,用戶(hù)可以在Dify里完成一個(gè)復(fù)雜的任務(wù),它分解后其中一步是查詢(xún)數(shù)據(jù),這一步是衡石在支撐服務(wù)。Agent查詢(xún),Chat BI進(jìn)行響應(yīng),然后Agent再回到工作流里。我們作為支持性的企業(yè)級(jí)Agent進(jìn)入一個(gè)復(fù)雜的任務(wù)編排里,承擔(dān)其中智能問(wèn)數(shù)的環(huán)節(jié)。
NL2DSL:語(yǔ)義層和大模型的雙向奔赴
受訪(fǎng)者供圖
AI科技評(píng)論:為什么采用NL2DSL的技術(shù)路線(xiàn)?
劉誠(chéng)忠:自然語(yǔ)言對(duì)數(shù)據(jù)靈活提問(wèn)的功能是BI行業(yè)十多年來(lái)的想法和嘗試,也是 BI 行業(yè)的技術(shù)趨勢(shì)。Tableau還專(zhuān)門(mén)收購(gòu)過(guò)一家做NLP的公司,效果也不是很成功。原因在于,大語(yǔ)言模型出現(xiàn)之前這項(xiàng)技術(shù)非常不成熟,它出現(xiàn)之后通過(guò)自然語(yǔ)言查詢(xún)數(shù)據(jù)才具有可行性。
創(chuàng)業(yè)做產(chǎn)品構(gòu)建的時(shí)候,我們就決定將工程團(tuán)隊(duì)的精力集中在加強(qiáng)語(yǔ)義層能力上,但當(dāng)時(shí)的考慮和AI無(wú)關(guān)。語(yǔ)義層是 BI 做數(shù)據(jù)分析的基礎(chǔ)能力,power BI在這方面做得很好,所以分析能力就強(qiáng)過(guò)別的 BI 工具。衡石是2016年創(chuàng)立的,算新一代BI公司,當(dāng)時(shí)把這些產(chǎn)品都研究過(guò),我們發(fā)現(xiàn)了語(yǔ)義層在整個(gè)產(chǎn)品演進(jìn)過(guò)程中至關(guān)重要的作用。2019年,衡石在語(yǔ)義層上就做得不錯(cuò)了。
(注:衡石采用NL2DSL的方式,將自然語(yǔ)言的詢(xún)問(wèn)翻譯為指標(biāo)描述語(yǔ)言,由BI層進(jìn)一步翻譯為SQL進(jìn)行下推查詢(xún)。)
AI科技評(píng)論:語(yǔ)義層上的技術(shù)優(yōu)勢(shì)在AI時(shí)代有什么意義?
劉誠(chéng)忠:語(yǔ)義層在BI上的優(yōu)勢(shì),在 AI 上也是優(yōu)勢(shì)。大模型出來(lái)之后,可以說(shuō)語(yǔ)義層能力更有用武之地,不需要大模型把自然語(yǔ)言翻譯成SQL那么底層的語(yǔ)言,只需要翻譯成中間語(yǔ)義層的語(yǔ)言即可,這對(duì)大模型提出的要求更低了。其實(shí)也只有降低對(duì)大模型的要求,Chat BI才更有可行性。因?yàn)閺募夹g(shù)路線(xiàn)的角度,大模型不擅長(zhǎng)精準(zhǔn)的數(shù)據(jù)分析場(chǎng)景,這也不是大部分模型廠(chǎng)商要發(fā)力的領(lǐng)域。長(zhǎng)期來(lái)看,BI行業(yè)的落地應(yīng)用門(mén)檻下降了,數(shù)據(jù)分析和數(shù)據(jù)智能應(yīng)用更加普及,AI是所有BI廠(chǎng)商的紅利。
AI科技評(píng)論:AI還給BI行業(yè)帶來(lái)了什么影響?
劉誠(chéng)忠:除了直接的問(wèn)數(shù),對(duì)分析報(bào)告生成也會(huì)有幫助,但這種幫助很大程度上依賴(lài)于垂直領(lǐng)域知識(shí),這是 AI 目前跟數(shù)據(jù)結(jié)合還不太成熟的方面。AI數(shù)據(jù)分析現(xiàn)在是第一階段,用戶(hù)對(duì)很多指標(biāo)的提問(wèn)可以馬上被準(zhǔn)確識(shí)別。第二階段是對(duì)于數(shù)據(jù)的走勢(shì)、關(guān)聯(lián)關(guān)系以及數(shù)據(jù)背后隱藏的洞察,可以給人更清楚的解讀。我們判斷,大模型對(duì)數(shù)據(jù)趨勢(shì)進(jìn)行預(yù)測(cè)和解讀的能力,可能在今年晚一些時(shí)候或明年會(huì)被比較大幅地增強(qiáng)。但這個(gè)我們判斷取決于垂直領(lǐng)域模型的進(jìn)展,才能真正落地。
AI科技評(píng)論:這是否對(duì)大模型的分析能力提出了更高的要求?
劉誠(chéng)忠:這需要它有非常強(qiáng)的分析能力。大模型技術(shù)的基礎(chǔ)趨勢(shì)會(huì)讓它的分析能力越來(lái)越好,但目前的推理模型還不太實(shí)用,所以我們主流使用的大模型還是DeepSeek-V3。我們也在觀察DeepSeek-R1,但是在問(wèn)數(shù)、解讀報(bào)告生成的場(chǎng)景中它并沒(méi)有特別的優(yōu)勢(shì)。同時(shí),關(guān)鍵還在于垂直領(lǐng)域的行業(yè)性數(shù)據(jù)作為關(guān)鍵語(yǔ)料對(duì)垂直模型的幫助,不只是大模型單方面的瓶頸。
AI科技評(píng)論:你評(píng)價(jià)模型性能更關(guān)注它在具體行業(yè)場(chǎng)景中的實(shí)用性嗎?
劉誠(chéng)忠:大家真正關(guān)注的是零售、制造、醫(yī)療這些具體行業(yè),一項(xiàng)技術(shù)如果很先進(jìn),最重要的是能拿來(lái)使用。比如BI,我們關(guān)注的是能不能落地到數(shù)據(jù)分析、分析報(bào)表可視化的具體場(chǎng)景里,因此會(huì)從一個(gè)很實(shí)用的角度來(lái)考察 AI 的能力。每個(gè)行業(yè)自己的需求都很現(xiàn)實(shí),行不行拿過(guò)來(lái)試一下。
AI科技評(píng)論:To B服務(wù)中沒(méi)有用戶(hù)敢相信大模型隨機(jī)輸出的內(nèi)容,但AI的本質(zhì)就是尋求概率,所以大模型使用效果會(huì)不會(huì)不穩(wěn)定?
劉誠(chéng)忠:對(duì),所以大模型在To B落地很困難。To B就是要精準(zhǔn),現(xiàn)在模型的能力在嚴(yán)肅數(shù)據(jù)的場(chǎng)景中太稚嫩,我們沒(méi)有看到太多的檢驗(yàn)和落地的實(shí)在效果。我們的價(jià)值也是在大模型能力不夠高的現(xiàn)狀下努力提升他的精準(zhǔn)性。企業(yè)用大模型直接問(wèn)數(shù)的準(zhǔn)確率可能只有30%,我們BI能幫它提高到80%、90%以上,基本達(dá)到可落地的程度。
(雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))文章)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。