0
當(dāng)你走入一家剛數(shù)字化升級(jí)過的商場(chǎng),可能會(huì)發(fā)現(xiàn)比以前更容易逛到喜歡的店鋪。
你也可能完全沒發(fā)現(xiàn),剛離開的面包店買起來比上次來順手是因?yàn)樨浌褶D(zhuǎn)了90度。
還有可能,到了飯點(diǎn)你跟隨著人流就找到了新的美食。
這些變化的背后,是曾經(jīng)只會(huì)統(tǒng)計(jì)人流、監(jiān)測(cè)危險(xiǎn)行為的AI攝像頭,已經(jīng)智能到會(huì)“算計(jì)”商業(yè)綜合體。
攝像頭的智能升級(jí),又源于視覺AI進(jìn)入了全新的視頻大模型時(shí)代。
視頻大模型,讓AI的能力從小學(xué)生級(jí)別,躍升為教授級(jí),零售、智能制造、城市管理、環(huán)境監(jiān)測(cè)這些已經(jīng)用上視覺AI的場(chǎng)景,將進(jìn)入全新的視頻大模型AI時(shí)代。
那個(gè)最被人熟知的英特爾酷睿CPU和銳炫GPU組合而成的的英特爾視頻AI計(jì)算盒,就是進(jìn)入全新視頻AI時(shí)代最容易獲取的鑰匙。
被AI「算計(jì)」的店鋪布局和貨架
傳統(tǒng)商業(yè)綜合體的布局和管理,依靠的是經(jīng)驗(yàn)。比如地下一層是超市餐飲,一層是化妝品、珠寶,二層是女裝、童裝,三層是男裝。
可消費(fèi)者的習(xí)慣在變化,不同地區(qū)的消費(fèi)者的消費(fèi)偏好也不相同,經(jīng)驗(yàn)?zāi)馨l(fā)揮的作用在減小,AI的價(jià)值越來越明顯。
已經(jīng)廣泛應(yīng)用的AI攝像頭,能夠統(tǒng)計(jì)人流,也可以幫商場(chǎng)的顧客更快找回遺失的物品,但在吸引顧客和提升商場(chǎng)運(yùn)營方面的效果還不顯著。
生成式AI時(shí)代的視頻大模型,讓零售行業(yè)的數(shù)字化再上一層樓。
北京楓藍(lán)國際購物中心副總陳鐵生頗有心得,擁有17年歷史的楓藍(lán)國際購物中心,經(jīng)過了兩次轉(zhuǎn)型,第二次轉(zhuǎn)型引入了開域集團(tuán)的數(shù)字化系統(tǒng),能夠統(tǒng)計(jì)商場(chǎng)各個(gè)電梯和樓層的客流量,不同樓層的客流特點(diǎn)和消費(fèi)需求,深入了解購物中心消費(fèi)者對(duì)餐飲、零售的偏好程度。
有了更豐富的數(shù)據(jù)洞察,優(yōu)化商鋪布局,調(diào)整商品種類和營銷策略就更加容易。
引入開域集團(tuán)的數(shù)字化系統(tǒng),楓藍(lán)國際購物中心從經(jīng)驗(yàn)管理向精細(xì)化管理轉(zhuǎn)變,也帶來了業(yè)績的增長,商場(chǎng)活動(dòng)的到店量增長了兩成,銷售額增長了近三成。購物中心就這樣被生成式AI“算計(jì)”了。
能“算計(jì)”大型購物中心,視頻大模型也能“算計(jì)”店鋪、貨架。
連鎖烘焙品牌多樂之日的北京盈科店,也用上開域集團(tuán)的數(shù)字化系統(tǒng),借助新一代的視頻AI生成的顧客到店動(dòng)線圖,發(fā)現(xiàn)約6成顧客在經(jīng)過面包柜后會(huì)直接走向緊鄰的收銀臺(tái),這導(dǎo)致了三明治柜臺(tái)的顧客相對(duì)較少。
運(yùn)營團(tuán)隊(duì)做了一個(gè)簡單的調(diào)整,把三明治展柜轉(zhuǎn)了90度,順應(yīng)顧客的動(dòng)線,持續(xù)數(shù)天的數(shù)據(jù)顯示光顧三明治柜臺(tái)的顧客有所增加。
這兩個(gè)案例都充分說明,開域集團(tuán)數(shù)字化系統(tǒng)所使用的視頻大模型,與2018年后的新零售所使用的AI,已經(jīng)發(fā)生了革命性改變,視頻大模型有更大的商業(yè)價(jià)值。
從傳統(tǒng)視覺AI到視頻大模型的全新時(shí)代
傳統(tǒng)的視覺AI算法之所以不能像視頻大模型一樣為包括零售在內(nèi)的應(yīng)用提供更具價(jià)值的數(shù)據(jù)和建議,主要還是技術(shù)存在局限性。
集成在傳統(tǒng)AI攝像頭里的算法CNN和RNN,一個(gè)能表征視頻內(nèi)容,比如地點(diǎn),人物;另一個(gè)能捕捉動(dòng)態(tài),比如視頻中人物的運(yùn)動(dòng)方向、軌跡,難以同時(shí)記住一個(gè)人以及其運(yùn)動(dòng)軌跡。
這就讓傳統(tǒng)AI視覺算法很難給商場(chǎng)或者面包店提供特定顧客的消費(fèi)特點(diǎn),幫助做出運(yùn)營決策。
視頻大模型的Transformer架構(gòu),平衡了內(nèi)容表征和視頻的動(dòng)態(tài),既能記住視頻中特定的人,還能記住這個(gè)人運(yùn)動(dòng)的軌跡。
這是算法的革新,傳統(tǒng)的CNN、RNN、LSTM算法就像是一個(gè)還不能觸類旁通的小學(xué)生,老師用大量的圖文教小學(xué)生知識(shí),比如認(rèn)識(shí)貓,但小學(xué)生辨別的時(shí)候,只要和老師教過的有明顯不同,就可能識(shí)別失敗。
并且傳統(tǒng)的AI算法的信息傳遞必須按順序進(jìn)行,如果傳輸過程很長,信息會(huì)失真或丟失。
所以傳統(tǒng)的AI算法泛化性差,部署時(shí)要配備專業(yè)的AI團(tuán)隊(duì),面向不同場(chǎng)景分別進(jìn)行訓(xùn)練和部署,不僅耗費(fèi)資源和時(shí)間,建設(shè)周期也極為漫長。
還有一個(gè)問題,傳統(tǒng)視頻AI方案要集中式部署,視頻流數(shù)據(jù)需要借助網(wǎng)絡(luò)傳輸至后端處理,海量的數(shù)據(jù)傳輸和數(shù)據(jù)安全面臨巨大挑戰(zhàn)。
泛化性差和需要集中部署都限制了傳統(tǒng)視覺AI的大規(guī)模應(yīng)用以及商業(yè)價(jià)值的挖掘。
比傳統(tǒng)AI更進(jìn)一步的生成式AI,就像是會(huì)自監(jiān)督學(xué)習(xí),且觸類旁通的大學(xué)生。
與小學(xué)生的學(xué)習(xí)過程截然不同,大學(xué)生不依賴?yán)蠋煹慕?jīng)驗(yàn)進(jìn)行自主學(xué)習(xí),通過學(xué)習(xí)優(yōu)質(zhì)的資料(具有代表性的視頻,配有準(zhǔn)確的自然語言描述),比如描述恰當(dāng)?shù)囊恢话咨呢執(zhí)稍诳蛷d沙發(fā)上,和大量質(zhì)量不那么好的資料,比如一只灰色的貓?jiān)诒寂艿囊曨l,對(duì)應(yīng)描述是房間,大量學(xué)習(xí)之后,這個(gè)大學(xué)生能判斷出是一只灰色的貓?jiān)诜块g里奔跑。
Transformer不僅能自監(jiān)督學(xué)習(xí),得益于信息不需要按順序傳遞,還能根據(jù)上下文理解,這打開了視覺AI的新世界,能在更多場(chǎng)景里完成更多復(fù)雜的任務(wù)。
比如在購物中心,傳統(tǒng)AI的視頻搜索局限于限定關(guān)鍵詞,基于視頻大模型的解決方案,直接搜“找出穿白衣服的小男孩”等,很快就能完成搜索和定位。得到結(jié)果的時(shí)間和準(zhǔn)確性,很大程度取決于底層的軟硬件。
視頻大模型時(shí)代最觸手可及的軟硬件底座
相比一維的文字,二維的圖像,處理三維的視頻對(duì)于處理器有更高的要求,并且視頻大模型出現(xiàn)不久,非??简?yàn)硬件對(duì)算法的快速適配。
全球范圍內(nèi)廣泛應(yīng)用的英特爾酷睿CPU和銳炫GPU構(gòu)建的英特爾視頻AI計(jì)算盒,是當(dāng)下部署視頻大模型不二的選擇。
其中的酷睿CPU處理器在視頻流讀取、數(shù)據(jù)分析等環(huán)節(jié),能夠滿足視頻大模型方案在高速數(shù)據(jù)處理、計(jì)算機(jī)視覺和低時(shí)延確定性計(jì)算上的需求。針對(duì)復(fù)雜的工作環(huán)境,英特爾也對(duì)處理器的穩(wěn)定性和可靠性進(jìn)行了專門優(yōu)化,保障24小時(shí)不間斷工作。
英特爾銳炫顯卡為視頻大模型中大量的推理任務(wù)提供算力支持。微架構(gòu)中的Xe內(nèi)核集成高帶寬矩陣引擎XMX,能夠?qū)I推理中常見的矩陣乘法和累加計(jì)算提供基于硬件的性能加速。
算力強(qiáng)大的硬件還不夠,OpenVINO工具套件保證了英特爾視頻AI計(jì)算盒能夠快速適配視頻大模型算法,并實(shí)現(xiàn)部署。
OpenVINO工具套件中基于 x86 內(nèi)核指令集的推理引擎,能使用硬件指令集來加速AI推理。OpenVINO 工具套件還可對(duì)計(jì)算圖結(jié)構(gòu)進(jìn)行進(jìn)一步優(yōu)化,通過提升算子計(jì)算并行性等方式,提升視頻大模型方案的推理效率。
開域集團(tuán)就是借助英特爾視頻AI計(jì)算盒的強(qiáng)勁算力,以及OpenVINO工具套件提供AI加速,構(gòu)建視頻大模型的數(shù)字化商場(chǎng)解決方案,將視頻大模型能力有效下沉至包括視覺終端、數(shù)字工牌等在內(nèi)的商場(chǎng)中的各類終端產(chǎn)品。
開域集團(tuán)CTO趙宇迪說,“使用了銳炫GPU,通過OpenVINO和英特爾oneAPI工具包等工作套件,充分發(fā)揮了英特爾銳炫GPU在AI模型推理方面的潛力,使得模型遷移和部署更加簡單快捷,同時(shí)大幅提升了模型的推理速度。”
當(dāng)然,開域集團(tuán)也會(huì)借助英特爾視頻AI計(jì)算盒之外更多英特爾強(qiáng)大的軟硬件,充分發(fā)揮生成式AI的優(yōu)勢(shì),為零售、地產(chǎn)、園區(qū)等領(lǐng)域提供先進(jìn)數(shù)字化解決方案,幫助用戶解鎖數(shù)字化轉(zhuǎn)型新密碼。
英特爾視頻AI計(jì)算盒還有一個(gè)非常顯著的優(yōu)勢(shì)——兼容現(xiàn)有安防監(jiān)控系統(tǒng)。
得益于英特爾視頻AI計(jì)算盒更具兼容性的設(shè)計(jì),新方案可以便捷地接入大多數(shù)現(xiàn)有的安防監(jiān)控系統(tǒng),并快速完成部署和調(diào)試,比如攝像頭只需要一根網(wǎng)線即可完成數(shù)據(jù)傳輸和電力供給,大幅降低安裝維護(hù)難度。
在此基礎(chǔ)上,英特爾視頻AI計(jì)算盒的泛化性能實(shí)現(xiàn)更豐富的AI功能,支持更廣泛的場(chǎng)景。
視頻大模型落地的巨大商業(yè)價(jià)值
開域集團(tuán)的解決方案是“云-邊-端”的架構(gòu)設(shè)計(jì),基于邊緣部署的視頻大模型讓系統(tǒng)避免了海量的網(wǎng)絡(luò)數(shù)據(jù)傳輸,使AI反應(yīng)速度更快。
數(shù)據(jù)在邊緣測(cè)的英特爾視頻AI計(jì)算盒處理不上傳云端,也能夠保障數(shù)據(jù)安全和隱私。
加上開域集團(tuán)在零售數(shù)字化領(lǐng)域的技術(shù)積累與豐富經(jīng)驗(yàn),自研的算法與大模型相結(jié)合,不僅能幫助商戶優(yōu)化門店布局,創(chuàng)新營銷策略,也能顯著提升商場(chǎng)和人員管理的效率。
比如可實(shí)現(xiàn)跨鏡完整識(shí)別“人”在空間內(nèi)的行為軌跡,在保障個(gè)人隱私安全的前提下,實(shí)現(xiàn)客流人數(shù)/人次的精準(zhǔn)統(tǒng)計(jì),還可以無感分離導(dǎo)購、保安等非顧客行為對(duì)客流數(shù)據(jù)的影響。
不僅能實(shí)現(xiàn)流量統(tǒng)計(jì)、店鋪導(dǎo)覽等常見功能,還能實(shí)現(xiàn)店鋪吸引力、客流偏好、消費(fèi)者分析、軌跡與熱力、停留時(shí)長、爬樓率等更多維度的數(shù)據(jù)洞察,從而實(shí)現(xiàn)更為精細(xì)化的商業(yè)運(yùn)營和管理。
也能通過對(duì)消防通道占用、跌倒識(shí)別、非營業(yè)時(shí)間闖入、員工空崗、玩手機(jī)監(jiān)控以及車流統(tǒng)計(jì)等多種情況進(jìn)行自動(dòng)化巡檢,幫助商場(chǎng)管理者和商戶降本增效。
視頻大模型擁有強(qiáng)大的泛化能力和自動(dòng)處理能力,降低在商業(yè)綜合體中部署AI的工作量和成本,提高用戶處理突發(fā)事件能力,也能在地產(chǎn)零售、生產(chǎn)物流、園區(qū)管理以及城市管理等多個(gè)行業(yè)應(yīng)用。
倉儲(chǔ)物流園可以通過攝像頭、傳感器等設(shè)備實(shí)時(shí)掌握車輛動(dòng)態(tài),優(yōu)化物流效率消除安全隱患。
智能制造產(chǎn)線可以用視頻大模型方案自動(dòng)識(shí)別設(shè)備故障的早期跡象,提前預(yù)警和維護(hù)。
解決城市管理中的交通擁堵,視頻大模型也能發(fā)揮更大價(jià)值,通過對(duì)歷史交通視頻數(shù)據(jù)的學(xué)習(xí),掌握交通流量的變化規(guī)律并預(yù)測(cè)未來一段時(shí)間內(nèi)的擁堵情況。
凍結(jié)的預(yù)訓(xùn)練大模型就已經(jīng)能夠?qū)崿F(xiàn)如此強(qiáng)大的AI功能,接下來視頻大模型仍然會(huì)繼續(xù)演進(jìn),朝著理解更長視頻,適配更豐富的場(chǎng)景的方向發(fā)展。
無論算法如何演進(jìn),演進(jìn)的速度多快,基于強(qiáng)大酷睿處理器以及銳炫處理器的英特爾視頻AI計(jì)算盒,以及OpenVINO和英特爾oneAPI工具包的生態(tài),都是落地視頻大模型的基石。
更詳細(xì)的信息請(qǐng)查閱:https://www.intel.cn/content/www/cn/zh/internet-of-things/unlocking-new-password-for-digital-transformation.html 雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。