0
得益于物聯(lián)網和工業(yè)4.0的興起,最近幾年,不少企業(yè)已經通過物聯(lián)網的手段,建立起了數(shù)據采集,監(jiān)控和展示的平臺。對于數(shù)據的深層次應用,例如利用最新的機器學習算法,對數(shù)據進行智能化提升,則是目前工業(yè)用戶進行數(shù)字化轉型的必由之路。
從現(xiàn)在的趨勢來看,人工智能的熱點領域都集中在語言、圖像交互類, 或者商業(yè)應用類。對于工業(yè)領域,基于物聯(lián)網獲取的流式數(shù)據,如何通過人工智能來實現(xiàn)效率提升?在使用這些數(shù)據的過程中,如何避免踩坑,順利進行方案的部署?這是工業(yè)界需要解決的問題。為此,本期硬創(chuàng)公開課,雷鋒網邀請了覺云科技CEO常偉來為大家講解如何用物聯(lián)網數(shù)據來構建工業(yè)智能。
常偉先生是覺云科技的的創(chuàng)始人及CEO,在成立覺云科技前,他來自于微軟上海,是物聯(lián)網方案部門負責人,負責基于云端的物聯(lián)網的服務組件設計和推廣,包括了Azure的PaaS和SasS的服務在中國的落地,提供云端的數(shù)據接入,協(xié)議轉換,服務分配,平臺集成,分析和展示。主要客戶包括上海觀致,中國福特、中國通用等企業(yè)。
以下內容整理自本期公開課,雷鋒網做了不改變愿意的編輯:
整個互聯(lián)網到物聯(lián)網走到現(xiàn)在是可以通過數(shù)據其解決一些問題的。
在信息化時代,我們經歷了從數(shù)據到信息到知識再到智能的過程,我們也相信在商業(yè)、工業(yè)領域都有大量的信息或者數(shù)據,而這些數(shù)據的價值就需要業(yè)界來挖掘,最后才會走到金字塔頂端智能所要解決的問題。
大家常見的是交互類的智能,例如語音識別、圖像識別等,毋庸置疑,這是現(xiàn)在很熱門的一類課題,但今天講的內容主要聚焦工業(yè)領域,怎么利用工業(yè)智能解決工業(yè)領域的問題。
這張圖片列舉了常見的幾種算法,分類、回歸、推薦、異常點檢測、聚類。分類主要是用來區(qū)分不同的群體,回歸主要用來預測,例如預測一臺設備什么時候發(fā)生故障;推薦主要解決的是,用戶買了商品A之后,可以推薦商品B或者C;異常點檢測主要針對沒有歷史記錄如何在一個矢量集來找出異常點。
現(xiàn)在這些算法都已經存在,我們的任務主要是利用這些算法來應用到商業(yè)應用或者工業(yè)應用當中。
工業(yè)物聯(lián)網的范圍很大,包括數(shù)據傳輸、采集、通信以及平臺的展示等。覺云目前做的是工業(yè)算法和模塊。這處于工業(yè)物聯(lián)網中游的位置,即拿到工業(yè)領域的流失數(shù)據后,再進行智能分析得出結果后在跟企業(yè)應用系統(tǒng)做集成。
在工業(yè)智能里面,一般使用的數(shù)據是流式數(shù)據,采集的數(shù)據大部分來自設備端的數(shù)據,例如,泵、變速箱和機床這些和設備相關的變量。
在采集完數(shù)據后,可以通過算法模型進行建模評估,評估完之后就可以給客戶提供預測性維護、能效管理以及質量管理等。
針對不同業(yè)務領域提供算法模型,這些算法模型還會推送出一些結果。最后還會有不同的部署方式。有兩種,一種是結果會嵌入到現(xiàn)有的設備管理系統(tǒng)平臺,第二種是會構建SaaS服務平臺,例如機床診斷模塊。
工業(yè)大數(shù)據分析是最近一兩年有了工業(yè)物聯(lián)網后才興起的。目前覺云是基于既有經驗,已經有行業(yè)的know how,可以在8周的時間里進行部署。
在這期間,主要做兩大工作:第一階段是數(shù)據的準備,包括數(shù)據導入、數(shù)據清洗和基本的可視化;第二部分是數(shù)據建模,包括特征和算法的選擇、模型測試和評估。這兩大工作后面會結合實際案例作分析。
在這兩部分工作做完后,就是數(shù)據運營了。上述模型通過可視化之后會部署到現(xiàn)有的平臺或者是SaaS服務云。在這部分,需要有日常的運營工作,例如應用端的部署、分值計量和衡量指標,到最后還會反饋到第一個階段,算法不是一成不變的,隨著數(shù)據的積累、故障調優(yōu),會重新反饋到第一階段。所以實際上,算法是在云端或者在本地的自學習的算法,隨著數(shù)據的積累,也會更加智能。
電梯是量很大的設備,對安全質量要求很高。在電梯的智能化轉型過程中,有三個階段。
第一階段以安全監(jiān)控為主,主要是東芝、日立這些日系企業(yè)通過總線系統(tǒng)收集電梯運行的實時數(shù)據,根據預先定義的閾值(例如最高速度)進行報警。
第二階段就是三菱電梯通過歷史數(shù)據進行存儲,然后對地洞次數(shù)、運行時間做統(tǒng)計。統(tǒng)計指的是數(shù)據分析來預測電梯的健康狀況。第一階段和第二階段主要用的是歷史數(shù)據或者是人工統(tǒng)計的方式來做分析。
第三階段就是智能預測了,這一階段可以通過電機總線和外加傳感器的方式來收集實時數(shù)據,這些數(shù)據可以從系統(tǒng)層面來分析故障、能耗等。與此同時,隨著這些數(shù)據的積累,還可以建立一個回修專家系統(tǒng),像OTIS、蒂森克虜伯這些公司已經在做這部分工作。
Gartner曾對蒂森克虜伯的方案做出這樣評價,它是電梯預測性維護的第一個方案,它可以告訴技術工人怎么去維護。蒂森是一家德國高端電梯公司,在北美一共有一百萬的電梯在運行。蒂森和微軟、CGI合作,通過物聯(lián)網監(jiān)控平臺BlueBox,可以把數(shù)據實時上傳到云端,在云端進行數(shù)據存儲分析,最后把結果展現(xiàn)到終端,所以售后團隊就可以提前知道電梯的情況,這樣就可以實現(xiàn)停機時間縮短一半。
雖然很多都能做到實時監(jiān)控,但大數(shù)據需要做的是用云來做實時的分析。
這張圖顯示了某臺電梯在某個位置的健康狀況。從圖中可以看到,這臺設備的健康指數(shù)是70%,這其中采集了溫度、電梯速度高速、電梯門關門時間等,通過這些數(shù)值的綜合評估來給電梯做健康值的打分。
下一步就是實時性預測。采集這些電梯變量之后,通過分析就可以得出預測,再對工作人員進行通知,設備在幾天之后會出現(xiàn)故障。
這是蒂森電梯的應用架構
從圖中可以看出,BlueBox獲取數(shù)據后,進行前端處理并做存儲。事實上,在這一階段,做存儲并不容易,流式數(shù)據的采集、展示和分析,對數(shù)據質量要求很高。此外,還可以利用機器學習來對實時監(jiān)控做評判。
做大數(shù)據分析出發(fā)點是解決用戶痛點,工業(yè)物聯(lián)網和傳統(tǒng)交互體驗的人工智能相比,最大的區(qū)別就是工業(yè)智能解決的是顯示存在的問題。預測維護可以幫助客戶進行提前預警、備貨,減少人力成本;創(chuàng)建新的可靠性標準;實時監(jiān)控,可以給電梯提供商、業(yè)務和用戶帶來安全保障。
和電梯一樣,變速箱也是一臺成套設備,由電機、減速箱、驅動器、鋼絲繩等部分組成。而對成套設備做預測性維護并非是預測成套設別的生命周期,最終都是對系統(tǒng)的組成單元做預測性維護,把問題聚焦。
這是整體的分析框架
數(shù)據源來自客戶,包括報警數(shù)據、模擬數(shù)據(電流電壓溫度等)、數(shù)字數(shù)據(開關位置)、標簽描述。拿到這些數(shù)據后,就要做相應的數(shù)據存儲和分析。這里主要做兩部分工作:1.可視化,主要目的發(fā)現(xiàn)問題的時間分布在哪,從該圖可以看出,我們收集到的數(shù)據量非常大,模擬數(shù)據175M,數(shù)字數(shù)據10M,報警歷史記錄有1740條。。
然后再通過機器學習進行建模,對故障模型進行分析,分析后把故障預測的結果推送到可視化工具。
在之前的案例中我們發(fā)現(xiàn),每個這些問題發(fā)生的頻率是不同的。變速箱過熱是常態(tài)問題,5個月一共發(fā)生了1340起,占到了整個故障的77%,如果能準確預測這類問題,那么就能結局大部分問題。
除此之外,需要注意的是,有些問題之間也存在關聯(lián),例如變速箱過熱會產生其它的問題。當某天變速箱過熱問題特別集中,我們要分析這其中的原因,這對數(shù)據建模、特征分析、特征工程非常有幫助。
拿到數(shù)據做完分析之后,下一個工作是要工程處理。
工業(yè)智能數(shù)據有個特點:低維高頻,維度不多(相比購買行為預測的變量很少),但是頻次很高,每秒都在采集。所以,我們需要有相應的處理辦法:對傳感器的數(shù)據做聚合,最大、最小、中值、標準方差等,主要目的是讓初始變量更加豐富,變量越多預測的準確性也越高。
然后是數(shù)據建模。對于故障預測,我們進行了多個模型的選擇,尤其是在分類和異常檢測方面。分類是要告訴設備是否會壞,這會用到二元分類、回歸、多元分類和異常點檢測。
建模后要進行模型評估
這張圖顯示的是,在自由的算法包中進行評估來預測下5個小時內發(fā)生變速箱過熱的概率。右下角是預測的對比值(邏輯回歸、增強決策樹、決策樹、支持向量機):
最終評估下來,增強決策樹算法在準確性、精準度等擁有很好的表現(xiàn),所以最后選擇用這個算來作為變速箱過熱的預測。
最后是模型部署。做完模型之后,輸出的結果是一條記錄,例如變速箱在未來5個小時發(fā)生過熱的概率是多少。這之后有三種選擇:第一是和現(xiàn)場維修工單系統(tǒng)對接,第二是把結果推送到系統(tǒng)監(jiān)控平臺,另外也會發(fā)郵件提醒給管理人員。
從目前來看,能做數(shù)據采集的公司一般都具備這樣的維修工單系統(tǒng)平臺。
變速箱智能化主要給客戶帶來了四個方面的價值:提升設備、人員的生產力;減少故障停機,提高客戶滿意度;建立智能碼頭;構建新的價值體系。
另外,這個案例還得出了一個結論:如果要做成套設備的話,一定要從組件開始做預測。
在工業(yè)制造里面,機床最核心的問題就是刀具問題。實際上,刀具之于機床就如牙齒之于人類,如果刀具發(fā)生問題能提前感知,才能第一時間修復。
如果問題發(fā)生之后,再去修復就已經產生了廢品,這也會造成更大的損失。
上圖顯示的是某公司通過控制器收集了不同機床運行的數(shù)據,包括電流、電壓等。這里有幾個原則:因為影響刀具壽命的變量很多,所以需要人工智能算法來預測;另外,可以和多年經驗曲線進行結合;刀具壽命是非線性關系,一定要通過實時數(shù)據進行在線學習。
應用大數(shù)據算法形成智能化機床設備管理體系之后,會根據數(shù)據建模分為兩大問題:第一類,刀具會不會發(fā)生故障,第二類是多久發(fā)生故障。
針對第一類問題,用分類模型來解決,例如選擇用邏輯回歸、決策樹還是神經網絡來告訴我們會不會壞,如果會壞,就來到下一個問題。預測多久發(fā)生故障,則主要用決策樹、泊松回歸、神經網絡回歸等來告訴設備提供商設備多久會壞。
之前,我們看到的智能算法主要聚焦在商業(yè)或者交互領域,現(xiàn)在我們正在嘗試把智能算法帶到工業(yè)領域。
工業(yè)智能,解決問題的算法體系主要分為三大類:第一是預測性維護,這對于基于物理損耗為主的設備是最行之有效的算法;第二類是能效管理;第三類是質量管理。
Q:對于流程工業(yè)生產環(huán)境下的生產設備故障預測,在數(shù)據采集匯總階段,需要考慮哪些因素?或者需要哪些數(shù)據輸入呢?
A:這里面有兩個層次的問題:第一個是自上而下來做,現(xiàn)在流程工業(yè)里面,DCS(雷鋒網注:分布式控制系統(tǒng),Distributed Control System)已經采取了很多數(shù)據,現(xiàn)在我們用這些DCS數(shù)據,我們可以做一些基本預測性維護;
第二種是自下而上,以泵為例,DCS有些數(shù)據是關于泵的,但是有些數(shù)據是沒有的,在這種情況下,一定是前裝+后裝的方式。前裝就是利用DCS固有的數(shù)據,后裝就是加裝一些沒有的數(shù)據,這樣配合才能準確預測泵或者管道的預測性維護的點。
我認為前裝方式所拿到的數(shù)據是最好的,后裝則更具挑戰(zhàn)。
Q:阿里云正式發(fā)布了ET工業(yè)大腦。這個大腦目前已經被用在了協(xié)鑫光伏工廠里,可以提高1%的生產良品率。常偉老師如何看待這個產品?對傳統(tǒng)工廠來說,怎么選擇?
A:阿里云這個是上文提到的第三類解決方案,質量管理方案。對于生產良品率來說,每個工廠都要case by case做分析,對傳統(tǒng)工廠肯定需要找一個比較靠譜的方案。
Q:小型工廠缺乏數(shù)據的積累,以您的經驗來看,對我們來說接入大數(shù)據方案需要考慮哪些問題?
A:小型工廠我建議采用SaaS解決方案,現(xiàn)在很多服務商提供一些現(xiàn)成的SaaS解決方案,幫助現(xiàn)有的工廠機床、泵等做到云端,然后再來根據數(shù)據做分析,對小型工廠來說,這種方案還是比較靠譜可行的。
Q:國內政府一直在喊數(shù)字化轉型,從目前來看,國內技術是否成熟了?
A:從現(xiàn)在來看,尤其是對制造企業(yè)而言,技術是比較成熟了,數(shù)字化轉型無非是數(shù)據采集、傳輸、存儲和分析這幾塊。目前的企業(yè)在幾部分都有比較成熟的解決方案,不過有些企業(yè)的管理水平有待提高。
大家一直在談我們的工業(yè)水平比較低,現(xiàn)在有一個問題是我們的管理能力是否能支持中國制造2020。
Q:工業(yè)化轉型最大的挑戰(zhàn)是什么?怎么去克服這些問題?
A:最大的挑戰(zhàn)我們認為有兩個方面:一個是人的管理水平;第二個是技術方面的問題。
覺云有一個客戶是做刀具的,通過傳統(tǒng)的方式他認為沒有法提升了。他們希望通過數(shù)字化的方式來提取數(shù)據,來告訴他這種刀具在加工哪種材料和工藝是最佳的,這就可以幫助他去挑戰(zhàn)國外一些企業(yè)。
目前來看,數(shù)字化轉型是解決技術問題的主要方式。做數(shù)字化平臺第一步是建立數(shù)字化預測,第二步是數(shù)字化工單系統(tǒng),第三步建立和工藝之間的關系,這幾步下來最少要2-3年,所以工廠要對這個周期有一個認知。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。