0
本文作者: 張帥 | 2019-05-28 18:17 |
雷鋒網(wǎng)消息,在2019全球人工智能技術(shù)大會(huì)主論壇,英特爾高級(jí)首席工程師、大數(shù)據(jù)技術(shù)全球CTO戴金權(quán)發(fā)表了題為“如何構(gòu)建統(tǒng)一的大數(shù)據(jù)分析+AI平臺(tái)”的演講,英特爾的硬件能力不必贅述,這次英特爾則著重展示了軟硬協(xié)同能力,尤其是人工智能開源軟件平臺(tái)Analytics Zoo。
戴金權(quán)表示,英特爾致力于提供從設(shè)備端到邊緣再到數(shù)據(jù)中心、云端完整的計(jì)算架構(gòu),比如在數(shù)據(jù)中心,英特爾至強(qiáng)系列服務(wù)器是AI應(yīng)用分析的基礎(chǔ)架構(gòu),同時(shí)也提供了多種神經(jīng)網(wǎng)絡(luò)處理器等硬件架構(gòu)。
英特爾開源AI軟件版圖
如上圖所示,這是英特爾使用開源AI軟件加速開發(fā)的版圖,他強(qiáng)調(diào),英特爾致力于提供全棧的解決方案,從最底層的算法開源項(xiàng)目幫助用戶更高效開發(fā)計(jì)算庫(kù),再到上層各種機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)的框架,再到最上層,英特爾也提供了一些開源工具包,目的是幫助應(yīng)用開發(fā)人員更高效的開發(fā)基于深度學(xué)習(xí)的應(yīng)用。
據(jù)雷鋒網(wǎng)了解,業(yè)內(nèi)大數(shù)據(jù)分析和AI平臺(tái)產(chǎn)品并不少,英特爾這類將大數(shù)據(jù)分析和AI平臺(tái)融為一體的模式正成為行業(yè)新趨勢(shì)。
第一,對(duì)于大多數(shù)用戶來說,尤其在生產(chǎn)系統(tǒng)當(dāng)中,基于Apache Spark這樣的大數(shù)據(jù)集群仍然是所有的生產(chǎn)數(shù)據(jù)以及包括大量硬件資源的聚集地,如何更高效利用生產(chǎn)數(shù)據(jù)以及硬件資源,能夠?qū)⑿碌娜斯ぶ悄艿膽?yīng)用支持起來成為新挑戰(zhàn)。
第二,要構(gòu)建一個(gè)工業(yè)級(jí)端到端的大數(shù)據(jù)分析+人工智能應(yīng)用,并不是說訓(xùn)練一個(gè)模型就可以完成的事情,其是一個(gè)非常復(fù)雜的流水線或者工作流。從數(shù)據(jù)的收集、導(dǎo)入、處理、特征的提取、各種模型的構(gòu)建訓(xùn)練,到最后的部署、推理等等,是一個(gè)非常復(fù)雜的工作流。
“我們能夠幫助用戶可以將這一個(gè)樣端到端的大數(shù)據(jù)處理分析加上機(jī)器學(xué)習(xí)的工作流能夠非常方便地構(gòu)建出來,從而大大能夠提高了用戶的開發(fā)效率、部署效率和運(yùn)維效率”,戴金權(quán)介紹道。
與過去數(shù)年相比,深度學(xué)習(xí)和人工智能應(yīng)用場(chǎng)景更加廣泛,要處理的數(shù)據(jù)也更加廣泛,所以客觀要求使用者構(gòu)建端到端的大數(shù)據(jù)處理分析加上機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的統(tǒng)一流水線。英特爾觀察到,客戶有越來越多的類似需求。
“我們有很多用戶是來自于很多非常大的互聯(lián)網(wǎng)公司或者是大的企業(yè)里面的傳統(tǒng)實(shí)驗(yàn)室,他慢慢的也會(huì)發(fā)現(xiàn),當(dāng)構(gòu)建了一些人工智能深度學(xué)習(xí)的框架和模型之后,怎么樣能夠很好的真正跑到生產(chǎn)系統(tǒng)上去,能將生產(chǎn)數(shù)據(jù)在上面跑起來。這是用戶來使用英特爾Analytics Zoo一個(gè)很重要的出發(fā)點(diǎn)?!?/p>
此外,Analytics Zoo的用戶也不乏硬件的OEM的廠商、軟件提供商、公有云服務(wù)商等,英特爾現(xiàn)場(chǎng)展示出的客戶包括浪潮、寶信、戴爾、阿里云和騰訊云等。
從深度學(xué)習(xí)模型到一個(gè)完整的工業(yè)級(jí)應(yīng)用要多少步驟?如上戴金權(quán)在現(xiàn)場(chǎng)展示的PPT,黑色部分是核心的深度學(xué)習(xí)模型,但是周邊有很多工作要完成,才能使之運(yùn)行起來。
深度學(xué)習(xí)的模型只是整個(gè)流程的一部分,要構(gòu)建和應(yīng)用深度學(xué)習(xí)模型,還有數(shù)據(jù)的導(dǎo)入、數(shù)據(jù)清洗、特征提取、對(duì)整個(gè)集群的資源的管理和各個(gè)應(yīng)用之間對(duì)這個(gè)資源的共享等,這些工作事實(shí)上占據(jù)了機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)的一個(gè)工業(yè)級(jí)應(yīng)用開發(fā)大部分的時(shí)間和資源。所以,數(shù)據(jù)處理、機(jī)器學(xué)習(xí),以及算法必須很好地和現(xiàn)有的大數(shù)據(jù)處理的工作流整合在一起。
這也是構(gòu)建一個(gè)端到端的應(yīng)用場(chǎng)景所面臨的問題,在沒有一個(gè)統(tǒng)一的大數(shù)據(jù)分析+AI平臺(tái)之前,需要人工把很多不同的框架拼湊起來。
另外很多用戶開發(fā)一般都是從單機(jī)開始,當(dāng)需要處理更多數(shù)據(jù)的時(shí)候,就需要跑到一個(gè)大規(guī)模分布式環(huán)境,甚至到一個(gè)生產(chǎn)環(huán)境里去。
從Analytics Zoo的角度,第一,英特爾能夠?qū)⒉煌目蚣軣o(wú)縫的集成到流水線里面去,通過在軟件層上面各種新的支持或者功能,能夠?qū)ensorFlow、Spark能夠非常無(wú)縫的集成在一個(gè)程序里面,在一個(gè)Spark程序里面直接嵌入TensorFlow的Code,然后一起運(yùn)行起來,這其實(shí)對(duì)很多用戶來說很有吸引力。
第二是在開發(fā)過程中,因?yàn)榈讓舆\(yùn)行在Spark這樣的引擎上,上面可以嵌入各種深度學(xué)習(xí)的功能,它可以運(yùn)行在一個(gè)單機(jī)的環(huán)境,也可以跑到一個(gè)分布式環(huán)境里面去,用戶也可以直接訪問生產(chǎn)數(shù)據(jù)。
“很多用戶之所以想用Analytics Zoo,就是它可以直接構(gòu)建端到端的,跟生產(chǎn)系統(tǒng)幾乎一致的原型。這是我們的一個(gè)主要出發(fā)點(diǎn),可以幫助用戶將整個(gè)的大數(shù)據(jù)分析+人工智能的應(yīng)用很方便的將端到端的流水線構(gòu)建出來,而且它可以很方便的從用戶的筆記本運(yùn)行到集群、運(yùn)行到用戶的生產(chǎn)環(huán)境當(dāng)中去,這是英特爾在底層Analytics Zoo這個(gè)平臺(tái)里所做的工作”,戴金權(quán)總結(jié)道。
Analytics Zoo是為了大數(shù)據(jù)平臺(tái)所優(yōu)化的,今天大數(shù)據(jù)平臺(tái)基本都運(yùn)行在非常大規(guī)模的英特爾至強(qiáng)處理器上,或許是幾十、幾百、幾千個(gè)節(jié)點(diǎn),但是英特爾使用了大量的底層優(yōu)化的框架和庫(kù),像MKL-DNN、OpenVINO等等,將來會(huì)通過英特爾One API這樣的生態(tài)系統(tǒng)輸出。
戴金權(quán)提到,當(dāng)在英特爾的生態(tài)系統(tǒng)上構(gòu)建一個(gè)人工智能開發(fā)平臺(tái)時(shí),帶來的好處就是底層能夠支持英特爾各種硬件的加速,不管是至強(qiáng)服務(wù)器,包括像Movidius、FPGA,神經(jīng)網(wǎng)絡(luò)處理器,還有將來的獨(dú)立顯卡,都可以通過One API下面的底層生態(tài)系統(tǒng)來給上層的平臺(tái)和應(yīng)用所使用。
雷鋒網(wǎng)總結(jié),Analytics Zoo能夠?qū)⒏鞣N不同的模塊不同的框架下統(tǒng)一到一個(gè)端到端流水線上,提高客戶開發(fā)部署大數(shù)據(jù)分析和深度學(xué)習(xí)的能力,這在如今深度學(xué)習(xí)或者機(jī)器學(xué)習(xí)越泛化的背景下十分重要,英特爾的工作能夠讓用戶減少人工智能應(yīng)用的開發(fā)環(huán)節(jié),快速推向現(xiàn)實(shí)場(chǎng)景。
英特爾高級(jí)首席工程師、大數(shù)據(jù)技術(shù)全球CTO戴金權(quán)已經(jīng)確認(rèn)出席由中國(guó)計(jì)算機(jī)學(xué)會(huì)主辦,雷鋒網(wǎng)、香港中文大學(xué)(深圳)聯(lián)合承辦的CCF-GAIR全球人工智能與機(jī)器人峰會(huì)。
2019年7月14日,CCF-GAIR 2019 將結(jié)合語(yǔ)音、計(jì)算機(jī)視覺等傳統(tǒng)人工智能重點(diǎn)方向的研究,以及如在經(jīng)濟(jì)學(xué)等領(lǐng)域的新應(yīng)用,承接歷史與未來、學(xué)術(shù)研究與產(chǎn)業(yè)應(yīng)用,對(duì)世界和中國(guó)近四十年來的人工智能研究進(jìn)行一個(gè)系統(tǒng)性的回顧并展望在當(dāng)前復(fù)雜國(guó)際形勢(shì)下中國(guó)人工智能的未來發(fā)展。
超鏈接:CCF-GAIR 2019 大會(huì)官網(wǎng)
相關(guān)文章:
英特爾首次向其投資者談?wù)撘粋€(gè)不為人知的“秘密”
英特爾以數(shù)據(jù)為中心的競(jìng)爭(zhēng)優(yōu)勢(shì)是什么?BATJ有個(gè)共同的觀點(diǎn)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。