0
本文作者: 張帥 | 2019-06-20 11:47 |
“科學(xué)規(guī)律的數(shù)量井噴,產(chǎn)業(yè)全面進入科學(xué)時代”,第四范式創(chuàng)始人兼CEO戴文淵道出了他的洞察。
1998年圖領(lǐng)獎獲得者Jim Gray于2005年提出《第四范式》,第四范式的典型特點是數(shù)據(jù)科學(xué),計算機從海量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律、形成理論詮釋自然現(xiàn)象。此即第四范式公司的愿景與目標。
戴文淵提到,在第四范式時代,企業(yè)的評估指標發(fā)生了變化,從追逐資產(chǎn)負債率、增長率、凈資產(chǎn)收益率等維度,改為追求創(chuàng)新速度,比如每天能找到多少個客戶需求,每天能發(fā)現(xiàn)多少種降低成本的新方法,每天能找到多少個提升企業(yè)運營效率的新思路。
這不是僅僅靠增加人力就能實現(xiàn)的任務(wù),商業(yè)智能的重要性在此凸顯。
戴文淵提出了企業(yè)全面智能化轉(zhuǎn)型新范式:1+N。1代表追求極致的業(yè)務(wù)效果,如何充分發(fā)揮數(shù)據(jù)的價值,如何從“事后分析”變?yōu)椤皩崟r決策”。N代表追求規(guī)?;涞匦?,如何讓一個Web開發(fā)人員也能開發(fā)AI應(yīng)用,如何解決AI落地過程中的數(shù)據(jù)瓶頸。
在1+N之下,充沛且高效的算力是基礎(chǔ),第四范式不僅提供軟件開發(fā)平臺,還提供AI算力的硬件平臺,
第四范式聯(lián)合創(chuàng)始人兼首席架構(gòu)師胡時偉回答了如上1+N的問題,第四范式認為,統(tǒng)一方法論+AutoML=快速構(gòu)建AI應(yīng)用,面向AI數(shù)據(jù)治理=規(guī)?;疉I落地。
構(gòu)建“閉環(huán)AI應(yīng)用”的兩大挑戰(zhàn),其一是數(shù)據(jù)的準備,傳統(tǒng)的數(shù)據(jù)積累并不適配于AI應(yīng)用,AI數(shù)據(jù)準備平均耗時達到14人月;其二是模型的開發(fā),AI專業(yè)人才缺失+高難度復(fù)雜的模型開發(fā)上線過程,導(dǎo)致模型開發(fā)上線平均周期達到了16人月。
在AI數(shù)據(jù)治理中,第四范式能夠提供數(shù)據(jù)采集訪問雙實時,全量原始數(shù)據(jù),線上線下一致性和利用回流數(shù)據(jù)自動標注的功能
有了大規(guī)模AI應(yīng)用,并不意味著萬事大吉,很多時候算力都會成為阻礙。胡時偉提到,在追求核心場景的極致效果案例中,隨著數(shù)據(jù)量擴大,機器數(shù)量是指數(shù)級上升而非線性;在追求規(guī)?;涞卮罅緼I應(yīng)用場景的案例中,隨著機器數(shù)量和場景數(shù)量增長,整體TCO也是指數(shù)級增長。傳統(tǒng)算力和AI應(yīng)用負載之間存在天然的鴻溝。
雷鋒網(wǎng)了解到,今年年初,IDC發(fā)布創(chuàng)新者榜單,第四范式旗下智能風控平臺及AutoML產(chǎn)品分別入選“中國人工智能金融反欺詐”、“亞太地區(qū)下一代高級大數(shù)據(jù)分析”創(chuàng)新者榜單。
入選理由如下:
快速部署分析能力:結(jié)合第四范式企業(yè)級AI平臺,AutoML可實現(xiàn)4步快速部署分析過程:收集行為數(shù)據(jù)、收集反饋數(shù)據(jù)、訓(xùn)練模型、利用產(chǎn)品套件部署模型。
基于自學(xué)習(xí)閉環(huán)構(gòu)建全自動化機器學(xué)習(xí)模型:第四范式AutoML自動化AI建模工具基于自學(xué)習(xí)閉環(huán),幫助企業(yè)構(gòu)建定制化、全自動化機器學(xué)習(xí)模型,應(yīng)對行業(yè)及企業(yè)面臨的挑戰(zhàn)。
深度優(yōu)化的軟硬件集成一體化:第四范式將整合現(xiàn)有軟件和服務(wù),為用戶提供企業(yè)級AI一體機。
在本次發(fā)布會上,第四范式進一步更新了新一代AI全線產(chǎn)品陣列。
基于如上難題,第四范式推出了SageOne Appliance軟硬一體化集成系統(tǒng)。該系統(tǒng)分為三部分,第一部分是AI平臺,包含數(shù)據(jù)管理平臺,學(xué)習(xí)圈開發(fā)平臺以及應(yīng)用運維平臺,同時也是AI開發(fā)&運行環(huán)境;
第二部分是AI核心引擎,包含AI訓(xùn)練引擎,AI推理引擎和AI存儲引擎;
第三部分是硬件基礎(chǔ)設(shè)施,這部分主要是Intel Cascade Lake AP處理器,4Pd ATX加速卡,Infini-cache無限緩存和Swift高吞吐零拷貝網(wǎng)絡(luò)。
第四范式表示,SageOne是一個全新的企業(yè)級產(chǎn)品物種,摒棄了傳統(tǒng)算力堆砌硬件的方式,而采用由軟件定義的專用AI系統(tǒng)架構(gòu),更好的理解AI 算法的運算架構(gòu)與邏輯,更深層次軟硬件一體化的優(yōu)化和加速,全面滿足企業(yè)AI應(yīng)用的算力需求。
以第四范式高維算法為基礎(chǔ),SageOne搭載第四范自主研發(fā)的硬件加速卡——4Paradigm ATX800,內(nèi)置模型訓(xùn)練和特征工程等多種加速能力,支持自動優(yōu)化訓(xùn)練超參數(shù)、高位特征計算過程I/O加速和高維GBDT訓(xùn)練加速等應(yīng)用,在企業(yè)應(yīng)用場景中表現(xiàn)出高達10倍的訓(xùn)練性能。
SageOne還內(nèi)置第四范式自主研發(fā)的高維、分布式網(wǎng)絡(luò)通訊協(xié)議Swift,集成pPRC自研網(wǎng)絡(luò)通信框架、零拷貝數(shù)據(jù)交換協(xié)議等AI領(lǐng)先通訊技術(shù),結(jié)合基于CLX-AP架構(gòu)的參數(shù)服務(wù)器集群。SageOne在高維特征計算過程I/O最大10X加速,高維稀疏場景模型訓(xùn)練比GPU提速5X以上,自研pRPC通信框架比百度bRPC和谷歌gRPC提速3-10X。
現(xiàn)場第四范式聯(lián)合創(chuàng)始人、首席科學(xué)家陳雨強首次提出了全新特性的AutoML 2.0技術(shù),他表示,AutoML 2.0不僅是世界首個交互式AutoML技術(shù),同時具備自動跨表特征增強能力。在世界知名的Kaggle機器學(xué)習(xí)競賽中,第四范式AutoML 2.0與數(shù)據(jù)科學(xué)家共同挑戰(zhàn)多項競賽,競賽結(jié)果數(shù)據(jù)顯示全世界平均每7-10位數(shù)據(jù)科學(xué)競賽選手,只有1位能擊敗第四范式AutoML 2.0;而在結(jié)構(gòu)化機器學(xué)習(xí)問題上第四范式AutoML 2.0比Google Cloud AutoML排名靠前61.2%,在圖像分類問題上比它排名靠前64.2%。
雷鋒網(wǎng)還了解到,基于目前企業(yè)AI應(yīng)用的痛點問題,第四范式未來還將引入隱私保護遷移學(xué)習(xí)(AutoPTL)、自動半監(jiān)督機器學(xué)習(xí)(AutoSSL)、自動正樣本和無標簽樣本學(xué)習(xí)(AutoPU)、自動知識圖譜嵌入(AutoKGE) 等眾多Auto“黑科技”到產(chǎn)品體系中,提高企業(yè)AI應(yīng)用率和價值。
此外,雷鋒網(wǎng)現(xiàn)場獲悉,第四范式宣布開啟“啟航”合作伙伴計劃,著力打造基于“先知”平臺的生態(tài)體系建設(shè)?;谙戎脚_,第四范式建立起產(chǎn)品賦能、咨詢賦能、交付賦能、營銷賦能、技術(shù)賦能五大賦能中心,正與廣大解決方案商、咨詢服務(wù)商、實施服務(wù)商、渠道分銷商及開發(fā)者開展生態(tài)合作。
相關(guān)文章:
第四范式AI賦能的下一征程:推出AutoCV平臺“范式視界”
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。