丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
業(yè)界 正文
發(fā)私信給王金許
發(fā)送

1

Zilliz 星爵:高維打擊,OLAP 數(shù)據(jù)庫的下一程

本文作者: 王金許 2018-01-22 11:04
導語:這個領域會有成為下一個 Oracle 的機會?

一個月前, Open Power 高峰論壇之后,IBM Systems Open Power 總經(jīng)理 Ken King 在媒體溝通會上向記者們再次強調(diào)了 Power9 架構的優(yōu)勢??傊谛阅苌?,與 X86 相比,就差他說“吊打”二字了。

一定程度上,這數(shù)據(jù)處理能力上的大幅提升有關,而 Zilliz 這家看上去不怎么起眼的數(shù)據(jù)庫公司是“賦能者”之一,它聯(lián)合 IBM 發(fā)布的是國內(nèi)首臺 GPU 硬件加速 OLAP 數(shù)據(jù)庫一體機 MEGAWISE。

這對 Power9 的性能到底有多大程度的提升呢?Zilliz 創(chuàng)始人星爵(真名謝超)當時給了一組數(shù)據(jù):利用 GPU 的高并發(fā)性,數(shù)據(jù)處理的性能相對 CPU 架構提高了 100 倍,同時,硬件成本降低了 10 倍,數(shù)據(jù)中心的運維、能耗成本大概降低 20 倍。

這些數(shù)據(jù)的背后就是 Zilliz 的價值所在,它從星爵極快的語速中結束,記者們看上去似乎還沒反應過來。

但更讓他們感到疑惑的或許是他說的第一句話:基于 GPU 硬件加速的新一代 OLAP 數(shù)據(jù)庫會是一項全新的顛覆性技術。

Zilliz 星爵:高維打擊,OLAP 數(shù)據(jù)庫的下一程

歸根結底,算力不夠

這個時代屬于人工智能,但也別忘了作為其重要基石的大數(shù)據(jù)。

放眼望去,各行業(yè)無論是堆積的歷史數(shù)據(jù),還是正產(chǎn)出的數(shù)據(jù)正在變得愈加龐雜,那些擁有數(shù)據(jù)的企業(yè)希望有更好數(shù)據(jù)分析服務來調(diào)整、掌控自身的業(yè)務。

但現(xiàn)有的處理方案,比如,基于 Hadoop 的技術雖然成本低,但分析速度難以滿足企業(yè)需求,而有些采集數(shù)據(jù)的處理還具有一定時效性。

總體而言,數(shù)據(jù)庫處理主要面臨這兩大瓶頸:一是數(shù)據(jù)計算速度,這與處理器相關,處理器越強大,算力越好,處理越快;二是數(shù)據(jù)訪問速度,數(shù)據(jù)要從磁盤讀取,然后轉(zhuǎn)到內(nèi)存進入處理器進行分析。

這兩大問題在數(shù)據(jù)庫發(fā)展中一直是此消彼長的存在,交替阻礙著彼此的發(fā)展。比如,通過水平擴展可以增加更多處理器,但這會降低數(shù)據(jù)訪問速度。而后來出現(xiàn)的 A6,SSD 固態(tài)硬盤把數(shù)據(jù)訪問速度提高了一個數(shù)量級,但處理架構不得不做出改變,就像數(shù)據(jù)不再是放在固態(tài)硬盤,而是在內(nèi)存里。

這樣問題來了,由于內(nèi)存比固態(tài)硬盤又多了一個數(shù)量級的訪問速度,那一旦給出更多數(shù)據(jù),CPU 計算能力又跟不上了。于是,又只能到處理器那里做文章,以此陷入新一輪你上我下的死循環(huán)之中。

這是當時在 Oracle 做數(shù)據(jù)庫的星爵一直所思考的問題。

身處在世界上頂尖數(shù)據(jù)庫專家云集的系統(tǒng)里,他對這個產(chǎn)業(yè)的認知不再只是琢磨具體的技術細節(jié),而是回歸那些基礎問題。

為什么數(shù)據(jù)庫發(fā)展會變慢?為什么大數(shù)據(jù)有這種 Hadoop 的方案出現(xiàn)?為什么數(shù)據(jù)分析不可能跟上數(shù)據(jù)產(chǎn)生量? 

歸根到底,星爵告訴雷鋒網(wǎng),這些都是因為數(shù)據(jù)庫處理系統(tǒng)的算力不夠。

數(shù)據(jù)庫的 indexes 加快了數(shù)據(jù)訪問、分析的速度,它本質(zhì)上是用空間來換時間,那如果有一個算力快 1 萬倍的 CPU 會不會更好呢?

他想到,加了 indexes 之后數(shù)據(jù)可能只存 1TB,而現(xiàn)在可能要存 1.5TB 甚至 2TB 的數(shù)據(jù)。但這樣,數(shù)據(jù)更新的同時也需要更新索引來維護數(shù)據(jù)一致性,這會導致插入更新數(shù)據(jù)的分析速度也會變慢,而算法也將變得更為復雜。

這又是另一個死胡同,跳出這個思維困境,一個大膽假設是干脆不要 indexes 了可以嗎?

上世紀 80 年代以后,indexes 就被視為數(shù)據(jù)庫的標配,但實際上,就像充電寶被看做是手機的“標配”一樣,星爵認為,其實就是算力不夠,“夠的話,indexes 也許就不需要了”。

2012 年,In-Memory Database 系統(tǒng)的出現(xiàn)也解決了一些問題,但他并不認為這能進行高維打擊——有 GPU 處理器的智能手機對功能手機就是高維打擊。

此路不通,他在尋找新的能讓數(shù)據(jù)庫有所革新的機會。

“提速降本”,高維打擊

基于 GPU 加速的數(shù)據(jù)庫研究最早于 2006 年就開始了,當時主要是在 GPU 上做數(shù)據(jù)庫處理算法。隨后,數(shù)據(jù)庫處理算法在不斷擴充和優(yōu)化中,與之相關的話題在每年的 SIGMOD、VLDB 和 ICDE 三大國際頂級數(shù)據(jù)庫會議上被業(yè)內(nèi)人士進行探討,

但直到 2013 年,深度學習的崛起將 GPU 市場普及度推向了高潮?;?GPU 這個新硬件平臺的天然優(yōu)勢,人們對它的認知不再是不務正業(yè)的游戲機,而是可以成為 CPU 一樣的服務器芯片。

更重要的是,以英偉達的 CUDA 為代表的 GPU 生態(tài)也建了起來,開發(fā)門檻隨之降低。

“這應該就是高維打擊的臨界點”,星爵覺得,他一直尋找的能讓數(shù)據(jù)庫從量變到質(zhì)變的革新終于要來了。

于是,2015 年下半年,在謝超所在的小組完成 Oracle 12c 的多租戶數(shù)據(jù)庫的研發(fā)后,是時候離開這個已經(jīng)服役 6 年的地方了。 

在 Oracle 的那些年,他經(jīng)歷了最初的項目立項到功能分析、需求分析,設計等整個流程。值得一提的是,2013 年,星爵所在的小組研發(fā)出了 Oracle 12c 第一版,“c”即代表“cloud(云計算)”,這是 Oracle 首個“為云而生”的數(shù)據(jù)庫,它奠定了未來 Oracle 數(shù)據(jù)庫發(fā)展的戰(zhàn)略方向。

不過,這家全球最大的數(shù)據(jù)庫巨頭準備在云計算市場發(fā)力,正是在他碩士畢業(yè)進入 Oracle 的第一年,這比 Amazon 在 2005 年第一次提出開發(fā)云計算平臺晚了整整四年。也難怪,Oracle CEO Larry Ellison 當時對云計算根本瞧不上,甚至認為那是一個愚蠢的概念。

與前老板的態(tài)度不同,星爵要去抓住做 GPU 數(shù)據(jù)庫的機會了,他堅定認為這與數(shù)據(jù)庫巨頭們競爭時能拉開差距。

因為 GPU 的出現(xiàn),讓數(shù)據(jù)提供速度與數(shù)據(jù)處理速度達到了平衡態(tài)。甚至,由于 GPU 處理能力在近幾年以數(shù)十倍速度不斷提升,這又遠超于數(shù)據(jù)供給的速度,同時基于像 IBM 的 NVLink 這種高速互聯(lián)技術,尤其 Power9 服務器使用的 NVLink 2.0,讓 GPU 與 CPU 之間可以建立三個通道,每個通道的速度提高到了 25G,這讓 GPU 訪問內(nèi)存的速度有了很大提升,而老對手英特爾并沒有解決數(shù)據(jù)訪問帶寬的問題。

對類似于 Power 系列軟硬一體機而言,基本需求點就是由軟件帶動硬件的銷售,所以在他看來,IBM 在使用了 Zilliz 的數(shù)據(jù)庫軟件之后,也會促進其硬件的銷量。 

數(shù)據(jù)分析速度問題就解決了,接下來就看能不能降低成本。

星爵告訴雷鋒網(wǎng),Power9 一體機每套大約 90 萬元,而像 Oracle 的 Exadata 服務器成本則在幾十萬美元到上百萬美元之間不等,這么一比,前者是占優(yōu)的。

還有更重要的后續(xù)維護和能耗成本。以前,在數(shù)據(jù)庫中心擺上服務器要占據(jù)半個機房,現(xiàn)在可能需要一臺服務器就已足夠,而節(jié)省了數(shù)據(jù)庫中心的空間,后期運維、能耗也自然隨之降低。 

除了搭載在 X86、Power 這樣的軟硬一體機上,Zilliz 的 GPU 數(shù)據(jù)庫軟件也被互聯(lián)網(wǎng)、金融、政府等行業(yè)應用,他們正在選擇一些頭部客戶去做 POC,把數(shù)據(jù)庫系統(tǒng)部署在它們的生產(chǎn)環(huán)境,以解決技術落地問題。他們今年預計會服務 30-50 家客戶。

他也看好云端的 SaaS 數(shù)據(jù)庫方案,認為這在未來有很大的成長空間,現(xiàn)在他們的客戶就有 AWS、騰訊云、阿里云等云廠商。 

成為下一個 Oracle 的機會

市場還處于早期階段。

Zilliz 目前是中國唯一一家做 GPU 數(shù)據(jù)庫的創(chuàng)業(yè)公司,其它拿到大額融資的還有三家,其中兩家在硅谷,一家在以色列。這四家公司在 OLAP 數(shù)據(jù)庫市場的年收入加起來不過 2000 萬美元左右。

不過,根據(jù) Gartner 的統(tǒng)計數(shù)據(jù),在 2017 年,OLAP 數(shù)據(jù)庫是大約是 183 億美元的市場,到 2020 年,預計會達到 228 億美元。

這個領域會有成為下一個 Oracle 或者安卓的機會,星爵這樣認為。

一個問題是,既然這個市場空間的想象力這么大,巨頭們難道會坐視不理嗎?理論上講,像英偉達和 IBM 這樣的巨頭既然有硬件,那憑借這樣的優(yōu)勢,它們介入基于 GPU 數(shù)據(jù)庫軟件自然也不奇怪。況且,在數(shù)據(jù)庫領域還有 Oracle 盤踞一方,那 Zilliz 這樣的創(chuàng)業(yè)公司能有多大的機會?

先從技術層面看,數(shù)據(jù)庫作為底層系統(tǒng)軟件,它的準入門檻不低,但對于做傳統(tǒng)的基于 CPU 數(shù)據(jù)庫的 Oracle 來說,它一旦選擇切換到以 GPU 為核心這個數(shù)據(jù)庫上,需要從硬件到軟件包括存儲、優(yōu)化、執(zhí)行到整個數(shù)據(jù)管理和調(diào)度上,基本都要重新寫入,而不只是更改一些兼容性內(nèi)容。這個過程看上去不那么輕松。

“它不像是手機 APP,甚至是 ERP 或者 CRM?!毙蔷魧卒h網(wǎng)解釋,這就好比微軟雖然在 PC 操作系統(tǒng)上馳騁了幾十年,但在手機這個硬件平臺上的競爭力幾乎忽略不計,“幾乎是一個推倒重來的過程?!?/p>

換個角度來看,即便巨頭們雖然有能力進入,它們的共性在于響應速度會緩慢很多。

另一方面,從商業(yè)角度來說,如果巨頭做 GPU 數(shù)據(jù)庫軟件,那必定也會沖擊現(xiàn)有的業(yè)務線。比如 Oracle現(xiàn)在賣得最好的是 Exadata,這還是 2010 年把 SUN 收購以后研發(fā)而成的。那在它投入了數(shù)十億美元的產(chǎn)品線,甚至還沒賺回成本時,它的目標應該是賣出更多的 Exadata,如果轉(zhuǎn)向 GPU 服務器它會非常慎重。

所以可以看到,近年來巨頭們的策略選擇也開始有所轉(zhuǎn)變,一般都是先守住自己擅長的硬件,然后在軟件上找相應的合作伙伴加盟開放平臺,不再追求大包大攬。 IBM 成立的 Open Power 基金會就是如此。

因此,星爵并不認為 GPU 數(shù)據(jù)庫這條路上他們會與 Oracle 們很快碰面。

創(chuàng)業(yè)公司機動性要更強,但并不意味著 Zilliz 闖入一個新興領域會比巨頭們?nèi)菀缀芏唷?/p>

公司發(fā)展戰(zhàn)略、商務拓展、市場銷售等方面是 CEO 星爵在這兩年里面臨的挑戰(zhàn),并且在未來幾年或許還將持續(xù)下去。一些挑戰(zhàn)讓這個團隊在這兩年里走了彎路。

最糾結的還是對產(chǎn)品化的判斷,初期如何在產(chǎn)品與市場找出無縫切合點讓他們難以取舍,“最開始要兼容,你不能說完全做一個跟現(xiàn)在市場上所有(系統(tǒng))都去兼容。選哪家做兼容本身也沒有對錯,但可能要看最終是不是能選出最有價值的客戶,這可能要做大量的工作?!?/p>

針對不同方案對應做數(shù)據(jù)庫,他們很快就做出了產(chǎn)品,但隨著系統(tǒng)增多,這種做法讓以后在技術上做擴展會更加復雜。

他們現(xiàn)在更希望提煉出其中的共性,然后做出統(tǒng)一的方案去兼容多個系統(tǒng),即使研發(fā)進度會相應減緩。對于 OLAP 數(shù)據(jù)庫軟件來說,其實本質(zhì)上做的就是一個平臺,“ERP、CRM 各種企業(yè)級軟件都是建立在數(shù)據(jù)庫之上的。”

在星爵看來,新一代數(shù)據(jù)庫技術就是能夠做到把各行業(yè)的大數(shù)據(jù)完全活用起來,包括那些正在死去的數(shù)據(jù)。

為了這個目標,Zilliz 正在加快市場的拓展,他們已經(jīng)與包括英偉達、IBM、偉創(chuàng)在內(nèi)的渠道商、系統(tǒng)整合商進行合作。直銷加渠道銷售是現(xiàn)在的策略,這種方式讓 Zilliz 既有了硬件合作伙伴,后者也成了自己的渠道商,那頭部客戶建立關系也會更加高效,但如果自建一個銷售團隊,效率不一定跟得上。

換句話說,他們今年的重心將偏向產(chǎn)品落地,兼顧技術與產(chǎn)品研發(fā),下半年,他們也會正式在 FPGA 上做數(shù)據(jù)庫的場景化研發(fā)。

“我是一定要創(chuàng)業(yè)的”

現(xiàn)在正好是 Zilliz 成立兩周年,回看當初離開 Oracle 的決定,星爵的回答很堅決:沒有任何猶豫。

因為在那里上班的第一天開始,他就是為創(chuàng)業(yè)去積累經(jīng)驗的——很早他就認定自己一定是要創(chuàng)業(yè)的。他說自己本質(zhì)上比較喜歡去追求冒險、探索未知空間。

創(chuàng)業(yè)這件事是充滿了未知,但選擇的領域確實又是他所擅長的。在威斯康星大學麥迪遜分校攻讀計算機科學碩士學位時,他專攻的就是數(shù)據(jù)庫,而后無論是在 Oracle 還是現(xiàn)在,所做的事都一脈相承。

他把硅谷文化也搬到了 Zilliz,“公司基本上是硅谷極客范兒”。

工程師身份讓他吸引了一批“臭味相投”的人才加入,他希望加入的早期員工有一個共同理念:為了做熱愛且有意義的事情走到一起,順便把錢賺了。

在團隊內(nèi)部,他推崇個人英雄主義,希望每個人都能獨當一面,這也解釋了他為什么要選“星爵”——《銀河護衛(wèi)隊》中保衛(wèi)銀河系的英雄——作為自己的花名。

星爵在宇宙中探索,卻不知道下個目的地,而他也擁抱創(chuàng)業(yè)中的不確定性?!斑@個過程中有挑戰(zhàn)那也是收獲,這就已經(jīng)足夠了,”他繼續(xù)說,“就算失敗了,那也會成為下一個你去探索的起點。”

有一絲騎士堂·吉訶德的意味,在宇宙中四處飄蕩的星爵在他眼里也挺失敗的?!暗绻松伎梢灶A知,就少了很多樂趣?!彼a充道。

注:題圖來源于 Behance,作者 Ilya Tselyutin

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關文章

編輯

關注人工智能的放牛娃
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說