0
本文作者: 張帥 | 2019-08-30 17:45 | 專題:CNCC 2019 |
全球正在進入蓬勃發(fā)展的數(shù)字經(jīng)濟時代,數(shù)字產(chǎn)業(yè)化、產(chǎn)業(yè)數(shù)字化正在促進實體經(jīng)濟和數(shù)字經(jīng)濟融合,數(shù)據(jù)成為關(guān)鍵生產(chǎn)要素,5G、4K/8K視頻、IoT、自動駕駛等新聯(lián)接、新應(yīng)用正加速數(shù)據(jù)生產(chǎn)和流動,數(shù)據(jù)的計算、存儲、數(shù)據(jù)庫和大數(shù)據(jù)技術(shù)不斷突破,相互融合,促進海量多樣性數(shù)據(jù)的價值最大化。
雷鋒網(wǎng)消息,近日由華為舉辦的全球數(shù)據(jù)基礎(chǔ)設(shè)施論壇上,華東師范大學(xué)副校長;數(shù)據(jù)學(xué)院創(chuàng)院院長、教授;中國計算機學(xué)會(CCF)數(shù)據(jù)庫專委會副主任周傲英發(fā)表了題為《中國未來需要什么樣的數(shù)據(jù)庫》主題演講。
周傲英教授深入淺出的講解了數(shù)據(jù)庫的發(fā)展歷史,并闡述了對數(shù)據(jù)庫發(fā)展趨勢的理解。他提到,過去的四五十年間,數(shù)據(jù)庫有很大的成功,但也有深刻的教訓(xùn)。發(fā)展至今,一個數(shù)據(jù)庫系統(tǒng)能夠解決所有的問題的想法已經(jīng)被擯棄,互聯(lián)網(wǎng)帶來的中國數(shù)據(jù)庫市場的新機遇。應(yīng)用驅(qū)動創(chuàng)新,應(yīng)用能夠促進技術(shù)的進步,技術(shù)倒逼應(yīng)用的發(fā)展,形成一個聯(lián)動良性循環(huán)。
以下為雷鋒網(wǎng)整理的周傲英教授演講實錄(雷鋒網(wǎng)現(xiàn)場編輯整理,未經(jīng)大會官方及演講者本人確認(rèn))。
周傲英:朋友們,很高興來到深圳,參加智能數(shù)據(jù)基礎(chǔ)設(shè)施全球論壇。我今天想跟大家分享的是《中國未來需要什么樣的數(shù)據(jù)庫》,也就是說,中國的數(shù)據(jù)庫面臨什么樣的機遇和什么樣的挑戰(zhàn)。
從數(shù)據(jù)庫的發(fā)展、數(shù)據(jù)庫的歷史角度。在世界上數(shù)據(jù)庫四五十年以來經(jīng)過了什么,我們未來會面臨著什么樣的環(huán)境,我們要做什么。這中間有一個特別大的變化,就是剛才侯總和胡總一直在提的數(shù)據(jù)。
“數(shù)據(jù)”是一個很老的詞,那為什么數(shù)據(jù)到現(xiàn)在如此的重要?數(shù)據(jù)庫是管理數(shù)據(jù)的,以前是管理數(shù)據(jù),未來也是管理數(shù)據(jù)。但就是因為現(xiàn)在我們對數(shù)據(jù)的認(rèn)識已經(jīng)超乎原來所有的認(rèn)識。這是我想分享的基本內(nèi)容。
大家都會想,數(shù)據(jù)庫是什么。因為對一般的領(lǐng)導(dǎo)或者非專業(yè)人士,大家說把數(shù)據(jù)放在一起就叫數(shù)據(jù)庫。最早的數(shù)據(jù)庫是叫Data Bank。數(shù)據(jù)是像金錢一樣要存在銀行里。
但實際上對于專業(yè)人士,我們知道數(shù)據(jù)庫是計算機科學(xué)一個蠻重要的分支,因為數(shù)據(jù)庫是支持關(guān)鍵核心業(yè)務(wù)。什么叫支持關(guān)鍵核心業(yè)務(wù)?就是管人、財、物,一定要精確管理,一定要分毫不差。數(shù)據(jù)庫經(jīng)過這幾十年的發(fā)展,有了巨大的變化。有了關(guān)系模型,有了事務(wù)處理,有查詢優(yōu)化,要越來越高效,越來越快。這就是數(shù)據(jù)庫這么幾十年的成就。
數(shù)據(jù)庫的發(fā)展,我們有非常輝煌的成就。這邊列出來的是四位數(shù)據(jù)庫的創(chuàng)造者或者先鋒(見PPT)。第一個是Charies Bachman,他提出了數(shù)據(jù)庫概念,提出DBTG報告,現(xiàn)在所的數(shù)據(jù)庫幾乎所有概念,各種語言等等概念都是他在他的報告里提出的。他是數(shù)據(jù)庫第一個圖靈獎獲得者。
第二個是關(guān)系數(shù)據(jù)庫,關(guān)系模型的提出者,第三個是事務(wù)處理模型的提出者,也是第四范式的提出者,第四個是伯克利的教授,是數(shù)據(jù)庫很多系統(tǒng)的研發(fā)者,體系架構(gòu)的完善者。(見PPT)
我們再回顧一下他們做的工作,源頭是COBOL語言。最早計算機出來時原來是做計算的,有了COBOL語言之后發(fā)現(xiàn)可以做商業(yè)的事,可以記帳可以發(fā)工資。
COBOL語言是一個語言,我們講語言時,往往是把處理語句和數(shù)據(jù)放在一起,COBOL語言的數(shù)據(jù)量特別大,數(shù)據(jù)那一步特別大,所以要有一個文件系統(tǒng)管它。
文件系統(tǒng)數(shù)據(jù)越來越多時,大家發(fā)現(xiàn)這是一個數(shù)據(jù)系統(tǒng)語言,所以有一個叫CODASYL,把COBOL語言做得更好。COBOL語言大家熟悉,如果不熟悉,追溯到2000年時,“千年蟲”就是COBOL語言帶來的。
在COBOL語言會議上提出了DBTG報告,所以Charies Bachman拿到了圖靈獎。它太簡單了,就是一個數(shù)據(jù)關(guān)系表,再到70年代時提出事務(wù)處理,使得原來在處理金融問題時,可以用一個公共模型來處理,不要每個人都去編程序,使得我們的穩(wěn)定性和可用性更強了。
數(shù)據(jù)庫有很大的成功,但也有深刻的教訓(xùn)。
這個深刻的教訓(xùn)是因為數(shù)據(jù)庫的發(fā)展歷史實際上是我們IT發(fā)展史的縮影、創(chuàng)新史的縮影。因為所有的IT,包括數(shù)據(jù)庫,都是應(yīng)用驅(qū)動創(chuàng)新。
剛才我在描述的,COBOL語言為了解決銀行的問題,就有了這一套發(fā)展,它是應(yīng)用在驅(qū)動創(chuàng)新。我們國家現(xiàn)在是講創(chuàng)新驅(qū)動發(fā)展。我們深刻的知道,對于IT來說,都是應(yīng)用驅(qū)動創(chuàng)新,先有應(yīng)用再有技術(shù),再有理論。這個應(yīng)用的創(chuàng)新跟技術(shù)的創(chuàng)新形成良性的互動,形成一個正循環(huán)。數(shù)據(jù)庫發(fā)展的教訓(xùn)在于這是我們數(shù)據(jù)庫的先賢總結(jié)出來的教訓(xùn)。
原本我們以為一個數(shù)據(jù)庫系統(tǒng)能夠解決所有的問題,到大數(shù)據(jù)、Hadoop出來后,數(shù)據(jù)庫人認(rèn)為原來我們這個系統(tǒng)解決不了任何問題?;ヂ?lián)網(wǎng)出來以后,互聯(lián)網(wǎng)是最大的數(shù)據(jù)庫,但我們的數(shù)據(jù)庫在里面毫無作為,然后我們痛定思痛總結(jié)出來,對一類應(yīng)用就有一個數(shù)據(jù)庫。
抽象,從具體到抽象,我們把共性的東西、普遍的東西、本質(zhì)的東西抽象出來,就形成了數(shù)據(jù)庫。數(shù)據(jù)庫典型的就是抽象二字。
數(shù)據(jù)對語義的抽象形成了關(guān)系模型。關(guān)系數(shù)據(jù)庫的偉大之處在于把數(shù)據(jù)和語義分開來,我們要做數(shù)據(jù)庫的設(shè)計,要設(shè)計第三范式,設(shè)計BC范式,把函數(shù)依賴抽象出來了,這個模式就反映了他們的語義。我們對業(yè)務(wù)邏輯的抽象,就得到了事物處理模型。一個票不給遞給兩個人,一個帳轉(zhuǎn)到那個帳號,一定要那邊落了帳才能結(jié)束。對業(yè)務(wù)邏輯的抽象形成事務(wù)模型。
數(shù)據(jù)庫的三大成就就是關(guān)系模型、事務(wù)模型和查詢優(yōu)化。兩大成就都是抽象導(dǎo)致的。
抽象成就了數(shù)據(jù)庫的產(chǎn)業(yè),成就了數(shù)據(jù)庫的輝煌,但30多年僵化的抽象阻礙了發(fā)展。大家覺得抽象這么完美,這就是上帝定的、老天定的。關(guān)系數(shù)據(jù)庫這幾十年一統(tǒng)天下,根本的原因是我們覺得它可以解決所有問題。
當(dāng)大數(shù)據(jù)、互聯(lián)網(wǎng)概念出來之后,大家發(fā)現(xiàn)它不能解決這些問題。數(shù)據(jù)庫發(fā)展歷史中,有行業(yè)壟斷的格局,我們經(jīng)常說三足鼎立,Oracle、DB2和TERADATA。
新的業(yè)態(tài),新的產(chǎn)品數(shù)據(jù)庫很難發(fā)展起來。我們知道這些數(shù)據(jù)庫有一個最大的特點,它很難Scaling Up。在互聯(lián)網(wǎng)時代,我們講Scaling Up,我們不止靠買高端的服務(wù)器、存儲向上擴展,這是數(shù)據(jù)庫不適應(yīng)當(dāng)代的原因。
互聯(lián)網(wǎng)改變了世界,互聯(lián)網(wǎng)改變世界是因為互聯(lián)網(wǎng)改變了人。
馬克思關(guān)于人的定義,他說人是社會關(guān)系的總和,人變了,這個世界就變了。這個互聯(lián)網(wǎng)怎么來改變?nèi)撕腿酥g的關(guān)系?因為它改變了人和人之間的連接,并且把用戶體驗用數(shù)據(jù)來做。以前是靠教育、教養(yǎng)改善用戶體驗,現(xiàn)在是靠數(shù)據(jù),行為數(shù)據(jù)。有人說我們愿意用自己的隱私數(shù)據(jù)來換取服務(wù)的便利。他為什么能夠那么好的用?其實他拿到我們的隱私數(shù)據(jù)、行為?;ヂ?lián)網(wǎng)為什么能做這件事?
互聯(lián)網(wǎng)就是平臺,在互聯(lián)網(wǎng)上誰都可以用,平等就會有民主。人工智能會再度熱,因為我們要做精準(zhǔn)營銷,通過行為數(shù)據(jù)洞察人性。最重要的手段是人工智能的算法或者深度學(xué)習(xí)的算法。馬克思也說,一個學(xué)科當(dāng)它用上數(shù)學(xué)了,就變成一個科學(xué)。我說互聯(lián)網(wǎng),就像100年以前中國人在呼喚的德先生和賽先生。互聯(lián)網(wǎng)特別重要,因為互聯(lián)網(wǎng)造就了大數(shù)據(jù)。
在十八大召開以后,2013年李克強總理領(lǐng)導(dǎo)的新一代政府上任時就在講大數(shù)據(jù)、國家戰(zhàn)略。有了大數(shù)據(jù)之后講互聯(lián)網(wǎng)+,到2015年講創(chuàng)業(yè)創(chuàng)新,2016年講供給側(cè)改革,2017年講分享經(jīng)濟,2018年講人工智能。我三五年前預(yù)測后面一定會講區(qū)塊鏈,因為區(qū)塊鏈才是真正的互聯(lián)網(wǎng)。這是世界潮流,數(shù)據(jù)帶來的。
互聯(lián)網(wǎng)為什么帶來這么大的變化?因為Data Is Power。
講到Data Is Power我們會想到Keowledge is power。我們現(xiàn)在講Power是在講電,數(shù)據(jù)是一個新的電。在Data Power以前我們還有兩個Power。最近的Power是“蒸汽能”,再早一點的Power是“電能”,后面是“數(shù)據(jù)能”。
有了蒸汽能才有第一次工業(yè)革命,我們進入工業(yè)經(jīng)濟,有了電能的誕生才有第二次工業(yè)革命。我們用最近30多年彌補了起來,現(xiàn)在面臨一個新的Power的誕生。
在新經(jīng)濟的背景下,也就是剛才提到的數(shù)字經(jīng)濟,我們覺得數(shù)據(jù)就是新的生產(chǎn)資料,算力就是新的生產(chǎn)力。一個新的Power來了,就像電來了,從蒸汽時代轉(zhuǎn)到電的時代就是未來已來,一切重構(gòu)的時代,所有一切都應(yīng)該重新來一遍。
在我們這個時代數(shù)據(jù)作為一個Power出來,我們看數(shù)據(jù)系統(tǒng),Hadoop、Spark,都是為了解決應(yīng)用的問題,把它抽象成技術(shù),通過開源推廣應(yīng)用。這就是數(shù)據(jù)系統(tǒng)的成長之路,它跟以前的數(shù)據(jù)庫是一樣的,只是現(xiàn)在是活生生的就在我們眼睛前告訴我們。
我們現(xiàn)在處在一個非常重要的機遇窗口期。在資本主義經(jīng)濟里有一個說法叫康德拉季耶夫周期理論。資本主義經(jīng)濟要經(jīng)過50年、60年的波動,并且在一個新的Power誕生以后,前面20年都在準(zhǔn)備裝備、技術(shù)、理論,后面30年是廣泛應(yīng)用階段?;ヂ?lián)網(wǎng)到現(xiàn)在整整20年,未來30年對中國特別重要,能不能把這個Data Power發(fā)揮它的威力。
我說中國數(shù)據(jù)庫在這樣的時代面臨重要的機遇,互聯(lián)網(wǎng)非常成功的告訴我們,應(yīng)用驅(qū)動創(chuàng)新,這是一條重要的路徑。
應(yīng)用能夠促進技術(shù)的進步,技術(shù)倒逼應(yīng)用的發(fā)展,形成一個良性循環(huán),這就是聯(lián)動。
我們處在升級換代的時代,我們面臨這種國際形勢,要我們做替代工程。替代工程和升級換代并舉的創(chuàng)新是最好的,我相信也是華為最好的機遇。替代工程只是我們的一個影子,升級換代才是最根本的東西,再加上開源。開源為這個持續(xù)的發(fā)展提供了生態(tài),開源從最初企業(yè)的自發(fā)行為個人的自發(fā)行為,逐漸演變成企業(yè)的商業(yè)行為。我現(xiàn)在覺得開源很多時候變成一種國家行為。因為它根本上是一種文化、精神,并且它會形成一種國家的萬眾創(chuàng)新的能力。
我對未來中國數(shù)據(jù)庫的發(fā)展,要特別重視IT領(lǐng)域?qū)?yīng)用驅(qū)動創(chuàng)新的認(rèn)識和研討。豐富的應(yīng)用是我們最大的驅(qū)動力,它應(yīng)該是我們研究的出發(fā)點,也應(yīng)該是我們研究的落腳點。
我們在解決問題的過程當(dāng)中,來形成技術(shù)、建立理論,我們要做好頂層設(shè)計,要營造健康的生態(tài)來打造開源的文化,我們有龐大的技術(shù)力量和研究力量,我們有那么大的工程師,那么多的大學(xué),但我們需要組織和需要引導(dǎo)。健康生態(tài)的營造首先需要開放,開源是必由之路?;A(chǔ)軟件和系統(tǒng)軟件的模塊化、?;?,才能做到開源,才能促進萬眾創(chuàng)新?;A(chǔ)研究和原始創(chuàng)新需要攻關(guān),需要久久圍攻。
我們處在數(shù)據(jù)庫發(fā)展的最佳時間,需要創(chuàng)新商業(yè)模式,豐富的應(yīng)用場景,要像華為這樣引領(lǐng)的企業(yè)。
我一直在說數(shù)據(jù)庫是信息社會的基礎(chǔ)設(shè)施。我們今天論壇的主題是“智能數(shù)據(jù)基礎(chǔ)設(shè)施”。如果數(shù)據(jù)認(rèn)為是一個新的Power,就像研究電力設(shè)施一樣,我們在研究我們的基礎(chǔ)設(shè)施。數(shù)據(jù)是一個新的Power,我們有非常成功的方法學(xué),需要全譜系的。
我們不是做一個Oracle,我們要量身打造,奪身定制,為不同的應(yīng)用做不同的數(shù)據(jù)庫系統(tǒng)。中國數(shù)據(jù)庫的未來在于要有開放的架構(gòu),不要抱殘守缺固步自封。開源的生態(tài),解決問題,要真正的解決問題,更重要的是要解放思想,我覺得Open是我們數(shù)據(jù)庫走向自由的必由之路。
謝謝大家!
【CNCC 2019來了!】
10月17-19日,CNCC 2019 將在蘇州金雞湖國際會議中心舉辦,本次會議由中國計算機學(xué)會 (CCF) 主辦,蘇州工業(yè)園區(qū)管委會承辦。
CNCC 全稱為中國計算機大會,是我國計算領(lǐng)域規(guī)模最大、規(guī)格最高的學(xué)術(shù)、技術(shù)、產(chǎn)業(yè)交融互動的盛會。該會議創(chuàng)建于 2003 年,每年于不同城市舉辦,至今已成功舉辦十五屆。會議形式包括大會特邀報告、大會論壇、技術(shù)論壇、特色活動及展覽展示等。大會對本文提到的安防芯片領(lǐng)域的最新趨勢動向準(zhǔn)備了豐富的內(nèi)容,敬請關(guān)注。
如果你是個人參會,可以:
?通過官網(wǎng)cncc.ccf.org.cn參會報名
?申請論壇,作為論壇主席或講者參會
?申請資助參會,申請者限邊遠地區(qū)高校青年教師或?qū)W生
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。