0
本文作者: 叨叨 | 2017-03-03 00:55 |
雷鋒網(wǎng)按:3月2日,“百度深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程實(shí)驗(yàn)室”正式揭牌,百度公司創(chuàng)始人李彥宏出席并發(fā)表了致辭。在致辭中,他表示不僅要在這個(gè)行業(yè)成為中國(guó)的第一,在世界上也要被仰慕。在外界看來(lái),“國(guó)字號(hào)”深度學(xué)習(xí)實(shí)驗(yàn)室落地百度,是李彥宏在全國(guó)政協(xié)會(huì)議上所提的“中國(guó)大腦”的某種實(shí)現(xiàn),即便官方并沒(méi)有采用這個(gè)詞。揭牌儀式上,該實(shí)驗(yàn)室的負(fù)責(zé)人林元慶,為在場(chǎng)的媒體講解了實(shí)驗(yàn)室的初步構(gòu)想和計(jì)劃。
以下是林元慶的演講內(nèi)容速記,雷鋒網(wǎng)在不改變?cè)獾幕A(chǔ)上做了調(diào)整:
下面我跟大家分享一下我們深度學(xué)習(xí)實(shí)驗(yàn)室接下來(lái)的計(jì)劃。之前我們跟共建單位清華、北航經(jīng)過(guò)了幾輪的討論,在這里面我簡(jiǎn)要介紹一下我們?cè)谶@個(gè)國(guó)家工程實(shí)驗(yàn)室里面到底要做些什么,我們一些初步的計(jì)劃是什么。下午我們這幾個(gè)單位還會(huì)再進(jìn)行一下午的Workshop,未來(lái)會(huì)討論對(duì)于我們這個(gè)深度實(shí)驗(yàn)室的規(guī)劃。
人工智能現(xiàn)在不但是百度的戰(zhàn)略,應(yīng)該也是國(guó)家的戰(zhàn)略。人工智能在過(guò)去這幾年經(jīng)歷了從量變到質(zhì)變的一個(gè)過(guò)程,去年特別熱的一個(gè)題目是谷歌的AlphaGo戰(zhàn)勝了圍棋冠軍。我還記得在2012年的時(shí)候,當(dāng)谷歌第一次發(fā)布自動(dòng)駕駛視頻的時(shí)候,我覺(jué)得這個(gè)東西哪一年會(huì)實(shí)現(xiàn)?覺(jué)得非常遙遠(yuǎn)。但是僅僅短短幾年過(guò)去了,這個(gè)自動(dòng)駕駛已經(jīng)是很多公司扎扎實(shí)實(shí)的目標(biāo)了,在百度我們希望能實(shí)現(xiàn)三年的商用,五年的量產(chǎn)。
我們今年年初參加了《最強(qiáng)大腦》人臉識(shí)別的比賽,能夠看到,其實(shí)人工智能技術(shù)發(fā)展到今天,確實(shí)在一些任務(wù)上已經(jīng)超越了人的能力,甚至是最優(yōu)秀的人的能力,這個(gè)其實(shí)對(duì)于我們后面的應(yīng)用是非常重要的。比如說(shuō)很多任務(wù)上,機(jī)器能夠真正的比人做得更好。
我想說(shuō)的是,人工智能其實(shí)是一個(gè)非常大的系統(tǒng)工程,其實(shí)是需要很多方面的因素結(jié)合在一起。這里面提到了人工智能的四大要素,可能在座的各位曾經(jīng)聽(tīng)過(guò)人工智能很重要的是深度學(xué)習(xí)、大數(shù)據(jù)和大計(jì)算,其實(shí)大應(yīng)用也是非常重要的。
我想用這張幻燈片來(lái)解釋一下為什么大應(yīng)用是非常重要的,比如說(shuō)我們有了一些初始的算法,有了一些初始的數(shù)據(jù),可以搭建一些初始的技術(shù)。我們這邊發(fā)布一些產(chǎn)品或者是服務(wù),有了這些產(chǎn)品和服務(wù)的話(huà),我們能夠搜集到更多的數(shù)據(jù),這樣的話(huà),數(shù)據(jù)跟算法一起迭代,能夠演化出更好的算法。當(dāng)然有了更好的算法,我們就有更好的技術(shù),有更好的技術(shù),我們就有更好的產(chǎn)品,就會(huì)使更多的用戶(hù)來(lái)用,因此這是一個(gè)正循環(huán)。也正是因?yàn)檫@個(gè)正循環(huán),人工智能演化的軌跡跟普通傳統(tǒng)的技術(shù)是不一樣的。比如我們平常說(shuō)的精密機(jī)床,它可能是幾十年非常線(xiàn)性的往上進(jìn)步。但是人工智能不是這樣的,人工智能的技術(shù)就是,可能在前期會(huì)是線(xiàn)性的慢慢的往上進(jìn)。但是當(dāng)這個(gè)正循環(huán)真正起作用的時(shí)候,它的發(fā)展是非常快的。因此,不管是技術(shù)水平或者是應(yīng)用的深度和廣度都會(huì)有一個(gè)迅速的體現(xiàn),這個(gè)其實(shí)是對(duì)于人工智能技術(shù)的研發(fā)非常重要的。從這個(gè)圖里面也解釋了剛才我們看到,要做人工智能技術(shù),我們這四個(gè)大要素都需要有很好的技術(shù),這樣的話(huà),我們才能夠研發(fā)出真正非常強(qiáng)大的人工智能的技術(shù)。
基于這樣的考慮,去年我們籌備深度學(xué)習(xí)實(shí)驗(yàn)室的時(shí)候聯(lián)合了清華大學(xué)、北京航天航空大學(xué)還有電子四院,我們也是希望在這幾個(gè)方面同時(shí)發(fā)力。在這個(gè)實(shí)驗(yàn)室里面我們準(zhǔn)備搭建七個(gè)平臺(tái),百度參與深度學(xué)習(xí)平臺(tái),清華會(huì)參與生物特征識(shí)別平臺(tái)、視覺(jué)感知平臺(tái),北航會(huì)參與視覺(jué)感知平臺(tái)和新型的人機(jī)交互,電信研究院會(huì)參與知識(shí)產(chǎn)權(quán)平臺(tái)和標(biāo)準(zhǔn)化平臺(tái)。標(biāo)準(zhǔn)化平臺(tái)其實(shí)也是非常重要的,我們很多人工智能的技術(shù)一定要變成一個(gè)標(biāo)準(zhǔn),讓它得到廣泛的應(yīng)用。中間這個(gè)是我們通常說(shuō)的人工智能的基礎(chǔ)技術(shù),包括聽(tīng)的、看的還有理解的就是自然語(yǔ)言處理。最基礎(chǔ)的就是我們要搭建我們深度學(xué)習(xí)的平臺(tái),剛才張?jiān)菏刻岬?,我們?cè)谶@個(gè)深度學(xué)習(xí)的國(guó)家工程實(shí)驗(yàn)室,其實(shí)我們的基礎(chǔ)是PaddlePaddle這個(gè)深度學(xué)習(xí)平臺(tái)。但是我們往上面研發(fā)的是整個(gè)人工智能一系列的技術(shù)。
我們列了這個(gè)實(shí)驗(yàn)室的建設(shè)目標(biāo),在接下來(lái)的兩到三年我們要實(shí)現(xiàn)的目標(biāo),要搭建這七個(gè)平臺(tái),每個(gè)平臺(tái)要實(shí)現(xiàn)的目標(biāo)都在這里。
深度學(xué)習(xí)平臺(tái)
一方面我們要開(kāi)放我們的PaddlePaddle,這是我們?nèi)ツ?月份就已經(jīng)做的。我們不單單要開(kāi)放PaddlePaddle,我們還要開(kāi)放深度學(xué)習(xí)的計(jì)算模塊,這里面會(huì)有GPU,還有大機(jī)型的CPU。在這個(gè)里面,我們希望把這個(gè)建成中國(guó)最大的深度學(xué)習(xí)平臺(tái)。
聽(tīng)覺(jué)平臺(tái)
包括語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)義理解,還有后端的一些很多的資源。百度在這個(gè)上面已經(jīng)取得了非常不錯(cuò)的技術(shù),我們這些技術(shù)去年入選了MIT的發(fā)布的十大突破技術(shù)榜單。
視覺(jué)感知
平臺(tái)包括的方面比較多,包括我們的檢索跟識(shí)別,包括清晰度圖像識(shí)別,我們也正在搭建醫(yī)學(xué)影像分析,比如說(shuō)我們希望拿到一張CT,來(lái)分析這個(gè)病人是不是有癌細(xì)胞。
生物特征識(shí)別平臺(tái)
我們能夠單獨(dú)拿出來(lái),這是一個(gè)非常重要的方式。其實(shí)我們應(yīng)該在兩個(gè)禮拜之前,我們的人臉識(shí)別獲得了MIT的十大突破技術(shù)之一。我們?cè)谶@個(gè)工程實(shí)驗(yàn)室,希望生物特征的識(shí)別、人臉識(shí)別、聲紋識(shí)別、虹膜識(shí)別等身份特征的識(shí)別做成一個(gè)能夠廣泛應(yīng)用的技術(shù)。
新型人機(jī)交換平臺(tái)
這個(gè)里面會(huì)融合計(jì)算機(jī)視覺(jué)的AR,百度最近也成立了一個(gè)事業(yè)部,就是純語(yǔ)音的,用非常自然的這種交互系統(tǒng),我們最后希望能夠把這些系統(tǒng)都放在一起,是一個(gè)基于AI的交互系統(tǒng)。包括我們最近這幾年基于觸摸的,就是在那個(gè)基礎(chǔ)上,我們想建立的基于AI的方面,這里面包括語(yǔ)音、語(yǔ)義識(shí)別和理解能力,還有計(jì)算機(jī)視覺(jué)的能力。
剛才也提到,我們希望把我們研發(fā)出來(lái)的很多的技術(shù)都標(biāo)準(zhǔn)化。因此,我們也會(huì)在這個(gè)工程實(shí)驗(yàn)室里面推進(jìn)標(biāo)準(zhǔn)化平臺(tái)的建設(shè),這樣的話(huà),希望很多研發(fā)出來(lái)的技術(shù),當(dāng)它足夠成熟的時(shí)候,能夠應(yīng)用在各個(gè)行業(yè)。
知識(shí)產(chǎn)權(quán)的保護(hù)
也是非常重要的,我們希望成為中國(guó)甚至是世界上最好的人工智能實(shí)驗(yàn)室,我們研發(fā)出來(lái)的很多技術(shù),我們也需要去做非常好的知識(shí)產(chǎn)權(quán)的保護(hù)。這個(gè)里面還包括知識(shí)產(chǎn)權(quán)的一些分析,比如說(shuō)能夠分析人工智能這個(gè)方向的趨勢(shì)各個(gè)方面,對(duì)于我們技術(shù)的研發(fā)提出建議,哪些技術(shù)是非常重要的,直到最后知識(shí)產(chǎn)權(quán)的保護(hù)。
我剛才提到了,人工智能的技術(shù)需要從四個(gè)大要素一起來(lái)發(fā)力,我們?cè)谶@四個(gè)大要素上具體是怎么做 的?
深度學(xué)習(xí)的平臺(tái)
我們把我們的PaddlePaddle去開(kāi)源,我們爭(zhēng)取把PaddlePaddle做成一個(gè)非常好的開(kāi)源系統(tǒng)。
計(jì)算資源
因此我們的PaddlePaddle會(huì)在這個(gè)計(jì)算資源的平臺(tái)上進(jìn)行深度的優(yōu)化,這是我們要做的一件非常重要的事情。這個(gè)計(jì)算資源跟PaddlePaddle我們會(huì)向社會(huì)開(kāi)放和科研單位開(kāi)放,他們只需要一個(gè)賬號(hào),就可以在這個(gè)平臺(tái)上去做各種各樣的實(shí)驗(yàn)和人工智能的研發(fā)。
大數(shù)據(jù)
我們會(huì)和目前的共建單位,甚至包括我們后面更多的合作單位我們來(lái)定義問(wèn)題,定義問(wèn)題的方式就是通過(guò)數(shù)據(jù),或者我們叫Benchmark來(lái)定義人工智能,我們會(huì)去看哪一些人工智能的方向是人工智能領(lǐng)域一些非常核心的,同時(shí)也需要技術(shù)突破的。這些方向,我們百度跟合作單位會(huì)投入很大的力量,吸引非常多的科研單位到這個(gè)平臺(tái)上我們一起來(lái)做研發(fā)。我們提供深度學(xué)習(xí)平臺(tái)、大計(jì)算平臺(tái)和大數(shù)據(jù)平臺(tái),我們一起研發(fā),希望能夠在一些技術(shù)上取得非常大的突破。
大應(yīng)用
假定我們前面的研發(fā)取得不錯(cuò)的技術(shù),這樣的話(huà),我們希望能在百度很多的應(yīng)用上很快的用起來(lái),或者是說(shuō)我們也會(huì)把這些應(yīng)用推到社會(huì)上,期望通過(guò)百度這個(gè)平臺(tái),這些研發(fā)出來(lái)的技術(shù)能夠獲得非常廣泛的應(yīng)用。
這樣的話(huà),剛才我強(qiáng)調(diào)的那個(gè)閉環(huán)希望能夠建立起來(lái),對(duì)我們要研發(fā)的技術(shù)進(jìn)行迭代。
我就講到這里,謝謝大家!
雷鋒網(wǎng)了解到,在揭牌儀式之后,百度及其他實(shí)驗(yàn)室共建單位還進(jìn)行了一個(gè)workshop,各自介紹了彼此在人工智能領(lǐng)域的研究與探索,為了今后的進(jìn)一步整合、共建做準(zhǔn)備。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。