0
本文作者: 夏睿 | 2017-03-12 10:33 |
本周,國內AI圈值得關注的事情有:FPGA 2017最佳論文出爐,雷鋒網對得主深鑒科技進行了專訪;人工智能”進入國家戰(zhàn)略層,AI公司最關注的是什么?AWE 2017本周在上海舉辦,海爾美的聯(lián)手百度DuerOS,共同推出“會說話的家用電器”;中國人工智能學會AIDL第二期【人工智能前沿講習班】日前在北京中科院自動化所舉行,北京大學王立威等教授參與講課;
國外AI圈新聞有:Ian Goodfellow 離開OpenAI,重回谷歌大腦團隊;Google Cloud Next' 17云計算大會在美召開,李飛飛提出AI民主化四大戰(zhàn)略;Facebook 開源新一代 AI 訓練服務器 Big Basin,速度提升一倍。
以下是本周新聞概述:
近日,深鑒科技的 ESE 語音識別引擎的論文在 FPGA 2017 獲得了唯一的最佳論文 ESE: Efficient Speech Recognition Engine with Sparse LSTM on FPGA。該項工作聚焦于使用 LSTM 進行語音識別的場景,結合深度壓縮以及專用處理器架構,使得經過壓縮的網絡在 FPGA 能夠實現(xiàn)超越 Pascal Titan X GPU 一個數(shù)量級的能效比。論文中所描述的 ESE 語音識別引擎也是深鑒科技 RNN 處理器產品的原型。
針對 FPGA 2017 最佳論文以及深鑒科技,雷鋒網采訪了深鑒科技 CEO 姚頌,主要討論了深鑒科技的這篇論文的核心靈感來自于哪里、這篇論文主要在哪些方面有著較大的突破、Deep Compression 和 ESE 的原理與作用、如何有效結合 Compressing CNN 和 Intepretating CNN 發(fā)揮它們的勢能、如何保證公司處于有利地位等多個問題。以下為采訪摘要:
論文靈感來源:韓松之前做過一項名為 EIE (Efficient Inference Engine)的研究并發(fā)表在 ISCA 2016 ,該項研究主要針對于卷積神經網絡里的全連接層,但并不能適應語音識別這樣的復雜場景。因此在結合實際應用后,我們設計出一套更為實用化的 ESE 架構,針對語音識別和 RNN 做了非常多的修改,并且將它實用化了。
論文突破:軟件方面,我們提出了 Load-balance-aware pruning。硬件方面,在整個硬件架構過程做了一個重新設計,能夠支持多路用戶,也能夠支持 RNN。
從哪幾方面提高了它在語音識別中的效率:該方案的核心就是它能支持在大規(guī)模用戶的情況下大幅降低延遲;其次使得功耗明顯降低,同時使延遲會變得更低,使得語音識別的精確度得到更進一步提升。
在3月5日上午李克強所做政府工作報告里,首次出現(xiàn)了“人工智能”這一詞匯,這給外界發(fā)出重要信號:人工智能這項技術,開始由國家背書了。
加快培育壯大新興產業(yè)。全面實施戰(zhàn)略性新興產業(yè)發(fā)展規(guī)劃,加快新材料、人工智能、集成電路、生物制藥、第五代移動通信等技術研發(fā)和轉化,做大做強產業(yè)集群。支持和引導分享經濟發(fā)展,提高社會資源利用效率,便利人民群眾生活?!?/p>
雖然只出現(xiàn)了一次,但這給外界發(fā)出重要信號:人工智能這項技術,開始由國家背書了。我們可以預見到,各地政府在這一“中央精神”指導下,將會投入豐富的資源建立本地人工智能平臺和公司,更多傳統(tǒng)行業(yè)公司也會更加大膽地擁抱AI技術,而對于已有的AI公司來說,或許會因此獲得更多的扶持和資源機遇,又或許會因為更多玩家的涌入,面臨更加兇險的競爭。
為了加速百度人工智能戰(zhàn)略布局及人工智能產品化和市場化進程,就在三周前,百度集團總裁兼COO陸奇發(fā)出通告,宣布將原度秘團隊升級為度秘事業(yè)部,直接向其匯報,這在當時可算是科技圈的重磅新聞之一。
一個月還未到,度秘事業(yè)部就有了大動作。在剛剛開幕的AWE 2017中國家電及消費電子博覽會上,度秘宣布與海爾、美的兩大家電巨頭達成戰(zhàn)略合作協(xié)議,并推出系列的智能家居產品。在度秘事業(yè)部剛成立的時候,陸奇就表示:「憑借語音與對話技術的優(yōu)勢,百度在引領新一代人機交互平臺上擁有巨大的機會,自然語言和其他智能交互方式有可能出現(xiàn)在從手機到家居的每一個設備中?!?,此次與兩大巨頭合作,是度秘在智能家居領域布局的一個重要信號,同樣也是兩個家電巨頭向「智能化」發(fā)展的重要標志之一。
在與海爾合作方面,海爾與度秘DuerOS達成了戰(zhàn)略合作,將DuerOS對話式人工智能操作系統(tǒng)加入到海爾產品序列,并且在現(xiàn)場發(fā)布了雙方合作的首款搭載DuerOS的冰箱——海爾馨廚系列冰箱。
在與美的合作方面,美的介紹了他們的「美的智慧家居科技有限公司」,也就是原美的智慧家居研究院在智能家居方面的布局,緊接著又介紹了M-Smart智慧生活開放平臺。隨后,發(fā)布了美的與度秘深度合作打造的「智能語音盒」。
中國人工智能學會AIDL第二期【人工智能前沿講習班】日前在北京中科院自動化所舉行,本期講習班的主題為【機器學習前沿】。北京大學教授王立威帶來了題為《機器學習理論:回顧與展望》的主題報告,主要對機器學習中關于泛化能力的幾個重要理論進行介紹。
北京大學教授王立威博士的主要研究領域集中于機器學習,在包括COLT, NIPS,JMLR, PAMI等權威會議期刊發(fā)表論文60余篇。2010年入選AI’s 10 to Watch,是首位獲得該獎項的亞洲學者。2012年獲得首屆國家自然科學基金優(yōu)秀青年基金,新世紀優(yōu)秀人才。任NIPS等權威會議Area Chair,和多家學術期刊編委。在主題報告結束后,雷鋒網(公眾號:雷鋒網)AI科技評論與王教授做了短時間交流,探討了1 人工智能現(xiàn)在能做什么、還不能做什么、和可能的突破口又在哪里,2 云計算已經將計算力提升到一個以前不敢想象的高度,甚至已經遠遠高于樣本的獲取能力,那么構建樣本是否會成為未來的研究重點3 數(shù)據(jù)對于算法而言處于怎樣的地位等多個問題。
為了做好云服務,這兩年谷歌一直很拼。砸錢、招人、出產品,谷歌攻城略地的三板斧總是屢試不爽。3月9日凌晨的Google Cloud Next' 17云計算大會上,四大天王(Diane Greene、CEO Sundar Pichai、Alphabet 執(zhí)行主席 Eric Schmidt 、云機器學習與人工智能首席科學家李飛飛)加上近十位合作企業(yè)的高管站臺,似乎也多了一分人多勢眾的感覺。
在全長兩個多小時的開場Keynote中,谷歌把大部分時間留給了合作企業(yè),這些來自零售、娛樂、電信、金融、電商等多個領域的巨頭逐一介紹自家業(yè)務是如何使用云服務的:
為普及谷歌云計算,使人工智能真正受惠于民眾,李飛飛在演講中講了“democratizing AI”(AI民主化),及其四個發(fā)力方向:計算力、算法、數(shù)據(jù)和人才。
針對AI民主化,雷鋒網也從更好的計算力、更通用的算法、更海量的數(shù)據(jù)、更優(yōu)秀的人才這四個方面進行了梳理。
更好的計算力(Computing)
機器學習計算引擎Cloud Machine Learning Engine實際上早在去年就公布了測試版本,這個基于TensorFlow搭建的平臺能夠幫助開發(fā)機器學習模型。在李飛飛的理解中,人工智能技術以往需要精通編程才能順利駕馭,如今借助現(xiàn)有的框架,用戶可以將基礎架構和模型搭建全權交給谷歌云進行大規(guī)模處理,把更多的精力放在“做什么”而不是“怎么做”上。這也是谷歌實現(xiàn)技術普及的一個過程:降低用戶的使用門檻,把更多的基礎內容交給更擅長的谷歌團隊來做。
更通用的算法(Algorithms)
在Keynote上,李飛飛就發(fā)布了一系列通用模型API,這也是讓AI變得更加“親民”的一種方式。用于圖像識別的Vision
API實際上早已經開發(fā)了一段時間,而視頻分析的Video Intelligence
API才是新推出的一大亮點,它可以自動識別視頻中的物體,讓視頻實現(xiàn)可搜索。
用李飛飛的話來說,視頻是計算機視覺里面的“暗物質”,因為它無法像圖片一樣實現(xiàn)便捷的搜索,但Video Intelligence API現(xiàn)在可以幫助開發(fā)者開發(fā)出從視頻中搜索實體的應用,并標記出對應物體的出現(xiàn)位置。雷鋒網(公眾號:雷鋒網)了解到,除了提取數(shù)據(jù),API還允許在對變換的場景打標簽。
更海量的數(shù)據(jù)(Data)
不論是算法訓練還是系統(tǒng)測試,龐大的數(shù)據(jù)量對于人工智能而言毫無疑問都非常寶貴。在與一些高校老師接觸的過程中,雷鋒網也了解到高校目前面臨著“數(shù)據(jù)荒”問題。高校研究目前都是采用公開數(shù)據(jù)集,主要目的是對算法的可行性進行測試。但這些數(shù)據(jù)集比起企業(yè)級別的數(shù)據(jù)實在是九牛一毛?,F(xiàn)在不少高校教授同樣身兼企業(yè)的首席科學家,數(shù)據(jù)不得不說是一個非常重要的考量。李飛飛此前加入谷歌,或許也是看中了谷歌在數(shù)據(jù)的強大實力。
更優(yōu)秀的人才(Talent)
為了讓人工智能的普及范圍更廣,單從企業(yè)的基礎設施入手自然不夠,人才的培養(yǎng)與合作同樣重要。谷歌發(fā)布 Advanced Solution Lab的目的,也在于充分利用谷歌人才的實力,幫助其它企業(yè)解決復雜的機器學習問題;此外,該計劃還將贊助一些嘗試解決困難問題的研究者,讓他們與谷歌一同解決——自然,采用的服務也都會是谷歌生態(tài)下的系列產品,而這一舉措又能夠更好地吸引越來越多的用戶轉投谷歌麾下。
據(jù)雷鋒網AI 科技評論消息,Ian Goodfellow 已于今年 3 月份從 OpenAI 重回谷歌。
目前 Ian Goodfellow 的 LinkedIn 個人資料已經新增了一列,頭銜為谷歌「Staff Research Scientist」,而 Twitter 上的資料顯示為「Google Brain research scientist」;不過維基和 Quora 上的資料暫時還沒有更新。
美國當?shù)貢r間 3 月 8 日,F(xiàn)acebook 正式宣布了新一代的服務器設計方案——“Big Basin”,它是 AI 訓練系統(tǒng) Big Sur 系列的繼承者。這些使用英偉達的 GPU 作為處理核心的服務器連接起來,形成一個巨大的 AI 訓練網絡,這使得 Facebook 的產品能夠進行物體和面部識別、實時文本翻譯、以及理解并描述圖片和視頻中的內容。
Facebook表示,與 Big Sur 相比,Big Basin 能夠訓練比之前的規(guī)模大 30% 的機器學習模型。根據(jù)在標準神經網絡模型上的測試,Big Basin 還可以通過壓縮訓練 AI 系統(tǒng)需要的大量數(shù)據(jù)集,將訓練速度提升一倍。
在正式推出面向大眾的產品之前,F(xiàn)acebook 會通過 Big Basin、Big Sur 這樣的服務器對這些 AI 系統(tǒng)進行訓練。正是因為 Facebook 的持續(xù)投入,才讓這一切變得可能。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。