丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給周翔
發(fā)送

0

微軟黃學(xué)東:微軟在很多AI領(lǐng)域領(lǐng)先Google | AI NEXT

本文作者: 周翔 2017-03-28 13:27
導(dǎo)語(yǔ):黃學(xué)東稱,1993年的時(shí)候,他們做的語(yǔ)音對(duì)話識(shí)別的詞錯(cuò)率(word error rate)高達(dá)80%。

微軟黃學(xué)東:微軟在很多AI領(lǐng)域領(lǐng)先Google | AI NEXT

雷鋒網(wǎng)按:本月 18 日,由美中技術(shù)與創(chuàng)新協(xié)會(huì)(Association of Technology and Innovation,ATI)主辦的第一屆“AI NEXT”大會(huì)在西雅圖召開。本次會(huì)議的主要嘉賓包括:微軟首席 AI 科學(xué)家鄧力,微軟院士黃學(xué)東,Uber 深度學(xué)習(xí)負(fù)責(zé)人 Luming Wang 等。華人之外,還有亞馬遜 Alexa 首席科學(xué)家 Nikko Strom,微軟小娜架構(gòu)師 Savas Parastatidis 等業(yè)內(nèi)知名專家。

大會(huì)主題是“探索 AI 的潛力,把 AI 技術(shù)應(yīng)用于實(shí)用項(xiàng)目和服務(wù)”,對(duì) CV、NLP、智能助手、深度學(xué)習(xí)框架均做了專題報(bào)告。微軟首席語(yǔ)音科學(xué)家黃學(xué)東也發(fā)表了演講,對(duì)微軟的人工智能業(yè)務(wù)和進(jìn)展做了全面的介紹和梳理。雷鋒網(wǎng)根據(jù)演講錄音和PPT整理成文。

雷鋒網(wǎng)注: 黃學(xué)東于1993年加入微軟,目前領(lǐng)導(dǎo)微軟在美國(guó)、德國(guó)、埃及、以色列的團(tuán)隊(duì)研發(fā)研發(fā)微軟企業(yè)人工智能客服對(duì)話解決方案 、cris.ai 和 luis.ai 等認(rèn)知服務(wù)、CNTK 開源深度學(xué)習(xí)工具等人工智能產(chǎn)品和技術(shù)。2017年2月,黃學(xué)東剛剛被評(píng)為“微軟全球技術(shù)院士”,這代表著微軟技術(shù)人員的最高榮譽(yù)。

微軟的AI業(yè)務(wù)簡(jiǎn)介

其實(shí),“人工智能(Artificial Intelligence)”一詞最初是在1956年DARTMOUTH學(xué)會(huì)上提出的,但是為何一直到如今人工智能技術(shù)才步入快速發(fā)展的軌道?黃學(xué)東認(rèn)為,主要是兩方面的原因:海量的數(shù)據(jù),以及計(jì)算能力的大幅提升。目前,人工智能主要集中在視覺、語(yǔ)音、語(yǔ)言和知識(shí)(圖譜)四個(gè)領(lǐng)域,但是未來計(jì)算機(jī)將能夠理解這個(gè)世界。

根據(jù)黃學(xué)東的介紹, 目前微軟的AI業(yè)務(wù)可以分成代理(Agent)、應(yīng)用( Application)、服務(wù)(Service)、基礎(chǔ)設(shè)施(Infrastructure)這四大塊。

  • 代理:Cortana(中文名:微軟小娜)、微軟小冰、Toronto Project(客服助手)

  • 應(yīng)用:Office 365、Dynamicas 365(整合CRM和ERP的云服務(wù)解決方案)、SwiftKey(輸入法)、Pix(拍照軟件)

  • 服務(wù) :聊天機(jī)器人框架(Bot  Framework)、認(rèn)知服務(wù)(Cognitive Services)、Cortana智能、認(rèn)知工具包(Cognitive Toolkit)

  • 基礎(chǔ)設(shè)施:適用于機(jī)器學(xué)習(xí)的Azure 、Azure N Series(GPU + FPGA)、FGPA(現(xiàn)場(chǎng)可編程門陣列)

計(jì)算機(jī)語(yǔ)言技術(shù)的發(fā)展史

微軟黃學(xué)東:微軟在很多AI領(lǐng)域領(lǐng)先Google | AI NEXT


  • 1954年,IBM和喬治城大學(xué)首次展示了能力非常有限的機(jī)器翻譯系統(tǒng)。

  • 1966年,John Pierce發(fā)布了一份關(guān)于“語(yǔ)言技術(shù)”非常關(guān)鍵的報(bào)告。

  • 1975年——1986年,美國(guó)政府沒有任何撥款支持機(jī)器翻譯或者語(yǔ)音識(shí)別,發(fā)展陷入停滯。

  • 1985年,“共同任務(wù)(common task)”方法的出現(xiàn),研究人員開始共享數(shù)據(jù)。

  • 2007年,基于統(tǒng)計(jì)學(xué)谷歌的翻譯上線。

  • 2011年,Siri登陸iPhone。

  • 2016年,微軟的語(yǔ)音識(shí)別系統(tǒng)的達(dá)到人類水平,同年谷歌發(fā)布支持8種語(yǔ)言的神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)。

雖然目前神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)還經(jīng)常鬧出各種笑話,但是黃學(xué)東認(rèn)為,在未來幾年內(nèi),計(jì)算機(jī)的翻譯水平有可能會(huì)和目前的語(yǔ)音識(shí)別一樣,達(dá)到人類(專家)的水平。

微軟在語(yǔ)音識(shí)別領(lǐng)域的成就

黃學(xué)東在演講中提到,微軟于1991建立了Research Lab,該實(shí)驗(yàn)室的愿景是讓計(jì)算機(jī)具備“看(see)、聽(listen)、說(speak)”的能力。1993年,微軟成立語(yǔ)音小組(Speech Group),希望能夠讓人與設(shè)備之間的語(yǔ)音交流成為主流。而如今,這一愿景正在實(shí)現(xiàn)。黃學(xué)東在演講中特別提到了《經(jīng)濟(jì)學(xué)人》今年1月份的封面文章——“Now we're talking”,該文章認(rèn)為語(yǔ)音技術(shù)讓計(jì)算機(jī)不那么令人生畏,而且更易接近。

黃學(xué)東稱,1993年的時(shí)候,他們做的語(yǔ)音對(duì)話識(shí)別的詞錯(cuò)率(word error rate,簡(jiǎn)稱WER)高達(dá)80%。然而2016年9月14日,由黃學(xué)東帶領(lǐng)的微軟語(yǔ)音團(tuán)隊(duì)在產(chǎn)業(yè)標(biāo)準(zhǔn)Switchboard語(yǔ)音識(shí)別基準(zhǔn)測(cè)試中,實(shí)現(xiàn)詞錯(cuò)率低至6.3%的這一技術(shù)突破,這比IBM的6.6%詞錯(cuò)率更低,達(dá)到目語(yǔ)音識(shí)別領(lǐng)域錯(cuò)誤率最低的水平。僅僅一個(gè)月后的10月18日,黃學(xué)東團(tuán)隊(duì)進(jìn)一步將詞錯(cuò)率降低至 5.9%,首次與專業(yè)速記員持平。

微軟黃學(xué)東:微軟在很多AI領(lǐng)域領(lǐng)先Google | AI NEXT

這個(gè)人類水平的對(duì)話語(yǔ)音識(shí)別系統(tǒng)用到了10個(gè)不同的DNN(深度神經(jīng)網(wǎng)絡(luò))。據(jù)雷鋒網(wǎng)了解,其具體實(shí)現(xiàn)過程是:首先用包括了ResNet(殘差網(wǎng)絡(luò))、LSTM(長(zhǎng)短期記憶網(wǎng)絡(luò))在內(nèi)的6個(gè)不同的神經(jīng)網(wǎng)絡(luò)組合并行工作,其結(jié)果再通過4個(gè)新的神經(jīng)網(wǎng)絡(luò)組合之后再輸出,最終達(dá)到專業(yè)速記員的水平。

但是黃學(xué)東表示,目前計(jì)算機(jī)的對(duì)語(yǔ)音的識(shí)別還只停留在轉(zhuǎn)錄階段,想要真正理解語(yǔ)義還非常困難。

微軟客服助手Toronto

微軟黃學(xué)東:微軟在很多AI領(lǐng)域領(lǐng)先Google | AI NEXT


黃學(xué)東表示,語(yǔ)音技術(shù)除了能夠用作娛樂用途之外,還能夠做很專業(yè)的事,比如技術(shù)支撐(technical support)。它在演講中提到,微軟除了語(yǔ)音助手Cortana和聊天機(jī)器人小冰之外,還有一個(gè)代號(hào)為“Toronto”的客服助手項(xiàng)目。

Toronto是基于深度強(qiáng)化學(xué)習(xí)的人工智能,能夠理解對(duì)話中的上下文,讓客服聊天機(jī)器人更加人性化、更加高效。

根據(jù)PPT的介紹,Toronto不僅能自動(dòng)回復(fù),給出建議,還能在解答不了時(shí)提示用戶轉(zhuǎn)接人工服務(wù)。此外,它還能幫助人工客服快速了解用戶信息,給出回答建議,并可以轉(zhuǎn)接給其他的工作人員,甚至還有錄音功能。

當(dāng)然,黃學(xué)東也表示,這些聊天助手和語(yǔ)音識(shí)別不一樣,并沒有一個(gè)已經(jīng)建立起來的有效訓(xùn)練方法(established recipe)。

微軟在深度學(xué)習(xí)方面的進(jìn)展

微軟黃學(xué)東:微軟在很多AI領(lǐng)域領(lǐng)先Google | AI NEXT微軟黃學(xué)東:微軟在很多AI領(lǐng)域領(lǐng)先Google | AI NEXT

黃學(xué)東此前曾表示,微軟的深度學(xué)習(xí)工具包CNTK其實(shí)比谷歌的TensorFlow開源的要早,但是由于一開始 并不是發(fā)布在GitHub上,所以外界知道的人相對(duì)少一些。但是黃學(xué)東表示,根據(jù)基準(zhǔn)測(cè)試的結(jié)果,CNTK比谷歌的TensorFlow和亞馬遜的MxNet的性能要更好:相同條件下,CNTK每秒能夠處理的樣本更多。

微軟黃學(xué)東:微軟在很多AI領(lǐng)域領(lǐng)先Google | AI NEXT

此外,黃學(xué)東還列舉了ComputerWorld今年2月的評(píng)測(cè)結(jié)果,來證明微軟在深度學(xué)習(xí)方面的實(shí)力。從圖中可以看出,微軟認(rèn)知工具包(Cognitive Toolkit)v2.0 beta 1版本在性能、開發(fā)的難易程度、以及部署的難易程度這三個(gè)方面表現(xiàn)突出,而綜合表現(xiàn)僅次于谷歌的TensorFlow r0.10。

微軟認(rèn)知工具包的優(yōu)勢(shì)

微軟黃學(xué)東:微軟在很多AI領(lǐng)域領(lǐng)先Google | AI NEXT

目前,微軟認(rèn)知服務(wù)的API主要包括語(yǔ)言、語(yǔ)音、機(jī)器學(xué)習(xí)、視覺、搜索、知識(shí)這幾大類。據(jù)黃學(xué)東介紹,微軟的認(rèn)知工具包有以下三大優(yōu)勢(shì):

  • 速度&可擴(kuò)展性:微軟認(rèn)知工具包訓(xùn)練和評(píng)估深度學(xué)習(xí)算法比其他的工具包都快,而且可以在不同的環(huán)境下有效擴(kuò)展的同時(shí)保持精度。

  • 商業(yè)級(jí)的質(zhì)量:使用了復(fù)雜的算法以及大量的數(shù)據(jù)集。

  • 兼容性:可以使用C++、Python等語(yǔ)言,而且能夠定制內(nèi)置訓(xùn)練算法,甚至使用自己的算法。


【招聘】雷鋒網(wǎng)堅(jiān)持在人工智能、無人駕駛、VR/AR、Fintech、未來醫(yī)療等領(lǐng)域第一時(shí)間提供海外科技動(dòng)態(tài)與資訊。我們需要若干關(guān)注國(guó)際新聞、具有一定的科技新聞選題能力,翻譯及寫作能力優(yōu)良的外翻編輯加入。 

簡(jiǎn)歷投遞至 wudexin@leiphone.com,工作地 北京。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

微軟黃學(xué)東:微軟在很多AI領(lǐng)域領(lǐng)先Google | AI NEXT

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說