丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給奕欣
發(fā)送

0

阿里 iDST 新人「物理學(xué)家」馮津偉:聲學(xué)設(shè)計(jì)與語音信號(hào)處理,是 AI 算法的核心前提

本文作者: 奕欣 編輯:楊曉凡 2017-11-30 10:56
導(dǎo)語:世界級(jí)聲學(xué)專家、原寶利通(Polycom)聲學(xué)設(shè)計(jì)與信號(hào)處理首席工程師馮津偉博士于近期加入阿里巴巴 iDST,擔(dān)任語音交互團(tuán)隊(duì)研究員。

雷鋒網(wǎng) AI 科技評(píng)論按:阿里巴巴人工智能核心團(tuán)隊(duì) iDST 近期又將一名頂級(jí)大牛納入麾下——世界級(jí)聲學(xué)專家、原寶利通(Polycom)聲學(xué)設(shè)計(jì)與信號(hào)處理首席工程師馮津偉博士于近期加入阿里巴巴 iDST,擔(dān)任語音交互團(tuán)隊(duì)研究員。

據(jù)悉,他的研究方向是「下一代人機(jī)自然交互技術(shù)」,該領(lǐng)域已得到阿里巴巴重點(diǎn)投入,「達(dá)摩院」的研究范圍就包含了這一方向。

阿里 iDST 新人「物理學(xué)家」馮津偉:聲學(xué)設(shè)計(jì)與語音信號(hào)處理,是 AI 算法的核心前提

馮津偉博士本科畢業(yè)于南京大學(xué)電子科學(xué)專業(yè),先后在南京大學(xué)攻讀聲學(xué)(1992-1995)及南洋理工大學(xué)電子信號(hào)處理的碩士學(xué)位(1996-1997),隨后赴美深造,于 2000 年獲得弗吉尼亞理工大學(xué)聲學(xué)博士學(xué)位。馮津偉博士畢業(yè)后一直在音視頻會(huì)議行業(yè)領(lǐng)先者寶利通擔(dān)任聲學(xué)設(shè)計(jì)和信號(hào)處理首席工程師(Principal Engineer),擁有十余項(xiàng)美國專利,大部分已產(chǎn)品化,是世界級(jí)的音頻專家,主持開發(fā)視頻跟蹤系統(tǒng)等創(chuàng)新產(chǎn)品,多次領(lǐng)業(yè)界之先。

在傳統(tǒng)行業(yè)耕耘 17 年的頂級(jí)工程師、專注研究聲學(xué)的「物理學(xué)家」,緣何會(huì)加入阿里巴巴這樣一個(gè)新興互聯(lián)網(wǎng)企業(yè)?加入阿里巴巴 iDST,他又將如何把自己的老本行與目前已有的業(yè)務(wù)進(jìn)行融合?抱著這些疑問,雷鋒網(wǎng) AI 科技評(píng)論與遠(yuǎn)在美國西雅圖的馮津偉博士進(jìn)行了一次電話交流,他向 AI 科技評(píng)論闡述了加入阿里巴巴 iDST 的原因與期待。

作為專業(yè)開發(fā)、制造和銷售高質(zhì)量音視頻會(huì)議系統(tǒng)及解決方案的提供商,寶利通的多代會(huì)議產(chǎn)品曾經(jīng)一度占據(jù) 90% 以上的市場(chǎng)份額。在這背后,以 2000 年加入寶利通工作的馮津偉博士為代表,他主導(dǎo)開發(fā)的圓形麥克風(fēng)陣列算法與音頻信號(hào)分類器成為沿用至今的業(yè)界標(biāo)桿。

而 17 年過去,包括寶利通在內(nèi)的傳統(tǒng)行業(yè)發(fā)生了新的變化。身處其中的馮津偉博士向雷鋒網(wǎng) AI 科技評(píng)論坦言,他從中看到了新興互聯(lián)網(wǎng)企業(yè)的高速發(fā)展,這也是他選擇加入阿里巴巴 iDST 的一個(gè)重要原因。

「我加入阿里,也反映了互聯(lián)網(wǎng)行業(yè)與傳統(tǒng)行業(yè)的一種融合變遷?!勾送?,馮津偉博士也表示,阿里巴巴的價(jià)值觀與他個(gè)人的想法不謀而合,這種契合也讓他對(duì)這家公司產(chǎn)生了特別的好感,并促使他最終加入阿里巴巴 iDST。

「我第一次了解阿里巴巴時(shí),發(fā)現(xiàn)它們家的產(chǎn)品名字都非常有趣,比如金融叫螞蟻金服,物流叫菜鳥物流,音樂叫蝦米音樂,信用叫芝麻信用。(這些名字)很親切很討人喜歡,我認(rèn)為這個(gè)命名思維的出發(fā)點(diǎn)是為普通百姓服務(wù)。我本身也是一個(gè)『草根』,因此覺得阿里巴巴的想法非常地貼近我的價(jià)值觀?!?/p>

從傳統(tǒng)行業(yè)加入阿里巴巴 iDST,馮津偉博士的主要工作又是什么呢?馮津偉博士告訴 AI 科技評(píng)論,他與阿里 iDST 的交集,就是自己的老本行——聲學(xué)設(shè)計(jì)與信號(hào)處理的有機(jī)結(jié)合。

一個(gè)完整的語音識(shí)別系統(tǒng)需要通過前端的聲學(xué)設(shè)計(jì),進(jìn)行信號(hào)的采集、處理,再通過后端的相關(guān)算法進(jìn)行識(shí)別。任何一個(gè)語音產(chǎn)品要投入使用,最主要的挑戰(zhàn)依然是端上語音信號(hào)的采集和處理。

今年 7 月,阿里巴巴發(fā)布智能音箱天貓精靈 X1,其中的聲紋識(shí)別功能便是其中的一大賣點(diǎn)。這項(xiàng)連亞馬遜 Echo 都不具備的功能,一大難點(diǎn)就在于遠(yuǎn)場(chǎng)語音識(shí)別在實(shí)際應(yīng)用中存在不少問題,受到噪聲、回聲、混響的干擾太大。而聲紋識(shí)別,很大程度上又是一種基于數(shù)據(jù)驅(qū)動(dòng)的模式識(shí)別問題。像遠(yuǎn)場(chǎng)的混響、噪聲問題,還有雞尾酒效應(yīng)問題,都是非常常見的信號(hào)處理難點(diǎn)。只有在特定環(huán)境中盡可能地保證聲音的高保真度,才能為后續(xù)的算法處理提供高質(zhì)量的數(shù)據(jù)。試想,如果收集到的聲音信號(hào)都非常模糊,談何后續(xù)的語音識(shí)別、合成甚至是同聲傳譯?

而馮津偉博士的就學(xué)經(jīng)歷正好涉及了聲學(xué)與信號(hào)處理這兩個(gè)領(lǐng)域,而他在博士畢業(yè)后一直在寶利通工作,在這兩個(gè)領(lǐng)域的結(jié)合上擁有深厚的理論研究經(jīng)驗(yàn)與實(shí)踐應(yīng)用經(jīng)歷。

寶利通在上世紀(jì) 80、90 年代就開始做聲學(xué)設(shè)計(jì)與信號(hào)處理的相關(guān)研究,至今已經(jīng)擁有二三十年的技術(shù)沉淀,馮津偉博士表示,最重要的一點(diǎn)就是在于老當(dāng)家在聲學(xué)設(shè)計(jì)上頗為重視,特別在減小失真上做到了極致。在最鼎盛的時(shí)期,寶利通的全球市場(chǎng)份額達(dá)到了 90% 以上。

「聲學(xué)設(shè)計(jì)與信號(hào)處理兩者的有機(jī)融合是非常必要的。我們以前經(jīng)常跟做聲學(xué)的公司打交道,有些音頻失真到 10%,但沒有人重視,因?yàn)槠髽I(yè)覺得人耳聽不出來。但是我們的麥克風(fēng)聽得出來,所以回波抵消就有可能成為問題。因此,我們不能只是處理線性問題,而對(duì)非線性問題不夠上心。這兩方面都需要懂,性能才可以更好地體現(xiàn)出來?!?/p>

加入阿里之后,馮津偉博士在傳統(tǒng)行業(yè)的聲學(xué)設(shè)計(jì)經(jīng)驗(yàn)可以完美地與阿里的業(yè)務(wù)相銜接。聲學(xué)設(shè)計(jì)與信號(hào)處理作為前端信號(hào)處理的主要技術(shù),毫無疑問將會(huì)為阿里巴巴的整個(gè)語音識(shí)別系統(tǒng)奠定堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。

馮津偉博士表示,以「達(dá)摩院」為代表的研究機(jī)構(gòu)逐步建立,阿里巴巴的研發(fā)實(shí)力肯定會(huì)比以前更上一層樓,并且可能會(huì)看到很多與眾不同的創(chuàng)新,「現(xiàn)在的智能音箱實(shí)際上跟著亞馬遜 Echo 走的很多,但阿里巴巴不一定會(huì)沿著它的老路,我們甚至可以引領(lǐng)行業(yè)。」

近年來,隨著深度學(xué)習(xí)的興起,以谷歌 WaveNet 為代表的技術(shù)甚至嘗試顛覆傳統(tǒng)的基于信息及控制論的信號(hào)處理與生成方法。對(duì)于人工智能的迅猛發(fā)展,馮津偉博士一方面嘆服時(shí)代趨勢(shì)的驚人變化,認(rèn)為 AI 的不斷發(fā)展終究會(huì)逐步取代原有的信號(hào)處理技術(shù);但基于現(xiàn)實(shí)狀況來看,他又認(rèn)為這一天仍未那么早到來。

一方面,有很多人用麥克風(fēng)原有的尺度去 PCM(Pulse-code modulation,脈沖編碼調(diào)制),直接引入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,但效果并不理想。這種研究在目前來看依然需要一定的時(shí)間,就像語音識(shí)別一樣,從 90 年代開始,直到近幾年才大規(guī)模商用起來;計(jì)算機(jī)視覺也同樣花了近 20 年才實(shí)現(xiàn)騰飛,同樣地,采用神經(jīng)網(wǎng)絡(luò)來做信號(hào)處理也需要經(jīng)歷這樣一個(gè)厚積薄發(fā)的過程。

而另一方面,神經(jīng)網(wǎng)絡(luò)擅長(zhǎng)處理非線性的工作;而一些線性的工作,在前端的信號(hào)處理階段就可以用很低的成本解決。以回?fù)艿窒麨槔?,相?duì)于提升 AI 算法而言,我們解決前者的成本與資源要小得多。也就是說,在做過前端信號(hào)處理后,我們可以大大降低后續(xù) AI 在算法處理上的非線性工作量。從成本這個(gè)角度來看,前端信號(hào)處理還是有它存在的必要的。

在 2017 杭州云棲大會(huì)上,馮津偉教授聽了不少教授、專家的演講,其中有人與自己的想法一致:語音系統(tǒng)的算法只是一部分,在實(shí)際應(yīng)用領(lǐng)域,更重要的一環(huán)是聲學(xué)設(shè)計(jì),要從源頭上保證數(shù)據(jù)的采集質(zhì)量。「在源頭上追溯整條數(shù)據(jù)鏈,如果有某個(gè)環(huán)節(jié)很弱,那么就會(huì)『牽一發(fā)而動(dòng)全身』,甚至使鏈條斷掉。」

馮津偉博士告訴雷鋒網(wǎng) AI 科技評(píng)論,阿里巴巴的一大核心競(jìng)爭(zhēng)力在于,從源頭到鏈條的最后一環(huán),從聲學(xué)設(shè)計(jì)、到前端信號(hào)處理,到 AI 識(shí)別算法三大模塊,阿里巴巴在每環(huán)技術(shù)都有自己的獨(dú)立研發(fā)團(tuán)隊(duì)。

「我們擁有完整的數(shù)據(jù)鏈,在每個(gè)模塊上我們基本上都有一支小團(tuán)隊(duì),可以實(shí)現(xiàn)獨(dú)立研發(fā)。在這之后,我們可以把三大模塊更緊密地融合在一起。結(jié)合聲學(xué)設(shè)計(jì)與信號(hào)處理的從業(yè)經(jīng)歷,我相信三個(gè)環(huán)節(jié)可以做到無縫融合。」阿里巴巴全鏈條、多業(yè)務(wù)、多線程的研發(fā)模式,在馮津偉博士看來是構(gòu)建了一個(gè)完善的生態(tài)系統(tǒng),在做細(xì)分項(xiàng)目的時(shí)候也很容易把各個(gè)部分的技術(shù)結(jié)合起來。

另一個(gè)令馮津偉博士深深認(rèn)同的地方在于阿里巴巴具有優(yōu)秀的核心團(tuán)隊(duì)?!脯F(xiàn)在我們有五個(gè)跨越全球的語音小組(北京、杭州、西雅圖、硅谷、新加坡),擁有世界一流的團(tuán)隊(duì),聚集著世界一流的人才。阿里 iDST 中有非常多優(yōu)秀的科學(xué)家與工程師,我自己也非常高興,能夠在與他們共事的過程中提升自己。」

馮津偉博士告訴雷鋒網(wǎng) AI 科技評(píng)論,加入阿里巴巴 iDST 后,他計(jì)劃帶領(lǐng)團(tuán)隊(duì),結(jié)合自己豐富的從業(yè)經(jīng)驗(yàn),把聲學(xué)設(shè)計(jì)與信號(hào)處理有機(jī)地融合起來,并且把每一個(gè)環(huán)節(jié)做到極致,「業(yè)余與專業(yè)的區(qū)別就在于細(xì)節(jié),如果要做到行業(yè)領(lǐng)先,我們就要把每個(gè)細(xì)節(jié)做到完美,做到最好?!估卒h網(wǎng) AI 科技評(píng)論也期待,馮津偉博士未來在阿里的產(chǎn)品上,能給我們帶來更多的體驗(yàn)驚喜。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

阿里 iDST 新人「物理學(xué)家」馮津偉:聲學(xué)設(shè)計(jì)與語音信號(hào)處理,是 AI 算法的核心前提

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說