丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給老王
發(fā)送

2

預(yù)告:解讀全新聲學(xué)模型與算法:2016 年語(yǔ)音識(shí)別的重大進(jìn)步丨硬創(chuàng)公開(kāi)課

本文作者: 老王 2017-01-16 20:28
導(dǎo)語(yǔ):特邀供職于阿里巴巴最神秘的研究部門(mén) iDST 的語(yǔ)音專家薛少飛博士,從聲學(xué)模型和算法角度深入講述 2016 年語(yǔ)音識(shí)別領(lǐng)域的重大突破。

在去年的錘子發(fā)布會(huì)中,羅永浩現(xiàn)場(chǎng)演示了訊飛輸入法后讓用戶意識(shí)到當(dāng)下語(yǔ)音識(shí)別能力的強(qiáng)大。當(dāng)然,語(yǔ)音識(shí)別在安靜環(huán)境、常用字詞、發(fā)音標(biāo)準(zhǔn)情況下已非常成熟,但在復(fù)雜環(huán)境下如遠(yuǎn)場(chǎng)識(shí)別、帶噪聲識(shí)別等情況下仍有一定的提升空間。

2016 年語(yǔ)音識(shí)別領(lǐng)域有著不小的進(jìn)展,其主要體現(xiàn)在模型方面的突破:

Deep CNN 模型大熱,百度把 Deep CNN 應(yīng)用于語(yǔ)音識(shí)別聲學(xué)建模中,將其與基于 LSTM 和 CTC 的端對(duì)端語(yǔ)音識(shí)別技術(shù)相結(jié)合,大大提升了語(yǔ)音識(shí)別能力;微軟則是把 ResNet 應(yīng)用于語(yǔ)音識(shí)別,在產(chǎn)業(yè)標(biāo)準(zhǔn) Switchboard 語(yǔ)音識(shí)別基準(zhǔn)測(cè)試中,實(shí)現(xiàn)了詞錯(cuò)率(WER)低至 5.9% 的新突破;科大訊飛也推出了全新的深度全序列卷積神經(jīng)網(wǎng)絡(luò) DFCNN。

與此同時(shí),新的深度學(xué)習(xí)開(kāi)源框架層出不窮,開(kāi)發(fā)者做語(yǔ)音識(shí)別到底是用 Kaldi 這類傳統(tǒng)框架還是用 TensorFlow 這類新型框架呢?

針對(duì)上述幾大話題,雷鋒網(wǎng)硬創(chuàng)公開(kāi)課特邀供職于阿里巴巴最神秘的研究部門(mén) iDST 的語(yǔ)音專家薛少飛博士,從聲學(xué)模型和算法角度深入講述 2016 年語(yǔ)音識(shí)別領(lǐng)域的重大突破。

嘉賓介紹

預(yù)告:解讀全新聲學(xué)模型與算法:2016 年語(yǔ)音識(shí)別的重大進(jìn)步丨硬創(chuàng)公開(kāi)課

薛少飛,阿里巴巴 iDST 語(yǔ)音識(shí)別專家,中國(guó)科學(xué)技術(shù)大學(xué)博士。現(xiàn)負(fù)責(zé)阿里聲學(xué)模型研究與應(yīng)用:包括語(yǔ)音識(shí)別聲學(xué)建模和深度學(xué)習(xí)在業(yè)務(wù)場(chǎng)景中的應(yīng)用。博士期間的研究方向?yàn)檎Z(yǔ)音識(shí)別說(shuō)話人自適應(yīng),提出基于 Speaker Code 的模型域自適應(yīng)方法,在語(yǔ)音相關(guān)的會(huì)議和期刊上發(fā)表論文十余篇。

本期公開(kāi)課內(nèi)容將包括但不限于:

  • 語(yǔ)音識(shí)別領(lǐng)域的最新進(jìn)展。

  • 詳解阿里的聲學(xué)模型。

  • Deep CNN 的原理,相比于之前的 LSTM、RNN、CTC 模型有哪些不同和優(yōu)勢(shì)。

  • 介紹不同單位提出的 Deep CNN 結(jié)構(gòu),如科大訊飛提出的深度全序列卷積神經(jīng)網(wǎng)絡(luò) DFCNN 等。

  • ResNet 在語(yǔ)音識(shí)別中的應(yīng)用。

  • 對(duì)比傳統(tǒng)語(yǔ)音識(shí)別開(kāi)源框架(Kaldi、CMU Sphinx、Julius)與深度學(xué)習(xí)開(kāi)源框架(CNTK、TensorFlow)

活動(dòng)詳情

主題:解讀全新聲學(xué)模型與算法:2016 年語(yǔ)音識(shí)別的重大進(jìn)步

嘉賓:薛少飛

時(shí)間:1 月 19 日周四晚上 20:00

形式:斗魚(yú)直播+微信群與嘉賓問(wèn)答互動(dòng)

地址:硬創(chuàng)公開(kāi)課 斗魚(yú)直播間(房間號(hào):788495)

本期雷鋒網(wǎng)硬創(chuàng)公開(kāi)課將會(huì)有【斗魚(yú)直播+微信群?jiǎn)柎稹績(jī)蓚€(gè)環(huán)節(jié)。嘉賓直播授課分享結(jié)束后,將會(huì)在微信群與群友問(wèn)答互動(dòng)。

為了打造高質(zhì)量且細(xì)分的讀者交流群,我們需要您提交一些基本資料作簡(jiǎn)單審核,而本次公開(kāi)課讀者群將優(yōu)先 NLP 相關(guān)從業(yè)者和學(xué)生進(jìn)入。

掃描下方海報(bào)上的二維碼,進(jìn)入雷鋒網(wǎng)人工智能垂直微信公眾號(hào)【AI 科技評(píng)論】后,可獲得詳細(xì)入群方式。

預(yù)告:解讀全新聲學(xué)模型與算法:2016 年語(yǔ)音識(shí)別的重大進(jìn)步丨硬創(chuàng)公開(kāi)課

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

預(yù)告:解讀全新聲學(xué)模型與算法:2016 年語(yǔ)音識(shí)別的重大進(jìn)步丨硬創(chuàng)公開(kāi)課

分享:
相關(guān)文章

編輯

微信 wangyafeng123456
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)