丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給AI科技評(píng)論
發(fā)送

0

清晰度提升40%,騰訊天籟AI降噪技術(shù)為聽障者帶來福音

本文作者: AI科技評(píng)論 2020-09-28 10:39
導(dǎo)語:加持天籟技術(shù)的人工耳蝸能夠?qū)⒄Z音的清晰度提升40%,極大改善聽障人士的聽覺體驗(yàn)。

9月27日,正值國際聾人日之際,騰訊多媒體實(shí)驗(yàn)室聯(lián)合騰訊公益慈善基金會(huì)、深圳市信息無障礙研究會(huì)等機(jī)構(gòu)召開發(fā)布會(huì),宣布發(fā)起“天籟行動(dòng)”,面向公益開發(fā)者、設(shè)備廠商、NGO及行業(yè),以API開放的形式,免費(fèi)授權(quán)騰訊天籟AI音頻技術(shù)。

騰訊高級(jí)執(zhí)行副總裁湯道生表示,這項(xiàng)行動(dòng)旨在幫助聽障人群解決“聽不清”難題。中度聽障人士可以借助人工耳蝸獲得聽力,但是受到噪音的影響很難聽得清。加持天籟技術(shù)的人工耳蝸能夠?qū)⒄Z音的清晰度提升40%,極大改善聽障人士的聽覺體驗(yàn)。

       清晰度提升40%,騰訊天籟AI降噪技術(shù)為聽障者帶來福音

騰訊開放天籟AI降噪技術(shù)




一、2780萬聽障者

根據(jù)世界衛(wèi)生組織數(shù)據(jù)顯示,全球約有11億的12-35歲的年輕人面臨聽力損失的風(fēng)險(xiǎn),約有3.6億人患有聽力損失的障礙,約占世界人口的5%,他們有不同程度的聽力損失,過著近乎寂靜的生活。

據(jù)第二次全國殘疾人抽樣調(diào)查結(jié)果顯示,我國2780萬聽力障礙患者,居目前我們國家五大類的殘疾人群中之首,并且每年以兩到三萬新增兒童在繼續(xù)增長。

在這2780萬的聽障人士里,有300多萬屬于重度耳聾,這些聾人只能通過人工耳蝸聽到聲音,將近90%的人群可以通過助聽器聽到聲音。

人工耳蝸和助聽器目前屬于相對(duì)成熟的技術(shù),但是由于費(fèi)用和服務(wù)力弱的原因,發(fā)達(dá)國家只有10%的聾人植入耳蝸,發(fā)展中國家更少。即便是植入耳蝸者,由于噪音和頻道及音量技術(shù)等復(fù)雜性,實(shí)際受益的人數(shù)更少。不管是人工耳蝸還是助聽器,降噪對(duì)于兩款產(chǎn)品極為重要。

人是信息語言和文化交流的產(chǎn)物,聽不到外界他人的聲音或聲音質(zhì)量不高,就會(huì)使他們減少接收許多資訊。深圳市殘聯(lián)黨組書記、理事長侯伊莎在發(fā)布會(huì)現(xiàn)場(chǎng)說道,對(duì)聽障人士來說,他們的社會(huì)關(guān)系容易出現(xiàn)問題,比如受教育的機(jī)會(huì)和工作的機(jī)會(huì)相對(duì)較少,社交及休閑活動(dòng)也因此會(huì)受限,這些情況會(huì)導(dǎo)致他們的心理問題和其他的社會(huì)問題,他們可能變得內(nèi)向,不合群,缺乏自信,焦慮、暴躁等等。

 


二、手機(jī)伴侶+人工耳蝸

騰訊多媒體實(shí)驗(yàn)室是騰訊旗下的音視頻通信和處理研發(fā)團(tuán)隊(duì),專注實(shí)時(shí)音視頻通信、音視頻編解碼前沿算法研究、音視頻國際標(biāo)準(zhǔn)、計(jì)算機(jī)視覺圖像處理、端到端音視頻質(zhì)量評(píng)測(cè)。

在發(fā)布會(huì)現(xiàn)場(chǎng),騰訊多媒體實(shí)驗(yàn)室高級(jí)總監(jiān)商世東分享了當(dāng)初將天籟音頻技術(shù)與人工耳蝸產(chǎn)品結(jié)合的契機(jī)。

現(xiàn)有市場(chǎng)上大部分的人工耳蝸產(chǎn)品,聽障者在佩戴之后,能獲得基礎(chǔ)的聽力,但是在某些場(chǎng)景下效果并不理想。最突出的是復(fù)雜的聲學(xué)場(chǎng)景下,比如商場(chǎng)和機(jī)場(chǎng),噪聲會(huì)導(dǎo)致聽力下降,這對(duì)于人工耳蝸佩戴者的聽覺體驗(yàn)和辨識(shí)度產(chǎn)生極大的負(fù)面影響。

人工耳蝸雖然小,但是面臨的挑戰(zhàn)巨大,因?yàn)樗芾玫馁Y源非常的有限。電腦和手機(jī)實(shí)現(xiàn)了GHz主頻多核架構(gòu),人工耳蝸由于尺寸限制,往往只能有幾十MHz的處理能力。在這樣的處理能力條件下,高復(fù)雜度的噪聲處理成為了業(yè)界的難點(diǎn)。

       清晰度提升40%,騰訊天籟AI降噪技術(shù)為聽障者帶來福音

騰訊多媒體實(shí)驗(yàn)室高級(jí)總監(jiān)商世東

基于此,商世東和團(tuán)隊(duì)萌生了通過AI算法改善聽障人群聽覺體驗(yàn)的想法,并找到了國內(nèi)最大的人工耳蝸廠商之一——諾爾康(Nurotron),雙方一起討論在當(dāng)前人工耳蝸軟硬件局限條件下的解決方案,經(jīng)過長達(dá)半年的技術(shù)驗(yàn)證,從架構(gòu)上最終確定了“手機(jī)伴侶+人工耳蝸”的聯(lián)合解決方案。

在手機(jī)上,通過手機(jī)強(qiáng)大的語音處理和采集能力,可以對(duì)采集到的語音進(jìn)行場(chǎng)景識(shí)別和場(chǎng)景有針對(duì)性的降噪和增量處理。針對(duì)處理過的語音,通過有線或者無線的方式發(fā)送到人工耳蝸,人工耳蝸可以進(jìn)一步刺激相應(yīng)的聽覺神經(jīng),有效的改善聽覺體驗(yàn)的效果。

針對(duì)噪聲消除,騰訊多媒體實(shí)驗(yàn)室融合了經(jīng)典的數(shù)字信號(hào)處理按和深度學(xué)習(xí)的技術(shù)。經(jīng)典的數(shù)字信號(hào)處理在處理平穩(wěn)噪聲上有獨(dú)特的優(yōu)勢(shì),同時(shí)計(jì)算復(fù)雜度比較低。但是對(duì)于日常生活中的非平穩(wěn)噪聲往往力不從心。

而深度學(xué)習(xí)技術(shù)有非常優(yōu)秀的特征建模能力,可以針對(duì)日常生活當(dāng)中的各種噪聲進(jìn)行準(zhǔn)確的建模,從而非常有效的移除生活中突發(fā)的噪聲。

但是深度學(xué)習(xí)的缺點(diǎn)往往在于運(yùn)算量復(fù)雜,所以為了進(jìn)一步降低運(yùn)算復(fù)雜度,騰訊多媒體實(shí)驗(yàn)室采用了多種輔助訓(xùn)練方法,并把訓(xùn)練后的模型進(jìn)一步量化處理,把運(yùn)算復(fù)雜度有效降低,解決了低功耗的手機(jī)終端上運(yùn)行降噪處理的難題。

商世東表示,整個(gè)處理過程中,他們針對(duì)人工耳蝸用戶常見的4類聲學(xué)場(chǎng)景,在業(yè)界首次采用了基于深度學(xué)習(xí)的殘差網(wǎng)絡(luò)結(jié)構(gòu),在多尺度和多級(jí)別的網(wǎng)絡(luò)架構(gòu)環(huán)境之下,對(duì)收集到的帶噪語音進(jìn)一步處理。

多尺度的架構(gòu)可以幫助有效區(qū)分4類聲學(xué)場(chǎng)景,而多級(jí)別的網(wǎng)絡(luò)架構(gòu)可以進(jìn)一步幫助區(qū)分易于混淆的帶噪語言的場(chǎng)景。經(jīng)過這樣的處理,并進(jìn)行4千多小時(shí)各種場(chǎng)景的噪聲的數(shù)據(jù)訓(xùn)練,該網(wǎng)絡(luò)總體上取得了96.2%的場(chǎng)景識(shí)別準(zhǔn)確率,為進(jìn)一步的增強(qiáng)和語音處理奠定了基礎(chǔ)。

考慮到手機(jī)上多麥克風(fēng)的節(jié)奏,騰訊多媒體實(shí)驗(yàn)室采用了以前在雷達(dá)以及智能天線領(lǐng)域使用的技術(shù),以輔助降噪和語音的正常處理,有效對(duì)特定方向的語音進(jìn)行針對(duì)性的加強(qiáng),同時(shí)濾除非特定方向的干擾人聲以及環(huán)境噪聲。雷鋒網(wǎng)

商世東表示,經(jīng)過多種技術(shù)的整合和處理,他們有效提升了聽障人士在各種溝通場(chǎng)景之下的效率,很好的幫助消除聽障人士不想聽到的聲音,將語音的清晰度提升40%。雷鋒網(wǎng)

據(jù)諾爾康實(shí)驗(yàn)檢測(cè)數(shù)據(jù)顯示,天籟技術(shù)與人工耳蝸結(jié)合后,語音識(shí)別性能大幅提升,平均識(shí)別率達(dá)到96.28%,其中帶噪語音識(shí)別率為93.38%,環(huán)境噪音中聲音識(shí)別率達(dá)到94.24%;在手機(jī)App中植入天籟技術(shù),手機(jī)雙麥陣列降噪的信噪比提升 20dB,MOS分提升了0.3-0.5,對(duì)于改善聽障人群聽覺體驗(yàn)有著積極效果。雷鋒網(wǎng)


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說