丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給木子
發(fā)送

0

上海地鐵攜手阿里云,落地語音購票,打造首個(gè) AI 地鐵城

本文作者: 木子 2017-12-07 11:22
導(dǎo)語:鄢志杰:如何才能突破舊有的使用場景,在強(qiáng)噪音的環(huán)境下讓人和機(jī)器進(jìn)行語音交互

上海地鐵攜手阿里云,落地語音購票,打造首個(gè) AI 地鐵城

人工智能在傳統(tǒng)行業(yè)遍地開花已經(jīng)不是新鮮事,但是進(jìn)入地鐵這種人流量大且復(fù)雜、噪聲極強(qiáng)的環(huán)境中,似乎還是第一次。雷鋒網(wǎng)消息,昨日(12月5日),上海地鐵攜手阿里云,落地語音購票,打造首個(gè) AI 地鐵城的消息刷了屏。

雷鋒網(wǎng)就此采訪了阿里云 iDST 智能語音交互團(tuán)隊(duì)總監(jiān)的鄢志杰,他也是該項(xiàng)目中語音購票技術(shù)的總負(fù)責(zé)人,聊了聊技術(shù)落地背后的故事。

“語音+視覺”搞定強(qiáng)噪音環(huán)境

大概半年前,擔(dān)任阿里云 iDST 智能語音交互團(tuán)隊(duì)總監(jiān)的鄢志杰,和同事參加某個(gè)機(jī)器人展會(huì)。在展會(huì)上,他們發(fā)現(xiàn)很多具有語音交互功能的機(jī)器人“聽力不好”,參展的觀眾需要抱著機(jī)器人的頭,幾乎貼在上面才能完成一兩句對話,主要原因就是環(huán)境噪音太強(qiáng),導(dǎo)致機(jī)器人無法分辨“要聽什么”。

在語音交互領(lǐng)域,“抗噪”是個(gè)難點(diǎn)。市面上相對成熟的語音交互產(chǎn)品,幾乎全部集中在家庭、辦公等安靜場景中,通過麥克風(fēng)陣列,可以讓機(jī)器輕易分辨“誰是說話人”,而類似機(jī)場、高鐵、咖啡廳、超市、展廳強(qiáng)噪音場景則沒有。

鄢志杰當(dāng)下就想,如何才能突破舊有的使用場景,在強(qiáng)噪音的環(huán)境下讓人和機(jī)器進(jìn)行語音交互。

上海地鐵攜手阿里云,落地語音購票,打造首個(gè) AI 地鐵城

面對這個(gè)具體的問題, iDST 的人工智能專家們想到了融合語音、視覺兩種模態(tài)的方法。具體來說,如果只通過擴(kuò)大麥克風(fēng)陣列,提升信噪比的單一方法,還是不夠,如果有了攝像頭之后,就可以通過視覺識別是否來人,來人是否講話,判斷之后用算法調(diào)整麥克風(fēng)位置,進(jìn)行定向增強(qiáng)。這樣,就可以讓一個(gè)強(qiáng)噪音環(huán)境變得和普通交互場景一樣了。

值得一提的是,采用視覺來確定目標(biāo)說話人后,還帶來一個(gè)更大的驚喜。此前語音交互產(chǎn)品,都需要通過“喚醒詞”,讓用戶喚醒,但“誤喚醒率”是個(gè)問題。而采用視覺后,機(jī)器可以通過人臉、嘴巴來判斷說話人是否開口說話,從而徹底免去了“喚醒”這一步,從而也就解決了“誤喚醒率”的問題。

當(dāng)然,實(shí)際工程化的過程并不像講起來這么簡單。鄢志杰坦陳,這種融合多模態(tài)的方式,學(xué)術(shù)界其實(shí)早有研究,但實(shí)際落地的產(chǎn)品似乎還沒見到。

技術(shù)的問題解決之后, iDST 在商店(嘈雜環(huán)境)里放了一臺可以使用語音來買咖啡的機(jī)器,用的就是語音+視覺的解決方案。這或許也是這種方案下,第一個(gè)落地的實(shí)際產(chǎn)品。

兩周之后,這個(gè)方案落地上海地鐵,咖啡機(jī)換成了購票機(jī),乘客可以通過語音進(jìn)行購票,掃碼支付,全程只需不到10秒。

口說有憑,自由通行

上海作為全球里程數(shù)最長的地鐵,共有 17 條線路,367個(gè)站點(diǎn),以連接兩大機(jī)場、虹橋火車站、川沙、陸家嘴、龍陽路磁浮站、南京路、靜安寺,橫貫東西的2號線為例,全天都處在擁擠狀態(tài),日客流量接近百萬。這條線路因?yàn)檫B接著交通樞紐和重要地標(biāo),充滿了來自全球各地不同語言的人,購票之難、時(shí)間之長可想而知。

采用阿里云 iDST 的語音購票方案后,每個(gè)人只需要走近售票機(jī),對售票機(jī)說出你想要去的地方,售票機(jī)就能夠自動(dòng)向乘客推薦線路和站點(diǎn),乘客掃碼或刷臉即可購票,全程不過10秒。

上海地鐵攜手阿里云,落地語音購票,打造首個(gè) AI 地鐵城

舉例來說,在此之前如果想去東方明珠,需要先拿出手機(jī),打開地圖應(yīng)用,查詢公交線路,走進(jìn)推薦的地鐵站,在售票機(jī)上通過點(diǎn)擊、投幣來買票,上地鐵。而現(xiàn)在,乘客可以直接進(jìn)入最近的地鐵站,對售票機(jī)說“我要去東方明珠”,售票機(jī)將自動(dòng)建議乘客坐到“陸家嘴站”,然后彈出二維碼進(jìn)行支付。

鄢志杰向雷鋒網(wǎng)表示,試運(yùn)行階段,目前該機(jī)器可以支持帶口音的普通話,但未來希望能夠覆蓋更多的語種和方言,滿足不同地方的乘客需求。

同時(shí),該技術(shù)在強(qiáng)噪音環(huán)境下的通用性,也方便將此解決辦法復(fù)制到機(jī)場、高鐵、商店等更多場景中。

多項(xiàng)技術(shù),打造 AI 地鐵城

除了語音購票技術(shù)外,亮相上海地鐵的還有阿里云的“刷臉進(jìn)站”、“智能客流監(jiān)測”兩項(xiàng)技術(shù)。

雷鋒網(wǎng)了解到,正在研發(fā)中的新型進(jìn)站閘機(jī)上,新增了一塊屏幕,用戶經(jīng)過屏幕時(shí),幾乎無需停留,屏幕就依托阿里云人臉識別技術(shù),完成了人臉識別,開啟閘機(jī),供乘客通過。

上海地鐵攜手阿里云,落地語音購票,打造首個(gè) AI 地鐵城

系統(tǒng)所采用的阿里云人臉識別算法具備業(yè)內(nèi)領(lǐng)先的精度和效率,在國際公開的人臉比對評測LFW中,精度超過99.5%;在身份認(rèn)證1:1比對場景,誤識率0.1%條件下,實(shí)測精度大于99%;1:3000身份識別場景,現(xiàn)場實(shí)測識別率>95%。

而智能客流分析技術(shù)則是基于視頻識別、數(shù)據(jù)分析機(jī)器學(xué)習(xí)和阿里云的數(shù)據(jù)可視化技術(shù),替代肉眼,觀察車站的客流速度、密度、擁擠指數(shù)等,同時(shí)結(jié)合地鐵列車運(yùn)營信息、外部天氣信息數(shù)據(jù),對未來流量進(jìn)行預(yù)測,幫助地鐵工作人員進(jìn)行客流疏導(dǎo)、應(yīng)急調(diào)度、危險(xiǎn)防范等,保障乘客安全。

上海地鐵攜手阿里云,落地語音購票,打造首個(gè) AI 地鐵城

目前,這些技術(shù)已經(jīng)完成實(shí)驗(yàn)室測試,進(jìn)入樣機(jī)研制階段,未來都將應(yīng)用于上海地鐵。相信在不久之后,我們就可以享受更為智慧、方便的公共交通服務(wù)了。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說