0
本文作者: 汪思穎 | 2018-07-05 11:03 |
雷鋒網(wǎng) AI 研習(xí)社按,百度 AI 開(kāi)發(fā)者大會(huì)于 2018 年 7 月 4 日正式開(kāi)幕,當(dāng)天上午,百度展示了他們強(qiáng)大的智能客服助理。詳情請(qǐng)戳如下視頻:
可以看到,智能客服助理不僅能與人流暢對(duì)話(huà),也能自如應(yīng)對(duì)人類(lèi)的閑聊。究竟這一系統(tǒng)是靠何種技術(shù)來(lái)支撐?在當(dāng)天下午的百度大腦分論壇上,來(lái)自百度視覺(jué)技術(shù)部、百度語(yǔ)音技術(shù)部、百度 AI 技術(shù)生態(tài)部、百度大數(shù)據(jù)部的多位負(fù)責(zé)人帶來(lái)了對(duì)百度語(yǔ)音語(yǔ)義技術(shù)的詳細(xì)解讀,除了技術(shù)解讀,他們還表示,未來(lái),將會(huì)有更多技術(shù)開(kāi)放給開(kāi)發(fā)者,用戶(hù)可以利用百度最新升級(jí)的 PaddlePaddle3.0,參加各種各樣的開(kāi)放競(jìng)賽,感受技術(shù)帶來(lái)的無(wú)盡魅力。雷鋒網(wǎng) AI 研習(xí)社也第一時(shí)間提取出大會(huì)亮點(diǎn),以饗讀者。
視覺(jué)語(yǔ)義、語(yǔ)音語(yǔ)義和知識(shí)圖譜
論壇伊始,百度視覺(jué)技術(shù)部、人臉技術(shù)部、增強(qiáng)現(xiàn)實(shí)技術(shù)部總監(jiān)吳中勤為大家介紹了視覺(jué)語(yǔ)義化的作用——可以讓機(jī)器從看清到看懂視頻,并提煉出結(jié)構(gòu)化語(yǔ)義知識(shí)。他表示,視覺(jué)語(yǔ)義化技術(shù)首先識(shí)別人、物體和場(chǎng)景,同時(shí)捕捉它們之間的行為和關(guān)系,通過(guò)時(shí)序化、數(shù)字化、結(jié)構(gòu)化的方式形成語(yǔ)義知識(shí),最終進(jìn)行智慧推理,落地應(yīng)用。
他描述了百度語(yǔ)義化平臺(tái)的技術(shù)架構(gòu)。首先是底層依賴(lài),這里包括數(shù)據(jù)采集、光學(xué)傳感器、嵌入式芯片、云端計(jì)算服務(wù),上層是識(shí)別算法,包括人體/人臉?lè)治觥⑽矬w檢測(cè)/識(shí)別/分割、文字識(shí)別、場(chǎng)景分析,再往上是語(yǔ)義分析層,包括動(dòng)作檢測(cè)/識(shí)別、視頻跟蹤、事件分析,接下來(lái)是產(chǎn)品方案層,包括智慧分析與推理、可視化展現(xiàn)等,最上層是豐富的應(yīng)用場(chǎng)景。
他表示,未來(lái),百度視覺(jué)語(yǔ)義化技術(shù)也將開(kāi)放給開(kāi)發(fā)者使用。
除了視覺(jué)語(yǔ)義化,語(yǔ)音語(yǔ)義一體化也非常重要。
百度語(yǔ)音技術(shù)部總監(jiān)高亮表示,百度目前在遠(yuǎn)場(chǎng)語(yǔ)音語(yǔ)義上有三個(gè)最新技術(shù)突破,一是語(yǔ)音語(yǔ)義一體化,二是多語(yǔ)種混合聲學(xué)建模,三是將傳統(tǒng)拼接技術(shù)與 WaveNet 融合。他表示,語(yǔ)音語(yǔ)義一體化將遠(yuǎn)場(chǎng)交互中高頻 Query 識(shí)別準(zhǔn)確率提升 10 個(gè)點(diǎn),并保持普通 Query 識(shí)別率不降。他也具體介紹了如何解決遠(yuǎn)場(chǎng)交互的高頻 Query,可以看到其中涉及到語(yǔ)言模型、聲學(xué)模型、高頻知識(shí)庫(kù)、語(yǔ)義糾錯(cuò)等多個(gè)方面。
2017 年,百度推出 Deep Peak2 建模技術(shù),這一技術(shù)適合多語(yǔ)種建模的上下文無(wú)關(guān)的音素組合建模,無(wú)需考慮音素組合的前后音連,大幅提升了中英文混合 Query 識(shí)別準(zhǔn)確率。
另外,遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)低成本解決方案「度小云」也在此時(shí)發(fā)布,這一方案基于 Deep Peak V2 語(yǔ)音識(shí)別技術(shù),以及面向高頻 Query 優(yōu)化的語(yǔ)音語(yǔ)義一體化技術(shù)和 LSTM-VAD 深度學(xué)習(xí)語(yǔ)音切分技術(shù)等,據(jù)悉,未來(lái)開(kāi)發(fā)者可以直接一站式獲取這一遠(yuǎn)場(chǎng)語(yǔ)音能力。
除了前面提到的視覺(jué)語(yǔ)義和語(yǔ)音語(yǔ)義,將語(yǔ)言變成知識(shí)也非常重要。百度 AI 技術(shù)平臺(tái)體系執(zhí)行總監(jiān)吳甜對(duì)百度語(yǔ)言與知識(shí)技術(shù)布局進(jìn)行了全面解讀,這其中包括計(jì)算、推理、知識(shí)圖譜、語(yǔ)言理解、語(yǔ)言生成等多層技術(shù)。
她在現(xiàn)場(chǎng)介紹了百度多元語(yǔ)義知識(shí)圖譜,其中包含實(shí)體圖譜、行業(yè)知識(shí)圖譜、事件圖譜、關(guān)注點(diǎn)圖譜、多媒體圖譜,目前,實(shí)體圖譜已經(jīng)能夠滿(mǎn)足 90% 用戶(hù)需求,行業(yè)知識(shí)圖譜也已經(jīng)覆蓋億級(jí)專(zhuān)業(yè)資源,多媒體圖譜包含十億張圖片與音視頻語(yǔ)義標(biāo)簽,能精準(zhǔn)關(guān)聯(lián) 95% 熱門(mén)實(shí)體。
她表示,百度理解與交互技術(shù)平臺(tái) UNIT 發(fā)布至今,已經(jīng)有 1 萬(wàn)名開(kāi)發(fā)者參與其中,累計(jì)創(chuàng)建了 1.3 萬(wàn)條技能,發(fā)起 33 萬(wàn)次啟發(fā)式訓(xùn)練,8 萬(wàn)次模型訓(xùn)練。目前,UNIT 升級(jí)至 2.0,進(jìn)一步增強(qiáng)了冷啟動(dòng)能力,能像人一樣在實(shí)踐中學(xué)習(xí)。
從百度語(yǔ)言與知識(shí)開(kāi)放技術(shù)藍(lán)圖中可以看到,目前百度的實(shí)體標(biāo)注、文本糾錯(cuò)、評(píng)論觀點(diǎn)定制化、對(duì)話(huà)情緒識(shí)別等多種功能已經(jīng)正式開(kāi)放。
吳甜表示,未來(lái),百度將會(huì)開(kāi)放實(shí)體屬性填充、長(zhǎng)文本實(shí)體標(biāo)注、內(nèi)容生成解決方案等多種技術(shù)。
PaddlePaddle3.0 以及各類(lèi)比賽和工具
值得一提的是,在上午的主論壇上,王海峰正式發(fā)布 PaddlePaddle3.0,下午,百度 AI 技術(shù)生態(tài)部總經(jīng)理喻友平對(duì)此進(jìn)行了詳細(xì)解讀。
從 PaddlePaddle 的歷史說(shuō)起,2012 年 1 月,百度開(kāi)始深度學(xué)習(xí)技術(shù)研發(fā),2013 年,百度開(kāi)始自研深度學(xué)習(xí)平臺(tái)服務(wù)百度多項(xiàng)核心業(yè)務(wù),2016 年 9 月,百度開(kāi)源自研深度學(xué)習(xí)框架 PaddlePaddle,2017 年 11 月,發(fā)布新一代深度學(xué)習(xí)框架 PaddlePaddle Fluid,到今天,宣布 PaddlePaddle 升級(jí)為 3.0 版本。
PaddlePaddle3.0 的核心框架包括 PaddlePaddle Fluid、PaddlePaddle Serving、PaddlePaddle Mobile,以及 AI Studio 在線實(shí)訓(xùn)平臺(tái)、AutoDL 網(wǎng)絡(luò)結(jié)構(gòu)自動(dòng)化設(shè)計(jì)平臺(tái)、EasyDL 快速應(yīng)用平臺(tái)。喻友平表示,目前百度已經(jīng)開(kāi)放部分訓(xùn)練好的常用模型,如 NLP(中文情感分析、中文詞法分析)、語(yǔ)音(DeepASR)、視覺(jué)(圖像分類(lèi)、目標(biāo)檢測(cè)、人臉檢測(cè)等)、強(qiáng)化學(xué)習(xí)(DQN)、AutoDL(模型設(shè)計(jì)、模型遷移、模型適配)等。
他也提到百度目前基于 PaddlePaddle 的多項(xiàng)比賽,今年下半年會(huì)有工信部首屆生物特征識(shí)別技術(shù)開(kāi)發(fā)者大賽、華大基因變異檢測(cè)賽事、KG 知識(shí)抽取、交通預(yù)測(cè)、車(chē)道線識(shí)別等多項(xiàng)競(jìng)賽,大家現(xiàn)在就可以關(guān)注。
而百度大數(shù)據(jù)(北京)實(shí)驗(yàn)室主任浣軍則詳細(xì)介紹了 PaddlePaddle3.0 中的 AutoDL。他表示,有了 AutoDL,開(kāi)發(fā)者無(wú)需特殊軟硬件設(shè)備和特殊訓(xùn)練,可以快速得到定制化高質(zhì)量的模型,能更高效自動(dòng)搜索神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。AutoDL 支持設(shè)計(jì)全新深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu),優(yōu)化現(xiàn)有深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù),同時(shí)能夠適配特定任務(wù)場(chǎng)景。
百度大數(shù)據(jù)部總監(jiān)郭謝也為在場(chǎng)觀眾正式介紹百度大數(shù)據(jù)眾智開(kāi)放平臺(tái)「點(diǎn)石」,其中包括三個(gè)開(kāi)發(fā)工具,Datalab、預(yù)置算法庫(kù)、預(yù)制模型庫(kù)。
可以看到,Datalab 是專(zhuān)為開(kāi)發(fā)者打造的交互式在線數(shù)據(jù)開(kāi)發(fā)工具,支持 Python 等多語(yǔ)言的交互式開(kāi)發(fā)環(huán)境,集成百度 PaddlePaddle 以及 TensorFlow 等優(yōu)秀開(kāi)源深度學(xué)習(xí)框架。目前 Datalab 已經(jīng)開(kāi)放限量邀測(cè)通道,7 月 8 日截止,各位小伙伴們可以抓緊時(shí)間。
相信不管你從事數(shù)據(jù)科學(xué)的哪項(xiàng)研究,都會(huì)在百度開(kāi)發(fā)者大會(huì)上找到自己感興趣的方向。而在第二天,精彩繼續(xù),雷鋒網(wǎng) AI 研習(xí)社也將為大家?guī)?lái)持續(xù)報(bào)導(dǎo)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。