丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能開發(fā)者 正文
發(fā)私信給汪思穎
發(fā)送

0

百度大腦論壇如期而至,語音、視覺、語言與知識技術(shù)成熱點

本文作者: 汪思穎 2019-07-04 22:29
導語:看看都有啥~

雷鋒網(wǎng) AI 科技評論消息,7 月 3 日,一年一度的百度 Create 2019 AI 開發(fā)者大會如期而至,在上午展示了百度音箱的系列更新、發(fā)布鴻鵠芯片、宣布自動駕駛方面的多項合作之后,下午的百度大腦論壇重磅開幕。

作為首位出場嘉賓,百度 CTO 王海峰博士表示,在上午,大家看到了百度 AI 技術(shù)在各行各業(yè)的應(yīng)用,如小度音響、自動駕駛,這些都承載在全新升級的百度大腦 5.0 上,上午只是管中窺豹,不足以看到所有技術(shù)進展。這場論壇將從算力到平臺再到生態(tài),為在場觀眾帶來百度大腦的更詳細解讀。

百度大腦論壇如期而至,語音、視覺、語言與知識技術(shù)成熱點

隨后,百度飛槳(PaddlePaddle)、百度 AutoDL、百度機器人技術(shù)、百度語音、百度地圖、百度智能視覺交互、百度大數(shù)據(jù)技術(shù)等諸多團隊負責人一一上場,為在場觀眾帶來了一場全面的技術(shù)盛宴。

百度飛槳最新進展及其應(yīng)用

作為百度極力推薦的深度學習平臺,飛槳自然是此次論壇的重點。百度深度學習技術(shù)平臺部總監(jiān)馬艷軍詳細介紹了飛槳在圖像搜索、目標檢測、工業(yè)質(zhì)檢方面的三大進展。隨后,他又一次談到飛槳的五大核心優(yōu)勢:全面支持動態(tài)圖&靜態(tài)圖兩種計算圖,官方支持模型目前已有超過 70 個,支持大規(guī)模分布式訓練,提供非常強的端到端部署能力,提供系統(tǒng)化深度學習技術(shù)服務(wù)。

百度大腦論壇如期而至,語音、視覺、語言與知識技術(shù)成熱點

馬艷軍博士表示,官方模型覆蓋三大主流任務(wù),PaddleNLP 目前已支持超過 20 種模型,PaddleCV 支持超過 50 種模型,Paddlehub 提供在線部署能力,支持 40+預訓練模型。

他隨后介紹,百度產(chǎn)品系統(tǒng)目前面臨了一系列挑戰(zhàn),諸如數(shù)據(jù)量在萬億級、訓練數(shù)據(jù)量在百億級等,在這些挑戰(zhàn)下,他們設(shè)置了大規(guī)模參數(shù)服務(wù)器解決方案。在最新發(fā)布的飛槳核心框架 Paddle Fluid v1.5 版本中,也更新了針對分布式訓練的 API。

而談到工具的發(fā)展,與開發(fā)者息息相關(guān)的必然是開發(fā)者培訓,飛槳目前有三大培養(yǎng)體系,黃埔學院、AI 快車道、PaddleCamp。在最后,他提到 2019 百度之星,這包括百度之星編程賽(基礎(chǔ)算法+AI 對抗賽)與百度之星開發(fā)賽(基于飛槳的目標檢測任務(wù)),這一賽事的報名會在本月截止,今年十月會進行全國總決賽。

百度發(fā)布行業(yè)知識圖譜平臺和智能創(chuàng)作平臺 2.0

百度 AI 技術(shù)平臺體系執(zhí)行總監(jiān)吳甜在會上帶來了百度語言與知識技術(shù)平臺的最新進展。她表示,自然語言處理、知識圖譜等技術(shù)都屬于認知層面的技術(shù),這些技術(shù)讓機器學會如何運用人類的語言和知識,進而能夠在此基礎(chǔ)上進行思維。隨后,她詳細介紹了百度最近開源的 ERNIE 模型,該模型不僅在學術(shù)界的一些任務(wù)上表現(xiàn)出眾,也有非常強大的應(yīng)用能力,在智能問答、CTR 預估、文本潤色、對話理解等百度產(chǎn)品中表現(xiàn)出色。

百度大腦論壇如期而至,語音、視覺、語言與知識技術(shù)成熱點

作為此次論壇的重點,吳甜正式發(fā)布行業(yè)知識圖譜和智能創(chuàng)作平臺 2.0。她表示,行業(yè)知識圖譜平臺是為了解決行業(yè)在智能化過程中關(guān)于知識構(gòu)建和知識應(yīng)用的需求。智能創(chuàng)作平臺在本質(zhì)上是對信息的重組織和再加工,通過自然語言處理、知識圖譜等基礎(chǔ)技術(shù),將大量的原始信息進行深度語義理解、邏輯分析,形成創(chuàng)作當中所需的知識圖譜和素材庫,可以在創(chuàng)作的成文階段為創(chuàng)作者提供組稿、順稿、潤色等能力。智能創(chuàng)作平臺 2.0 具備如下三個新特性:實時熱點關(guān)聯(lián)豐富素材、全面的創(chuàng)作輔助能力、領(lǐng)先的多模生成技術(shù)。

大熱的自動機器學習

隨著自動機器學習的火熱,百度恰逢其時地帶來了這一技術(shù)的最新分享。

百度大數(shù)據(jù)實驗室主任浣軍表示,自主人工智能有三項關(guān)鍵技術(shù):網(wǎng)絡(luò)結(jié)構(gòu)的自設(shè)計、學習自適應(yīng)、計算環(huán)境自我適配,AutoDL 1.0 展示了深度學習與人類專家相媲美,AutoDL 2.0 展示出深度學習已經(jīng)可以超過人類專家,AutoDL 3.0 則從設(shè)計、遷移、適配三個方面進行了全新升級。在 AutoDL 設(shè)計上,百度提出 styleNAS(具有照片真實感的風格遷移神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索),可以大大簡化計算量,圖像質(zhì)量也得到了進一步提升。

百度大腦論壇如期而至,語音、視覺、語言與知識技術(shù)成熱點

他隨后提到自動化建模的一些典型應(yīng)用場景,如語義分割、目標檢測、圖像分類等,具體應(yīng)用如城市垃圾檢測、把攝像機布置在水里檢測魚類從而進行生態(tài)保護。除了視覺上的一系列應(yīng)用,他也提到百度自動化建模在 NLP 中的應(yīng)用,在中文情感分類任務(wù)中,這一技術(shù)取得了與專家手工調(diào)優(yōu)將近同樣精度的效果,但大大節(jié)省了人工。

百度語音技術(shù)解讀

隨著此次開發(fā)者大會的召開,我們也看到百度在語音上取得的諸多突破。百度語音技術(shù)部高級總監(jiān)高亮介紹了百度在語音方面的三大技術(shù)突破,他先是展望了百度從 2012 年至今的語音識別技術(shù)進展,隨著模型的不斷改進,準確率越來越高。

他重點談到 SMLTA 流式多級截斷注意力模型,這是國際上首次實現(xiàn)局部注意力建模超越整句注意力模型,也是國際上首次在線語音大規(guī)模使用的注意力模型,不管是在輸入法還是在音箱上,有效產(chǎn)品相對準確率均能得到較大提升。

隨后,他強調(diào)了 MEITRON 風格遷移技術(shù),他們希望音箱在文字以外能傳達更多信息,但面臨三方面挑戰(zhàn):風格遷移、音色模擬、情感擬人,具體來說,諸如能進行音色的個性化設(shè)置,能表達除文字以外的意思,如高興、傷心等情緒。MEITRON 通過若干語句的空間建模,能輸出音色、韻律、情緒三個獨立的網(wǎng)絡(luò)。他表示,該網(wǎng)絡(luò)采用非監(jiān)督訓練,不需要海量數(shù)據(jù),能進行動態(tài)分類。

關(guān)于百度鴻鵠智能語音芯片的技術(shù)細節(jié),他也在這次論壇上進行了詳細說明。該芯片適合遠場語音交互場景,支持深度學習計算過程和深度模型加載的高度并行。

百度大腦論壇如期而至,語音、視覺、語言與知識技術(shù)成熱點

核心參數(shù)如下:

  • 指令集:HiFi4 自定義指令集,雙核 DSP

  • 儲存:超大內(nèi)存,包含 TCM,Cache 和 SRAM

  • 工藝:TSMC 40nm LP,功耗 100mW

  • 符合車規(guī)可靠性標準 

  • 具備遠場語音交互的邊緣計算能力,包括陣列信號處理、語音喚醒、離線語音識別。

視覺、機器人、智能地圖等更多技術(shù)

百度視覺技術(shù)部、增強現(xiàn)實技術(shù)部總監(jiān)吳中勤在論壇現(xiàn)場發(fā)布視覺語義化平臺 2.0,在 1.0 時代,我們的目標是從看清到看懂,在 2.0 時代,要形成智能交互、軟硬件結(jié)合。

他表示,智能交互包括一體化人機交互系統(tǒng)(人臉、手勢、肢體、環(huán)境等),可以應(yīng)用于 AR 特效相機和智能車機、智能音箱等設(shè)備。談到軟硬結(jié)合的視覺解決方案,他提到 PaddleSlim 模型壓縮平臺、FaceID 多模態(tài)人臉識別組件、軟硬件一體的 AI 相機解決方案,也詳細介紹了這些產(chǎn)品的諸多優(yōu)勢。

百度三維視覺首席科學家楊睿剛對百度機器人技術(shù)進行了分享。他表示,機器人就是一個智能體,目前,百度對智能體技術(shù)的研究主要集中在自動駕駛 Apollo、工程機械和服務(wù)機器人三大方面。他談到工程機械智能化需要賦予智能體從感知到?jīng)Q策再到動作的能力,隨后,他詳細帶來了這些能力所需要的技術(shù)細節(jié)。

百度大腦論壇如期而至,語音、視覺、語言與知識技術(shù)成熱點

他表示,上午主論壇中的「茶博士」,這是一種組合的 AI 能力,這里包括多引擎對話理解、多候選型應(yīng)答生成、位置敏感的指代消除、基于多輪對話的狀態(tài)更新與動作觸發(fā)?;诎俣?3D 視覺,機器人可以進行茶杯檢測和位置追蹤,基于機器人運動規(guī)劃和控制,機械臂可以對工作空間進行碰撞檢測,避開障礙物。在實時規(guī)劃運動后,機器人可以自動生成倒茶軌跡,隨后,機器人能感知水流變化,實時調(diào)整倒茶位置。他表示,在未來,AI 技術(shù)已經(jīng)不再是孤島,組合 AI 將推動工程機械和其它應(yīng)用飛躍發(fā)展。

百度地圖事業(yè)部總經(jīng)理李瑩帶來了基于飛槳的百度地圖通行時間智能預估,她表示,新一代人工智能地圖結(jié)合了語音、AR、高精度知識圖譜等各種技術(shù),

百度地圖 ETA(Estimated Time of Arrival)是地圖路線規(guī)劃的主要特征,也是用戶出行決策的重要參考因素,這一技術(shù)可以讓用戶在出行時避免擁堵時段、了解擁堵時長、躲避擁堵路線,但同時也面臨很多挑戰(zhàn)和難點,如變化大、因素多、時效性高、個性化強。基于此,他們提出基于飛槳的深度神經(jīng)網(wǎng)絡(luò)到達時間預估模型,可以實現(xiàn)實時 ETA 精準預估、擁堵路段時間預估,該模型融合了多層編碼、多層感知等。

最后,百度大數(shù)據(jù)部高級總監(jiān)郭謝帶來了百度點石大數(shù)據(jù)平臺的介紹,他也對該平臺的三大核心特性進行了解讀,包括安全的數(shù)據(jù)融合加工環(huán)境、多層次開放的可定制組件,以及功能一體化的大數(shù)據(jù)開發(fā)平臺。

關(guān)于百度大腦的更多細節(jié),大家可以點擊如下地址進一步了解。

https://ai.baidu.com/

在這次論壇上,除了看到百度強推的飛槳,以及在所有 AI 會議上避不開的計算機視覺、自然語言處理技術(shù),我們還看到了百度自動機器學習、語音、機器人技術(shù)等的最新進展。未來,百度大腦究竟會增加哪些功能,以及飛槳是否會向前跟進一步,成為國產(chǎn)深度學習平臺之光,拭目以待。

雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

百度大腦論壇如期而至,語音、視覺、語言與知識技術(shù)成熱點

分享:
相關(guān)文章

編輯

關(guān)注AI學術(shù),例如論文
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說