0
本文作者: 恒亮 | 2017-03-12 10:20 |
各位周末好!對(duì) AI 開(kāi)發(fā)者來(lái)說(shuō),本周發(fā)生了不少大事值得關(guān)注,重點(diǎn)包括:Facebook 開(kāi)源全新算法庫(kù) FAISS 和新一代機(jī)器學(xué)習(xí) GPU 服務(wù)器 Big Basin;谷歌召開(kāi) Google Cloud Next 云技術(shù)大會(huì),宣布收購(gòu) Kaggle,并發(fā)布視頻搜索 API;英偉達(dá)針對(duì) AI 發(fā)布全新嵌入式開(kāi)發(fā)組件 Jetson TX2;以及百度發(fā)布 PaddlePaddle 全新 API 大幅減少代碼冗余等。下面我們將完整梳理本周內(nèi)與開(kāi)發(fā)者息息相關(guān)的 AI 大事件,并推薦幾個(gè) AI 研習(xí)社編譯整理的開(kāi)發(fā)者資源,祝大家周末愉快。
雷鋒網(wǎng)消息,F(xiàn)AIR(Facebook 人工智能實(shí)驗(yàn)室)上周發(fā)表了一篇論文,提出一項(xiàng)針對(duì)聚類(lèi)和相似性搜索的新算法設(shè)計(jì)。新架構(gòu)比此前最先進(jìn)的算法更快更高效,并使用 GPU 來(lái)獲得更高的內(nèi)存帶寬和計(jì)算吞吐量。
基于此項(xiàng)研究,F(xiàn)AIR 近日在 Github 開(kāi)源了一個(gè)名為 FAISS 的庫(kù),相關(guān)文檔已陸續(xù)完成上傳,并于昨日更新了安裝文件。能進(jìn)行聚類(lèi)和相似性搜索的算法已有不少,F(xiàn)AISS 對(duì)它們進(jìn)行了優(yōu)化,以便更高效地在 GPU 上運(yùn)行。FAISS 整合的部分算法有:
Fast K-Nearest Neighbour
QuickSelect
Warpselect
K-Means clustering
FAIR 表示,F(xiàn)AISS 有五大特性:
使用 C++ 編寫(xiě),有完整的 Python/numpy 封裝。
支持單個(gè)、多 GPU。
優(yōu)異的可擴(kuò)展性,通常情況下能支持最多 100 個(gè)維度。
基于 BLAS 和 CUDA。
比當(dāng)前最先進(jìn)的庫(kù)速度提高 8.5 倍。
詳情:http://m.ozgbdpf.cn/news/201703/lzEITGcs5Miuh8k5.html
GitHub:http://m.ozgbdpf.cn/news/201703/lzEITGcs5Miuh8k5.html
論文:https://arxiv.org/abs/1702.08734
在 Google Cloud Next 云技術(shù)大會(huì)之前,谷歌通過(guò)開(kāi)發(fā)者博客公布了一個(gè)可以媲美圖像識(shí)別領(lǐng)域 ImageNet 的大型音頻數(shù)據(jù)庫(kù) AudioSet。據(jù)稱(chēng),該數(shù)據(jù)庫(kù)包含了 632 個(gè)音頻類(lèi)別以及 2084320 條人工標(biāo)記的每段 10 秒長(zhǎng)度的聲音剪輯片段(來(lái)自 YouTube 視頻),覆蓋范圍包括人聲、動(dòng)物聲、各種樂(lè)器與音樂(lè)流派,以及日常生活環(huán)境的聲音等。總體量為:2100 萬(wàn)標(biāo)注視頻、5800 個(gè)小時(shí)的音頻,以及 527 種類(lèi)型的標(biāo)注聲音。
論文:https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/45857.pdf
詳情:https://research.google.com/audioset/
去年十月,微軟人工智能與研究部門(mén)的一個(gè)研究者和工程師團(tuán)隊(duì)報(bào)告他們的語(yǔ)音識(shí)別系統(tǒng)實(shí)現(xiàn)了和專(zhuān)業(yè)速錄員相當(dāng)甚至更低的詞錯(cuò)率(WER)——達(dá)到了 5.9%。本周 3 月 7 日,IBM 在官方博客發(fā)文稱(chēng)人類(lèi)的水平實(shí)際上應(yīng)該是 5.1%,同時(shí)表示 IBM Watson 的詞錯(cuò)率已經(jīng)超越了之前微軟報(bào)告的最佳水平,達(dá)到了 5.5%。
詳情:http://m.ozgbdpf.cn/news/201703/bJaCYcArDJIenrAC.html
3月7日,英偉達(dá)發(fā)布了全新的嵌入式開(kāi)發(fā)組件 Jetson TX2。據(jù)報(bào)道,這塊全新發(fā)布的開(kāi)發(fā)板只有一塊信用卡大小,但提供了超過(guò)前代產(chǎn)品近兩倍的運(yùn)算性能。按照公司高管的說(shuō)法,之所以提供如此強(qiáng)勁的運(yùn)算性能,就是為了助力開(kāi)發(fā)者在深度神經(jīng)網(wǎng)絡(luò)等 AI 智能領(lǐng)域的研究。
詳情:http://m.ozgbdpf.cn/news/201703/MJ1rgDpXMzUENYtF.html
Google Cloud Next 云技術(shù)大會(huì)于當(dāng)?shù)貢r(shí)間3月8日上午8:30在美國(guó)加州舊金山開(kāi)幕(北京時(shí)間約為9日凌晨1點(diǎn))。
大會(huì)上,谷歌宣布收購(gòu)大數(shù)據(jù)競(jìng)賽平臺(tái) Kaggle,但并未公布具體交易條款。報(bào)道稱(chēng),被收購(gòu)后 Kaggle 將會(huì)保留獨(dú)立團(tuán)隊(duì)和品牌,并接入谷歌云服務(wù),繼續(xù)舉辦大數(shù)據(jù)相關(guān)的競(jìng)賽。
此外,谷歌還推出了全新視頻搜索 API :Video Intelligence API 。報(bào)道稱(chēng),Video Intelligence API 的主要功能是標(biāo)注視頻中的物體和場(chǎng)景,即實(shí)現(xiàn)了自動(dòng)化的視頻標(biāo)記,從此開(kāi)發(fā)者可以像搜圖片一樣輕松地搜索視頻中的內(nèi)容。目前該 API 尚處 Private Beta 階段,并未完全公開(kāi)。
收購(gòu) Kaggle 詳情:http://m.ozgbdpf.cn/news/201703/ZjpnddCoUDr3Eh8c.html
視頻搜索 API 詳情:https://cloud.google.com/video-intelligence/
繼 2015 年發(fā)布開(kāi)源機(jī)器學(xué)習(xí) GPU 服務(wù)器 Big Sur 并將其成功應(yīng)用之后,今天(3 月 9 日) Facebook 通過(guò)官方博客宣布 Big Sur 的升級(jí)版 —— Big Basin 已經(jīng)研發(fā)成功,并在 Open Compute Project 開(kāi)源。據(jù)稱(chēng),通過(guò)將內(nèi)存從 12 GB 增加到 16 GB ,以及提高算數(shù)吞吐量(arithmetic throughput),Big Basin 可以處理的機(jī)器學(xué)習(xí)模型規(guī)模增加了 30%。
詳情:http://m.ozgbdpf.cn/news/201703/MJ1rgDpXMzUENYtF.html
3 月 9 日,百度宣布已完成 PaddlePaddle 新 API 的內(nèi)測(cè)版本。PaddlePaddle 是百度研發(fā)的深度學(xué)習(xí)開(kāi)源平臺(tái),于去年 9 月對(duì)公眾開(kāi)放,稱(chēng)得上是國(guó)內(nèi)機(jī)器學(xué)習(xí)開(kāi)源項(xiàng)目的領(lǐng)軍者。雷鋒網(wǎng)獲悉,該新 API 接口大幅精簡(jiǎn)了 PaddlePaddle 的代碼量。下面百度官方公布的對(duì)比圖,左為舊 API 上的 CNN 程序,右為新 API。
如圖所示,新 API 的代碼非常簡(jiǎn)潔。百度表示,這主要是由于三個(gè)方面的改進(jìn):
新的概念模型
提供“訓(xùn)練、“測(cè)試”、“推理”等新的高級(jí) API,并支持 Kubernetes 。
組合的 data bricks
此外,百度還開(kāi)放了《使用 PaddlePaddle 進(jìn)行深度學(xué)習(xí)》的使用手冊(cè),其中有示例教程。
手冊(cè)下載地址:http://book.paddlepaddle.org/index.en.html
詳情:http://research.baidu.com/paddlepaddles-new-api-simplifies-deep-learning-programs/
IBM InterConnect 2017 開(kāi)發(fā)者大會(huì)將于 3 月 19-23 日在拉斯維加斯舉行。日前為了吸引更多的開(kāi)發(fā)者參與,IBM 在官方博客中總結(jié)了此次會(huì)議對(duì) Java 開(kāi)發(fā)者而言的 6 大亮點(diǎn):
1. Code Rally 編程拉力賽
2. DevZone 開(kāi)發(fā)者社區(qū)
3. 微服務(wù)(Microservices)專(zhuān)題討論
4. Open Tech Summit 技術(shù)開(kāi)放峰會(huì)
5. 基于 IBM WebSphere Liberty 和 MicroProfile 的敏捷開(kāi)發(fā)
6. 基于 IBM WebSphere Liberty 和 Node.js 的本地云微服務(wù)
詳情:https://www.ibm.com/blogs/cloud-computing/2017/03/java-developer-interconnect-2017/
本文詳細(xì)介紹了《計(jì)算機(jī)科學(xué)的數(shù)學(xué)》這本書(shū)的來(lái)龍去脈,并推薦了其他一些相關(guān)資源,包括一個(gè)權(quán)威的機(jī)器學(xué)習(xí)入門(mén)書(shū)單和十大機(jī)器學(xué)習(xí)公開(kāi)課等。
地址:http://m.ozgbdpf.cn/news/201703/1ywNOxhiSuX3pNJZ.html
本文盤(pán)點(diǎn)了 24 個(gè)高品質(zhì)的在線(xiàn)數(shù)據(jù)科學(xué)入門(mén)教程,原作者是一位自學(xué)成才的數(shù)據(jù)科學(xué)大牛,文中匯總的課程不但參考了在線(xiàn)慕課社區(qū) Class Central 成千上萬(wàn)的課程評(píng)分和評(píng)論數(shù)據(jù),更是原作者的經(jīng)驗(yàn)之談,因此非常具有參考價(jià)值
地址:http://m.ozgbdpf.cn/news/201703/gCpBclh3rST2rHzc.html
原文來(lái)自滑鐵盧大學(xué)的博士研究生 Terry Taewoong Um,他搜集整理了 2012 年以來(lái)在深度學(xué)習(xí)領(lǐng)域被引用次數(shù)最多的一百多篇論文,值得深入研究。
地址:https://github.com/terryum/awesome-deep-learning-papers
雷鋒網(wǎng)相關(guān)閱讀:
百度發(fā)布 PaddlePaddle 新 API;微軟更新 Linux 平臺(tái)虛擬機(jī) DSVM 等 | AI 開(kāi)發(fā)者頭條
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。