0
本文作者: sunshine_lady | 2016-12-05 10:16 |
在過去的十年中,計(jì)算機(jī)科學(xué)家設(shè)法利用大量的互聯(lián)網(wǎng)用戶來解決那些通常一臺計(jì)算機(jī)無法破解的難題。比如檢測一副圖片中是否有樹出現(xiàn)、對網(wǎng)站評級、檢查電話號碼等。
機(jī)器學(xué)習(xí)社區(qū)很早便開始致力于“眾包”( crowdsourcing )這樣快速而廉價(jià)的途徑,從而獲取大量的帶標(biāo)簽數(shù)據(jù)。在有監(jiān)督學(xué)習(xí)中,含類別標(biāo)簽的數(shù)據(jù)可以稱得上是機(jī)器學(xué)習(xí)的老師,它可以用于訓(xùn)練機(jī)器學(xué)習(xí)系統(tǒng),實(shí)現(xiàn)諸如識別語音及圖片分類等功能。比如將帶有貓的圖片與“貓咪”這個(gè)詞語捆綁起來。
通常,傳遞這種帶標(biāo)簽數(shù)據(jù)是通過眾包雇員添加的。是否存在一種使眾包發(fā)揮更大作用的方式呢?
在今年12月5日,微軟公司將在巴塞羅那舉辦的 NIPS(Conference on Neural Information Processing Systems,神經(jīng)計(jì)算領(lǐng)域頂會)上通過一個(gè)演示報(bào)告,來闡述一種新型的超越數(shù)據(jù)收集的眾包方法。這一演示將解釋微軟苦心鉆研的關(guān)于“什么才是眾包”、“如何指派眾包成員”等問題,并展示微軟公司使用眾包的豐富經(jīng)驗(yàn)。
三大眾包創(chuàng)新,使工作內(nèi)容超越了單純的收集數(shù)據(jù):
管理眾包雇員的機(jī)制中可增強(qiáng)機(jī)器學(xué)習(xí)模型。比如,通過提供對象相似度信息為眾包產(chǎn)生核心。或在計(jì)算機(jī)視覺、語音識別領(lǐng)域中,增強(qiáng)更大更復(fù)雜的機(jī)器學(xué)習(xí)模型。
應(yīng)用混合智能系統(tǒng)。這些“人工介入”的 AI 系統(tǒng),使人類和機(jī)器相互彌補(bǔ),實(shí)現(xiàn)了 1+1>2 的效果。盡管關(guān)于混合智能系統(tǒng)的研究是很新穎的,但是已經(jīng)有很多引人注目的實(shí)例暗示著眾包的應(yīng)用潛力。比如實(shí)時(shí)請求式的關(guān)閉日常對話的字幕,或者人力寫作和編輯。
更廣泛的在線研究人類行為。眾包受到了社會科學(xué)家的熱烈追捧。尤其是那些習(xí)慣使用亞馬遜土耳其機(jī)器人平臺的科學(xué)家。眾包將幫助他們更快速的、更便捷的為“行為實(shí)驗(yàn)”雇傭大量的實(shí)驗(yàn)對象。這樣的實(shí)驗(yàn)同樣對計(jì)算機(jī)科學(xué)家有利。在社會計(jì)算興起的時(shí)代,計(jì)算機(jī)科學(xué)家將不能再忽略人類行為的影響,例如計(jì)算機(jī)科學(xué)家研究電腦系統(tǒng)的性能時(shí),需要設(shè)計(jì)良性算法和系統(tǒng),從而更確切地模擬人類行為。
最新關(guān)于質(zhì)量和數(shù)量的研究,已經(jīng)打開了眾包的黑盒子,研究表明眾包人群并不僅僅是孤立的承包商,而是擁有著豐富社交結(jié)構(gòu)的網(wǎng)絡(luò)。同時(shí),實(shí)驗(yàn)還發(fā)現(xiàn)使用良性的財(cái)政獎勵(比如根據(jù)績效進(jìn)行支付)和內(nèi)在激勵(激起好奇心)都會提高眾包人群的工作質(zhì)量。
這項(xiàng)研究教會我們?nèi)绾胃佑行У暮腿巳捍蚪坏溃合嗷プ鹬兀星蟊貞?yīng),邏輯清晰。
眾包對機(jī)器學(xué)習(xí)和人工智能系統(tǒng)有著潛在的深遠(yuǎn)影響。但是為了激發(fā)其潛能,我們需要更多有創(chuàng)造的思想者來探索全新的使用方法。
微軟研發(fā)部主管:Jennifer Wortman Vaughan 攝影: John Brecher
采訪專欄
Jenn,您是理論家嗎?您的理論是未公開的嗎?
Jennifer Wortman Vaughan:可能因?yàn)槲业膶W(xué)習(xí)理論和算法經(jīng)濟(jì)學(xué)相對還是比較有意義,所以我在 NIPS 社區(qū)中比較有知名度。但是這不能說是個(gè)理論指導(dǎo)。事實(shí)上,這種理論幾乎沒有涉及數(shù)學(xué)推導(dǎo)。但是如果你對我的理論很感興趣,比如理論中人腦計(jì)算的數(shù)學(xué)基礎(chǔ),這些理論都可以為實(shí)驗(yàn)性和經(jīng)驗(yàn)性研究提供幫助??梢匀タ纯次易罱膱?bào)告。(傳送門在此:http://www.jennwv.com/papers/mfsc_ccc.pdf)
您的理論主要是針對什么人群?
Jennifer Wortman Vaughan:這種理論是開放的,任何人想要學(xué)習(xí)眾包的尖端研究都可以來下載相關(guān)論文和報(bào)告。只要你想掌握眾包或者特殊機(jī)器學(xué)習(xí)技巧,你就可以精通這些。任何有好奇心的人,我都非常歡迎來學(xué)習(xí)這些知識。
可以在線聽您的報(bào)告嗎?
Jennifer Wortman Vaughan:當(dāng)然!如果我在報(bào)告廳,我會把更多細(xì)節(jié)報(bào)告展示出來,比如會議安排和更多資源。我相信我的理論同時(shí)也會被報(bào)道,如果我有更新發(fā)現(xiàn),我將會第一時(shí)間展示出來。
via microsoft
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。