0
本文作者: 隔壁王大喵 | 2017-03-31 10:00 |
雷鋒網(wǎng)AI科技評(píng)論按:Geoffrey Hinton 于 2013 年加入谷歌,目前在谷歌大腦團(tuán)隊(duì)致力將深度學(xué)習(xí)應(yīng)用于實(shí)踐領(lǐng)域。近日,谷歌大腦團(tuán)隊(duì)推出了新作,一作 Melody Y. Guan 及 Varun Gulshan、Andrew M. Dai 及 Hinton 提出了一種創(chuàng)新的方法,通過給個(gè)體標(biāo)簽建模來提高分類能力。
論文鏈接:https://arxiv.org/pdf/1703.08774.pdf
給數(shù)據(jù)集進(jìn)行標(biāo)記的任務(wù)通常是由許多不同的專家分工完成的,每位專家只標(biāo)記其中一小部分?jǐn)?shù)據(jù)而同一個(gè)數(shù)據(jù)點(diǎn)又包含有多位專家所標(biāo)記的標(biāo)簽。這樣的做法不僅減輕了每位專家的個(gè)人工作量并且還有助于揭開數(shù)據(jù)中難以發(fā)現(xiàn)的真相。當(dāng)專家們對(duì)同一個(gè)數(shù)據(jù)點(diǎn)的標(biāo)簽存在不同意見時(shí),標(biāo)準(zhǔn)的做法是將獲得更多專家支持的標(biāo)簽作為正確的標(biāo)簽,或者將正確的標(biāo)簽進(jìn)行建模以獲得分布狀態(tài)。
但是,這樣的做法忽視了有關(guān)于哪些專家標(biāo)記了哪些標(biāo)簽這一潛在的有效信息。因此為了獲得這些額外的信息,谷歌大腦團(tuán)隊(duì)提出要單獨(dú)對(duì)專家進(jìn)行建模,然后學(xué)習(xí)平均權(quán)重以組合這些信息,比如說可能是以樣本特定(sample-specific)的方式進(jìn)行組合。通過這種方法,就能給更可靠的專家分配更多的權(quán)重,并利用個(gè)別專家的獨(dú)特優(yōu)勢(shì)來對(duì)某些特定類型的數(shù)據(jù)進(jìn)行分類。
在這篇論文中,雷鋒網(wǎng)了解到,作者展示了通過采用這種標(biāo)記方法我們提升了計(jì)算機(jī)輔助診斷糖尿病導(dǎo)致視網(wǎng)膜病變的準(zhǔn)確度,并且此方法的表現(xiàn)也優(yōu)于Welinder和Perona以及Mnih和Hinton所提出的方法。谷歌大腦團(tuán)隊(duì)的工作提供了一種創(chuàng)新的方法,以處理那些數(shù)量巨大的、需要借助專家來標(biāo)記標(biāo)簽的現(xiàn)實(shí)數(shù)據(jù)。
Via Who Said What: Modeling Individual Labelers Improves Classification,雷鋒網(wǎng)編譯
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。