丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能開發(fā)者 正文
發(fā)私信給楊鯉萍
發(fā)送

0

圖像識別之美食挑戰(zhàn)賽 Ⅱ:由二分類到多分類,增加的不止是一點(diǎn)復(fù)雜度......

本文作者: 楊鯉萍 2020-02-13 21:35
導(dǎo)語:競賽技術(shù)難度再次升級

雷鋒網(wǎng) AI 開發(fā)者按:就在幾個月前,AI 研習(xí)社推出了第一場有關(guān)美食識別的挑戰(zhàn)賽(http://m.ozgbdpf.cn/news/201912/flrnkIxJGI4bw3TE.html)。該比賽要求參賽者能夠從給出待識別圖片中正確區(qū)分豆腐與土豆,這一任務(wù)也讓眾多圖片識別愛好者得到了初級練手。

相較第一場美食識別挑戰(zhàn)賽,這次推出的比賽 2.0 難度略有增加。除了食材種類的成倍增加之外,四種食材的圖片辨識度也有所降低。這對于專注于圖像識別的開發(fā)者而言,相信是非常值得嘗試的一次挑戰(zhàn)!

圖像識別之美食挑戰(zhàn)賽 Ⅱ:由二分類到多分類,增加的不止是一點(diǎn)復(fù)雜度......

二分類 ---> 多分類

如果你單純以為這次挑戰(zhàn)賽只是將種類增加了 2 類,那可就誤會大了。從學(xué)術(shù)的角度來看,這次的問題實(shí)際上是由之前的二分類問題擴(kuò)展到了多分類問題。

通常在處理二分類問題時,我們只需將所涉及類別分為兩類,例如:真(1),假(0),然后再進(jìn)行兩兩配對即可。之后根據(jù)測試結(jié)果與實(shí)際情況的對比,我們還會得到一個混淆矩陣,其中包括四類數(shù)據(jù):

  • 預(yù)測為真且實(shí)際為真的 True Positives(TP)

  • 預(yù)測為假且實(shí)際為真的 False Negatives(FN)

  • 預(yù)測為真且實(shí)際為假的 False Positives(FP)

  • 預(yù)測為假且實(shí)際為假 True Negatives(TN)

圖像識別之美食挑戰(zhàn)賽 Ⅱ:由二分類到多分類,增加的不止是一點(diǎn)復(fù)雜度......

二分類問題

除此之外,也涉及到由此衍生的多個衡量模型質(zhì)量的相關(guān)指標(biāo)。例如:精確率 (Precision)——模型判斷正確的數(shù)據(jù) (TP+TN) 占總數(shù)據(jù)的比例;召回率 (Recall)——模型正確判斷出的正例 (TP) 占數(shù)據(jù)集中所有正例的比例;準(zhǔn)確率 (Accuracy)——針對模型判斷出的所有正例 (TP+FP) 而言, 其中真正例 (TP) 占的比例。

而如果是多分類問題,例如本次挑戰(zhàn)賽所涉及的 4 類,不僅分類將對應(yīng)增加為茄子(0)、山藥(1)、苦瓜(2)、西蘭花(3),而且相應(yīng)的混淆矩陣也將由之前的 2*2 變?yōu)?4*4。如果多分類問題擴(kuò)展到 10 類,那混淆矩陣將會變成 10*10 的矩陣。

圖像識別之美食挑戰(zhàn)賽 Ⅱ:由二分類到多分類,增加的不止是一點(diǎn)復(fù)雜度......

多類細(xì)胞分類問題示例

類似于線性回歸分類,多元線性回歸較單元線性回歸問題,增加變量個數(shù)即單變量推廣到多元;運(yùn)用梯度下降法時,方法同單變量線性回歸,代價函數(shù)也將有很大的變化。

具體而言,多變量的時候,變量的取值范圍將有差異。如果差異過大,產(chǎn)生的代價函數(shù)極不規(guī)整,像特別狹長的橢圓,這時候進(jìn)行梯度下降時,路徑會十分曲折。

圖像識別之美食挑戰(zhàn)賽 Ⅱ:由二分類到多分類,增加的不止是一點(diǎn)復(fù)雜度......

圖片來源:https://blog.csdn.net/qq_36187544/article/details/87879423

如此一來,多分類問題不僅有多個參數(shù)增加的代價問題;同時,考慮到模型質(zhì)量問題,也需要有更為復(fù)雜的衡量指標(biāo)來對模型進(jìn)行判斷與優(yōu)化。因此,多分類問題每多一個類別,識別問題的復(fù)雜維度將大大增加。

多分類問題解決思路

當(dāng)問題從二分類變?yōu)槎喾诸悤r,通常開發(fā)者們采用的是拆解法,即:將多分類問題拆分成多個二分類問題,為每一個二分類問題訓(xùn)練一個分類器,再綜合多個分類標(biāo)準(zhǔn)下的預(yù)測結(jié)果進(jìn)行集成,得到最終分類。這種將問題轉(zhuǎn)換的拆分策略主要為三種:

  • 二元關(guān)聯(lián) 將每個標(biāo)簽當(dāng)做單獨(dú)的一個類分類問題。給定數(shù)據(jù)集 D 這里有 N 個類別,這種情況下就是將這些類別兩兩配對,從而產(chǎn)生 N(N-1)/2 個二分類任務(wù),在測試的時候把樣本傳給這些分類器,然后進(jìn)行決策。

  • 分類器鏈 將每一次的一個類作為正例,其余作為反例,總共訓(xùn)練 N 個分類器。測試的時候若僅有一個分類器預(yù)測為正的類別則對應(yīng)的類別標(biāo)記作為最終分類結(jié)果,若有多個分類器預(yù)測為正類,則選擇置信度最大的類別作為最終分類結(jié)果。

  • 多分類策略 基于一種糾錯輸出碼的分類方法,分為編碼與解碼兩個步驟。編碼負(fù)責(zé)對 N 個類別做 M 次劃分,解碼則負(fù)責(zé)用 M 個分類器分別對測試樣本進(jìn)行預(yù)測,得到最終預(yù)測結(jié)果。

圖像識別之美食挑戰(zhàn)賽 Ⅱ:由二分類到多分類,增加的不止是一點(diǎn)復(fù)雜度......

ECOC 編碼示意圖

但不管是哪種策略,對于每個分類器的訓(xùn)練集,開發(fā)者都可以先將原始訓(xùn)練集的標(biāo)簽重新定義分成兩類,轉(zhuǎn)化為二分類問題,然后對每個分類器作相應(yīng)的心理,從而對測試集進(jìn)行分類判斷得到每一個分類器標(biāo)簽,最后在通過對各個分類器的標(biāo)簽得到最后的識別結(jié)果。

除此之外,選擇合適的評價指標(biāo)有助于選出更適合于當(dāng)前任務(wù)的算法,開發(fā)者還可以為這一識別模型設(shè)計合適的評價指標(biāo)。對于分類任務(wù)而言,評價指標(biāo)主要關(guān)注點(diǎn)在于系統(tǒng)分類正確的能力;因此,所涉及到的評價指標(biāo)可參考二分類的精確率、召回率、準(zhǔn)確率等。

圖像識別之美食挑戰(zhàn)賽 Ⅱ:由二分類到多分類,增加的不止是一點(diǎn)復(fù)雜度......

對于多類別分類,圖示為兩特征分 3 類

美食識別挑戰(zhàn)(Ⅱ):茄子、山藥、苦瓜 or 西蘭花?

本次 AI 研習(xí)社發(fā)起的美食識別挑戰(zhàn)賽任務(wù)即:正確判斷美食圖片中出現(xiàn)的食材。其中,食材共 4 種分類,包含了:茄子、山藥、苦瓜、西蘭花。

這相對于第一場美食識別系列挑戰(zhàn)賽「土豆 or 豆腐」而言,難度有所上升。但和之前比賽相同的是,每張圖片只包含了其中一種食材。

圖像識別之美食挑戰(zhàn)賽 Ⅱ:由二分類到多分類,增加的不止是一點(diǎn)復(fù)雜度......

來源:AI 研習(xí)社

大賽主頁提供了「肺炎 X 光片」相關(guān)的數(shù)據(jù)集,包括了訓(xùn)練集 6140 張,測試集 856 張。參賽者需要根據(jù)美食圖片中食材進(jìn)行分類,其中:茄子=0、山藥=1、苦瓜=2、西蘭花=3。

開始時間:2020-02-13 18:00:00

結(jié)束時間:2020-03-14 23:59:59

本次大賽基礎(chǔ)獎金池為 3000 元,比賽一共設(shè)置了三種獎項,包括了:參與獎(30%)、突破獎(20%)、排名獎(50%);AI 研習(xí)社春節(jié)紅包活動仍在繼續(xù),邀請好友參賽得獎金,獎金直接劃入個人賬戶,視同比賽獎金。以上四種獎項均互不沖突哦!

圖像識別之美食挑戰(zhàn)賽 Ⅱ:由二分類到多分類,增加的不止是一點(diǎn)復(fù)雜度......

數(shù)據(jù)集部分圖片示例

數(shù)據(jù)集下載鏈接:

https://static.leiphone.com/food_challenge2.zip 

春節(jié)紅包活動:

https://god.yanxishe.com/competition/activity/jumpPullNewer   

評審標(biāo)準(zhǔn)

最終提交結(jié)果文件如下所示,其中,第一個字段位:測試集圖片 ID(注意 ID 即文件名是從 0 開始的);第二個字段:食材 ID(茄子=0、山藥=1、苦瓜=2、西蘭花=3)

Ps:建議使用 UTF-8 編碼,共計 856 個結(jié)果,因?yàn)閿?shù)量不足可能導(dǎo)致無法評分哈~

圖像識別之美食挑戰(zhàn)賽 Ⅱ:由二分類到多分類,增加的不止是一點(diǎn)復(fù)雜度......

整個比賽的評審?fù)耆该骰?,我們將會對比選手提交的 csv 文件,確認(rèn)正確分辨圖片數(shù)據(jù),并按照如下公式計算得分,其中:

  • True:模型分類正確數(shù)量

  • Total :測試集樣本總數(shù)量

圖像識別之美食挑戰(zhàn)賽 Ⅱ:由二分類到多分類,增加的不止是一點(diǎn)復(fù)雜度......

每日 24:00,我們也會將最新結(jié)果更新在官網(wǎng)排行榜上,你可以隨時隨地查看自己的排名情況。

更多信息,可進(jìn)入?yún)①愔黜摬榭矗?a target="_blank" rel=nofollow>https://god.yanxishe.com/26 

雷鋒網(wǎng) AI 開發(fā)者  雷鋒網(wǎng) 

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

圖像識別之美食挑戰(zhàn)賽 Ⅱ:由二分類到多分類,增加的不止是一點(diǎn)復(fù)雜度......

分享:
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說