丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給AI研習(xí)社-譯站
發(fā)送

0

第二彈!CS231n 2017中文字幕視頻:如何訓(xùn)練機(jī)器進(jìn)行視覺識(shí)別?

本文作者: AI研習(xí)社-譯站 2017-11-17 11:35
導(dǎo)語:11月10日正式開課,每周五更新,預(yù)計(jì)持續(xù)12周!

雷鋒網(wǎng):CS231n 2017雙語字幕版獨(dú)家上線!Lecture 2 | Image Classification 更新了!

2017春季CS231n中文版終于上線,課程中文版已經(jīng)在AI慕課學(xué)院(mooc.ai )發(fā)布( free free free ),11月10日正式開課,每周五更新,預(yù)計(jì)持續(xù)12周!

雷鋒網(wǎng)中文版課程鏈接:http://www.mooc.ai/course/26

什么是CS231n 2017?

CS231n 的全稱是 CS231n: Convolutional Neural Networks for Visual Recognition,即面向視覺識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)。

該課程是斯坦福大學(xué)計(jì)算機(jī)視覺實(shí)驗(yàn)室推出的課程。需要注意的是,我們這次翻譯的是 2017 春季(4 月至 6 月)的最新版本。

雷鋒網(wǎng)引用課程主頁上的官方課程描述如下:

計(jì)算機(jī)視覺已經(jīng)在我們的社會(huì)中無處不在,并廣泛運(yùn)用在搜索、圖像理解、應(yīng)用程序、測繪、醫(yī)藥、無人機(jī)和自動(dòng)駕駛汽車等領(lǐng)域。這些應(yīng)用程序的核心技術(shù)是視覺識(shí)別任務(wù),如圖像分類、圖像定位和圖像檢測。近期,神經(jīng)網(wǎng)絡(luò)(又名 “深度學(xué)習(xí)”)方法上的進(jìn)展極大地提高了這些代表最先進(jìn)水平的視覺識(shí)別系統(tǒng)性能。

本課程深入探討深度學(xué)習(xí)架構(gòu)的細(xì)節(jié)問題,重點(diǎn)學(xué)習(xí)視覺識(shí)別任務(wù)(尤其是圖像分類任務(wù))的端到端學(xué)習(xí)模型。在為期 10 周的課程中,學(xué)生將學(xué)習(xí)如何實(shí)現(xiàn)、訓(xùn)練和調(diào)試自己的神經(jīng)網(wǎng)絡(luò),并建立起對計(jì)算機(jī)視覺領(lǐng)域前沿研究方向的詳細(xì)理解。最后的任務(wù)將涉及訓(xùn)練一個(gè)有數(shù)百萬參數(shù)卷積神經(jīng)網(wǎng)絡(luò),并將其應(yīng)用于最大的圖像分類數(shù)據(jù)庫(ImageNet)上。

我們將著重教授如何設(shè)置圖像識(shí)別問題,學(xué)習(xí)算法(例如反向傳播),用于訓(xùn)練和微調(diào)(fine-tuning)網(wǎng)絡(luò)的工程實(shí)踐技巧,引導(dǎo)學(xué)生完成實(shí)踐作業(yè)和最終課程項(xiàng)目。本課程的大部分背景知識(shí)和素材都來源于 ImageNet Challenge 競賽。

Lecture 2 | Image Classification 圖像分類內(nèi)容提要

Lecture 2 | Image Classification 由 Justin Johnson授課 ,帶著同學(xué)們一起討論了數(shù)據(jù)驅(qū)動(dòng)方法、K-最近鄰算法、線性分類,深層次地了解算法是如何運(yùn)行的,關(guān)注各類算法的技術(shù)細(xì)節(jié)。導(dǎo)師還布置了第一次課程作業(yè),需要同學(xué)們在看完本期視頻后,學(xué)著完成 K-最近鄰分類器、線性分類器(SVM,Softmax)、兩層神經(jīng)網(wǎng)絡(luò)、提取圖像特征集,作業(yè)通過Python+Numpy完成。不會(huì)Python和Numpy的新手們,要盡快開始學(xué)習(xí),他們特地寫了個(gè)教程教你入門上手。

聊完作業(yè)和工具,開始進(jìn)入正題, Justin重點(diǎn)講了以下幾個(gè)問題:

Q1:我們怎么研究圖像處理的任務(wù)?(計(jì)算機(jī)視覺中真正核心的任務(wù))

Justin:簡而言之,就是通過數(shù)據(jù)。當(dāng)你做圖像分類時(shí),分類系統(tǒng)接收一些輸入圖像(比如阿貓阿狗),并且系統(tǒng)已經(jīng)清楚了一些已經(jīng)確定了的分類或者標(biāo)簽,這里有一些設(shè)定了好了的分類標(biāo)簽數(shù)據(jù)集,那計(jì)算機(jī)的工作就是看圖片,并且給它分配其中一些固定的分類標(biāo)簽。這對于人類來說,太簡單不過了,但是對于機(jī)器而言,真的是一個(gè)非常非常困難的問題。計(jì)算機(jī)呈現(xiàn)圖片的方式其實(shí)就是一大堆數(shù)字,所以圖像可能就是800*600的像素,像素會(huì)給出紅、綠、藍(lán)三個(gè)值。所以這是一個(gè)巨大的數(shù)字陣列。

Q2:哪些發(fā)展推動(dòng)了圖像識(shí)別問題的實(shí)現(xiàn)?

Justin:數(shù)據(jù)驅(qū)動(dòng)的方法。抓取大量圖片數(shù)據(jù)集,機(jī)器會(huì)搜集所有數(shù)據(jù)用某種方式總結(jié)然后生成一個(gè)模型,識(shí)別不同類的對象的核心要素,然后用模型來識(shí)別新的圖片。我們的接口需要寫兩個(gè)函數(shù),一個(gè)是訓(xùn)練函數(shù)(接收圖片和標(biāo)簽,輸出模型),一個(gè)是預(yù)測函數(shù)(接收模型,對圖片種類預(yù)測),正是運(yùn)用了這種方法,過去十幾二十年里,圖像識(shí)別領(lǐng)域的進(jìn)步非常之大。這種數(shù)據(jù)驅(qū)動(dòng)類的算法比深度學(xué)習(xí)更廣義的一種理念。

Q3:訓(xùn)練機(jī)器進(jìn)行視覺識(shí)別的過程是什么?

Justin:單純記錄所有的訓(xùn)練數(shù)據(jù),數(shù)據(jù)集會(huì)不斷尋找新的圖片,給出新的標(biāo)簽。比如,CIFAR -10訓(xùn)練數(shù)據(jù)集,其中就有5W訓(xùn)練圖,1W測試圖。右欄Test images and nearest neighbors圖中,左側(cè)是測試圖,右側(cè)是訓(xùn)練圖,訓(xùn)練圖中會(huì)顯示與測試圖最接近的圖片。特殊情況下,我們?nèi)绾蝸韺Ρ葍煞鶊D片呢?這就要選擇比較函數(shù)了。我們用了L1距離(又稱為“曼哈頓距離”),對單個(gè)像素進(jìn)行比較,只取測試圖(左上角的像素)- 訓(xùn)練圖(相應(yīng)的左上角像素)的絕對值,就是兩幅圖的像素差別??梢园l(fā)現(xiàn)兩幅圖中有456處不同。(這里使用的是Numpy提供的向量運(yùn)算,只需要一兩行Python代碼,用于最近鄰算法,就能實(shí)現(xiàn))

Q4:在訓(xùn)練集中,訓(xùn)練和測試的過程可以多快呢?

Justin:所需的時(shí)間是,存儲(chǔ)數(shù)據(jù)的時(shí)間(恒定)+比較訓(xùn)練圖和測試圖時(shí)間(慢)。一般來說,訓(xùn)練過程在數(shù)據(jù)中心完成的(快),測試過程是在手機(jī)、瀏覽器其它低能耗的設(shè)備上完成的(慢),這種方式相當(dāng)落后。為了讓速度加快,我們選擇卷積神經(jīng)網(wǎng)絡(luò)和其他參數(shù)模型,讓測試過程加快。使用了最近鄰算法。

Q5: 我們想訓(xùn)練圖像分類算法,具體怎么操作?

Justin:我們常見的做法,是把數(shù)據(jù)分為三組,大部分?jǐn)?shù)據(jù)作為訓(xùn)練集,然后再建立一個(gè)驗(yàn)證集和測試集,在訓(xùn)練集上用不同的超參來訓(xùn)練算法,在驗(yàn)證集上進(jìn)行評估,然以后再用超參,來選擇在驗(yàn)證集上表現(xiàn)最好的,再把這組驗(yàn)證集上表現(xiàn)最佳的分類器拿出來在測試集上跑一跑,這才是你要寫到論文中的數(shù)據(jù)。這個(gè)數(shù)據(jù)告訴你,你的算法在未見的新數(shù)據(jù)上表現(xiàn)如何。記得,要分隔驗(yàn)證集和測試集,通常到最后一刻我們才會(huì)接觸到測試集。

Q6:線性分類是什么?

Justin:線性分類是一種非常簡單的學(xué)習(xí)算法,可以幫助我們建立起整個(gè)神經(jīng)網(wǎng)絡(luò)和卷積網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)就像玩樂高,你可以擁有不同種類的神經(jīng)網(wǎng)絡(luò)組件,并且可以將這些組件組合,來構(gòu)建不同的大型卷積網(wǎng)絡(luò),它是我們在不同類型的深度學(xué)習(xí)應(yīng)用程序中,看到的最基本的構(gòu)建塊之一。卷積神經(jīng)關(guān)注圖像,而循環(huán)神經(jīng)關(guān)注語言,我們可以把這兩個(gè)網(wǎng)絡(luò)放在一起,再一起訓(xùn)練,最終得到一個(gè)超級厲害的系統(tǒng)。深層神經(jīng)網(wǎng)絡(luò)像樂高玩具,而線性分類器就像這個(gè)巨大網(wǎng)絡(luò)中的基礎(chǔ)模塊。這是線性分類器的基本工作原理。

以上是Lecture 2 | Image Classification的重點(diǎn)內(nèi)容,當(dāng)然導(dǎo)師還具體回答了同學(xué)們的提問,詳細(xì)解答了K-最近鄰算法、線性分類器的相關(guān)技術(shù)細(xì)節(jié)。

為了方便大家交流,AI研習(xí)社專門開辟了社區(qū)供大家交流。在社區(qū)中,目前支持大家提問/回答,以及發(fā)布文章,可以插入圖片、視頻、超鏈接、代碼塊、公式編輯器,歡迎大家在社區(qū)中進(jìn)行更多形式的交流~社區(qū)地址:www.mooc.ai/bbs 

現(xiàn)在我們誠摯邀請正在學(xué)習(xí)CS231n課程的小伙伴來講解這門課的課后作業(yè),這門課共有3個(gè) Assignments 以及1個(gè) Final Project ,你可以選擇其中一個(gè)或幾個(gè)來進(jìn)行分享講解~詳情鏈接:http://cs231n.github.io/

目前雷鋒字幕組還有許多優(yōu)秀AI課程仍在翻譯中,希望和我們一起翻譯學(xué)習(xí)進(jìn)步,歡迎微信聯(lián)系 julylihuaijiang,加入我們。

第二彈!CS231n 2017中文字幕視頻:如何訓(xùn)練機(jī)器進(jìn)行視覺識(shí)別?

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

第二彈!CS231n 2017中文字幕視頻:如何訓(xùn)練機(jī)器進(jìn)行視覺識(shí)別?

分享:
相關(guān)文章

知情人士

AI研習(xí)社(yanxishe.com)譯站頻道,傳播前沿人工智能知識(shí),讓語言不再成為學(xué)習(xí)知識(shí)的門檻。(原雷鋒字幕組)
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說