丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能開發(fā)者 正文
發(fā)私信給汪思穎
發(fā)送

2

干貨滿滿,阿里天池CIKM2017 Rank4比賽經(jīng)驗(yàn)分享

本文作者: 汪思穎 編輯:楊曉凡 2017-08-23 14:49
導(dǎo)語(yǔ):如何利用雷達(dá)模數(shù)據(jù)建立準(zhǔn)確的降水預(yù)報(bào)模型?

雷鋒網(wǎng) AI 科技評(píng)論按:由深圳氣象局與阿里巴巴聯(lián)合承辦的CIKM AnalytiCup 2017第一賽季已經(jīng)宣告結(jié)束。本次比賽的目標(biāo)是利用雷達(dá)數(shù)據(jù)(多普勒雷達(dá)回波外推數(shù)據(jù)),來(lái)建立一個(gè)準(zhǔn)確的降水預(yù)報(bào)模型。

這次比賽吸引了1395支隊(duì)伍參賽,排行榜也已在阿里天池平臺(tái)進(jìn)行公示。

在這次比賽中,來(lái)自中國(guó)科學(xué)院的懷北村明遠(yuǎn)湖隊(duì)(隊(duì)員Zhang Rui, Qiao Fengchun, Guo Ran)在GitHub上分享了自己的代碼和方法,他們?cè)诘谝浑A段獲得第三名,第二階段獲得第四名。雷鋒網(wǎng) AI科技評(píng)論將他們發(fā)布的內(nèi)容進(jìn)行了整理,如下:

背景介紹

在這次比賽中,主辦方提供了一組不同時(shí)間跨度(間隔為6分鐘,共15個(gè)時(shí)間跨度)和不同高度下(0.5km、1.5km、2.5km、3.5km)測(cè)量的雷達(dá)圖,每個(gè)雷達(dá)圖都包含目標(biāo)站點(diǎn)和目標(biāo)站點(diǎn)周圍區(qū)域的雷達(dá)反射率值。每個(gè)雷達(dá)圖覆蓋以目標(biāo)站點(diǎn)為中心,面積為101 * 101平方公里的區(qū)域。該區(qū)域被標(biāo)記為101×101格,目標(biāo)站點(diǎn)位于中心,即(50,50)。

數(shù)據(jù)集中包含真實(shí)的雷達(dá)圖和氣象觀測(cè)中心收集到的目標(biāo)站點(diǎn)降水量。

比賽的任務(wù)是預(yù)測(cè)在未來(lái)1-2個(gè)小時(shí)內(nèi)每個(gè)目標(biāo)站點(diǎn)的總降雨量。

干貨滿滿,阿里天池CIKM2017 Rank4比賽經(jīng)驗(yàn)分享

數(shù)據(jù)處理過(guò)程

Percentil Method百分位數(shù)法

他們采用統(tǒng)計(jì)的方法來(lái)降低雷達(dá)數(shù)據(jù)的維度。對(duì)于每個(gè)雷達(dá)圖,他們對(duì)目標(biāo)站附近到整個(gè)地圖范圍內(nèi)不同大小的區(qū)域都選取了雷達(dá)反射率值的25、50、75、100百分位。

干貨滿滿,阿里天池CIKM2017 Rank4比賽經(jīng)驗(yàn)分享

圖:以目標(biāo)站點(diǎn)為中心選取不同的區(qū)域

Wind法

他們首先將原始數(shù)據(jù)(15*4*101*101)壓縮成稍小的數(shù)據(jù)(15*4*10*10),然后通過(guò)判斷風(fēng)向,將數(shù)據(jù)壓縮到15*4*6*6個(gè)特征。整個(gè)預(yù)處理過(guò)程都是利用卷積神經(jīng)網(wǎng)絡(luò)的方法,特別是卷積運(yùn)算和最大池化。

干貨滿滿,阿里天池CIKM2017 Rank4比賽經(jīng)驗(yàn)分享

圖:卷積計(jì)算表征

干貨滿滿,阿里天池CIKM2017 Rank4比賽經(jīng)驗(yàn)分享

圖:池化計(jì)算表征

他們利用第四層的數(shù)據(jù)來(lái)判斷風(fēng)向。然后,為了計(jì)算最終風(fēng)向,用兩種方法來(lái)選擇有代表性的數(shù)據(jù)。第一種方法在每10*10單元中使用最大的值作為表征,第二種方法則采用最大的5個(gè)數(shù)據(jù)的平均值作為表征。

在選出有代表性的數(shù)據(jù)之后,通過(guò)每?jī)蓚€(gè)時(shí)間間隔之間數(shù)據(jù)的偏差值算出移動(dòng)方向,最終基于給定的閾值統(tǒng)計(jì)不同移動(dòng)方向的數(shù)目,按照數(shù)目最多移動(dòng)方向的確定最終風(fēng)向。

干貨滿滿,阿里天池CIKM2017 Rank4比賽經(jīng)驗(yàn)分享

圖:當(dāng)風(fēng)向?yàn)槲?、西北、西南時(shí)提取特征的方法

模型

在這次任務(wù)中,他們的模型結(jié)合了Random Forestry、XGBoost和雙向GRU單元(Bidirectional Gated Recurrent Unit)等,得出了較為滿意的結(jié)果。

運(yùn)用的工具

Python 3.6

Keras

XGBoost

Sklearn

他們的代碼:https://github.com/zxth93/CIKM_AnalytiCup_2017

via:GitHub

雷鋒網(wǎng) AI科技評(píng)論

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

干貨滿滿,阿里天池CIKM2017 Rank4比賽經(jīng)驗(yàn)分享

分享:

編輯

關(guān)注AI學(xué)術(shù),例如論文
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)