丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能開發(fā)者 正文
發(fā)私信給楊鯉萍
發(fā)送

0

競(jìng)技世界首席數(shù)據(jù)科學(xué)家巴川:數(shù)據(jù)科學(xué),未來或?qū)⒊蔀槊褡搴诵母?jìng)爭(zhēng)力

本文作者: 楊鯉萍 2019-09-26 18:22
導(dǎo)語:怎樣才能在大數(shù)據(jù)時(shí)代浪潮,翻出最美浪花

雷鋒網(wǎng) AI 開發(fā)者按:09 月 21 日,CCF TF 第 22 期「數(shù)據(jù)驅(qū)動(dòng)」主題會(huì)議順利舉辦。本次會(huì)議主席由競(jìng)技世界首席數(shù)據(jù)科學(xué)家巴川擔(dān)任,會(huì)議特別邀請(qǐng)了來自學(xué)界與業(yè)界的多位大咖共同探討數(shù)據(jù)驅(qū)動(dòng)技術(shù)在生活與生產(chǎn)中的應(yīng)用與價(jià)值。特邀嘉賓包括:清華大學(xué)計(jì)算機(jī)系教授兼軟件所所長(zhǎng)李國(guó)良、河北省大數(shù)據(jù)計(jì)算重點(diǎn)實(shí)驗(yàn)室副主任劉晶、京東數(shù)科智能城市事業(yè)部數(shù)據(jù)管理平臺(tái)部負(fù)責(zé)人鮑捷、滴滴出行高級(jí)數(shù)據(jù)科學(xué)家繆瑩瑩以及餓了么研究員傅周宇。

大數(shù)據(jù)時(shí)代已經(jīng)到來,針對(duì)當(dāng)下 AI 與數(shù)據(jù)驅(qū)動(dòng)的痛難點(diǎn)和未來發(fā)展趨勢(shì),會(huì)議細(xì)節(jié)設(shè)置部署,以及對(duì)數(shù)據(jù)驅(qū)動(dòng)相關(guān) AI 學(xué)術(shù)青年的發(fā)展方向,雷鋒網(wǎng) AI 開發(fā)者獨(dú)家訪問了巴川主席,并在不改變?cè)獾那闆r下,將采訪內(nèi)容整理如下。

競(jìng)技世界首席數(shù)據(jù)科學(xué)家巴川:數(shù)據(jù)科學(xué),未來或?qū)⒊蔀槊褡搴诵母?jìng)爭(zhēng)力

巴川,資深數(shù)據(jù)科學(xué)家

曾就職于中國(guó)搜索、搜狐暢游等,主要從事互聯(lián)網(wǎng)數(shù)據(jù)挖掘,現(xiàn)任競(jìng)技世界(北京)網(wǎng)絡(luò)技術(shù)有限公司首席數(shù)據(jù)科學(xué)家

主要研究領(lǐng)域包括互聯(lián)網(wǎng)用戶行為挖掘、產(chǎn)品運(yùn)營(yíng)分析、社交網(wǎng)絡(luò)挖掘、反作弊、風(fēng)控體系、推薦系統(tǒng)、數(shù)據(jù)可視化等

數(shù)據(jù)、技術(shù),誰主浮沉

AI 開發(fā)者:作為一名資深數(shù)據(jù)科學(xué)家,你認(rèn)為數(shù)據(jù)的核心價(jià)值在哪里?

巴川:現(xiàn)在的數(shù)據(jù)技術(shù)發(fā)展于社會(huì)的意義遠(yuǎn)遠(yuǎn)大于其商業(yè)價(jià)值。數(shù)據(jù)工作本身是在大數(shù)據(jù)中尋找數(shù)據(jù)背后的數(shù)學(xué)規(guī)律,而對(duì)數(shù)學(xué)規(guī)律的掌握將是社會(huì)變革的重要?jiǎng)恿?,它可能促進(jìn)整個(gè)社會(huì)的發(fā)展;尤其在當(dāng)下世界格局競(jìng)爭(zhēng)激烈的時(shí)候,大數(shù)據(jù)的挖掘與研究將很有可能成為民族的核心競(jìng)爭(zhēng)力。

AI 開發(fā)者:對(duì)數(shù)據(jù)挖掘與處理的難點(diǎn)又主要體現(xiàn)在哪些方面?

巴川:數(shù)據(jù)挖掘與處理難點(diǎn)主要在數(shù)據(jù)獲取階段。

一方面在于數(shù)據(jù)本身,如果你獲得的數(shù)據(jù)質(zhì)量較差,得到的結(jié)果也不會(huì)太好。因此數(shù)據(jù)獲取的全面性和質(zhì)量將對(duì)于研究結(jié)果有很大的影響。而關(guān)于用戶隱私問題,則是數(shù)據(jù)獲取難的另一原因。因?yàn)閿?shù)據(jù)獲取可能會(huì)侵犯到他人的隱私,所以在數(shù)據(jù)的使用過程中,我們需要小心謹(jǐn)慎的對(duì)待數(shù)據(jù),通常我們也會(huì)進(jìn)行一定的脫敏操作,盡可能在保護(hù)用戶隱私和給用戶提供便利之間找一個(gè)平衡點(diǎn)。

因此總體來講,怎樣能夠既便捷又規(guī)范的獲取質(zhì)量較高的數(shù)據(jù),這個(gè)是我們?cè)跀?shù)據(jù)獲取中需要重點(diǎn)解決的難題。

AI 開發(fā)者:目前,深度學(xué)習(xí)的結(jié)果很依賴于數(shù)據(jù),你認(rèn)為可以從哪些方面實(shí)現(xiàn)改進(jìn)與突破呢?

巴川:通常來講,研究人員利用數(shù)據(jù)進(jìn)行深度學(xué)習(xí)的過程中主要用到了神經(jīng)網(wǎng)絡(luò)技術(shù),而神經(jīng)網(wǎng)絡(luò)具有可驗(yàn)證不可解釋的特點(diǎn)。因此,從技術(shù)角度來看,研究神經(jīng)網(wǎng)絡(luò)等相關(guān)技術(shù)的可解釋性,可能會(huì)是一個(gè)很好的突破點(diǎn)。一旦算法可解釋性變強(qiáng),它對(duì)數(shù)據(jù)的依賴就會(huì)大大降低。

不過,如果想得到更好的結(jié)果,仍然需要數(shù)據(jù)的「質(zhì)」和「量」進(jìn)行輔助。只有數(shù)據(jù)與算法兩者綜合發(fā)展,才能得到更準(zhǔn)確更完美的結(jié)果。

AI 開發(fā)者:那在你看來,技術(shù)與數(shù)據(jù)之間是一種什么樣的關(guān)系?

巴川:兩者的關(guān)系總體上可以概括為「技術(shù)的發(fā)展有賴于好的數(shù)據(jù),數(shù)據(jù)本身的獲取和價(jià)值挖掘也有賴于技術(shù)的發(fā)展,兩者就好比廚師與食材的關(guān)系」。當(dāng)然,兩者的發(fā)展都有一個(gè)共同的目的,即幫助我們改善生活和生產(chǎn)。

AI 開發(fā)者:數(shù)據(jù)驅(qū)動(dòng)目前主要都應(yīng)用在哪些方面?這些領(lǐng)域的發(fā)展是怎樣的呢?

巴川:數(shù)據(jù)技術(shù)與 AI 的發(fā)展,在行業(yè)里的表現(xiàn)基本是一個(gè)輪動(dòng)的狀態(tài)。例如:互聯(lián)網(wǎng)領(lǐng)域現(xiàn)在的發(fā)展雖然可達(dá)八九十分,但它依舊在爆發(fā)式增長(zhǎng),其中很大原因是由于互聯(lián)網(wǎng)產(chǎn)品傳播效果好,所以有些應(yīng)用能直擊用戶癢點(diǎn)時(shí)就會(huì)產(chǎn)生病毒式傳播。而金融、電信、政務(wù)等行業(yè)的數(shù)據(jù)技術(shù)應(yīng)用,在國(guó)家的大力推動(dòng)下,發(fā)展比較穩(wěn)健,僅次于互聯(lián)網(wǎng)。至于另外一些傳統(tǒng)行業(yè),它們的數(shù)據(jù)盡管還沒能得到很好的開發(fā),相對(duì)于前幾個(gè)行業(yè)可能有所滯后,但這也將會(huì)是未來發(fā)展的目標(biāo)之一。

競(jìng)技世界首席數(shù)據(jù)科學(xué)家巴川:數(shù)據(jù)科學(xué),未來或?qū)⒊蔀槊褡搴诵母?jìng)爭(zhēng)力

圖 1 競(jìng)技世界首席數(shù)據(jù)科學(xué)家巴川老師 CCF TF 大會(huì)演講現(xiàn)場(chǎng)

AI 開發(fā)者:在你所說的輪動(dòng)領(lǐng)域里面,你比較看好哪個(gè)領(lǐng)域?

巴川:目前以及未來三年內(nèi),我覺得最熱的可能還是能直接刺激人們生活的領(lǐng)域,即與互聯(lián)網(wǎng)相關(guān)的行業(yè)。然后可能是金融,金融科技領(lǐng)域這幾年已經(jīng)蠢蠢欲動(dòng),也許它將成為數(shù)據(jù)驅(qū)動(dòng)未來的黑馬之一。而對(duì)于傳統(tǒng)行業(yè)的升級(jí)改造,有很多的前期準(zhǔn)備工作要做,可能需要一定的時(shí)間,才能使得數(shù)據(jù)驅(qū)動(dòng)技術(shù)在這些行業(yè)得到較快的發(fā)展。

AI 開發(fā)者:我們知道競(jìng)技世界在做游戲方面也非常厲害,你認(rèn)為數(shù)據(jù)驅(qū)動(dòng)和游戲之間的關(guān)系是怎樣的呢?

巴川:競(jìng)技世界主要是一個(gè)互聯(lián)網(wǎng)平臺(tái),已擁有超過 5 個(gè)億的足夠大的用戶量,使得跟數(shù)據(jù)相關(guān)的技術(shù)更易于推進(jìn)。通過對(duì)大量數(shù)據(jù)的分析,我們可以非常直觀的去解決很多問題,包括:在游戲發(fā)行階段怎么樣去獲客,在運(yùn)營(yíng)階段怎么樣去促活以及怎么樣最大化創(chuàng)收等。因此,數(shù)據(jù)驅(qū)動(dòng)和游戲之間有著越來越緊密的聯(lián)系。

洞見 AI 之未來

AI 開發(fā)者:大數(shù)據(jù)、機(jī)器學(xué)習(xí)、AI 相關(guān)的概念,近年來越來越火熱,你如何看待近幾年 AI 領(lǐng)域的快速增長(zhǎng)?

巴川:總體上,我把大數(shù)據(jù)、機(jī)器學(xué)習(xí)、AI 都理解為關(guān)于數(shù)據(jù)的技術(shù)。這些技術(shù)通過利用數(shù)據(jù)來模仿人類的一些行為,從而改善我們的生活和生產(chǎn)。

因此,所謂的爆發(fā)式增長(zhǎng),更多的是應(yīng)用領(lǐng)域,這屬于順應(yīng)時(shí)代發(fā)展與需求的一種現(xiàn)象。而究其根本,這一現(xiàn)象主要是得益于算力的增長(zhǎng),即計(jì)算機(jī)硬件的發(fā)展在 AI 技術(shù)的爆發(fā)式增長(zhǎng)方面起著極其重要的作用。

AI 開發(fā)者:那么,你認(rèn)為目前技術(shù)突破的主要難點(diǎn)在哪呢?

巴川:技術(shù)的發(fā)展與算法革新有很大的關(guān)系,而技術(shù)突破的難點(diǎn)也主要在于算法方面。

通常,底層的算法更偏數(shù)學(xué)化,需要更嚴(yán)謹(jǐn)更強(qiáng)大的理論支撐進(jìn)行驗(yàn)證說明,相對(duì)于應(yīng)用方面,理論發(fā)展則非常緩慢,往往一個(gè)革命性算法的誕生,可能需要十幾年,甚至幾十年。

AI 開發(fā)者:面對(duì)當(dāng)下大力發(fā)展應(yīng)用而較少人專心投入技術(shù)研究的現(xiàn)狀,你是怎么看待其中利弊的呢?

巴川:總體來看,現(xiàn)在是一個(gè)良性的階段。

應(yīng)用的大力發(fā)展本身會(huì)帶來一定的利益驅(qū)動(dòng),以及整體社會(huì)的關(guān)注度。在這樣的大環(huán)境下,技術(shù)的發(fā)展自然能夠得到很大推動(dòng)力量,進(jìn)而促使理論研究的人力投入增加,最終帶動(dòng)技術(shù)的發(fā)展。所以,我們也無須過分關(guān)注當(dāng)下,時(shí)間或許能證明一切。

AI 開發(fā)者:目前,哪些行業(yè)在 AI 的應(yīng)用中受益比較大呢?

巴川:從企業(yè)的角度來看,勞動(dòng)密集型、重復(fù)性勞動(dòng)較多的企業(yè)受益會(huì)比較大,因?yàn)橛脵C(jī)器替代人可以節(jié)省很大的勞力成本,比如:客服機(jī)器人、工業(yè)機(jī)器人等。

而從人的角度來看,受益較大的是原來從事跟數(shù)據(jù)技術(shù)相關(guān)的崗位,比如:做 AI、做大數(shù)據(jù)、做深度學(xué)習(xí)方面的人才。

AI 開發(fā)者:時(shí)下深度學(xué)習(xí)也是非常火熱的領(lǐng)域之一,那你認(rèn)為 AI 的下一波爆發(fā)高潮會(huì)是什么時(shí)候,或者在怎樣的契機(jī)下產(chǎn)生呢?

巴川:無論是機(jī)器學(xué)習(xí),還是深度學(xué)習(xí)、遷移學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等,這些名詞都不是最重要的,它們只是隨著各種新技術(shù)而產(chǎn)生的代號(hào)。因此,如果從宏觀層面來談爆發(fā)高潮的話,這些數(shù)據(jù)技術(shù)一直都處于爆發(fā)式增長(zhǎng)的高潮之中,并且這樣的狀態(tài)還將持續(xù)至少 3-5 年。

AI 開發(fā)者:那你認(rèn)為 AI 應(yīng)用開發(fā)的未來發(fā)展趨勢(shì)是怎樣的呢?

巴川:現(xiàn)在 AI 的應(yīng)用主要集中在互聯(lián)網(wǎng)行業(yè),但很多傳統(tǒng)行業(yè),比如:礦產(chǎn)、化工等行業(yè),AI 技術(shù)應(yīng)用得很少。

總體來看,如果 AI 應(yīng)用在互聯(lián)網(wǎng)方面的開發(fā)能夠達(dá)到八九十分,可能金融、政務(wù)能達(dá)到六十多分,而一些傳統(tǒng)行業(yè)可能還處于三四十分甚至更低的不及格階段。但往往新的領(lǐng)域,會(huì)有更強(qiáng)的爆發(fā)力,所以我認(rèn)為 AI 未來的發(fā)展總體上會(huì)是一個(gè)版塊輪動(dòng)的狀態(tài)。

數(shù)據(jù)科學(xué)家的神秘面紗

AI 開發(fā)者:作為本次 CCF TF 會(huì)議的召集人,整個(gè)議程的設(shè)置,包括選題、嘉賓的邀請(qǐng)你是出于怎樣的考量呢?

巴川:這次請(qǐng)的嘉賓既有學(xué)術(shù)界的大牛,也有企業(yè)界的大咖,這正和 CCF TF 的宗旨與口號(hào)——「只為技術(shù)專家」相契合。

特邀嘉賓包括學(xué)術(shù)界的清華李國(guó)良教授、河北工業(yè)大學(xué)劉靜教授,企業(yè)界的滴滴、餓了么、京東知名互聯(lián)網(wǎng)企業(yè)里的數(shù)據(jù)專家。因此,本次大會(huì)我們主要希望能夠進(jìn)一步促進(jìn)產(chǎn)學(xué)融合,增加產(chǎn)學(xué)互動(dòng)交流。

而在議題方面,我們既有「數(shù)據(jù)驅(qū)動(dòng)生活」又有「數(shù)據(jù)驅(qū)動(dòng)生產(chǎn)」主題。其中李國(guó)良教授講的題為「AI 原生數(shù)據(jù)庫(kù)」,看似跟數(shù)據(jù)驅(qū)動(dòng)關(guān)系不大,但對(duì)于數(shù)據(jù)庫(kù)的管理員來說,對(duì)數(shù)據(jù)庫(kù)的優(yōu)化也屬于數(shù)據(jù)驅(qū)動(dòng)的重點(diǎn)內(nèi)容。而劉晶教授的議題是數(shù)據(jù)驅(qū)動(dòng)傳統(tǒng)行業(yè)的升級(jí)改造。滴滴、餓了么、京東的議題則是用數(shù)據(jù)驅(qū)動(dòng)改善我們的生活。

總體來講,本次會(huì)議中我們既有數(shù)據(jù)驅(qū)動(dòng)生活,又有數(shù)據(jù)驅(qū)動(dòng)生產(chǎn),還包含了數(shù)據(jù)庫(kù)系統(tǒng)優(yōu)化,這是一場(chǎng)討論較為全面的數(shù)據(jù)驅(qū)動(dòng)主題大會(huì)。

競(jìng)技世界首席數(shù)據(jù)科學(xué)家巴川:數(shù)據(jù)科學(xué),未來或?qū)⒊蔀槊褡搴诵母?jìng)爭(zhēng)力

圖 2 CCF TF 「數(shù)據(jù)驅(qū)動(dòng)」圓桌會(huì)議現(xiàn)場(chǎng)

AI 開發(fā)者:具備哪些能力的人,更有可能成為一名優(yōu)秀的數(shù)據(jù)科學(xué)家?

巴川:我一直都帶著既嚴(yán)謹(jǐn)負(fù)責(zé)的態(tài)度對(duì)待數(shù)據(jù)又樂觀活潑的心態(tài)去使用數(shù)據(jù)。這不僅能夠保證結(jié)果的合理性和嚴(yán)肅性,還能幫助你獲得一些非常有價(jià)值的出乎意料的結(jié)果。

同時(shí),數(shù)學(xué)和編程都是數(shù)據(jù)科學(xué)中很重要的內(nèi)容。數(shù)學(xué)基礎(chǔ)常常能夠決定你將來走多高、多遠(yuǎn);而編程能力則能夠更直接的實(shí)現(xiàn)創(chuàng)意。在很多數(shù)據(jù)技術(shù)全面開發(fā)時(shí),通過動(dòng)手能力和編程能力去實(shí)踐自己的想法,尤其是快速實(shí)現(xiàn)自己的想法,可能會(huì)讓你很大程度上受益。

AI 開發(fā)者:我們都知道,除了數(shù)據(jù)科學(xué)家的身份之外,你還是眾多名校的老師,你是怎么處理這兩個(gè)身份之間的關(guān)系呢?

巴川:用四個(gè)字概括,即教學(xué)相長(zhǎng)。

一方面,我在企業(yè)做數(shù)據(jù)科學(xué)時(shí)會(huì)積累很多項(xiàng)目經(jīng)驗(yàn),將這些經(jīng)驗(yàn)傳授給學(xué)生的過程本身就是很快樂的。而另一方面,于我而言,學(xué)生給我的啟發(fā)以及眼界上的拓寬也讓我受益頗豐。這既是一個(gè)教學(xué)的過程又是一個(gè)同行交流的過程,所以我可能在一個(gè)學(xué)期內(nèi),教給他們十幾種算法和案例,他們則每個(gè)組反饋給我一個(gè)案例,進(jìn)而增加我的案例庫(kù),在這一過程中,我也得到了很快的成長(zhǎng)。

AI 開發(fā)者:對(duì)于 AI 開發(fā)者或者 AI 專業(yè)的學(xué)生,你有什么想要傳達(dá)給他們嗎?

巴川:成功其實(shí)是必然和偶然的結(jié)合。少一點(diǎn)功利心,多一點(diǎn)童心,報(bào)著好奇的探索欲去看待這個(gè)世界,再將自己的技術(shù)運(yùn)用到該用之處,你就很有可能在大數(shù)據(jù)浪潮中,翻出屬于自己的浪花。有時(shí)候,盡管新潮是很大的誘惑,但是只有既保持對(duì)這個(gè)行業(yè)的嚴(yán)肅性,同時(shí)又保持自己的初心,才能愈發(fā)長(zhǎng)遠(yuǎn)地發(fā)展下去。

雷鋒網(wǎng) AI 開發(fā)者 雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

競(jìng)技世界首席數(shù)據(jù)科學(xué)家巴川:數(shù)據(jù)科學(xué),未來或?qū)⒊蔀槊褡搴诵母?jìng)爭(zhēng)力

分享:
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說