丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能開發(fā)者 正文
發(fā)私信給恒亮
發(fā)送

1

一篇文章告訴你如何成為數(shù)據(jù)科學(xué)家

本文作者: 恒亮 2017-04-07 16:35
導(dǎo)語:將專業(yè)技術(shù)轉(zhuǎn)化為業(yè)務(wù)支持,這才是作為數(shù)據(jù)科學(xué)家的工作核心。

 一篇文章告訴你如何成為數(shù)據(jù)科學(xué)家

通常來說,年輕人都很容易立志成為什么,例如成為一名科學(xué)家,然后又很快放棄。這一方面是因為擺在他們面前的誘惑太多,也因為成為一名科學(xué)家真的很不容易。

這一點(diǎn)放在數(shù)據(jù)科學(xué)上尤其突出。實(shí)際上,近年來隨著數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的火爆,我們經(jīng)常能遇到剛畢業(yè)的大學(xué)生立志成為數(shù)據(jù)科學(xué)家,但很快又放棄的例子。究其原因,我認(rèn)為在很大程度上是因為要成為一名真正的數(shù)據(jù)科學(xué)家,需要掌握的專業(yè)知識實(shí)在是太多了:包括計算機(jī)科學(xué)、編程基礎(chǔ)、數(shù)學(xué)知識、機(jī)器學(xué)習(xí)算法甚至商業(yè)洞察力等等。

看起來這些知識無窮無盡,而且還在不斷地發(fā)展和變化,似乎終其一生也無法完全掌握。但實(shí)際上并非如此,下文我們整理了成為數(shù)據(jù)科學(xué)家的四個關(guān)鍵因素,它們并沒有想象中的龐雜,而且正是由于不斷的發(fā)展和變化,因此對于新手來說通常只需要關(guān)注其中比較核心的基礎(chǔ)知識就可以了。

成為數(shù)據(jù)科學(xué)家的四個關(guān)鍵因素:

  1. 編程基礎(chǔ):例如 R 語言和 Python 語言,這兩種語言是數(shù)據(jù)科學(xué)家們最常使用的數(shù)據(jù)建模、數(shù)據(jù)清理和數(shù)據(jù)管理語言。

  2. 機(jī)器學(xué)習(xí)核心算法:例如回歸、樸素貝葉斯、支持向量機(jī) SVM(Support Vector Machine)、隨機(jī)森林等,大部分面試官都希望面試者們能了解這些最基本的機(jī)器學(xué)習(xí)算法。

  3. 在恰當(dāng)?shù)膯栴}上磨煉自己:對于數(shù)據(jù)科學(xué)家而言,優(yōu)秀和偉大之間的一個重要差別就是:找準(zhǔn)一個恰當(dāng)?shù)膯栴}并為之鍥而不舍的能力。

  4. 能講述一個激動人心的故事:這將有助于你說服客戶并讓他們最終采納你的意見。

下面我們圍繞這四點(diǎn)展開闡述。

  編程語言

與精通一門或者一系列編程語言相比,數(shù)據(jù)科學(xué)家應(yīng)該更關(guān)注編程的靈活性。即他們需要具備遷移學(xué)習(xí)的能力,將一種語言的編程技巧輕松遷移到當(dāng)前項目需要的語言中,目標(biāo)是找到解決問題的最佳方案。

為此,對新手來說最好的辦法是先學(xué)習(xí)一些應(yīng)用廣泛的基礎(chǔ)性語言。例如專注于統(tǒng)計計算的 R 語言,以及更具通用性的 Python 語言。一旦你熟悉了這兩種語言,那么學(xué)習(xí)其他新語言就會容易得多,因為它們之間一定存在一些通用的特性和語法細(xì)節(jié)。

總之,作為一名數(shù)據(jù)科學(xué)家,編程語言只是一種工具,你并不需要成為編程領(lǐng)域的專家。但你必須熟悉它們,以便于利用這些工具解決一些現(xiàn)實(shí)的數(shù)據(jù)研究問題,以及一些簡單的編碼和調(diào)試問題。

  機(jī)器學(xué)習(xí)算法

這里首先需要強(qiáng)調(diào)的是,在機(jī)器學(xué)習(xí)算法中我們?nèi)匀粦?yīng)該專注于基礎(chǔ)知識,避免盲目追求最新技術(shù)。

這是因為沒有了基礎(chǔ)的支持,最新的技術(shù)成果也將變得毫無意義。一個數(shù)據(jù)科學(xué)家應(yīng)該關(guān)注于技術(shù)核心,例如評估機(jī)器學(xué)習(xí)分類算法的優(yōu)劣,了解客戶更關(guān)心哪些分類錯誤等。畢竟,真實(shí)成本分析比準(zhǔn)確率更有價值。

同樣,懂得各種機(jī)器學(xué)習(xí)算法之間的差異,能夠為模型選擇最恰當(dāng)?shù)膮?shù)也非常重要。一般基礎(chǔ)的機(jī)器學(xué)習(xí)分類器包括邏輯和線性回歸、樸素貝葉斯、隨機(jī)森林和 K 均值聚類等。這里需要強(qiáng)調(diào)的是:機(jī)器學(xué)習(xí)是一個不斷發(fā)展變化的學(xué)科,不要試圖一蹴而就。也就是說,作為數(shù)據(jù)科學(xué)初學(xué)者,你不應(yīng)該把太多的精力放在機(jī)器學(xué)習(xí)和人工智能上,而應(yīng)該多考慮一些非技術(shù)的要素。

  非技術(shù)性要素

認(rèn)為技術(shù)要素是促成最終成功的最大驅(qū)動力,是一個非常常見的錯誤,對于數(shù)據(jù)科學(xué)家而言,我認(rèn)為溝通技巧和解決問題的能力也許更加重要。因為這些能力將有助于你取得諸多具有影響力的成果:包括增加公司收入、創(chuàng)新產(chǎn)品甚至改變整個行業(yè)的走向。最終你將從一名普通的 SQL 程序猿成長為一個值得信賴的商業(yè)伙伴。下面列出我認(rèn)為最重要的三點(diǎn)非技術(shù)要素。

1. 我認(rèn)為最關(guān)鍵的一個非技術(shù)要素就是“數(shù)據(jù)直覺”(data intuition),即結(jié)合領(lǐng)域內(nèi)的專業(yè)知識和商業(yè)敏感性,提出最深刻的見解,并能夠快速決策的能力。數(shù)據(jù)直覺可以讓從業(yè)者以多種不同的方式理解數(shù)據(jù),找出數(shù)據(jù)中的異常值,以及最不容易發(fā)覺的變化趨勢。

通常情況下我都會把處理數(shù)據(jù)問題視為一個檸檬,即隨著時間的推移,通過不斷努力,我究竟能從這顆檸檬里榨出多少有價值的果汁。而這也是數(shù)據(jù)直覺的含義:為了找到最優(yōu)的解決方案,你已經(jīng)嘗試了所有可能的方法,從數(shù)據(jù)中發(fā)掘了所有有價值的信息。

當(dāng)然,培養(yǎng)自己的數(shù)據(jù)直覺需要時間,也需要實(shí)踐的積累。實(shí)際上,一個最有效的培養(yǎng)方法就是參與一些與自己的工作和生活息息相關(guān)的項目,例如買房子、或者買一輛新的山地自行車。另一個方法是處理與自己的愛好相關(guān)的數(shù)據(jù)。這種方法的優(yōu)勢是:你對自己喜歡的行業(yè)已經(jīng)有了一定的前期了解,另外你對該問題的結(jié)論也具有天然的熱情。最終,在這些項目中總結(jié)和積累的“直覺”將被應(yīng)用于其他的數(shù)據(jù)分析場景。

2. 我認(rèn)為第二點(diǎn)非常關(guān)鍵的非技術(shù)因素是解決問題的能力,也就是將客戶的需求轉(zhuǎn)化為具體的問題,并將其分解成一系列可以切實(shí)執(zhí)行的解決方案的能力。以下是我在這方面的一些經(jīng)驗總結(jié),僅供參考:

  • 深刻認(rèn)識問題的內(nèi)容和意義,只有充分認(rèn)識了問題,才能解決問題;

  • 找到可用數(shù)據(jù),如果數(shù)據(jù)的格式有問題,找出解決辦法;

  • 分析數(shù)據(jù),并發(fā)掘其中決定性的變化趨勢,找到最能說明問題的變量或特征;

  • 研究哪種分析算法和模型最高效,并預(yù)測、解釋結(jié)果;

  • 將你的分析結(jié)果分享給利益相關(guān)者,并向他們征求意見。

3. 最后一點(diǎn)非技術(shù)要素:認(rèn)識到你的工作不僅僅是數(shù)據(jù)分析,它也包括向非技術(shù)人員提供大數(shù)據(jù)意見指導(dǎo)。因為大多數(shù)普通用戶并不會談?wù)摂?shù)據(jù),他們只關(guān)心營收、銷售、推廣和產(chǎn)品。將專業(yè)技術(shù)轉(zhuǎn)化為業(yè)務(wù)支持,這才是作為數(shù)據(jù)科學(xué)家的工作核心。

現(xiàn)在,請牢記上述四個關(guān)鍵點(diǎn),向著數(shù)據(jù)科學(xué)家的目標(biāo)奮勇前進(jìn)吧,助你好運(yùn)!

注:本文來源 medium,原作者是 UCLA 統(tǒng)計學(xué)博士,雷鋒網(wǎng)編譯

雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))相關(guān)閱讀:

數(shù)據(jù)科學(xué)家=最佳職業(yè)?美招聘平臺將其評為全美最理想工作

一張圖看懂?dāng)?shù)據(jù)科學(xué)家、數(shù)據(jù)工程師和軟件工程師之間的區(qū)別

亞馬遜數(shù)據(jù)專家十年經(jīng)驗總結(jié):成為數(shù)據(jù)科學(xué)家的關(guān)鍵四步

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

 一篇文章告訴你如何成為數(shù)據(jù)科學(xué)家

分享:
相關(guān)文章

編輯

歡迎交流,微信:whl123465
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說