丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給AI研習(xí)社-譯站
發(fā)送

0

數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)家有什么不同

本文作者: AI研習(xí)社-譯站 2019-04-26 10:47
導(dǎo)語:有個最常見的問題是數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師之間的區(qū)別?

數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)家有什么不同

本文為 AI 研習(xí)社編譯的技術(shù)博客,原標(biāo)題 :

What Is The Difference Between A Data Engineer And A Data Scientist

作者 | SeattleDataGuy

翻譯 | 約翰遜 · 李加薪、CONFIDANT    

校對 | 鄧普斯?杰弗        審核 | 艾狄生?多利       整理 | 立魚王

原文鏈接:

https://medium.com/coriers/what-is-the-difference-between-a-data-engineer-and-a-data-scientist-a25a10b91d66

作者:Ben Rogojan

我們最近在Reddit上做了問答活動。有個最常見的問題是數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師之間的區(qū)別。因此,我們想在這個主題上下寫一篇文章來深入探討下這個話題。

數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)家有什么不同

有許多數(shù)據(jù)專家的崗位聽起來沒多大區(qū)別,使用的工具也很類似,我們很難知道各類職位應(yīng)該承擔(dān)什么樣的職責(zé)。此外,較小的公司可能會受限于他們聘請的數(shù)據(jù)工程師或數(shù)據(jù)科學(xué)家的人數(shù),這便意味著很多時候特定的任務(wù)和目標(biāo)可能會開始混合。

上述使得明確區(qū)分這兩個角色變得更加困難。因此,我們想通過討論數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)家所擁有的不同目標(biāo),思維模式,工具和背景來了解兩個職位的不同之處。

在我們討論差異之前,我們想做一個快速的引言。事實是,許多數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師將執(zhí)行其他技術(shù)角色的任務(wù)。數(shù)據(jù)科學(xué)家可能需要開發(fā)ETL,數(shù)據(jù)工程師可能需要開發(fā)API和前端。因此,我們在下面指出的區(qū)別只是為了弄清楚技術(shù)差異在哪里。

數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)家有什么不同

來源:DataCamp

   目標(biāo)

數(shù)據(jù)工程師的目標(biāo)更側(cè)重于任務(wù)和開發(fā)。數(shù)據(jù)工程師構(gòu)建自動化系統(tǒng)和模型數(shù)據(jù)結(jié)構(gòu),以允許有效地處理數(shù)據(jù)。這意味著數(shù)據(jù)工程師的目標(biāo)是創(chuàng)建和開發(fā)表格和數(shù)據(jù)管道,以支持分析儀表板和其他數(shù)據(jù)客戶(如數(shù)據(jù)科學(xué)家、分析師和其他工程師)。它與大多數(shù)工程師相似。為了能夠執(zhí)行最終的任務(wù),需要進(jìn)行大量的設(shè)計、假設(shè)、限制和開發(fā)。每個設(shè)計和解決方案都有自己的一組限制,即使它們都可以執(zhí)行最終任務(wù)。

相比之下,數(shù)據(jù)科學(xué)家往往更關(guān)注問題。從這個意義上說,他們正在尋找降低成本/增加利潤、改善客戶體驗或業(yè)務(wù)效率的方法。這意味著他們需要問問題,然后回答問題(問問題,假設(shè),然后得出結(jié)論)。所以他們需要問的問題比如,什么影響了病人的再入院,如果增加A vs. B,顧客會花更多錢嗎,有沒有更快的遞送包裹的路線?跳過剩下的過程。這里的目標(biāo)是找到問題的答案。這可能是一個最終的結(jié)論或更多的問題。在整個過程中,數(shù)據(jù)科學(xué)家分析、收集支持,并可以得出問題的結(jié)論。

   工具

這就是事情會變得混亂的地方。數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師通常都依賴于python和SQL。然而,這兩個技術(shù)角色使用這些技能的方式各不相同。同樣,這與心態(tài)的差異有關(guān)。Python是一種非常健壯的語言,它具有幫助管理操作任務(wù)和分析任務(wù)的庫。

數(shù)據(jù)科學(xué)家將使用panda和Scikit Learn這樣的庫,而數(shù)據(jù)工程師將使用python來管理管道。這就是像airflow和Luigi這樣的圖書館派上用場的地方。

類似地,數(shù)據(jù)科學(xué)家查詢將是特別關(guān)注的(例如,關(guān)注問題)。而數(shù)據(jù)工程師的查詢將集中于清理和轉(zhuǎn)換數(shù)據(jù)。

現(xiàn)在,數(shù)據(jù)專家還可以使用其他工具。這包括Tableau, Jupyter筆記本和其他一些。說到底,區(qū)別在于他們?nèi)绾问褂盟鼈儭?/p>

   背景

現(xiàn)在,當(dāng)談到數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)家之間的差異時,另一個常見的問題是需要什么樣的背景。

數(shù)據(jù)工程和數(shù)據(jù)科學(xué)都需要對數(shù)據(jù)和編程有一定的了解。即使是有限的范圍。然而,有一些區(qū)別超出了編程。特別是數(shù)據(jù)科學(xué)家。由于數(shù)據(jù)科學(xué)家更像研究人員,擁有以研究為基礎(chǔ)的背景是一種優(yōu)勢。

這可能是在經(jīng)濟(jì)學(xué)、心理學(xué)、流行病學(xué)等領(lǐng)域。將研究背景、SQL、Python和良好的商業(yè)意識結(jié)合起來,您就擁有了一位數(shù)據(jù)科學(xué)家。這些并不是一成不變的。事實上,我們遇到了一位獲得多個學(xué)位的的數(shù)據(jù)科學(xué)家。大多數(shù)雇主更傾向于雇傭至少擁有碩士學(xué)位的數(shù)據(jù)科學(xué)家,他的專業(yè)是技術(shù)或數(shù)學(xué)。

數(shù)據(jù)工程職位通常不需要碩士學(xué)位。數(shù)據(jù)工程更多的是作為一名開發(fā)人員。這需要更多的實踐經(jīng)驗,而不是理論知識。所以獲得碩士學(xué)位并不能提供相同的價值。雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)

   一個例子

假設(shè)一家醫(yī)療保健公司的董事決定,他們想要弄清楚如何減少30天前再次入院的病人數(shù)量。從數(shù)據(jù)的角度來看,需要做幾件事。

數(shù)據(jù)科學(xué)家需要弄清楚是什么驅(qū)使病人重新入院。這是他們將試圖回答的問題。根據(jù)他們得出的結(jié)論,他們將與業(yè)務(wù)部門合作,制定度量指標(biāo) 。這些指標(biāo)是如何創(chuàng)建將由數(shù)據(jù)科學(xué)家得到答案。

數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師有很多不同之處。他們有不同的目標(biāo)和背景,但這就是兩者共同利用的價值所在。數(shù)據(jù)工程師更多地關(guān)注工程健壯系統(tǒng),這一事實使得數(shù)據(jù)科學(xué)家能夠輕松地查詢數(shù)據(jù)并有效地分析數(shù)據(jù)。他們的合作伙伴關(guān)系使公司從數(shù)據(jù)中獲得價值。

我們希望這篇文章能有所幫助!如果你有任何問題,請隨時聯(lián)系我們。

想要繼續(xù)查看該篇文章相關(guān)鏈接和參考文獻(xiàn)?

點擊數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師有什么不同?即可訪問:

https://ai.yanxishe.com/page/TextTranslation/1567

AI研習(xí)社IJCAI小組組長本周將采訪大咖教授:Victor R. Lesser

大家有什么問題想要問Victor R. Lesser的,都可以在IJCAI小組里面進(jìn)行提問!

小組鏈接:https://ai.yanxishe.com/page/meeting/47

掃碼即刻參與提問,帶話題#提問 IJCAI 大咖#,提問采納者有機(jī)會獲得禮品一份,小組研值累積排行前三者,更有機(jī)會獲得 AI 研習(xí)社贊助的「直達(dá)頂會」的機(jī)票+酒店等參會費用,讓你親臨大會現(xiàn)場,和大咖面對面~。

數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)家有什么不同


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)家有什么不同

分享:
相關(guān)文章

知情人士

AI研習(xí)社(yanxishe.com)譯站頻道,傳播前沿人工智能知識,讓語言不再成為學(xué)習(xí)知識的門檻。(原雷鋒字幕組)
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說