丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能開發(fā)者 正文
發(fā)私信給恒亮
發(fā)送

0

數(shù)據(jù)科學入門難?老司機為你盤點 24 門精品課程

本文作者: 恒亮 2017-03-07 18:49
導語:關(guān)于數(shù)據(jù)科學入門,這些課程你可以試試。

數(shù)據(jù)科學入門難?老司機為你盤點 24 門精品課程

雷鋒網(wǎng)按:本文盤點了 24 個高品質(zhì)的在線數(shù)據(jù)科學入門教程,原作者 David Venturi,他獲有化學工程和經(jīng)濟學的雙學位,熱衷于數(shù)學、數(shù)據(jù)科學和統(tǒng)計學,同時也是一位編程愛好者。更具傳奇色彩的是,他本來就讀于一所名校的計算機科學專業(yè),但覺得對數(shù)據(jù)科學更感興趣——于是果斷退學,從 Coursera、edx、Udemy 等慕課平臺開始自學,終邁入專家行列。

他的經(jīng)歷說來也并不特別,世界上又多了一個慕課代言人而已。但雷鋒網(wǎng)認為,他的經(jīng)歷具有兩點價值:首先,最好的教學資源已經(jīng)在那兒了——很多還是免費的,取不取,只是我們自己的選擇。第二點,David Venturi 或許不是權(quán)威的數(shù)據(jù)科學專家,但他是慕課老司機——最好的公開課有哪些?當然還是慕課老司機的推薦最靠譜。

因此,這篇源于 David Venturi 長期的學習經(jīng)驗總結(jié),同時結(jié)合了在線慕課社區(qū) Class Central 成千上萬的課程評分和評論數(shù)據(jù)的盤點文章,自然對數(shù)據(jù)科學的入門學習具有非常重要的參考價值。

下面,我們一起來看看這位老司機的課程推薦。(入選課程的截止日期為 2017 年 1 月,按照優(yōu)先級降序排列)

數(shù)據(jù)科學入門難?老司機為你盤點 24 門精品課程

David Venturi

  關(guān)于評選標準

首先,所有的入選課程都必須滿足三個必要條件:

1. 必須主要教授數(shù)據(jù)科學,并且越相關(guān)越好。

2. 必須有人維護,例如根據(jù)用戶需求或者按照計劃每月更新。

3. 必須是一個互動性的在線教程,因此以下列出的不包括書籍或是其他只讀教程。

此后,我們收集了來自 Class Central 和其他評論網(wǎng)站的關(guān)于這些課程的評分數(shù)據(jù),計算了每個課程的加權(quán)平均得分,然后人工閱讀了課程的用戶評論信息,綜合兩者,得到了以下列表。這里,我們主要考慮了以下兩個關(guān)鍵因素。

1. 教程的覆蓋是否合理。例如,教程不能跳過一些科目,也不能在某些科目上糾纏過多的細節(jié)。

2. 教程是否采用了通用工具。例如,我們優(yōu)先選擇了那些通過流行的編程語言( Python 或 R 預言)實現(xiàn)的教程。

數(shù)據(jù)科學入門難?老司機為你盤點 24 門精品課程

最后需要說明的是,這里我們只考慮了評分最高和評論最多的課程,而且由于資源和時間有限,難免會有遺漏,歡迎各位讀者在留言區(qū)補充。

  關(guān)于數(shù)據(jù)科學

為了更好地選擇和梳理課程,首先要簡單了解數(shù)據(jù)科學是什么,以及數(shù)據(jù)科學家平常都在做哪些研究。這里,我們給出一張數(shù)據(jù)科學的處理過程概覽,原作者是哈佛大學的 Joe Blitzstein 和 Hanspeter Pfister 教授。

數(shù)據(jù)科學入門難?老司機為你盤點 24 門精品課程

我們認為,一個優(yōu)秀的數(shù)據(jù)科學入門教程,應該覆蓋上圖的每個方面,解釋其中的關(guān)鍵概念,介紹研究中常用的工具,而且最好能提供一些簡單示例(動手實操的示例)。

另外,由于本文的主題是“入門”教程盤點,因此這里不包括約翰·霍普金斯大學放在 Coursera 上的數(shù)據(jù)科學專業(yè)課程,也不包括 Udacity(優(yōu)達學城) 提供的數(shù)據(jù)分析師納米學位課程,這里我們只為數(shù)據(jù)科學的每個科目提供最好的個人入門教程盤點。

最后需要指出的是,以下列出的某些課程可能需要統(tǒng)計學和編程基礎,讀者可以自行學習這些基礎科目,也可以參考這兩個推薦課程列表。

統(tǒng)計學:https://www.class-central.com/report/best-statistics-probability-courses-data-science/ 

編程:https://www.class-central.com/report/best-programming-courses-data-science/ 

下面是課程推薦部分。

  重點推薦

1. Data Science A-Z:Real-Life Data Science Exercises Included

講師:Kirill Eremenko

平臺:Udemy

花費:15美元

時長:21小時

詳情:https://www.udemy.com/datascience/ 

在我們所有入選的二十多個課程中,Data Science A-Z 在知識點覆蓋寬度和廣度方面是當之無愧的王者。在高達 3071 份課程評論之中,它的加權(quán)平均星級達到了4.5星(滿分5星),是評價最高和評論數(shù)量最多的課程之一。

該課程完整覆蓋了數(shù)據(jù)科學的各項子科目,并貼心地提供了現(xiàn)實生活中的例子作為示例。另外,21小時也是一個非常好的時長,從評價來看,大部分訂閱者都認為講師的課程安排非常合理。價格方面,由于 Udemy 平臺經(jīng)常推出打折促銷活動,因此變動比較頻繁,目前的售價是15美元。

需要指出的是,該課程并不滿足我們上文提及的“采用通用工具”的評選要求(課程中沒有采用 Python 或 R 語言的相關(guān)工具,而是采用了 gretl,Tableau,Excel 等工具)。關(guān)于這一點,講師 Kirill Eremenko 做了如下說明。

在 gretl 中,用戶將可以像在 R 或者 Python 環(huán)境中那樣進行類似的建模操作,而且不用編寫代碼。這一點對于 Data Science A-Z 教程至關(guān)重要。因為訂閱者的編程水平可能參差不齊,而我希望通過這個課程傳達一個框架性的東西,一個健壯的模型,用戶可以自由選擇他們喜歡的工具。gretl 可以幫助我們避免陷入編程相關(guān)的難題。

2. Intro to Data Analysis

講師:Caroline Buckey

平臺:Udacity

花費:免費

時長:每周6小時,持續(xù)6周,共36小時

詳情:https://cn.udacity.com/course/intro-to-data-analysis--ud170/ 

Intro to Data Analysis 是一個相對較新的產(chǎn)品,是 Udacity 旗下數(shù)據(jù)分析師納米學位的一個細分課程。該課程的特點是完整并且清晰地覆蓋了數(shù)據(jù)科學的整個處理過程,盡管它在建模方面略有欠缺,但仍不失為一個優(yōu)秀的數(shù)據(jù)科學課程,甚至有訂閱者對它評價為 5 星級別。

該課程的視頻制作精良,講解清晰明了,并且許多知識點都搭配了實操測驗題。另外,由于這些配套測驗題都是基于 NumPy 和 Pandas 等框架的,因此訂閱者通過該課程的學習,除了能學到完整的大數(shù)據(jù)知識之外,還能順便提升自己對各種 Python 庫的應用能力。課程的最后一章涉及 Udacity 旗下的納米學位授予,雖然并不是免費的,但考慮到各大企業(yè)對納米學位的認可度,因此仍不失為一個很好的投資。

3. Data Science Fundamentals

講師:多人授課

平臺:Big Data University

花費:免費

時長:13小時,如果包括課程最后介紹R語言的“R 101”章節(jié),則需要18小時

詳情:https://bigdatauniversity.com/learn/data-science/ 

Data Science Fundamentals 由 IBM 旗下 Big Data University 提供的四個子章節(jié)組成,這四個子章節(jié)分別是:3小時的“Data Science 101”,5個小時的“Data Science Methodology”,5個小時的數(shù)據(jù)科學開源工具實操,以及最后5個小時的R語言入門“R 101”。

該課程完整覆蓋了數(shù)據(jù)科學的整個處理過程,并介紹了 Python、R 語言和其他幾個開源工具??傮w上說,課程更貼近實際應用,具有巨大的生產(chǎn)參考價值。但由于它在 Class Central 等評分網(wǎng)站中沒有太多數(shù)據(jù),因此目前還不清楚訂閱者對它的評價如何。

  其他課程

介紹完以上三個重點推薦的高品質(zhì)課程之外,下面按照加權(quán)平均的評分結(jié)果降序排列,推薦一些其他的大數(shù)據(jù)科學入門參考課程。

4. Python for Data Science and Machine Learning Bootcamp

講師:Jose Portilla

平臺:Udemy

詳情:https://www.udemy.com/python-for-data-science-and-machine-learning-bootcamp/ 

該課程基于 Python 語言,完整覆蓋了數(shù)據(jù)科學的整個處理過程。其主要特點是更偏重基于大數(shù)據(jù)處理的 Python 語言實現(xiàn),與下面將會提到的 Jose 的 R 語言課程一樣,本課程同時可以作為 Python 語言以及數(shù)據(jù)科學的入門教程。課程總時長 21.5 小時,通過計算 1644 名訂閱者的加權(quán)評分結(jié)果,該課程的得分高達 4.7 星級。同樣,與 Udemy 旗下其他的課程一樣,該課程的售價也變動頻繁,目前的售價是 15 美元。

5. Data Science and Machine Learning Bootcamp with R

講師:Jose Portilla

平臺:Udemy

詳情:https://www.udemy.com/data-science-and-machine-learning-bootcamp-with-r/ 

該課程基于 R 語言,同樣完整覆蓋了數(shù)據(jù)科學的整個處理過程。與上一個課程不同的是,本課程是基于 R 語言的,可同時作為 R 語言以及數(shù)據(jù)科學的入門教程。課程總時長 18 小時,通過計算 847 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 4.6 星級。目前該課程在 Udemy 的售價同樣是 15 美元。

數(shù)據(jù)科學入門難?老司機為你盤點 24 門精品課程

6. Data Science and Machine Learning with Python — Hands On!

講師:Frank Kane

平臺:Udemy

詳情:https://www.udemy.com/data-science-and-machine-learning-with-python-hands-on/ 

該課程基于 Python 語言,并未全部覆蓋數(shù)據(jù)科學的完整處理過程,而是更專注于統(tǒng)計和機器學習領(lǐng)域。課程總時長 9 小時,通過計算 3104 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 4.5 星級。目前的售價是 15 美元。

7. Introduction to Data Science

講師:Data Hawk Tech 數(shù)據(jù)科學咨詢公司

平臺:Udemy

詳情:https://www.udemy.com/learn-data-science/ 

該課程的時長很短,只有 3 個小時,因此雖然其覆蓋的范圍很全,但深度卻不足,同時也簡單覆蓋了 R 和 Python 語言。通過計算 62 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 4.4 星級。目前的售價是 10 美元。

8. Applied Data Science: An Introduction

講師:Syracuse University

平臺:CourseSites by Blackboard

詳情:https://www.class-central.com/mooc/1806/open-education-by-blackboard-applied-data-science-an-introduction 

該課程雖然完整覆蓋了數(shù)據(jù)科學的整個處理過程,但其覆蓋深度并不平均。它的講述重點放在基本的統(tǒng)計學原理和 R 語言的應用。整個課程的組織并不系統(tǒng),通過計算 6 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 4.33 星級。免費。

9. Introduction To Data Science

講師:Nina Zumel 和 John Mount

平臺:Udemy

詳情:https://www.udemy.com/introduction-to-data-science/ 

該課程基于 R 語言,僅覆蓋了部分數(shù)據(jù)科學的處理過程,在數(shù)據(jù)準備和建模方面有很好的講述深度。課程總時長 6 小時,通過計算 101 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 4.3 星級。目前的售價是 50 美元。

10. Applied Data Science with Python

講師:V2 Maestros 大數(shù)據(jù)公司

平臺:Udemy

詳情:https://www.udemy.com/applied-data-science-with-python/ 

該課程基于 Python 語言,完整覆蓋了數(shù)據(jù)科學的整個處理過程,并且對每個細分科目都有很好的覆蓋深度。課程總時長為 8.5 小時,通過計算 92 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 4.3 星級。目前的售價是 15 美元。

數(shù)據(jù)科學入門難?老司機為你盤點 24 門精品課程

11. Want to be a Data Scientist?

講師:V2 Maestros 大數(shù)據(jù)公司

平臺:Udemy

詳情:https://www.udemy.com/want-to-be-a-data-scientist/ 

該課程的時長很短,只有 3 個小時,因此雖然其覆蓋的范圍很全,但深度卻不足,簡單提到了幾個開源工具。通過計算 790 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 4.3 星級。免費。

12. Data to Insight: an Introduction to Data Analysis

講師:University of Auckland

平臺:FutureLearn

詳情:https://www.futurelearn.com/courses/data-to-insight?utm_campaign=Courses+feed&utm_medium=courses-feed&utm_source=courses-feed 

該課程的覆蓋范圍目前并不清楚,根據(jù)官方介紹,課程更專注于數(shù)據(jù)挖掘、發(fā)現(xiàn)和可視化。課程時長 24 小時(每周 3 小時,共 8 周),不提供點播。通過計算 2 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 4 星級。目前該課程可免費試聽,進階內(nèi)容需要付費 59 英鎊,可提供證書。

13. Data Science Orientation

講師:Microsoft

平臺:edX

詳情:https://www.edx.org/course/data-science-orientation-microsoft-dat101x-1 

該課程只部分覆蓋了數(shù)據(jù)科學的處理過程,并且缺少建模方面的內(nèi)容。由于是微軟提供的課程,因此大部分的數(shù)據(jù)處理工具都使用了 Excel。課程的時長為 12-24小時不等(每周 2-4 小時,共 6 周)。通過計算 40 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 3.95 星級。課程本身免費,但訂閱者可以選擇支付 25 美元獲取一個完課證書。

14. Data Science Essentials

講師:Microsoft

平臺:edX

詳情:https://www.edx.org/course/data-science-essentials-microsoft-dat203-1x-2 

該課程基于 R 、Python 和 Azure ML 等工具,完整覆蓋了數(shù)據(jù)科學的整個處理過程,并且對每個細分科目都有很好的覆蓋深度。時長為 18-24 小時不等(每周 3-4 小時,共 6 周)。通過計算 67 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 3.81 星級。課程本身免費,但訂閱者可以選擇支付 49 美元獲取一個完課證書。

數(shù)據(jù)科學入門難?老司機為你盤點 24 門精品課程

15. Applied Data Science with R

講師:V2 Maestros 大數(shù)據(jù)公司

平臺:Udemy

詳情:https://www.udemy.com/applied-data-science-with-r/ 

該課程是第 10 條推薦的 R 語言版,完整覆蓋了數(shù)據(jù)科學的整個處理過程,并且對每個細分科目都有很好的覆蓋深度。課程時長 11小時。通過計算 212 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 3.8 星級。目前的售價是 15 美元。

16. Intro to Data Science

講師:Dave Holtz 和 Cheng-Han Lee

平臺:Udacity

詳情:https://cn.udacity.com/course/intro-to-data-science--ud359/ 

該課程基于 Python,雖然只覆蓋了部分數(shù)據(jù)科學的處理過程,但對于每個課程范圍內(nèi)的知識點都做了詳細介紹。雖然 Udacity 具有業(yè)內(nèi)公認的一個非常棒的探索性數(shù)據(jù)分析(Exploratory Data Analysis,EDA)課程,但總體上本課程缺乏數(shù)據(jù)探索性方面的介紹。課程時長共 48 小時(每周 6 小時,8 周)。一些評論認為該課程缺乏高階內(nèi)容,并且組織混亂。通過計算 18 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 3.61 星級。免費。

17. Introduction to Data Science in Python

講師:University of Michigan

平臺:Coursera

詳情:https://www.coursera.org/learn/python-data-analysis/ 

該課程基于 Python,只覆蓋了部分數(shù)據(jù)科學的處理過程,而且沒有數(shù)據(jù)建模和可視化的相關(guān)內(nèi)容(更深入的內(nèi)容在密歇根大學開設的另一個名為“Applied Data Science with Python Specialization”的系列課程中,感興趣的同學可以在詳情頁面中詳細了解)。本課程時長為 4 周。通過計算 15 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 3.6 星級??擅赓M試聽,高階內(nèi)容需要付費。

數(shù)據(jù)科學入門難?老司機為你盤點 24 門精品課程

18. Data-driven Decision Making

講師:PwC

平臺:Coursera

詳情:https://www.coursera.org/learn/decision-making 

該課程基于 R、Python、Excel、SAS 和 Tableau 等工具,只覆蓋了部分數(shù)據(jù)科學的處理過程,缺乏建模的相關(guān)內(nèi)容,更注重業(yè)務實現(xiàn)。課程時長為 4 周。通過計算 2 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 3.5 星級??擅赓M試聽,高階內(nèi)容需要付費。

19. A Crash Course in Data Science

講師:Johns Hopkins University

平臺:Coursera

詳情:https://www.coursera.org/learn/data-science-course/ 

該課程是關(guān)于數(shù)據(jù)科學整個處理過程的完整概述,覆蓋了幾乎所有細分科目,但教授深度都不足。時長為 4-6 小時,大約需要 1 周完成。通過計算 19 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 3.4 星級。可免費試聽,高階內(nèi)容需要付費。

20. The Data Scientist’s Toolbox

講師:Johns Hopkins University

平臺:Coursera

詳情:https://www.coursera.org/learn/data-scientists-tools/  

該課程同樣覆蓋了數(shù)據(jù)科學的完整過程,但教授深度不足。更多的是作為霍普金斯大學“Data Science Specialization”課程的一個預熱班。官方介紹稱課程的時長為每周 1-4 小時,共需要 4 周,但有網(wǎng)友指出只需要兩個小時就能全部完成。通過計算 182 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 3.22 星級??擅赓M試聽,高階內(nèi)容需要付費。

21. Data Management and Visualization

講師:Wesleyan University

平臺:Coursera

詳情:https://www.coursera.org/learn/data-visualization/ 

該課程基于 Python 和 SAS 工具,只覆蓋了部分數(shù)據(jù)科學的處理過程,缺少建模方面的內(nèi)容,更注重實際應用。課程時長為 4 周,每周需要 4-5 小時。通過計算 6 名訂閱者的加權(quán)評分結(jié)果,該課程的得分為 2.67 星級??擅赓M試聽,高階內(nèi)容需要付費。

以下課程沒有評論數(shù)據(jù)可供參考,但也值得關(guān)注。

22. CS109 Data Science

平臺:Harvard University

詳情:http://cs109.github.io/2015/ 

該課程基于 Python,完整覆蓋了數(shù)據(jù)科學的整個處理過程,并且對每個細分科目都有很好的覆蓋深度(而且有些內(nèi)容對于“入門”這一主題可能會顯得太過深入)。該課程是哈佛大學的大數(shù)據(jù)公開課,完全免費,只是由于并非針對在線消費設計,因此課程導航設計可能不會太友好。整個課程的學習大約需要 12 周,所有視頻都是在哈佛大學的課堂上實錄的。值得一提的是,上文關(guān)于數(shù)據(jù)科學的概述圖表就是來自本課程。

數(shù)據(jù)科學入門難?老司機為你盤點 24 門精品課程

23. Introduction to Data Analytics for Business

講師:University of Colorado Boulder

平臺:Coursera

詳情:https://www.coursera.org/learn/data-analytics-business/ 

該課程只覆蓋了部分數(shù)據(jù)科學的處理過程,缺少數(shù)據(jù)建模和可視化的相關(guān)內(nèi)容,更注重業(yè)務實現(xiàn)。數(shù)據(jù)科學過程在該課程中被稱為“信息-行為的價值鏈”(Information-Action Value chain)。課程時長為 4 周,較深入的內(nèi)容都基于 SQL 實現(xiàn)??擅赓M試聽,高階內(nèi)容需要付費。

24. Introduction to Data Science

講師:Barton Poulson

平臺:lynda

詳情:https://www.lynda.com/Big-Data-tutorials/Introduction-Data-Science/420305-2.html 

該課程基于 R 語言和 Python,時長很短,只有 3 個小時,因此雖然其覆蓋的范圍很全,但深度卻不足??擅赓M試聽,高階內(nèi)容需要付費。

來源:class-central,雷鋒網(wǎng)編譯

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

數(shù)據(jù)科學入門難?老司機為你盤點 24 門精品課程

分享:
相關(guān)文章

編輯

歡迎交流,微信:whl123465
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說