1
昨天與大家分享了最值得一讀的機器學習免費書籍。這次,雷鋒網(wǎng)再為大家呈上數(shù)據(jù)科學領(lǐng)域的相關(guān)圖書、教程。仍然是正版免費,仍然是英文原著,部分有漢語譯本。
本列表不分先后次序。
作者:John Hopcroft, Ravindran Kannan
未出版的教學筆記。正在學習數(shù)據(jù)科學理論課程的童鞋,這本書是一個不錯的補充。
作者:吳恩達, Jiquan Ngiam, Chuan Yu Foo, Yifan Mai, Caroline Suen
吳老師等斯坦福學者整理的教程, 講解無監(jiān)督特征學習和深度學習的主要概念,以及相關(guān)算法的實現(xiàn)和應(yīng)用。需要基礎(chǔ)機器學習知識。吳老師建議修完他的 Coursera 機器學習公開課再來讀這個。
地址:http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial
作者:Jake VanderPlas
書如其名,介紹用 Python 進行數(shù)據(jù)開發(fā)的主流工具庫,包括 IPython, NumPy, Pandas, Matplotlib, Scikit-Learn。 O'Reilly Media 出版。
地址:https://github.com/jakevdp/PythonDataScienceHandbook
作者:Kareem Alkaseer
這本以墻皮為封面的書,是理解機器學習和大數(shù)據(jù)基本概念的好去處,包含大量代碼示例。
地址:https://www.gitbook.com/book/kalkaseer/hands-on-ml-and-bigdata/details
作者:Allen B. Downey
針對 Python 開發(fā)者的概率論和統(tǒng)計學入門。這本書十分強調(diào)用于現(xiàn)實中數(shù)據(jù)集的簡單實用技巧。O'Reilly 的“Think X”系列,是幫助有編程基礎(chǔ)的開發(fā)者進行跨界學習的不錯資源,程序猿可多關(guān)注。該系列基本都有中文譯本,本書名為《統(tǒng)計思維》。
地址:http://greenteapress.com/thinkstats/
作者: Allen B. Downey
從計算方法角度對貝葉斯統(tǒng)計的入門介紹。同樣是 O'Reilly“Think X”系列(雷鋒網(wǎng)注:感謝下 O'Reilly 的分享精神),同樣對程序員友好:使用 Python 代碼而不是數(shù)學,使用 discrete approximations 而非 continuous mathematics。中文譯版名為《貝葉斯思維》 。
地址:http://greenteapress.com/wp/think-bayes/
作者:Stephen Boyd,Lieven Vandenberghe
如書名,對該領(lǐng)域做了比較全面的綜合介紹。至于如何高效地用算術(shù)方面解決這類問題,書中有許多細節(jié)。這本書是劍橋大學出版社出版,但在網(wǎng)上免費分享(好吧,劍橋中國史賣那么貴我就不吐槽了)。中文版《凸優(yōu)化》可在主流書商買到。
地址:http://stanford.edu/~boyd/cvxbook/
作者:Sean Luke
作者是教這門課的教授,這是他根據(jù)課程編寫的筆記,面向本科生、開發(fā)者、程序員、或其他需要打基礎(chǔ)的人。作者將這本書免費分享,雷鋒網(wǎng)獲知,他希望大家在其網(wǎng)站上填一份個人信息表格再下載。
地址:https://cs.gmu.edu/~sean/book/metaheuristics/
在上述書籍之外,倒還有幾本不錯的機器學習和統(tǒng)計領(lǐng)域的免費電子書。但雷鋒網(wǎng)此前盤點過的,本文不再重復(fù)。請參考此前文章:最近很火的《計算機科學的數(shù)學》是本什么樣的書?。
另外,更全面的機器學習外文書籍盤點,請看:機器學習漫游指南 最完整的入門書單(外文版)。
via paralleldots
相關(guān)文章:
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。