0
本文作者: AI研習(xí)社 | 2020-07-31 14:51 |
為什么寫(xiě)這本書(shū) · · · · · ·
網(wǎng)絡(luò)爬蟲(chóng)其實(shí)很早就出現(xiàn)了,最開(kāi)始網(wǎng)絡(luò)爬蟲(chóng)主要應(yīng)用在各種搜索引擎中。在搜索引擎中,主要使用通用網(wǎng)絡(luò)爬蟲(chóng)對(duì)網(wǎng)頁(yè)進(jìn)行爬取及存儲(chǔ)。 隨著大數(shù)據(jù)時(shí)代的到來(lái),我們經(jīng)常需要在海量數(shù)據(jù)的互聯(lián)網(wǎng)環(huán)境中搜集一些特定的數(shù)據(jù)并對(duì)其進(jìn)行分析,我們可以使用網(wǎng)絡(luò)爬蟲(chóng)對(duì)這些特定的數(shù)據(jù)進(jìn)行爬取,并對(duì)一些無(wú)關(guān)的數(shù)據(jù)進(jìn)行過(guò)濾,將目標(biāo)數(shù)據(jù)篩選出來(lái)。對(duì)特定的數(shù)據(jù)進(jìn)行爬取的爬蟲(chóng),我們將其稱(chēng)為聚焦網(wǎng)絡(luò)爬蟲(chóng)。
在大數(shù)據(jù)時(shí)代,聚焦網(wǎng)絡(luò)爬蟲(chóng)的應(yīng)用需求越來(lái)越大。 目前在國(guó)內(nèi)Python網(wǎng)絡(luò)爬蟲(chóng)的書(shū)籍基本上都是從國(guó)外引進(jìn)翻譯的,國(guó)內(nèi)的本版書(shū)籍屈指可數(shù),故而我跟華章的副總編楊福川策劃了這本書(shū)。本書(shū)的撰寫(xiě)過(guò)程中各方面的參考資料非常少,因此完成本書(shū)所花費(fèi)的精力相對(duì)來(lái)說(shuō)是非常大的。
本書(shū)從系統(tǒng)化的視角,為那些想學(xué)習(xí)Python網(wǎng)絡(luò)爬蟲(chóng)或者正在研究Python網(wǎng)絡(luò)爬蟲(chóng)的朋友們提供了一個(gè)全面的參考,讓讀者可以系統(tǒng)地學(xué)習(xí)Python網(wǎng)絡(luò)爬蟲(chóng)的方方面面,在理解并掌握了本書(shū)的實(shí)例之后,能夠獨(dú)立編寫(xiě)出自己的Python網(wǎng)絡(luò)爬蟲(chóng)項(xiàng)目,并且能夠勝任Python網(wǎng)絡(luò)爬蟲(chóng)工程師相關(guān)崗位的工作。
同時(shí),本書(shū)的另一個(gè)目的是,希望可以給大數(shù)據(jù)或者數(shù)據(jù)挖掘方向的從業(yè)者一定的參考,以幫助這些讀者從海量的互聯(lián)網(wǎng)信息中爬取需要的數(shù)據(jù)。所謂巧婦難為無(wú)米之炊,有了這些數(shù)據(jù)之后,從事大數(shù)據(jù)或者數(shù)據(jù)挖掘方向工作的讀者就可以進(jìn)行后續(xù)的分析處理了。
本書(shū)是一本系統(tǒng)介紹Python網(wǎng)絡(luò)爬蟲(chóng)的書(shū)籍,全書(shū)注重實(shí)戰(zhàn),涵蓋網(wǎng)絡(luò)爬蟲(chóng)原理、如何手寫(xiě)Python網(wǎng)絡(luò)爬蟲(chóng)、如何使用Scrapy框架編寫(xiě)網(wǎng)絡(luò)爬蟲(chóng)項(xiàng)目等關(guān)于Python網(wǎng)絡(luò)爬蟲(chóng)的方方面面。
本書(shū)的主要特色如下: 系統(tǒng)講解Python網(wǎng)絡(luò)爬蟲(chóng)的編寫(xiě)方法,體系清晰。 結(jié)合實(shí)戰(zhàn),讓讀者能夠從零開(kāi)始掌握網(wǎng)絡(luò)爬蟲(chóng)的基本原理,學(xué)會(huì)編寫(xiě)Python網(wǎng)絡(luò)爬蟲(chóng)以及Scrapy爬蟲(chóng)項(xiàng)目,從而編寫(xiě)出通用爬蟲(chóng)及聚焦爬蟲(chóng),并掌握常見(jiàn)網(wǎng)站的爬蟲(chóng)反屏蔽手段。 有配套免費(fèi)視頻,對(duì)于書(shū)中的難點(diǎn),讀者可以直接觀看作者錄制的對(duì)應(yīng)視頻,加深理解。 擁有多個(gè)爬蟲(chóng)項(xiàng)目編寫(xiě)案例,比如博客類(lèi)爬蟲(chóng)項(xiàng)目案例、圖片類(lèi)爬蟲(chóng)項(xiàng)目案例、模擬登錄爬蟲(chóng)項(xiàng)目等。除此之外,還有很多不同種類(lèi)的爬蟲(chóng)案例,可以讓大家在理解這些案例之后學(xué)會(huì)各種類(lèi)型爬蟲(chóng)的編寫(xiě)方法。
總之,在理解本書(shū)內(nèi)容并掌握書(shū)中實(shí)例之后,讀者將能勝任Python網(wǎng)絡(luò)爬蟲(chóng)工程師方向的工作并學(xué)會(huì)各種類(lèi)型網(wǎng)絡(luò)爬蟲(chóng)項(xiàng)目的編寫(xiě)。此外,本書(shū)對(duì)于大數(shù)據(jù)或數(shù)據(jù)挖掘方向的從業(yè)者也非常有幫助,比如可以利用Python網(wǎng)絡(luò)爬蟲(chóng)輕松獲取所需的數(shù)據(jù)信息等。
本書(shū)面向的讀者
Python網(wǎng)絡(luò)爬蟲(chóng)初學(xué)者
網(wǎng)絡(luò)爬蟲(chóng)工程師
大數(shù)據(jù)及數(shù)據(jù)挖掘工程師
高校計(jì)算機(jī)專(zhuān)業(yè)的學(xué)生
其他對(duì)Python或網(wǎng)絡(luò)爬蟲(chóng)感興趣的人員
作者簡(jiǎn)介 · · · · · ·
重慶韜翔網(wǎng)絡(luò)科技有限公司董事長(zhǎng)兼CEO,51CTO、CSDN講師,《知道日?qǐng)?bào)》特約作者,國(guó)家工信部高級(jí)網(wǎng)絡(luò)營(yíng)銷(xiāo)師,蜻蜓FM獨(dú)家簽約主播。 多年IT技術(shù)實(shí)戰(zhàn)開(kāi)發(fā)經(jīng)驗(yàn),曾做過(guò)程序員,也做過(guò)技術(shù)總監(jiān),現(xiàn)在運(yùn)營(yíng)一家專(zhuān)注于中大型軟件開(kāi)發(fā)與IT技術(shù)服務(wù)的公司。 曾出品發(fā)行過(guò)多門(mén)IT類(lèi)課程,包括但不限于《Python系列實(shí)戰(zhàn)教程》、《Python GUI系列實(shí)戰(zhàn)教程》、《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)教程》、《Nginx運(yùn)維實(shí)戰(zhàn)教程》。
補(bǔ)充說(shuō)明 · · · · · ·
本站所有資源版權(quán)均屬于原作者所有,這里所提供資源均只能用于參考學(xué)習(xí)用,請(qǐng)勿直接商用。如需刪除,請(qǐng)聯(lián)系 kefu@yanxishe.com
AI 研習(xí)社已經(jīng)和阿里大文娛、曠視、搜狗搜索、小米等知名公司達(dá)成聯(lián)系,幫助大家更好地求職找工作,一鍵投遞簡(jiǎn)歷至 HR 后臺(tái),準(zhǔn)備了一些內(nèi)推渠道群。
歡迎大家添加研習(xí)社小學(xué)妹微信(aiyanxishe),小學(xué)妹拉你加入(備注求職)。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
相關(guān)文章:
資料 | 圖靈程序設(shè)計(jì)叢書(shū):深度學(xué)習(xí)入門(mén):基于Python的理論與實(shí)現(xiàn)
資料 | NLP漢語(yǔ)自然語(yǔ)言處理原理與實(shí)踐 作者鄭捷
資料 | 數(shù)字圖像處理與機(jī)器視覺(jué)Visual C++與Matlab實(shí)現(xiàn) 作者張錚
資料 | Python 機(jī)器學(xué)習(xí)基礎(chǔ)教程
資料 | O'Reilly精品圖書(shū)系列:算法精解 C 語(yǔ)言描述 (簡(jiǎn)體中文)
資料 | 白話深度學(xué)習(xí)與TensorFlow
資料 | 編寫(xiě)高質(zhì)量Python代碼的59個(gè)有效方法
資料 | JavaScript框架設(shè)計(jì) 第二版
資料 | 算法(第4版)【圖靈程序設(shè)計(jì)叢書(shū)】算法領(lǐng)域的經(jīng)典參考書(shū)
資料 |世界著名計(jì)算機(jī)教材精選:數(shù)據(jù)挖掘十大算法(中文版)
資料 | 樹(shù)莓派Python編程入門(mén)與實(shí)戰(zhàn)
資料 | 《人工智能編程范式:通用Lisp中的案例研究》1048頁(yè)P(yáng)DF免費(fèi)下載
資料 | Yann LeCun「人工智能發(fā)展的挑戰(zhàn)在于無(wú)監(jiān)督學(xué)習(xí)」原版演講PPT
資料 | 算法圖解:像小說(shuō)一樣有趣的算法入門(mén)書(shū)
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。