幫助中心 | 我的帳號 | 關於我們

Python爬蟲開發與項目實戰

  • 作者:編者:范傳輝
  • 出版社:機械工業
  • ISBN:9787111563877
  • 出版日期:2017/06/01
  • 裝幀:平裝
  • 頁數:423
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    隨著大數據時代到來,網路信息量也變得更多更大,基於傳統搜索引擎的局限性,網路爬蟲應運而生。范傳輝編著的《Python爬蟲開發與項目實戰》從基本的爬蟲原理開始講解,通過介紹Pthvon編程語言和Web前端基礎知識引領讀者入門,之後介紹動態爬蟲原理以及Scrapy爬蟲框架,最後介紹大規模數據下分散式爬蟲的設計以及PySpider爬蟲框架等。
    本書主要特點:
    ·由淺入深,從Pvthon和Web前端基礎開始講起,逐步加深難度,層層遞進。
    ·內容詳實,從靜態網站到動態網站,從單機爬蟲到分散式爬蟲,既包含基礎知識點,又講解了關鍵問題和難點分析,方便讀者完成進階。
    ·實用性強,本書共有9個爬蟲項目,以系統的實戰項目為驅動,由淺及深地講解爬蟲開發中所需的知識和技能。
    ·難點詳析,對js加密的分析、反爬蟲措施的突破、去重方案的設計、分散式爬蟲的開發進行了細緻的講解。

作者介紹
編者:范傳輝
    范傳輝 資深網蟲,Python開發者,參與開發了多項網路應用,在實際開發中積累了豐富的實戰經驗,並善於總結,貢獻的多篇技術文章廣受好評。研究興趣包括網路安全、爬蟲技術、數據分析、驅動開發等技術。

目錄
前言
基礎篇
第1章 回顧Python編程
  1.1 安裝Python
    1.1.1 Windows上安裝Python
    1.1.2 Ubuntu上的Python
  1.2 搭建開發環境
    1.2.1 Eclipse+PyDev
    1.2.2 PyCharm
  1.3 IO編程
    1.3.1 文件讀寫
    1.3.2 操作文件和目錄
    1.3.3 序列化操作
  1.4 進程和線程
    1.4.1 多進程
    1.4.2 多線程
    1.4.3 協程
    1.4.4 分散式進程
  1.5 網路編程
    1.5.1 TCP編程
    1.5.2 UDP編程
  1.6 小結
第2章 Web前端基礎
  2.1 W3C標準
    2.1.1 HTML
    2.1.2 CSS
    2.1.3 JavaScript
    2.1.4 XPath
    2.1.5 JSON
  2.2 HTTP標準
    2.2.1 HTTP請求過程
    2.2.2 HTTP狀態碼含義
    2.2.3 HTTP頭部信息
    2.2.4 Cookie狀態管理
    2.2.5 HTTP請求方式
  2.3 小結
第3章 初識網路爬蟲
  3.1 網路爬蟲概述
    3.1.1 網路爬蟲及其應用
    3.1.2 網路爬蟲結構
……
第4章 HTML解析大法
第5章 數據存儲(無資料庫版)
第6章 實戰項目:基礎爬蟲
第7章 實戰項目:簡單分散式爬蟲
中級篇
第8章 數據存儲(資料庫版)
第9章 動態網站抓取
第10章 Web端協議分析
第11章 終端協議分析

第12章 初窺Scrapy爬蟲框架
第13章 深入Scrapy爬蟲框架
第14章 實戰項目:Scrapy爬蟲
深入篇
第15章 增量式爬蟲
第16章 分散式爬蟲與Scrapy
第17章 實戰項目:Scrapy分散式爬蟲
第18章 人性化PySpider爬蟲框架

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032