幫助中心 | 我的帳號 | 關於我們

Python網路爬蟲開發從入門到精通

  • 作者:編者:劉延林
  • 出版社:北京大學
  • ISBN:9787301309094
  • 出版日期:2019/12/01
  • 裝幀:平裝
  • 頁數:356
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書共分3篇,針對Python爬蟲初學者,從零開始,系統地講解了如何利用Python進行常見的網路爬蟲的程序開發。
    第1篇快速入門篇(第1章?第9章):本篇主要介紹了Python環境的搭建和一些Python的基礎語法知識等、Python爬蟲入門知識及基本的使用方法、Ajax數據的分析和抓取、動態渲染頁面數據的爬取、網站代理的設置與使用、驗證碼的識別與破解,以及App數據抓取、數據的存儲方法等內容。
    第2篇技能進階篇(第10章?第12章):本篇主要介紹了PySpider和Scrapy兩個常用爬蟲框架的基本使用方法、分散式爬蟲的實現思路,以及數據分析、數據清洗常用庫的使用方法。
    第3篇項目實戰篇(第13章):本篇通過6個綜合實戰項目,詳細地講解了Python數據爬蟲開始與實戰應用。本篇對全書內容進行了總結回顧,強化讀者的實操水平。
    本書案例豐富,注重實戰,既適合Python程序員和爬蟲愛好者閱讀學習,也適合作為廣大職業院校相關專業的教學用書。

作者介紹
編者:劉延林
    劉延林,雲鏡團隊創始人,擁有多年網路爬蟲開發經驗,著有《Python網路爬蟲開發從入門到精通》,擅長Python網路爬蟲、Web、數據挖掘與分析、網路安全、產品研發等領域。

目錄
第1篇  快速入門篇
  第1章  Python基礎
    1.1  Python環境搭建
    1.1.1  windows系統下的Python環境安裝與配置
    1.1.2  Linux系統下的Python環境安裝
    1.1.3  Mac OS X系統搭建Python 3
    1.1.4  IDE開發工具介紹
    1.2 Python編程入門
    1.2.1  第一個Python程序
    1.2.2  Python註釋
    1.2.3數據類型和變數
    1.2.4  字元串和編碼
    1.2.5  列表
    1.2.6  元組
    1.2.7  字典
    1.2.8  條件語句
    1.2.9  循環語句
    1.2.10  函數
    1.2.11  類
    1.3  新手實訓
    1.4  新手問答
    本章小結
  第2章  Python爬蟲入門
    2.1  爬蟲的分類
    2.1.1  通用網路爬蟲
    2.1.2  聚焦網路爬蟲
    2.1.3  增量式網路爬蟲
    2.1.4  深層網路爬蟲
    2.2  爬蟲的基本結構和工作流程
    2.3  爬蟲策略
    2.3.1  深度優先遍歷策略
    2.3.2  寬度優先遍歷策略
    2.3.3  大站優先策略
    2.3.4  最佳優先搜索策略
    2.4  HTTP的基本原理
    2.4.1  URI和URI介紹
    2.4.2  超文本
    2.4.3  HTTP和HTTPS
    2.4.4  HTTP的請求過程
    2.5  網頁基礎
    2.5.1  網頁的組成
    2.5.2  網頁的結構
    2.6  Session和Cookie
    2.6.1  Session和Cookie的基本原理
    2.6.2  Session和Cookie的區別
    2.63  常見誤區
    2.7  新手實訓
    2.8  新手問答
    本章小結
  第3章  基本庫的使用

    3.1  urllib
    3.1.1  urlopen()
    3.1.2  簡單抓取網頁
    3.1.3  設置請求超時
……
第2篇  技能進階篇
第3篇  項目實戰篇

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032