幫助中心 | 我的帳號 | 關於我們

Python網路爬蟲(電腦專業任務驅動應用型教材)

  • 作者:編者:耿興隆//胡鍾月//周祥|責編:薛華強
  • 出版社:電子工業
  • ISBN:9787121438103
  • 出版日期:2023/03/01
  • 裝幀:平裝
  • 頁數:212
人民幣:RMB 49 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書基於Python3.10,以項目教學的方式,循序漸進地介紹Python網路爬蟲的基本原理和具體應用的方法與技巧。
    全書分7個項目,具體內容包括:Python基礎認知、網路爬蟲基礎認知、Urllib請求模塊庫的應用、安裝Urllib3請求模塊庫併發送請求、Requests請求模塊庫的應用、解析網頁、Scrapy爬蟲框架等。
    本書實例豐富、內容翔實、操作方法簡單易學,不僅適合作為職業院校電腦與軟體工程相關專業的教材,也可作為從事數據分析相關工作的專業人士的參考用書。
    本書附有電子資料,內容為書中所有實例的源文件、相關資源及實例操作過程錄屏動畫,供讀者在學習中使用。

作者介紹
編者:耿興隆//胡鍾月//周祥|責編:薛華強

目錄
項目一  Python基礎認知
  任務一  Python概述
    一、Python簡介
    二、安裝Python
    三、安裝PyCharm
    四、Python語法規範
  任務二  Python命令的組成
    一、基本符號
    二、常量與變數
    三、數據類型
    四、功能符號
  任務三  程序結構
    一、表達式語句
    二、順序結構
    三、選擇結構
    四、循環結構
    五、條件表達式
    六、程序的流程式控制制
  項目實戰
    實戰  輸出百度網址
項目二  網路爬蟲基礎認知
  任務一  網路爬蟲概述
    一、網路爬蟲的基本原理
    二、網路爬蟲系統框架
    三、爬行策略
    四、網路爬蟲的分類
    五、開源網路爬蟲框架/項目
  任務二  HTTP
    一、HTTP  的工作原理
    二、Urllib  模塊庫
    三、URL  定義
    四、URL  編碼設置
  任務三  網頁請求過程
    一、發送請求報文
    二、返迴響應
    三、HTTP  消息
  項目實戰
    實戰一  搜索商品網址
    實戰二  搜索食品價格網址
項目三  Urllib  請求模塊庫的應用
  任務一  發送網頁請求
    一、基本HTTP  請求
    二、Request  網路請求
    三、設置請求頭
    四、Handler  方法發送請求
    五、設置代理IP
    六、身份驗證
  任務二  網頁下載
    一、網頁結構
    二、寫入網頁文件

    三、網頁文件下載
  項目實戰
    實戰一  下載Python學習網址
    實戰二  下載公司網頁HTML文件
項目四  安裝Urllib3請求模塊庫併發送請求
  任務一  安裝Urllib3請求模塊庫
    一、安裝Anaconda
    二、安裝Urllib3模塊庫
  任務二  發送請求
    一、創建代理對象
    二、請求方法
    三、定義請求頭
    四、設置代理IP
    五、自動重試
    六、重定向
  項目實戰
    實戰  發送請求訪問淘寶
項目五  Requests  請求模塊庫的應用
  任務一  網頁請求
    一、標準的HTTP  請求
    二、返迴響應消息
    三、JSON  格式數據
  任務二  發送請求方法
    一、發送GET  請求方法
    二、發送POST  請求方法
    三、其他請求方法
  任務三  複雜網路請求
    一、複雜請求頭
    二、上傳文件
    三、Cookies  驗證
    四、會話保持
  任務四  異常處理
    一、try-except語句
    二、Urllib異常處理模塊
    三、Urllib3異常處理模塊
    四、request異常處理模塊
  項目實戰
    實戰  爬取豆瓣最受歡迎的影評網址
項目六  解析網頁
  任務一  正則表達式解析網頁
    一、正則表達式模式
    二、使用re模塊實現正則表達式
    三、字元串查找
    四、字元串替換
    五、字元串分割
  任務二  XPath解析網頁
    一、XPath概述
    二、XPath網頁解析
    三、獲取節點信息
    四、節點關係

    五、查找節點信息
    六、屬性節點
    七、XPath運算符
    八、XML節點軸
  任務三  BeautifulSoup解析網頁
    一、安裝BeautifulSoup
    二、創建BeautifulSoup對象
    三、通過屬性獲取節點內容
    四、根據節點關係獲取節點
    五、查找節點內容
    六、通過CSS  選擇器查找節點內容
  項目實戰
    實戰一  獲取查詢網中河北省石家莊市的郵編區號
    實戰二  爬取銷售熱門圖書名稱
    實戰三  下載銷售熱門圖書的圖片
項目七  Scrapy  網路爬蟲框架
  任務一  Scrapy  網路爬蟲框架基礎認知
    一、Scrapy  網路爬蟲框架基礎
    二、Scrapy  常用命令
    三、創建Scrapy項目
  任務二  使用模板創建Spider文件
    一、創建網路爬蟲文件命令
    二、創建basic模板文件
    三、創建crawl模板文件
    四、創建csvfeed模板文件
    五、創建xmlfeed模板文件
  任務三  Scrapy網路爬蟲文件
    一、Spider類
    二、配置網路爬蟲
    三、啟動網路爬蟲
    四、提取數據
  項目實戰
    實戰  提取景區名稱

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032