幫助中心 | 我的帳號 | 關於我們

Python爬蟲案例實戰(微課視頻版高等學校大數據專業系列教材)

  • 作者:編者:呂雲翔//韓延剛//張揚|責編:陳景輝//李燕
  • 出版社:清華大學
  • ISBN:9787302633778
  • 出版日期:2023/07/01
  • 裝幀:平裝
  • 頁數:237
人民幣:RMB 59.9 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書主要介紹Python爬蟲編寫的基礎知識,以及對爬蟲數據的存儲、深入處理和分析。全書分為四部分:第一部分為爬蟲基礎篇,第二部分為實戰基礎篇(9個案例),第三部分為框架應用篇(5個案例),第四部分為爬蟲應用場景及數據處理篇(6個案例)。
    本書由淺入深地介紹爬蟲常用的方法和工具,以及對爬蟲數據處理的應用和實現。但需要注意的是,爬蟲的技術棧不僅包含這幾部分,而且在實際工作中的細分方法也不盡相同。本書只是對目前爬蟲技術中最為常用的一些知識點用案例的形式進行了分類和講解,而更多的應用也值得讀者在掌握一定的基礎技能後進一步探索。
    本書適合Python語言初學者、網路爬蟲技術愛好者、數據分析從業人士以及高等學校電腦科學、軟體工程等相關專業的師生閱讀。

作者介紹
編者:呂雲翔//韓延剛//張揚|責編:陳景輝//李燕

目錄
第一部分  爬蟲基礎篇  
  第1章  Python網路爬蟲基礎
    1.1  HTTP、HTML與JavaScript
      1.1.1  HTTP
      1.1.2  HTML
      1.1.3  JavaScript
    1.2  Requests的使用
      1.2.1  Requests簡介
      1.2.2  使用Requests編寫爬蟲程序
    1.3  常見的網頁解析工具
      1.3.1  BeautifulSoup
      1.3.2  XPath與lxml
    1.4  Scrapy框架與Selenium
      1.4.1  爬蟲框架:Scrapy
      1.4.2  模擬瀏覽器:Selenium
    1.5  本章小結
第二部分  實戰基礎篇
  第2章  爬取某遊戲Top100選手信息
    2.1  JavaScript對象與JSON
    2.2  爬取方案分析
      2.2.1  方案一
      2.2.2  方案二
    2.3  本章小結
  第3章  爬取豆瓣電影簡介
    3.1  確定信息源
    3.2  獲取網頁信息
    3.3  解析信息內容
    3.4  批量爬取網頁信息
    3.5  本章小結
  第4章  爬取源代碼練習評測結果
    4.1  網站分析
    4.2  編寫爬蟲
    4.3  運行並查看結果
    4.4  本章小結
  第5章  爬取網路中的小說和購物評論
    5.1  下載網路小說
      5.1.1  分析網頁
      5.1.2  編寫爬蟲
      5.1.3  運行並查看TXT文件
    5.2  下載購物評論
      5.2.1  查看網路數據
      5.2.2  編寫爬蟲
      5.2.3  數據下載結果與爬蟲分析
    5.3  本章小結
  第6章  爬取新浪財經股票資訊
    6.1  編寫爬蟲
    6.2  運行並查看結果
    6.3  展示網頁
    6.4  本章小結
  第7章  爬取豆瓣電影海報

    7.1  豆瓣網站分析與爬蟲設計
      7.1.1  從需求出發
      7.1.2  處理登錄問題
    7.2  編寫爬蟲
      7.2.1  爬蟲腳本
      7.2.2  程序分析
    7.3  運行並查看結果
    7.4  本章小結
  第8章  爬取免費IP代理項目
    8.1  代理伺服器的分類
    8.2  網站分析
    8.3  編寫爬蟲
    8.4  運行並查看結果
    8.5  本章小結
  第9章  爬取微信群聊成員信息
    9.1  用Selenium爬取Web端微信信息
    9.2  基於Python的微信API工具
    9.3  爬蟲的部署和管理
      9.3.1  配置遠程主機
      9.3.2  編寫本地爬蟲
      9.3.3  部署爬蟲
      9.3.4  查看運行結果
      9.3.5  使用爬蟲管理框架
    9.4  本章小結
  第10章  爬取網易跟帖
    10.1  網頁自動化工具的簡介
    10.2  分析網頁
    10.3  編寫爬蟲
    10.4  運行並通過MongoDB查看數據
    10.5  本章小結
第三部分  框架應用篇
  第11章  爬取機場航班信息
    11.1  分析網頁
    11.2  編寫爬蟲
    11.3  爬蟲的使用說明
    11.4  本章小結
  第12章  爬取拼多多商品的評論數據
    12.1  分析網頁
    12.2  環境搭建
    12.3  編寫爬蟲
    12.4  運行並查看資料庫MongoDB
    12.5  本章小結
  第13章  使用爬蟲框架Gain和PySpider
    13.1  Gain框架
    13.2  使用Gain做簡單爬取
    13.3  PySpider框架
    13.4  使用PySpider進行爬取
    13.5  本章小結
  第14章  爬取新浪新聞並通過客戶端展示
    14.1  項目分析

    14.2  創建資料庫
    14.3  設置頁面下載器
    14.4  生產者-消費者模型
    14.5  客戶端界面設計
    14.6  本章小結
  第15章  爬取某機場航班出發時間數據
    15.1  程序設計
      15.1.1  分析網頁
      15.1.2  將數據保存到資料庫
    15.2  編寫爬蟲
      15.2.1  前置準備
      15.2.2  代碼編寫
      15.2.3  運行並查看資料庫中的結果
    15.3  本章小結
第四部分  爬蟲應用場景及數據處理篇
  第16章  用爬蟲和Flask搭建新聞介面服務
    16.1  編寫爬蟲
      16.1.1  爬取數據源網頁
      16.1.2  搭建Flask服務
      16.1.3  程序代碼詳情
    16.2  本章小結
  第17章  網易雲音樂評論內容的爬取與分析
    17.1  jieba庫
    17.2  WordCloud庫
    17.3  網頁分析
    17.4  編寫爬蟲
    17.5  運行結果
    17.6  本章小結
  第18章  爬取二手房數據並繪製熱力圖
    18.1  數據爬取
      18.1.1  分析網頁
      18.1.2  地址轉換成經緯度
      18.1.3  編寫爬蟲
      18.1.4  數據下載結果
    18.2  繪製熱力圖
    18.3  本章小結
  第19章  用爬蟲數據搭建附近二手房價格搜索引擎
    19.1  編寫爬蟲
      19.1.1  準備數據
      19.1.2  安裝以及使用ES
      19.1.3  實現房價地理位置坐標搜索的搜索引擎
    19.2  本章小結
  第20章  爬取豆瓣電影影評並簡單分析數據
    20.1  需求分析與爬蟲設計
      20.1.1  網頁分析
      20.1.2  函數設計
    20.2  編寫爬蟲
      20.2.1  編寫程序
      20.2.2  可能的改進
    20.3  本章小結

  第21章  爬取用戶影評數據並通過推薦演算法推薦電影
    21.1  明確目標與數據準備
      21.1.1  明確目標
      21.1.2  數據採集與處理
      21.1.3  工具選擇
    21.2  初步分析
      21.2.1  用戶角度分析
      21.2.2  電影角度分析
    21.3  用推薦演算法實現電影推薦
    21.4  本章小結
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032