幫助中心 | 我的帳號 | 關於我們

社交網站的數據挖掘與分析(原書第3版)

  • 作者:(美)馬修·A.羅素//米哈伊爾·克拉森|責編:孫榕舒|譯者:蘇統華//郭勇//潘巍
  • 出版社:機械工業
  • ISBN:9787111674047
  • 出版日期:2021/02/01
  • 裝幀:平裝
  • 頁數:334
人民幣:RMB 119 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書指導你挖掘隱藏在Twitter、Facebook、Linkedln、Instagram和GitHub等流行社交網站上的豐富數據。通過這本暢銷指南,數據科學家、分析師和程序員將學習如何在Jupyter Notebook或者Docker容器中使用Python代碼分析社交媒體中的真知灼見——哪些人正在通過社交媒體進行聯繫?他們正在談論什麼?他們目前身在何處?
    在本書的第一部分,每一章都聚焦社交網站生態的某個具體方面,囊括了各大主流社交網站,也包括了網頁、博客和訂閱源、郵箱、GitHub以及新增加的Instagram的內容。第二部分提供了實用指南,其中包括超過20個供挖掘Twitter數據之用的簡短代碼解決方案。

作者介紹
(美)馬修·A.羅素//米哈伊爾·克拉森|責編:孫榕舒|譯者:蘇統華//郭勇//潘巍

目錄
前言
第一部分  社交網站導引
  序幕
  第1章  挖掘Twitter:探索熱門話題、發現人們的談論內容等
    1.1  概述
    1.2  Twitter風靡一時的原因
    1.3  探索Twitter API
      1.3.1  基本的Twitter術語
      1.3.2  創建一個Twitter API連接
      1.3.3  探索熱門話題
      1.3.4  搜索推文
    1.4  分析140字(或更多)的推文
      1.4.1  提取推文實體
      1.4.2  使用頻率分析技術分析推文和推文實體
      1.4.3  計算推文的辭彙豐富性
      1.4.4  檢視轉推模式
      1.4.5  使用直方圖將頻率數據可視化
    1.5  本章小結
    1.6  推薦練習
    1.7  在線資源
  第2章  挖掘Facebook:分析粉絲頁面、查看好友關係等
    2.1  概述
    2.2  探索Facebook的圖譜API
      2.2.1  理解圖譜API
      2.2.2  理解開放圖協議
    2.3  分析社交圖譜聯繫
      2.3.1  分析Facebook頁面
      2.3.2  使用pandas操作數據
    2.4  本章小結
    2.5  推薦練習
    2.6  在線資源
  第3章  挖掘Instagram:電腦視覺、神經網路、對象識別和人臉檢測
    3.1  概述
    3.2  探索Instagram API
      3.2.1  建立Instagram API請求
      3.2.2  獲取你自己的Instagram訂閱源
      3.2.3  通過主題標籤檢索媒體
    3.3  Instagram帖子的剖析
    3.4  人工神經網路速成
      3.4.1  訓練神經網路「看」圖片
      3.4.2  手寫數字識別
      3.4.3  使用預訓練的神經網路在照片中識別物體
    3.5  神經網路在Instagram帖子中的應用
      3.5.1  標記圖像內容
      3.5.2  在圖像中檢測人臉
    3.6  本章小結
    3.7  推薦練習
    3.8  在線資源
  第4章  挖掘LinkedIn:分組職位、聚類同行等
    4.1  概述

    4.2  探索LinkedIn API
      4.2.1  發起LinkedIn API請求
      4.2.2  下載LinkedIn的聯繫人並保存為CSV文件
    4.3  數據聚類速成
      4.3.1  對數據進行規範化處理以便進行分析
      4.3.2  測量相似度
      4.3.3  聚類演算法
    4.4  本章小結
    4.5  推薦練習
    4.6  在線資源
  第5章  挖掘文本文件:計算文檔相似度、提取搭配等
    5.1  概述
    5.2  文本文件
    5.3  TF-IDF簡介
      5.3.1  詞頻
      5.3.2  逆文檔頻率
      5.3.3  TF-IDF
    5.4  用TF-IDF查詢人類語言數據
      5.4.1  自然語言工具包概述
      5.4.2  對人類語言使用TF-IDF
      5.4.3  查找相似文檔
      5.4.4  分析人類語言中的二元文法
      5.4.5  分析人類語言數據的反思
    5.5  本章小結
    5.6  推薦練習
    5.7  在線資源
  第6章  挖掘網頁:使用自然語言處理理解人類語言、總結博客內容等
    6.1  概述
    6.2  抓取、解析和爬取網頁
    6.3  通過解碼語法來探索語義
      6.3.1  一步步講解自然語言處理
      6.3.2  人類語言數據中的句子檢測
      6.3.3  文檔摘要
    6.4  以實體為中心的分析:範式轉換
    6.5  人類語言數據處理分析的質量
    6.6  本章小結
    6.7  推薦練習
    6.8  在線資源
  第7章  挖掘郵箱:分析誰和誰說什麼以及說的頻率等
    7.1  概述
    7.2  獲取和處理郵件語料庫
      7.2.1  Unix郵箱指南
      7.2.2  獲得Enron數據
      7.2.3  將郵件語料轉換為Unix郵箱
      7.2.4  將Unix郵箱轉換為pandas DataFrame
    7.3  分析Enron語料庫
      7.3.1  根據日期/時間範圍查詢
      7.3.2  發件人/收件人通信的分析模式
      7.3.3  根據關鍵詞查找郵件
    7.4  分析你自己的郵件數據

      7.4.1  通過OAuth訪問你的Gmail
      7.4.2  獲取和解析郵件
      7.4.3  Immersion對電子郵件的可視化模式
    7.5  本章小結
    7.6  推薦練習
    7.7  在線資源
  第8章  挖掘GitHub:檢查軟體協同習慣、構建興趣圖譜等
    8.1  概述
    8.2  探索GitHub的API
      8.2.1  建立GitHub API連接
      8.2.2  建立GitHub API請求
    8.3  使用屬性圖為數據建模
    8.4  分析GitHub興趣圖譜
      8.4.1  初始化一個興趣圖譜
      8.4.2  計算圖的中心度度量
      8.4.3  為用戶添加「關注」邊來擴展興趣圖譜
      8.4.4  以節點為中心獲得更高效的查詢
      8.4.5  興趣圖譜的可視化
    8.5  本章小結
    8.6  推薦練習
    8.7  在線資源
第二部分  Twitter數據挖掘與分析實用指南
  第9章  Twitter數據挖掘與分析
    9.1  訪問Twitter的API(開發目的)
    9.2  使用OAuth訪問Twitter的API(產品目的)
    9.3  探索流行話題
    9.4  查找推文
    9.5  構造方便的函數調用
    9.6  使用文本文件存儲JSON數據
    9.7  使用MongoDB存儲和訪問JSON數據
    9.8  使用信息流API對Twitter數據管道抽樣
    9.9  採集時序數據
    9.10  提取推文實體
    9.11  在特定的推文範圍內查找最流行的推文
    9.12  在特定的推文範圍內查找最流行的推文實體
    9.13  對頻率分析製表
    9.14  查找轉推了狀態的用戶
    9.15  提取轉推的屬性
    9.16  創建健壯的Twitter請求
    9.17  獲取用戶檔案信息
    9.18  從任意的文本中提取推文實體
    9.19  獲得用戶的所有好友和關注者
    9.20  分析用戶的好友和關注者
    9.21  獲取用戶的推文
    9.22  爬取好友關係圖
    9.23  分析推文內容
    9.24  提取鏈接目標摘要
    9.25  分析用戶收藏的推文
    9.26  本章小結
    9.27  推薦練習

    9.28  在線資源
第三部分  附錄
  附錄A  關於本書虛擬機體驗的信息
  附錄B  OAuth入門
  附錄C  Python和Jupyter Notebook的使用技巧

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032