幫助中心 | 我的帳號 | 關於我們

實戰情報大數據

  • 作者:編者:鄧勁生//黃金鋒//黎珍|責編:白立軍
  • 出版社:清華大學
  • ISBN:9787302567080
  • 出版日期:2021/01/01
  • 裝幀:平裝
  • 頁數:260
人民幣:RMB 59.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    通過大數據手段搜集挖掘情報信息,已成為國際上專業情報領域的重要手段。本書選取網路輿論、社會事件、開源人物、用戶行為、科技動態、視頻圖像、公共衛生等多個具有代表性的情報大數據領域,圍繞大數據背景下情報的採集、存儲、管理和分析等方面,從技術實現途徑進行全方位詳解,以幫助讀者學習掌握在海量數據中提煉出高價值情報的方法。
    本書適合高等學校數據科學與大數據、電腦、軟體工程、人工智慧等本專科教學使用,也適合作為對情報大數據感興趣的研究生、工程師和研究人員的學習資料。

作者介紹
編者:鄧勁生//黃金鋒//黎珍|責編:白立軍

目錄
第1章  情報大數據概述
  1.1  大數據方法對情報的顛覆性影響
    1.1.1  大數據時代的情報新特點
    1.1.2  大數據時代情報工作新思維
    1.1.3  情報大數據的分析流程
  1.2  「稜鏡」計劃案例簡介
    1.2.1  數據基礎
    1.2.2  情報分析
    1.2.3  情報目標
  1.3  情報大數據平台常用框架
    1.3.1  數據源採集
    1.3.2  大數據預處理
    1.3.3  大數據存儲
    1.3.4  大數據分析與挖掘
    1.3.5  常見技術框架和工具
    1.3.6  學習階段建議
第2章  網路輿論情報大數據採集與分析
  2.1  總體設計
    2.1.1  需求分析
    2.1.2  技術選型
    2.1.3  框架軟體
    2.1.4  開發流程
  2.2  實戰環境搭建
    2.2.1  準備操作系統環境
    2.2.2  搭建Hadoop平台
    2.2.3  數據採集工具Flume
    2.2.4  數據倉庫Hive
    2.2.5  數據導入導出工具Sqoop
    2.2.6  配置資料庫MySQL
  2.3  業務開發
    2.3.1  數據採集與上傳至HDFS
    2.3.2  數據存儲在Hive
    2.3.3  Sqoop導出數據到MySQL
    2.3.4  數據導成表格
  2.4  可視化分析
    2.4.1  熱門關鍵詞詞雲
    2.4.2  熱門關鍵詞詞頻
第3章  社會事件情報關聯與可視化分析
  3.1  總體設計
    3.1.1  功能結構
    3.1.2  業務流程
    3.1.3  資料庫設計
    3.1.4  資料庫選型
  3.2  實戰環境搭建
    3.2.1  安裝ClickHouse
    3.2.2  配置ClickHouse
    3.2.3  創建ClickHouse庫表
    3.2.4  數據導入ClickHouse
  3.3  業務開發
    3.3.1  創建開源情報採集庫表

    3.3.2  定時更新Gdelt記錄
    3.3.3  下載gdeltv2文件
    3.3.4  數據導入ClickHouse
  3.4  可視化分析
    3.4.1  國家/地區交互網路構建
    3.4.2  西方媒體對中國的情感分析
    3.4.3  全球人物熱點分析
    3.4.4  全球組織關係熱點分析
    3.4.5  全球熱點主題分析
    3.4.6  抗議性事件情況分析
第4章  開源人物情報社會網路構建
  4.1  總體設計
    4.1.1  需求分析
    4.1.2  功能結構
    4.1.3  業務流程
    4.1.4  數據對象建模
    4.1.5  技術選型
  4.2  實戰環境搭建
    4.2.1  部署Neo4j
    4.2.2  安裝py2neo模塊
    4.2.3  安裝scrapy模塊
  4.3  業務開發
    4.3.1  使用scrapy模塊爬取開源人物情報數據
    4.3.2  使用SPARQL語句查詢人物
    4.3.3  爬取已定義的所有關係
    4.3.4  爬取人物實體信息及關係
    4.3.5  提取親屬信息
    4.3.6  通過工具導入批量數據
    4.3.7  利用py2neo模塊導入數據
  4.4  可視化分析
    4.4.1  通過人物屬性值查找節點
    4.4.2  通過人物屬性值查找相關聯的節點
    4.4.3  監測時任美國總統羅斯福的親屬關係
    4.4.4  查詢時任美國總統約翰·肯尼迪的校友關係
    4.4.5  分析往屆美國總統的死亡原因
第5章  用戶行為情報分析及個性化推薦
  5.1  總體設計
    5.1.1  需求分析
    5.1.2  技術選型
    5.1.3  技術分析
    5.1.4  開發流程
  5.2  實戰環境搭建
    5.2.1  搭建Scala環境
    5.2.2  搭建Spark平台
    5.2.3  安裝Maven
    5.2.4  搭建IDEA集成開發工具
  5.3  業務開發
    5.3.1  用戶視頻行為數據集
    5.3.2  個性化視頻推薦
    5.3.3  個性化推薦結果分析

  5.4  可視化分析
    5.4.1  觀影人員評價總體分析
    5.4.2  觀影人員年齡段分佈
    5.4.3  觀影人員職業分佈
    5.4.4  視頻類型標籤分析
第6章  科技動態情報大數據搜索優化
  6.1  總體設計
    6.1.1  需求分析
    6.1.2  技術選型
    6.1.3  資料庫設計
  6.2  實戰環境搭建
    6.2.1  搭建Elasticsearch環境
    6.2.2  Elasticsearch集成中文分詞器
    6.2.3  Elasticsearch集成拼音分詞器
    6.2.4  搭建SpringBoot應用框架
    6.2.5  SpringBoot集成MySQL資料庫
    6.2.6  SpringBoot集成Elasticsearch搜索引擎
  6.3  業務開發
    6.3.1  科技新聞爬蟲模塊
    6.3.2  搜索引擎實現
    6.3.3  Elasticsearch搜索優化
  6.4  日誌可視化
    6.4.1  搭建Kibana環境
    6.4.2  搭建Logstash環境
    6.4.3  日誌可視化分析
  6.5  可視化分析
    6.5.1  靜態資源準備
    6.5.2  後台管理頁集成
    6.5.3  新聞列表頁集成
    6.5.4  靜態頁面優化
第7章  視頻圖像情報深度學習車牌識別
  7.1  總體設計
    7.1.1  需求分析
    7.1.2  技術分析
    7.1.3  開發流程
  7.2  實戰環境搭建
    7.2.1  人工神經網路庫Keras
    7.2.2  數值計算擴展NumPy
    7.2.3  Python庫Theano
    7.2.4  安裝Sklearn
    7.2.5  安裝OpenCV
  7.3  業務開發
    7.3.1  卷積神經網路
    7.3.2  車牌定位與截取
    7.3.3  車牌號碼識別
第8章  公共衛生情報可視化態勢展示
  8.1  總體設計
    8.1.1  技術選型
    8.1.2  技術分析
    8.1.3  資料庫設計

  8.2  實戰環境搭建
    8.2.1  搭建Zookeeper環境
    8.2.2  搭建Kafka環境
    8.2.3  搭建Elasticsearch+MySQL環境
    8.2.4  後端框架搭建
  8.3  業務開發
    8.3.1  請求疫情介面數據
    8.3.2  發布數據到Kafka
    8.3.3  整合MySQL和Elasticsearch
    8.3.4  數據持久化
  8.4  可視化分析
    8.4.1  印度疫情發展趨勢折線圖
    8.4.2  印度疫情發展趨勢柱狀圖
    8.4.3  歐洲疫情南丁格爾玫瑰圖
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032