幫助中心 | 我的帳號 | 關於我們

Python自然語言處理入門與實戰(大數據技術精品系列教材)

  • 作者:編者:戴程//張良均|責編:趙亮
  • 出版社:人民郵電
  • ISBN:9787115592781
  • 出版日期:2022/10/01
  • 裝幀:平裝
  • 頁數:214
人民幣:RMB 59.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書以自然語言處理常用技術與真實案例相結合的方式,深入淺出地介紹自然語言處理中的關鍵內容。全書共8章,內容包括導論、文本數據爬取、文本基礎處理、文本進階處理、天問一號事件中的網民評論情感分析、新聞文本分類、基於瀏覽記錄的個性化新聞推薦,以及基於TipDM大數據挖掘建模平台實現新聞文本分類。本書各章均包含課後習題,其中前4章為選擇題,后4章為操作題,可幫助讀者通過練習和操作實踐,鞏固所學的內容。
    本書可作為高校數據科學、人工智慧和新聞傳播相關專業的教材,也可作為自然語言處理愛好者的自學用書。

作者介紹
編者:戴程//張良均|責編:趙亮

目錄
第1章  導論
  1.1  自然語言處理概述
    1.1.1  發展歷程
    1.1.2  研究任務
    1.1.3  自然語言處理與新聞傳媒
  1.2  自然語言處理工具
    1.2.1  常見的自然語言處理工具
    1.2.2  Python與自然語言處理
  1.3  NLP的開發環境
    1.3.1  Anaconda安裝
    1.3.2  Anaconda應用介紹
  小結
  課後習題
第2章  文本數據爬取
  2.1  HTTP通信基礎
    2.1.1  熟悉HTTP請求方法與過程
    2.1.2  熟悉常見HTTP狀態碼
    2.1.3  熟悉HTTP頭部信息
    2.1.4  熟悉Cookie
  2.2  靜態網頁爬取
    2.2.1  實現HTTP請求
    2.2.2  網頁解析
    2.2.3  數據存儲
  2.3  動態網頁爬取
    2.3.1  逆向分析爬取
    2.3.2  使用Selenium庫爬取
  小結
  課後習題
第3章  文本基礎處理
  3.1  語料庫
    3.1.1  語料庫概述
    3.1.2  語料庫種類與原則
    3.1.3  NLTK庫
    3.1.4  語料庫的獲取
    3.1.5  語料庫的構建與應用
  3.2  分詞與詞性標注
    3.2.1  中文分詞簡介
    3.2.2  基於規則的分詞
    3.2.3  基於統計的分詞
    3.2.4  中文分詞工具jieba庫
    3.2.5  詞性標注簡介
    3.2.6  詞性標注規範
    3.2.7  jieba詞性標注
  3.3  命名實體識別
    3.3.1  命名實體識別簡介
    3.3.2  CRF模型
    3.3.3  命名實體識別流程
  3.4  關鍵詞提取
    3.4.1  關鍵詞提取技術簡介
    3.4.2  關鍵詞提取演算法

    3.4.3  自動提取文本關鍵詞
  小結
  課後習題
第4章  文本進階處理
  4.1  文本向量化
    4.1.1  文本向量化簡介
    4.1.2  文本離散表示
    4.1.3  分散式表示
    4.1.4  Word2Vec詞向量的訓練
  4.2  文本相似度計算
    4.2.1  文本相似度的定義
    4.2.2  文本的表示
    4.2.3  常用文本相似度演算法
  4.3  文本分類與聚類
    4.3.1  文本挖掘簡介
    4.3.2  文本分類常用演算法
    4.3.3  文本聚類常用演算法
    4.3.4  文本分類與聚類的步驟
    4.3.5  新聞文本分類
    4.3.6  新聞文本聚類
  小結
  課後習題
第5章  天問一號事件中的網民評論情感分析
  5.1  業務背景與項目目標
    5.1.1  業務背景
    5.1.2  數據說明
    5.1.3  分析目標
  5.2  分析方法與過程
    5.2.1  數據探索
    5.2.2  文本預處理
    5.2.3  繪製詞雲圖
    5.2.4  使用樸素貝葉斯構建情感分類模型
    5.2.5  模型評估
    5.2.6  模型優化
  小結
  課後習題
第6章  新聞文本分類
  6.1  業務背景與項目目標
    6.1.1  業務背景
    6.1.2  數據說明
    6.1.3  分析目標
  6.2  分析方法與過程
    6.2.1  數據採集
    6.2.2  數據探索
    6.2.3  文本預處理
    6.2.4  SVM模型構建
    6.2.5  模型評價
  小結
  課後習題
第7章  基於瀏覽記錄的個性化新聞推薦

  7.1  業務背景與項目目標
    7.1.1  業務背景
    7.1.2  數據說明
    7.1.3  分析目標
  7.2  分析方法與過程
    7.2.1  數據探索
    7.2.2  數據預處理
    7.2.3  模型構建
    7.2.4  模型評估
  小結
  課後習題
第8章  基於TipDM大數據挖掘建模平台實現新聞文本分類
  8.1  平台簡介
    8.1.1  實訓庫
    8.1.2  數據連接
    8.1.3  實訓數據
    8.1.4  我的實訓
    8.1.5  系統演算法
    8.1.6  個人演算法
  8.2  實現新聞文本分類
    8.2.1  數據源配置
    8.2.2  文本預處理
    8.2.3  構建、訓練並評價支持向量機模型
  小結
  課後習題

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032