幫助中心 | 我的帳號 | 關於我們

文本信息處理與應用(普通高等教育數據科學與大數據技術專業教材)

  • 作者:編者:何黎松//姚香秀|責編:鞠向超
  • 出版社:中國水利水電
  • ISBN:9787522637617
  • 出版日期:2025/11/01
  • 裝幀:平裝
  • 頁數:224
人民幣:RMB 48 元      售價:
放入購物車
加入收藏夾

內容大鋼
    在人工智慧和大數據時代,文字信息的分析與處理已成為關鍵技能。本書主要針對本科階段的文本信息處理與應用課程的教學進行編寫,內容偏基礎,強調實踐應用。本書主要內容包括概論、文本預處理、中文分詞與可視化、關鍵詞提取、文本向量化、文本聚類、主題模型、文本分類、情感分析、詞網路分析、綜合案例分析和前沿介紹。
    本書可作為自然語言處理課程的前置課程,適用於數據科學相關專業的高年級本科生使用。閱讀和使用本書需要已經學過概率論、統計學、機器學習和 Python 編程課程。

作者介紹
編者:何黎松//姚香秀|責編:鞠向超

目錄
前言
第1章  概論
  本章導讀
  本章要點
  1.1  文本信息處理與應用概述
    1.1.1  文本信息簡介
    1.1.2  文本信息處理與應用的概念
    1.1.3  文本信息處理與應用的發展歷史
    1.1.4  文本信息處理與應用的學科關係
  1.2  文本信息分析的應用場景
    1.2.1  政府工作中的文本信息分析
    1.2.2  教育工作中的文本信息分析
    1.2.3  新文科中的文本信息分析
    1.2.4  社交媒體中的文本信息分析
  1.3  Python在文本信息處理中的優勢與庫
    1.3.1  Python文本信息處理的優勢
    1.3.2  常用的Python文本信息處理庫
  本章小結
  本章習題
第2章  文本預處理
  本章導讀
  本章要點
  2.1  讀取文本數據
    2.1.1  從本地文件讀取文本數據
    2.1.2  從網路獲取文本數據
  2.2  正則表達式
    2.2.1  元字元
    2.2.2  正則表達式函數
  2.3  文本清洗
    2.3.1  去除雜訊和無關信息
    2.3.2  標準化文本
    2.3.3  文本去重
  2.4  文本分割與合併
    2.4.1  文本分割
    2.4.2  文本合併
  2.5  文本預處理綜合案例
    2.5.1  「十四五」規劃分篇
    2.5.2  《倚天屠龍記》文本預處理
  本章小結
  本章習題
第3章  中文分詞與可視化
  本章導讀
  本章要點
  3.1  分詞方法
    3.1.1  基於規則的分詞方法
    3.1.2  基於統計的分詞方法
    3.1.3  基於深度學習的分詞方法
  3.2  常見分詞庫
    3.2.1  jieba庫
    3.2.2  NLTK庫

    3.2.3  HanLP庫
  3.3  文本可視化技術
    3.3.1  詞雲圖
    3.3.2  詞頻柱形圖
  本章小結
  本章習題
第4章  關鍵詞提取
  本章導讀
  本章要點
  4.1  關鍵詞提取技術概述
  4.2  基於統計的關鍵詞提取演算法
    4.2.1  基於統計的關鍵詞提取演算法概述
    4.2.2  TF-IDF演算法基本原理
    4.2.3  TF-IDF演算法的Python實踐
  4.3  基於圖模型的關鍵詞提取演算法
    4.3.1  基於圖模型的關鍵詞提取演算法概述
    4.3.2  PageRank演算法
    4.3.3  TextRank演算法
    4.3.4  TextRank演算法的Python實踐
  本章小結
  本章習題
第5章  文本向量化
  本章導讀
  本章要點
  5.1  文本向量化簡介
  5.2  文本向量化的發展歷史
  5.3  Word2Vec
    5.3.1  Word2Vec的基本原理
    5.3.2  Word2Vec的兩種訓練模型
    5.3.3  使用Word2Vec實現文本相似度計算
  5.4  Doc2Vec
    5.4.1  Doc2Vec的基本原理
    5.4.2  Doc2Vec的兩種訓練模型
    5.4.3  使用Doc2Vec實現文本相似度計算
  本章小結
  本章習題
第6章  文本聚類
  本章導讀
  本章要點
  6.1  文本聚類介紹
    6.1.1  文本聚類的定義
    6.1.2  文本聚類的發展歷史
    6.1.3  文本聚類的應用場景
    6.1.4  文本聚類的流程
  6.2  聚類演算法介紹
    6.2.1  K-means聚類演算法
    6.2.2  高斯混合聚類演算法
    6.2.3  層次聚類演算法
    6.2.4  DBSCAN演算法
  6.3  聚類類別數判斷

    6.3.1  肘部法則
    6.3.2  輪廓係數
    6.3.3  Davies-Bouldin指數
  6.4  文本聚類的Python實踐
  本章小結
  本章習題
第7章  主題模型
  本章導讀
  本章要點
  7.1  主題模型介紹
    7.1.1  主題模型的發展歷史
    7.1.2  主題模型的應用場景
    7.1.3  主題模型的建模流程
  7.2  LDA主題模型
    7.2.1  LDA的基本原理
    7.2.2  LDA參數的估計方法
    7.2.3  LDA主題數的確定
    7.2.4  LDA模型的優缺點
    7.2.5  LDA主題模型的Python實踐
  7.3  DTM模型
    7.3.1  DTM模型的介紹
    7.3.2  DTM模型的優缺點
    7.3.3  DTM模型的Python實踐
  本章小結
  本章習題
第8章  文本分類
  本章導讀
  本章要點
  8.1  文本分類介紹
    8.1.1  文本分類的定義
    8.1.2  文本分類的發展歷史
    8.1.3  文本分類的應用場景
    8.1.4  文本分類的流程
  8.2  基於機器學習演算法的文本分類
    8.2.1  機器學習演算法
    8.2.2  集成學習演算法
    8.2.3  基於機器學習演算法的文本分類的Python實踐
  8.3  基於深度學習的文本分類
    8.3.1  循環神經網路分類器
    8.3.2  基於深度學習的文本分類的Python實踐
  本章小結
  本章習題
第9章  情感分析
  本章導讀
  本章要點
  9.1  情感分析介紹
    9.1.1  情感分析的發展歷史
    9.1.2  情感分析的應用場景
    9.1.3  情感分析的方法
  9.2  基於情感詞典的情感分析

    9.2.1  基於情感詞典的情感分析方法步驟
    9.2.2  情感詞典
    9.2.3  基於情感詞典的情感分析的優缺點
    9.2.4  基於情感詞典的情感分析的Python實踐
  9.3  基於機器學習的情感分析
    9.3.1  基於機器學習的情感分析的定義
    9.3.2  基於機器學習的情感分析的流程
    9.3.3  基於機器學習的情感分析的Python實踐
  9.4  基於Python庫的情感分析
    9.4.1  可用於情感分析的Python庫
    9.4.2  基於Python庫進行情感分析的分析實踐
  本章小結
  本章習題
第10章  詞網路分析
  本章導讀
  本章要點
  10.1  詞網路分析介紹
    10.1.1  詞網路分析的定義
    10.1.2  詞網路分析的發展歷史
    10.1.3  詞網路分析的應用場景
    10.1.4  詞網路分析的方法
  10.2  詞網路構建
    10.2.1  詞共現網路構建的方法
    10.2.2  詞共現網路構建的Python實踐
  10.3  詞網路描述分析
    10.3.1  詞網路描述分析指標介紹
    10.3.2  詞網路描述分析的Python實踐
  10.4  詞網路社群發現
    10.4.1  社群發現演算法
    10.4.2  詞網路社群發現的Python實踐
  本章小結
  本章習題
第11章  A型汽車消費者評論數據分析
  本章導讀
  本章要點
  11.1  案例背景
  11.2  數據說明
  11.3  情感分析
  11.4  詞雲圖分析
  本章小結
  本章習題
第12章  子女教育問題文本信息分析
  本章導讀
  本章要點
  12.1  案例背景
  12.2  數據說明
  12.3  情感分析
  12.4  主題模型
  本章小結
  本章習題

第13章  基於密度聚類的公眾留言熱點話題研究
  本章導讀
  本章要點
  13.1  案例背景
  13.2  數據說明
  13.3  數據整理
    13.3.1  文本分詞
    13.3.2  文本向量化
  13.4  基於密度聚類的熱點話題研究
  本章小結
  本章習題
第14章  前沿介紹
  本章導讀
  本章要點
  14.1  前沿概覽
  14.2  大語言模型
    14.2.1  大語言模型介紹
    14.2.2  大語言模型技術要點
    14.2.3  生成式人工智慧
  14.3  大語言模型實踐
    14.3.1  大語言模型部署方法
    14.3.2  提示詞工程
    14.3.3  大語言模型實踐案例
  本章小結
  本章習題
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032