幫助中心 | 我的帳號 | 關於我們

文本挖掘與信息檢索概論/大數據與人工智慧技術叢書

  • 作者:編者:蔡曉妍//楊黎斌//程塨//姚西文//姚超等|責編:付弘宇//薛陽
  • 出版社:清華大學
  • ISBN:9787302597445
  • 出版日期:2022/10/01
  • 裝幀:平裝
  • 頁數:180
人民幣:RMB 49 元      售價:
放入購物車
加入收藏夾

內容大鋼
    文本挖掘與信息檢索是近年來人工智慧領域的熱點研究方向。本書共分8章,包括信息檢索概述、信息檢索模型、信息檢索的評價、文本分類技術、文本聚類技術、自動摘要技術、文本推薦技術和網頁鏈接分析,融合了統計學、機器學習、資料庫等知識,具有多學科交叉的特點。
    本書內容全面,案例豐富,適合作為人工智慧、數據科學、電腦、軟體工程等信息技術相關專業的本科生和研究生教材,也可作為企事業單位、政府部門和研究機構的文本挖掘、信息檢索相關方向研究人員的參考資料。

作者介紹
編者:蔡曉妍//楊黎斌//程塨//姚西文//姚超等|責編:付弘宇//薛陽

目錄
第1章  信息檢索概述
  1.1  數據、信息和知識
    1.1.1  從數據到信息
    1.1.2  從信息到知識
  1.2  信息檢索的定義
  1.3  信息檢索的發展
    1.3.1  信息檢索的發展歷史
    1.3.2  信息檢索的主要方法
    1.3.3  信息檢索的應用
    1.3.4  信息檢索的發展趨勢
  習題
第2章  信息檢索模型
  2.1  概述
  2.2  向量空間檢索模型
    2.2.1  內積
    2.2.2  相似度計算
  2.3  概率檢索模型
    2.3.1  概率論基礎知識
    2.3.2  詞項權重
    2.3.3  二值獨立模型
    2.3.4  非二值獨立模型
  2.4  基於語言建模的信息檢索模型
    2.4.1  龐特模型
    2.4.2  零概率問題以及解決方法
    2.4.3  語言模型檢索框架
    2.4.4  跨語言檢索模型
  習題
第3章  信息檢索的評價
  3.1  信息檢索的評價指標
    3.1.1  查全率
    3.1.2  ?准率
    3.1.3  查准率與查全率的關係
    3.1.4  漏檢率和誤檢率
    3.1.5  響應時間
  3.2  信息檢索系統的評價
  習題
第4章  文本分類技術
  4.1  概述
    4.1.1  基本概念
    4.1.2  文本自動分類的兩種類型
    4.1.3  文本分類模式
    4.1.4  文本分類過程
  4.2  文本預處理
    4.2.1  分詞技術
    4.2.2  停用詞去除
    4.2.3  文本特徵選擇方法
    4.2.4  文本表示方法
  4.3  相似度度量方法
  4.4  常用分類演算法分析
    4.4.1  Rocchio演算法

    4.4.2  貝葉斯分類器
    4.4.3  貝葉斯信念網路
    4.4.4  K近鄰演算法
    4.4.5  支持向量機
  4.5  分類性能評價
    4.5.1  精確度和召回率
    4.5.2  F-測量
    4.5.3  分類方法的綜合評價
  4.6  基於向量空間模型的文本分類方法
    4.6.1  文本分類系統的結構框架
    4.6.2  改進的文本特徵抽取演算法
    4.6.3  二級分類模式
  4.7  基於語言模型的文本分類
    4.7.1  概述
    4.7.2  Bigram模型
    4.7.3  特徵提取
    4.7.4  分類器設計
    4.7.5  統計平滑
  4.8  基於卷積神經網路的文本分類
    4.8.1  CNN概述
    4.8.2  CNN文本分類經典結構
    4.8.3  CNN文本分類方法
  習題
第5章  文本聚類技術
  5.1  概述
  5.2  常用的聚類方法
    5.2.1  基於劃分的聚類方法
    5.2.2  基於分層的聚類方法
    5.2.3  基於密度的聚類方法
    5.2.4  基於網格的聚類方法
    5.2.5  基於模型的聚類方法
  5.3  聚類演算法的評價標準
  5.4  基於K-means的文本聚類演算法
    5.4.1  概述
    5.4.2  K-means演算法理論基礎
    5.4.3  K-means演算法結果影響因素
    5.4.4  TF-IDF理論基礎
    5.4.5  基於K-means文本聚類的主要步驟
    5.4.6  基於K-means演算法的聚類實例
  5.5  基於潛在語義索引的文本聚類方法
    5.5.1  概述
    5.5.2  矩陣的奇異值分解
    5.5.3  LSI技術的理論基礎
    5.5.4  基於LSI文本聚類的主要步驟
    5.5.5  基於LSI文本聚類的實例
  5.6  基於Word2Vec的文本聚類方法
    5.6.1  詞向量概述
    5.6.2  Word2Vec語言模型
    5.6.3  連續詞袋模型
    5.6.4  Skip-gram模型

    5.6.5  基於Word2Vec的文本聚類舉例
  習題
第6章  自動摘要技術
  6.1  概述
  6.2  抽取式摘要
    6.2.1  基於TextRank的文本自動摘要
    6.2.2  基於圖模型的文本自動摘要
    6.2.3  融合雜訊檢測的多文檔自動摘要
    6.2.4  抽取式多文檔自動摘要
  6.3  生成式摘要
    6.3.1  融合辭彙特徵的生成式摘要模型
    6.3.2  基於深度學習的文本自動摘要
    6.3.3  基於HITS注意力神經網路的生成式摘要模型
  6.4  自動摘要的評價方法
    6.4.1  內部評價法
    6.4.2  外部評價法
  習題
第7章  文本推薦技術
  7.1  基於內容的推薦方法
    7.1.1  概述
    7.1.2  存在的問題
  7.2  基於協同過濾的推薦方法
    7.2.1  基於用戶的協同過濾推薦方法
    7.2.2  基於物品的協同過濾推薦方法
    7.2.3  存在的問題
  7.3  混合推薦方法
  7.4  基於圖表示學習的推薦方法
    7.4.1  圖表示學習方法
    7.4.2  基於圖表示學習的推薦
    7.4.3  基於DeepWalk異構文獻網路表示學習的個性化全局引文推薦方法
  7.5  推薦系統的評價
    7.5.1  評價指標
    7.5.2  基於DeepWalk異構文獻網路表示學習的個性化全局引文推薦方法的實驗結果分析
  習題
第8章  網頁鏈接分析
  8.1  超鏈和頁面內容的關係
  8.2  特徵提取和特徵表示
  8.3  不同搜索階段的分析
  8.4  PageRank演算法
    8.4.1  PageRank演算法定義
    8.4.2  PageRank演算法的優點和缺點
    8.4.3  基於LexRank的多文檔自動摘要方法
  8.5  HITS演算法
    8.5.1  HITS演算法定義
    8.5.2  尋找其他的特徵向量
    8.5.3  尋找同引分析和文獻耦合的關係
    8.5.4  HITS演算法的優點和缺點
    8.5.5  基於HITS的多文檔自動摘要
  8.6  兩種演算法的比較
  8.7  鏈接分析的應用

  習題
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032