幫助中心 | 我的帳號 | 關於我們

自然語言處理與計算語言學

  • 作者:(法)巴格夫·斯里尼瓦薩-德西坎|責編:傅道坤|譯者:何煒
  • 出版社:人民郵電
  • ISBN:9787115540249
  • 出版日期:2020/08/01
  • 裝幀:平裝
  • 頁數:217
人民幣:RMB 59 元      售價:
放入購物車
加入收藏夾

內容大鋼
    自然語言處理是一門融語言學、電腦科學、數學于一體的科學,研究人與電腦之間用自然語言進行有效通信的各種理論和方法。計算語言學是指通過建立形式化的數學模型來分析、處理自然語言,並在電腦上用程序來實現分析和處理的過程,旨在以機器來模擬人的部分或全部語言能力的目的。
    本書作為一本借助於Python編程語言以及各種開源工具(如Gensim、spaCy等)來執行文本分析、自然語言處理和計算語言學演算法的圖書,從應用層面介紹了相關的理論知識和所涉及的技術。本書共分為15章,其內容涵蓋了文本分析的定義、使用Python進行文本分析的技巧、spaCy語言模型、Gensim工具、詞性標注及其應用、NER標注及其應用、依存分析、主題模型、高級主題建模、文本聚類和文本分類、查詢詞相似度計算和文本摘要、詞嵌入、使用深度學習處理文本、使用Keras和spaCy進行深度學習、情感分析與聊天機器人的原理介紹等。
    本書適合對自然語言處理的實現細節感興趣的Python程序開發人員閱讀。如果讀者具備統計學的基本知識,對學習本書內容會大有裨益。

作者介紹
(法)巴格夫·斯里尼瓦薩-德西坎|責編:傅道坤|譯者:何煒
    巴格夫·斯里尼瓦薩-德西坎,是就職於法國INRIA公司(位於里爾)的一名研究人員。作為MODAL(數據分析與機器建模)小組的一員,致力於度量學習、預測聚合和數據可視化等研究領域。同時,他也是Python開源社區的一名活躍貢獻者,在2016年度Google的夏季編程賽上,他通過Gensim實現了動態主題模型。Bhargav是歐洲和亞洲PyCons和PyDatas的常客,並使用Python進行文本分析教學。他也是Python機器學習軟體包pycobra的維護者,還在Machine Learning Research雜誌上發表過相關文章。 是就職於法國INRIA公司(位於里爾)的一名研究人員。作為MODAL(數據分析與機器建模)小組的一員,致力於度量學習、預測聚合和數據可視化等研究領域。同時,他也是Python開源社區的一名活躍貢獻者,在2016年度Google的夏季編程賽上,他通過Gensim實現了動態主題模型。Bhargav是歐洲和亞洲PyCons和PyDatas的常客,並使用Python進行文本分析教學。他也是Python機器學習軟體包pycobra的維護者,還在Machine Learning Research雜誌上發表過相關文章。

目錄
第1章  什麼是文本分析
  1.1  什麼是文本分析
  1.2  搜集數據
  1.3  若輸入錯誤數據,則輸出亦為錯誤數據(garbage in,garbage out)
  1.4  為什麼你需要文本分析
  1.5  總結
第2章  Python文本分析技巧
  2.1  為什麼用Python來做文本分析
  2.2  用Python進行文本操作
  2.3  總結
第3章  spaCy語言模型
  3.1  spaCy庫
  3.2  spaCy的安裝步驟
  3.3  故障排除
  3.4  語言模型
  3.5  安裝語言模型
  3.6  安裝語言模型的方式及原因
  3.7  語言模型的基本預處理操作
  3.8  分詞
  3.9  詞性標注
  3.10  命名實體識別
  3.11  規則匹配
  3.12  預處理
  3.13  總結
第4章  Gensim:文本向量化、向量變換和n-grams的工具
  4.1  Gensim庫介紹
  4.2  向量以及為什麼需要向量化
  4.3  詞袋(bag-of-words)
  4.4  TF-IDF(詞頻-反向文檔頻率)
  4.5  其他表示方式
  4.6  Gensim中的向量變換
  4.7  n-grams及其預處理技術
  4.8  總結
第5章  詞性標注及其應用
  5.1  什麼是詞性標注
  5.2  使用Python實現詞性標注
  5.3  使用spaCy進行詞性標注
  5.4  從頭開始訓練一個詞性標注模型
  5.5  詞性標注的代碼示例
  5.6  總結
第6章  NER標注及其應用
  6.1  什麼是NER標注
  6.2  用Python實現NER標注
  6.3  使用spaCy實現NER標注
  6.4  從頭開始訓練一個NER標注器
  6.5  NER標注應用實例和可視化
  6.6  總結
第7章  依存分析
  7.1  依存分析
  7.2  用Python實現依存分析

  7.3  用spaCy實現依存分析
  7.4  從頭開始訓練一個依存分析器
  7.5  總結
第8章  主題模型
  8.1  什麼是主題模型
  8.2  使用Gensim構建主題模型
  8.3  隱狄利克雷分配(Latent Dirichlet Allocation)
  8.4  潛在語義索引(Latent Semantic Indexing)
  8.5  分層狄利特雷過程(Hierarchical Dirichlet Process)
  8.6  動態主題模型
  8.7  使用scikit-learn構建主題模型
  8.8  總結
第9章  高級主題建模
  9.1  高級訓練技巧
  9.2  探索文檔
  9.3  主題一致性和主題模型的評估
  9.4  主題模型的可視化
  9.5  總結
第10章  文本聚類和文本分類
  10.1  文本聚類
  10.2  聚類前的
  10.3   K-means 
  10.4   層次聚類 
  10.5   文本分類 
  10.6   總結 
第11章  查詢詞相似度計算和文本摘要 
  11.1   文本距離的度量 
  11.2   查詢詞相似度計算 
  11.3   文本摘要 
  11.4   總結 
第12章  Word2Vec、Doc2Vec和Gensim 
  12.1   Word2Vec 
  12.2   用Gensim實現Word2Vec 
  12.3   Doc2Vec 
  12.4   其他詞嵌入技術 
  12.5   總結 
第13章  使用深度學習處理文本 
  13.1   深度學習 
  13.2   深度學習在文本上的應用 
  13.3   文本生成 
  13.4   總結 
第14章  使用Keras和spaCy進行深度學習 
  14.1   Keras和spaCy 
  14.2   使用Keras進行文本分類 
  14.3   使用spaCy進行文本分類 
  14.4   總結 
第15章  情感分析與聊天機器人 
  15.1   情感分析 
  15.2   基於Reddit的新聞數據挖掘 
  15.3   基於Twitter的微博數據挖掘 

  15.4   聊天機器人 
  15.5   總結 

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032