幫助中心 | 我的帳號 | 關於我們

自然語言處理原理與實戰/人工智慧科學與技術叢書

  • 作者:編者:陳敬雷|責編:趙凱//李曄
  • 出版社:清華大學
  • ISBN:9787302632726
  • 出版日期:2023/11/01
  • 裝幀:平裝
  • 頁數:407
人民幣:RMB 99 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書從自然語言處理基礎開始,逐步深入各種自然語言處理的熱點前沿技術,使用了Java和Python兩門語言精心編排了大量代碼實例,契合公司實際工作場景技能,側重實戰。
    全書共19章,詳細講解中文分詞、詞性標注、命名實體識別、依存句法分析、語義角色標注、文本相似度演算法、語義相似度計算等內容,同時提供配套完整實戰項目,例如對話機器人實戰、搜索引擎項目實戰、推薦演算法系統實戰。
    本書理論聯繫實踐,深入淺出,知識點全面。通過閱讀本書,讀者不僅可以理解自然語言處理知識,還能通過實戰項目案例更好地將理論融入實際工作中。
    本書適合自然語言處理的初學者閱讀,有一定經驗的演算法工程師也可從書中獲取很多有價值的知識,並通過實戰項目更好地理解自然語言處理的核心內容。

作者介紹
編者:陳敬雷|責編:趙凱//李曄
    陳敬雷,充電了么創始人,中國首席數據官聯盟專家委員。擁有十幾年互聯網從業經驗,在技術領域,尤其在大數據和人工智慧方向有豐富的演算法工程落地實戰經驗,其中在獵聘網任職期間主導的推薦演算法系統項目獲得公司優秀項目獎,推薦效果得到5倍的提升。目前專註于大數據和人工智慧驅動的上班族在線教育行業,研發了充電了么App,用深度學習演算法、NLP、推薦引擎等技術來高效提升在線學習效率。

目錄
第1章  自然語言處理技術概述
  1.1  自然語言處理介紹
    1.1.1  自然語言處理的定義及其在實際工作中的定位
    1.1.2  自然語言處理的經典應用場景
  1.2  自然語言處理的技能要求和職業發展路徑
    1.2.1  大數據部門組織架構和自然語言處理職位所處位置
    1.2.2  自然語言處理的職位介紹和技能要求
    1.2.3  自然語言處理的職業生涯規劃和發展路徑
    1.2.4  自然語言處理的市場平均薪資水平
第2章  中文分詞
  2.1  中文分詞原理
  2.2  規則分詞
    2.2.1  正向最大匹配法
    2.2.2  逆向最大匹配法
    2.2.3  雙向最大匹配法
  2.3  機器學習統計分詞
    2.3.1  隱馬爾可夫模型分詞
    2.3.2  感知器分詞
    2.3.3  CRF分詞
  2.4  分詞工具實戰
    2.4.1  CRF++工具包實戰
    2.4.2  Python的Jieba分詞
    2.4.3  Java的HanLP分詞
    2.4.4  Java的IK分詞
    2.4.5  Java的mmseg4j分詞
第3章  詞性標注
  3.1  詞性標注原理
    3.1.1  詞性介紹
    3.1.2  HMM詞性標注
    3.1.3  感知器詞性標注
    3.1.4  CRF詞性標注
  3.2  詞性標注工具實戰
    3.2.1  Python的Jieba詞性標注
    3.2.2  Java的HanLP詞性標注
第4章  命名實體識別
  4.1  命名實體識別原理
  4.2  基於HMM角色標注的命名實體識別
    4.2.1  中國人名識別
    4.2.2  地名識別
    4.2.3  機構公司名識別
  4.3  基於線性模型的命名實體識別
    4.3.1  感知器命名實體識別
    4.3.2  CRF命名實體識別
第5章  依存句法分析
  5.1  依存句法分析原理
  5.2  HanLP基於神經網路依存句法分析器
第6章  語義角色標注
  6.1  語義角色標注原理
  6.2  語義角色標注的設計框架
    6.2.1  生成語義生成樹

    6.2.2  剪枝
    6.2.3  角色識別
    6.2.4  角色分類
第7章  文本相似度演算法
  7.1  字元串編輯距離
    7.1.1  演算法原理
    7.1.2  Java代碼實現
    7.1.3  Python代碼實現
  7.2  餘弦相似度
    7.2.1  演算法原理
    7.2.2  Java代碼實現
    7.2.3  Python代碼實現
第8章  語義相似度計算
  8.1  《同義詞詞林》
    8.1.1  演算法原理
    8.1.2  代碼實戰
  8.2  基於深度學習的語義相似度
    8.2.1  DSSM
    8.2.2  CNN-DSSM
    8.2.3  LSTM-DSSM
第9章  詞頻-逆文檔頻率
  9.1  TF-IDF演算法原理
  9.2  Java代碼實現TF-IDF
  9.3  TF-IDF的Python代碼實現
第10章  條件隨機場
  10.1  演算法原理
  10.2  開源工具實戰
第11章  新詞發現與短語提取
  11.1  新詞發現
  11.2  短語提取
第12章  搜索引擎SolrCloud和Elasticsearch
  12.1  全文搜索引擎介紹及原理
  12.2  Lucene搜索引擎
  12.3  SolrCloud
    12.3.1  SolrCloud介紹及原理
    12.3.2  SolrCloud實戰
  12.4  Elasticsearch
    12.4.1  Elasticsearch介紹及原理
    12.4.2  Elasticsearch實戰
第13章  Word2Vec詞向量模型
  13.1  Word2Vec詞向量模型介紹及原理
  13.2  Word2Vec詞向量模型實戰
    13.2.1  Spark分散式實現Word2Vec詞向量模型
    13.2.2  谷歌開源Word2Vec工具
第14章  文本分類
  14.1  文本分類介紹及相關演算法
  14.2  樸素貝葉斯演算法
    14.2.1  演算法原理
    14.2.2  源碼實戰
  14.3  支持向量機

    14.3.1  演算法原理
    14.3.2  源碼實戰
  14.4  Python開源快速文本分類器FastText
    14.4.1  FastText框架核心原理
    14.4.2  FastText和Word2Vec的區別
    14.4.3  FastText實戰
  14.5  BERT文本分類
    14.5.1  BERT模型介紹及原理
    14.5.2  BERT中文文本分類實戰
第15章  文本聚類
  15.1  文本聚類介紹及相關演算法
  15.2  K-means文本聚類
    15.2.1  演算法原理
    15.2.2  源碼實戰
  15.3  LDA主題詞——潛在狄利克雷分佈模型
    15.3.1  演算法原理
    15.3.2  源碼實戰
第16章  關鍵詞提取和文本摘要
  16.1  關鍵詞提取
    16.1.1  關鍵詞提取介紹及相關演算法
    16.1.2  基於Python的關鍵詞提取實戰
    16.1.3  基於Java的關鍵詞提取實戰
  16.2  文本摘要
    16.2.1  文本摘要介紹及相關演算法
    16.2.2  基於Python的文本摘要實戰
    16.2.3  基於Java的文本摘要實戰
第17章  自然語言模型
  17.1  自然語言模型原理與介紹
  17.2  N-Gram統計語言模型
  17.3  LSTM神經網路語言模型
第18章  分散式深度學習實戰
  18.1  TensorFlow深度學習框架
    18.1.1  TensorFlow原理和介紹
    18.1.2  TensorFlow安裝部署
  18.2  MXNet深度學習框架
    18.2.1  MXNet原理和介紹
    18.2.2  MXNet安裝部署
  18.3  神經網路演算法
    18.3.1  多層感知器演算法
    18.3.2  卷積神經網路
    18.3.3  循環神經網路
    18.3.4  長短期記憶神經網路
    18.3.5  端到端神經網路
    18.3.6  生成對抗網路
    18.3.7  深度強化學習
    18.3.8  TensorFlow分散式訓練實戰
    18.3.9  分散式TensorFlowonKubernetes集群實戰
第19章  自然語言處理項目實戰
  19.1  對話機器人項目實戰
    19.1.1  對話機器人原理與介紹

    19.1.2  基於TensorFlow的對話機器人
    19.1.3  基於MXNet的對話機器人
    19.1.4  基於深度強化學習的機器人
    19.1.5  基於搜索引擎的對話機器人
    19.1.6  對話機器人的Web服務工程化
  19.2  搜索引擎項目實戰
    19.2.1  搜索引擎系統架構設計
    19.2.2  搜索框架技術選型
    19.2.3  搜索相關度排序
    19.2.4  搜索綜合排序演算法
    19.2.5  搜索內容意圖識別和智能糾錯
    19.2.6  搜索智能聯想詞
    19.2.7  搜索輸入框默認關鍵詞猜你喜歡
    19.2.8  相關搜索關鍵詞推薦
    19.2.9  排序學習與NDCG搜索評價指標
    19.2.10  個性化搜索猜你喜歡
    19.2.11  搜索此關鍵詞的用戶最終購買演算法
    19.2.12  搜索大數據平台及數據倉庫建設
  19.3  推薦演算法系統實戰
    19.3.1  推薦系統架構設計
    19.3.2  推薦數據倉庫集市
    19.3.3  ETL數據處理
    19.3.4  協同過濾用戶行為挖掘
    19.3.5  ContentBase文本挖掘演算法
    19.3.6  用戶畫像興趣標籤提取演算法
    19.3.7  基於用戶心理學的模型推薦
    19.3.8  多策略融合演算法
    19.3.9  准實時在線學習推薦引擎
    19.3.10  Redis緩存處理
    19.3.11  分散式搜索
    19.3.12  推薦二次排序演算法
    19.3.13  在線Web實時推薦引擎服務
    19.3.14  在線AB測試推薦效果評估
    19.3.15  離線AB測試推薦效果評估
    19.3.16  推薦位管理平台
參考資料

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032