幫助中心 | 我的帳號 | 關於我們

自然語言處理從入門到實戰

  • 作者:編者:胡盼盼|責編:張丹
  • 出版社:中國鐵道
  • ISBN:9787113266912
  • 出版日期:2020/06/01
  • 裝幀:平裝
  • 頁數:251
人民幣:RMB 79.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    為了幫助廣大愛好自然語言處理(NaturalLanguageProcessing,NLP)技術的讀者朋友入門此領域,本書闡述了自然語言處理概況、領域應用、相關處理工具包、相關的機器學習及深度學習模型、文本預處理及文本表徵等基礎知識,以及具體的自然語言處理任務,包括文本分類、關係抽取、知識圖譜、文本摘要、序列標注、機器翻譯和聊天系統,同時介紹了自然語言處理技術在學術界以及工業界的發展、應用現狀,併為讀者們提供了部分面試參考題目。
    本書適合有一定的編程及機器學習基礎,想入門自然語言處理,以及想系統了解或準備求職自然語言處理初級崗位的讀者閱讀。

作者介紹
編者:胡盼盼|責編:張丹
   胡盼盼 自然語言處理工程師,斯特拉斯堡大學電腦語言學碩士,曾任法國科學院(CNRS,Centre National de la Recherche Scientifique)演算法研究員,負責過醫療知識圖譜、聊天機器人、智能律師系統、文本生成系統等企業級核心項目。

目錄
第一部分  了解自然語言處理
第1章  自然語言處理初探
  1.1  自然語言處理概述
    1.1.1  自然語言處理早期發展史
    1.1.2  新世紀的里程碑事件
  1.2  自然語言處理的挑戰
    1.2.1  詞義消歧
    1.2.2  指代消解
    1.2.3  上下文理解
    1.2.4  語義與語用的不對等
  1.3  自然語言處理的應用領域
    1.3.1  醫療
    1.3.2  教育
    1.3.3  媒體
    1.3.4  金融
    1.3.5  法律
  1.4  自然語言處理的常見工具
    1.4.1  基礎任務工具包
    1.4.2  科學計算及機器學習框架
    1.4.3  深度學習框架
  本章小結  
  思考題  
第二部分  自然語言處理核心技術
第2章  自然語言處理與機器學習
  2.1  邏輯回歸
    2.1.1  邏輯回歸基本原理
    2.1.2  邏輯回歸在實踐中的注意要點
    2.1.3  邏輯回歸的優勢與不足
  2.2  樸素貝葉斯
    2.2.1  樸素貝葉斯基本原理
    2.2.2  樸素貝葉斯的類型
    2.2.3  樸素貝葉斯的優勢與不足
  2.3  Kmeans演算法
    2.3.1  Kmeans演算法基本原理
    2.3.2  Kmeans演算法實踐
    2.3.3  Kmeans演算法的優勢與不足
  2.4  決策樹
    2.4.1  決策樹的屬性劃分
    2.4.2  隨機森林的基本原理
    2.4.3  隨機森林在應用中的注意細節
  2.5  主成分分析
    2.5.1  梯度上升法解PCA
    2.5.2  協方差矩陣解PCA
    2.5.3  實戰PCA
  本章小結  
  思考題  
第3章  自然語言處理與神經網路
  3.1  神經網路初探
    3.1.1  神經元結構
    3.1.2  常見的激活函數

    3.1.3  誤差反向傳播演算法
  3.2  常見的神經網路結構
    3.2.1  多層感知機
    3.2.2  循環神經網路的基本原理
    3.2.3  卷積神經網路的基本原理
    3.2.4  神經網路的優勢與不足
  3.3  神經網路演算法的改進與提升
    3.3.1  防止過擬合的方法
    3.3.2  訓練速度與精度的提高方法
    3.3.3  注意力機制
  本章小結  
  思考題  
第三部分  自然語言處理基本任務
第4章  文本預處理
  4.1  文本預處理的基礎項目
    4.1.1  文本規範化
    4.1.2  語義分析
    4.1.3  分詞
    4.1.4  文本糾錯
  4.2  關鍵詞提取
    4.2.1  基於特徵統計
    4.2.2  基於主題模型
    4.2.3  基於圖模型
  4.3  數據不平衡的處理
    4.3.1  常見方法
    4.3.2  數據不平衡問題實戰
  本章小結  
  思考題  
第5章  文本的表示技術
  5.1  詞袋模型
    5.1.1  基於頻次的詞袋模型
    5.1.2  基於TFIDF的詞袋模型
    5.1.3  相關工具的使用
  5.2  Word2Vec詞向量
    5.2.1  Word2Vec的基本原理
    5.2.2  Word2Vec模型細節及代碼演示
    5.2.3  應用工具訓練Word2Vec
  5.3  改進后的詞表徵
    5.3.1  GloVe模型
    5.3.2  FastText模型
    5.3.3  ELMo模型
  5.4  句向量
    5.4.1  基於詞向量的平均
    5.4.2  沿用Word2Vec思想
    5.4.3  有監督方式
  本章小結  
  思考題  
第6章  序列標注
  6.1  序列標注基礎
    6.1.1  序列標注的應用場景

    6.1.2  基線方式
    6.1.3  序列標注任務的難點
  6.2  基於概率圖的模型
    6.2.1  隱馬爾科夫模型(HMM)
    6.2.2  最大熵馬爾科夫模型(MEMM)
    6.2.3  條件隨機場模型(CRF)
    6.2.4  天氣預測實例
  6.3  基於深度學習的方式
    6.3.1  數據表徵形式
    6.3.2  序列處理模型
  本章小結  
  思考題  
第7章  關係抽取
  7.1  關係抽取基礎
    7.1.1  關係抽取概述
    7.1.2  關係抽取的主要方法
    7.1.3  深度學習與關係抽取
    7.1.4  強化學習與關係抽取
  7.2  基於半監督的關係抽取模式:Snowball系統
    7.2.1  Patterns及Tuples的生成
    7.2.2  Patterns及Tuples的評估
    7.2.3  Snowball的實現細節
  7.3  關係抽取工具——DeepDive
    7.3.1  DeepDive概述
    7.3.2  DeepDive工作流程
    7.3.3  概率推斷與因子圖
  本章小結  
  思考題  
第四部分  自然語言處理高級任務
第8章  知識圖譜
  8.1  知識圖譜基本概念
    8.1.1  從語義網路到知識圖譜
    8.1.2  知識的結構化、存儲及查詢
    8.1.3  幾個開源的知識圖譜
  8.2  知識圖譜的關鍵構建技術
    8.2.1  本體匹配
    8.2.2  實體鏈接
    8.2.3  知識推理
  8.3  知識圖譜應用
    8.3.1  反欺詐
    8.3.2  個性化推薦
    8.3.3  知識庫問答
  本章小結  
  思考題  
第9章  文本分類
  9.1  文本分類的常見方法
    9.1.1  機器學習
    9.1.2  模型融合
    9.1.3  深度學習
  9.2  文本分類的不同應用場景

    9.2.1  二分類
    9.2.2  多分類
    9.2.3  多標籤多分類
  9.3  案例:搭建一款新聞主題分類器
    9.3.1  數據預處理
    9.3.2  訓練與預測
    9.3.3  改進
  本章小結  
  思考題  
第10章  文本摘要
  10.1  抽取式摘要
    10.1.1  傳統方法
    10.1.2  基於深度學習的方法
    10.1.3  抽取式摘要的訓練數據問題
  10.2  生成式摘要
    10.2.1  基礎模型
    10.2.2  前沿模型中的技巧
    10.2.3  強化學習與生成式摘要
  10.3  案例:搭建網球新聞摘要生成器
    10.3.1  基於詞頻統計的摘要生成器
    10.3.2  基於圖模型的摘要生成器
    10.3.3  結果分析
  本章小結  
  思考題  
第11章  機器翻譯
  11.1  傳統機器翻譯
    11.1.1  源起
    11.1.2  基於規則
    11.1.3  基於大規模語料
  11.2  統計機器翻譯
    11.2.1  相關流派
    11.2.2  基於信源通道的統計機器翻譯
    11.2.3  案例:外星語的翻譯實戰
  11.3  神經機器翻譯
    11.3.1  基本原理
    11.3.2  改進機制
    11.3.3  前沿與挑戰
  本章小結  
  思考題  
第12章  聊天系統
  12.1  聊天系統的類型
    12.1.1  閑聊式機器人
    12.1.2  知識問答型機器人
    12.1.3  任務型聊天機器人
  12.2  聊天系統的關鍵技術
    12.2.1  檢索技術
    12.2.2  意圖識別和詞槽填充
    12.2.3  對話管理
    12.2.4  強化學習與多輪對話
  12.3  案例:閑聊機器人實戰

    12.3.1  技術概要
    12.3.2  基本配置及數據預處理
    12.3.3  閑聊機器人模型的搭建
    12.3.4  模型訓練、預測以及優化
  本章小結  
  思考題  
第五部分  自然語言處理求職
第13章  自然語言處理技術的現在、未來及擇業
  13.1  自然語言處理組織及人才需求介紹
    13.1.1  學術界
    13.1.2  工業界
    13.1.3  人才需求現狀
  13.2  未來與自然語言處理
    13.2.1  自然語言處理熱點技術方向
    13.2.2  自然語言處理的應用暢想
    13.2.3  自然語言處理帶來的行業衝擊
  13.3  面試題
    13.3.1  數據結構與演算法
    13.3.2  數學基礎
    13.3.3  機器學習與深度學習
    13.3.4  自然語言處理專業
    13.3.5  實際問題解決及技術領域見解
  本章小結  
  思考題  
附錄A  思考題 參考答案
附錄B  面試題答案目錄

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032