幫助中心 | 我的帳號 | 關於我們

Java自然語言處理(原書第2版)/智能系統與技術叢書

  • 作者:(美)理查德·M.里斯//(印)艾希什辛格·巴蒂亞|責編:李美瑩|譯者:鄒偉//李妍//武現臣
  • 出版社:機械工業
  • ISBN:9787111657873
  • 出版日期:2020/07/01
  • 裝幀:平裝
  • 頁數:221
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書融合作者多年從業和教學經驗,全面闡述使用Java從非結構化數據中組織和提取有用文本的各種實用方法。本書重點介紹NLP應用中可能遇到的核心NLP任務,每個任務都從問題的描述以及應用領域開始,循序漸進地進行分析並給出解決方案,便於你更好地理解NLP技術,高效地解決實際問題。
    全書內容豐富,不僅全面描述和總結了自然語言處理的基礎知識,還詳細介紹了自然語言處理的多種技術,包括NLP工具、文本分詞、文本斷句、詞性判斷、任務識別、文本分類、關係提取和組合應用等。書中結合多個示例進行深入分析,並採用Java編程語言進行處理與結果分析。

作者介紹
(美)理查德·M.里斯//(印)艾希什辛格·巴蒂亞|責編:李美瑩|譯者:鄒偉//李妍//武現臣

目錄
譯者序
前言
作者簡介
審校者簡介
第1章  NLP概論
  1.1  NLP是什麼
  1.2  為什麼使用NLP
  1.3  為什麼NLP這麼難
  1.4  NLP工具匯總
    1.4.1  Apache OpenNLP
    1.4.2  Stanford NLP
    1.4.3  LingPipe
    1.4.4  GATE
    1.4.5  UIMA
    1.4.6  Apache Lucene Core
  1.5  Java深度學習
  1.6  文本處理任務概述
    1.6.1  查找文本的各部分
    1.6.2  文本斷句
    1.6.3  特徵工程
    1.6.4  查找人物和事件
    1.6.5  詞性判斷
    1.6.6  對文本和文檔進行分類
    1.6.7  關係提取
    1.6.8  使用組合方法
  1.7  理解NLP方法
    1.7.1  識別任務
    1.7.2  選擇模型
    1.7.3  建立並訓練模型
    1.7.4  驗證模型
    1.7.5  運用模型
  1.8  準備數據
  1.9  總結
第2章  查找文本的各部分
  2.1  理解文章的各個部分
  2.2  分詞是什麼
  2.3  簡單的Java分詞器
    2.3.1  使用Scanner類
    2.3.2  使用split方法
    2.3.3  使用BreakIterator類
    2.3.4  使用StreamTokenizer類
    2.3.5  使用StringTokenizer類
    2.3.6  Java核心分詞的性能考慮
  2.4  NLP分詞器API
    2.4.1  使用OpenNLPTokenizer類
    2.4.2  使用Stanford分詞器
    2.4.3  訓練分詞器找出文本的各部分
    2.4.4  分詞器比較
  2.5  了解規範化
    2.5.1  轉換成小寫

    2.5.2  刪除停用詞
    2.5.3  使用詞幹分析
    2.5.4  使用詞元化
    2.5.5  使用管道進行標準化處理
  2.6  總結
第3章  文本斷句
第4章  人物識別
第5章  詞性判斷
第6章  用特徵表示文本
第7章  信息檢索
第8章  對文本和文檔進行分類
第9章  主題建模
第10章  使用解析器提取關係
第11章  組合管道
第12章  創建一個聊天機器人

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032