幫助中心 | 我的帳號 | 關於我們

基於Spark NLP的自然語言處理

  • 作者:(美)亞歷克斯·托馬斯|責編:劉熾|譯者:唐曉//胡喬林//陳新
  • 出版社:中國電力
  • ISBN:9787519869670
  • 出版日期:2022/09/01
  • 裝幀:平裝
  • 頁數:386
人民幣:RMB 128 元      售價:
放入購物車
加入收藏夾

內容大鋼
    如果你想構建一個使用自然語言文本的企業級應用程序,但不確定從哪裡開始或使用什麼工具,本書將幫助你入門。Wisecube的首席數據科學家Alex Thormas向軟體工程師和數據科學家展示了如何使用深度學習和Apache Spark NLP庫,來構建可擴展的自然語言處理(NLP)應用程序。
    通過在Spark處理框架上使用NLP的具體示例、實踐,進行理論解釋和動手練習,本書將會介紹從基本語言學和寫作系統到情感分析和搜索引擎的所有內容。你還將探索一些開發基於文本的應用程序會遇到的特殊問題,例如性能等。在下面四個部分中,你將學習NLP基礎知識和構建模塊,然後再深入研究應用程序和系統構建:
    基礎知識:了解自然語言處理、Apache Spark上的NLP和深度學習的基礎知識。
    構建模塊:學習構建NLP應用程序的技術(包括標記化、句子分割和命名實體識別),並了解它們的工作方式和原因。
    應用程序:探索構建你自己的NLP應用程序的設計、開發和實驗過程。
    構建NLP系統:考慮生產和部署NLP模型的選項,包括支持哪些人類語言。

作者介紹
(美)亞歷克斯·托馬斯|責編:劉熾|譯者:唐曉//胡喬林//陳新
    亞歷克斯·托馬斯是Wisecube的首席數據科學家。他將自然語言處理和機器學習運用於臨床數據、身份數據、僱主和求職者數據以及如今的生化數據。Alex從09版本開始使用Apache Spark,在工作中也用過包括UIMA和OpenNLP在內的多種NLP庫和框架。

目錄
前言
第一部分  基礎知識
  第1章  快速入門
    1.1  簡介
    1.2  其他工具
    1.3  建立你自己的開發環境
      1.3.1  前置條件
      1.3.2  啟動Apache spark
      1.3.3  檢查代碼
    1.4  熟悉Apache Spark
      1.4.1  使用spark NLP啟動Apache spark
      1.4.2  在Apache spark中載入和查看數據
    1.5  Spark NLP的Hello World示例
  第2章  自然語言基礎知識
    2.1  什麼是自然語言
      2.1.1  語言的起源
      2.1.2  口頭語言和書面語言
    2.2  語言學
      2.2.1  語音學和音系學
      2.2.2  詞法學(形態學)
      2.2.3  語法
      2.2.4  語義學
    2.3  社會語言學:方言、語域和其他變體
      2.3.1  禮節
      2.3.2  語境
    2.4  語用學
      2.4.1  羅曼·雅各布森
      2.4.2  如何運用語用學
    2.5  書寫系統
      2.5.1  起源
      2.5.2  字母
      2.5.3  輔音音素文字
      2.5.4  母音附標文字
      2.5.5  音節表
      2.5.6  標識象形符
    2.6  編碼
      2.6.1  ASCII
      2.6.2  Unicode
      2.6.3  UTF
    2.7  練習:分詞
      2.7.1  英語分詞
      2.7.2  希臘語分詞
      2.7.3  Ge'ez(阿姆哈拉語)分詞
    2.8  資源
  第3章  Apache Spark上的NLP
    3.1  並行性、併發性、分散式計算
      3.1.1  Apache Hadoop之前的並行化
      3.1.2  MapReduce和Apache Hadoop
      3.1.3  Apache Spark
第二部分  構建模塊

第三部分  應用
第四部分  構建NLP系統
術語表

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032