幫助中心 | 我的帳號 | 關於我們

數據科學技術(文本分析和知識圖譜全彩印刷)

  • 作者:蘇海波//劉譯璟//易顯維//蘇萌|責編:趙軍
  • 出版社:清華大學
  • ISBN:9787302649700
  • 出版日期:2024/01/01
  • 裝幀:平裝
  • 頁數:334
人民幣:RMB 129 元      售價:
放入購物車
加入收藏夾

內容大鋼
    數據科學的關鍵技術包括數據存儲計算、數據治理、結構化數據分析、語音分析、視覺分析、文本分析和知識圖譜等方面。本書的重點是詳細介紹文本分析和知識圖譜方面的技術。文本分析技術主要包括文本預訓練模型、多語種文本分析、文本情感分析、文本機器翻譯、文本智能糾錯、NL2SQL問答以及ChatGPT大語言模型等。知識圖譜技術主要包括知識圖譜構建和知識圖譜問答等。本書將理論介紹和實踐相結合,詳細闡述各個技術主題的實現路線,並對應用於業界演算法大賽中的技術方案和技巧進行源代碼解讀,幫助讀者深入理解技術原理。最後,本書還介紹了文本分析和知識圖譜技術在政務、公共安全、應急等多個行業中的智能應用實踐案例。
    本書適合具備Python和機器學習技術基礎的高等院校學生、文本分析(或者自然語言處理)以及知識圖譜領域的演算法工程師和研究機構的研究者閱讀,也適合數據科學和人工智慧領域的研究者作為參考書。

作者介紹
蘇海波//劉譯璟//易顯維//蘇萌|責編:趙軍

目錄
第1章  什麼是數據科學
  1.1  數據科學的定義
    1.1.1  數據科學的背景
    1.1.2  數據科學的定義
  1.2  數據科學的關鍵技術
    1.2.1  數據存儲計算
    1.2.2  數據治理
    1.2.3  結構化數據分析
    1.2.4  語音分析
    1.2.5  視覺分析
    1.2.6  文本分析
    1.2.7  知識圖譜
  1.3  本章小結
  1.4  習題
  1.5  本章參考文獻
第2章  文本預訓練模型
  2.1  文本分析技術的發展史
  2.2  Transformer模型結構
  2.3  預訓練模型的結構和變種
  2.4  加速處理器GPU和TPU
    2.4.1  GPU的介紹
    2.4.2  GPU產品命名
    2.4.3  TPU和GPU的區別
    2.4.4  TPU的使用總結
  2.5  預訓練模型的常見問題
    2.5.1  模型輸入的常見問題
    2.5.2  模型原理的常見問題
    2.5.3  模型進化的常見問題
  2.6  預訓練模型的源碼解讀
    2.6.1  模型架構
    2.6.2  BertModel
    2.6.3  BERT預訓練任務
    2.6.4  BERT微調
  2.7  本章小結
  2.8  習題
  2.9  本章參考文獻
第3章  多語種文本分析
  3.1  多語種文本分析背景介紹
  3.2  多語種文本分析技術
    3.2.1  Polyglot技術
    3.2.2  Multilingual BERT
    3.2.3  XLM多語言模型
    3.2.4  XLMR多語言模型
    3.2.5  模型實驗效果
  3.3  多語種文本分析源碼解讀
  3.4  本章小結
  3.5  習題
  3.6  本章參考文獻
第4章  文本情感分析
第5章  文本機器翻譯

第6章  文本智能糾錯
第7章  知識圖譜構建
第8章  知識圖譜問答
第9章  結構化知識NL2SQL問答
第10章  ChatGPT大語言模型
第11章  行業實踐案例

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032