幫助中心 | 我的帳號 | 關於我們

自然語言處理基礎與大模型(案例與實踐)/中國科學院大學研究生教學輔導書系列

  • 作者:宗成慶//趙陽//飛槳教材編寫組|責編:孫亞楠
  • 出版社:清華大學
  • ISBN:9787302651550
  • 出版日期:2024/01/01
  • 裝幀:平裝
  • 頁數:291
人民幣:RMB 98 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書在簡要介紹自然語言處理代表性模型和方法的基礎上,通過具體案例詳細展現了相關模型和演算法的實現過程,並給出了可執行的程序代碼、數據集和運行結果。全書內容既有經典的統計語言模型,也有神經網路基礎模型和大語言模型前沿技術。應用案例從情感分析、信息抽取、自動摘要和文本語義匹配,到閱讀理解、意圖理解、文本生成和機器翻譯,全方位地展示自然語言處理從理論到實踐的全貌。書中提供的所有代碼都已通過調試,並以Jupyter Notebook形式托管在百度AI Studio星河社區上。讀者按照書中的說明就可以直接使用AI Studio提供的免費計算資源在線編譯運行書中的程序代碼,為讀者實踐練習提供了極大的便利。
    本書可作為高等院校相關專業高年級本科生和研究生學習自然語言處理課程的教學輔導書,也可供對自然語言處理技術感興趣的初學者或者從事相關技術研發的工程技術人員參考。

作者介紹
宗成慶//趙陽//飛槳教材編寫組|責編:孫亞楠

目錄
第1章  緒論
  1.1  自然語言處理方法概述
  1.2  本書的內容組織
  1.3  本書的實踐平台
    1.3.1  本地運行
    1.3.2  AI Studio星河社區運行
    1.3.3  本書使用的API
    1.3.4  本書使用的數據集
第2章  神經網路基礎
  2.1  概述
  2.2  神經元與感知機
    2.2.1  神經元
    2.2.2  感知機
    2.2.3  常見的激活函數
  2.3  前饋神經網路
  2.4  卷積神經網路
    2.4.1  卷積
    2.4.2  池化
    2.4.3  卷積神經網路
  2.5  循環神經網路
    2.5.1  簡單循環神經網路
    2.5.2  長短時記憶網路
    2.5.3  門控循環單元
    2.5.4  循環神經網路拓展知識
第3章  分散式表示
  3.1  詞的分散式表示
    3.1.1  靜態詞向量
    3.1.2  動態詞向量
  3.2  短語的分散式表示
  3.3  句子的分散式表示
    3.3.1  基於循環神經網路的表示方法
    3.3.2  基於預訓練語言模型的表示方法
第4章  序列生成模型
  4.1  基於循環神經網路的Seq2Seq模型
    4.1.1  基於RNN的Seq2Seq模型原理
    4.1.2  解碼策略
  4.2  融合注意力機制的Seq2Seq模型
  4.3  基於Transformer的Seq2Seq模型
    4.3.1  自注意力模型
    4.3.2  Transformer的網路結構
    4.3.3  Transformer編碼器
    4.3.4  Transformer解碼器
    4.3.5  知識延伸:基於Transformer結構的模型
第5章  基礎語言模型
  5.1  統計語言模型
    5.1.1  模型定義
    5.1.2  數據平滑方法
    5.1.3  語言模型評價
  5.2  神經網路語言模型
    5.2.1  前饋神經網路語言模型

    5.2.2  循環神經網路語言模型
    5.2.3  語言模型與詞向量
第6章  預訓練大模型
  6.1  GPT語言模型
    6.1.1  GPT模型預訓練
    6.1.2  GPT在下游任務中的應用
  6.2  BERT語言模型
    6.2.1  BERT模型的預訓練任務
    6.2.2  BERT在下游任務中的應用
  6.3  ERNIE語言模型
  6.4  預訓練大模型
    6.4.1  基礎大模型
    6.4.2  指令微調
    6.4.3  基於人類反饋的強化學習
第7章  詞語切分
  7.1  基於BERT實現中文分詞
    7.1.1  任務目標
    7.1.2  實現思路及流程
    7.1.3  數據處理
    7.1.4  模型構建
    7.1.5  訓練配置
    7.1.6  模型訓練
    7.1.7  模型評估
    7.1.8  模型預測
  7.2  基於BPE演算法實現子詞切分
    7.2.1  任務目標
    7.2.2  實現思路及流程
    7.2.3  構建BPE詞表
    7.2.4  文本子詞切分
    7.2.5  語料還原
  7.3  實驗思考
第8章  文本情感分類方法實踐
  8.1  基於LSTM模型的情感分類方法
    8.1.1  任務目標
    8.1.2  實現思路及流程
    8.1.3  數據處理
    8.1.4  模型構建
    8.1.5  訓練配置
    8.1.6  模型訓練
    8.1.7  模型評估
    8.1.8  模型預測
  8.2  基於BERT模型實現情感分類
    8.2.1  數據處理
    8.2.2  模型構建
    8.2.3  訓練配置
    8.2.4  模型訓練
    8.2.5  模型評估
    8.2.6  模型預測
  8.3  基於BERT的屬性級情感分類
    8.3.1  任務目標

    8.3.2  實現思路及流程
    8.3.3  屬性和觀點抽取
    8.3.4  屬性級情感分類
    8.3.5  全流程模型推理
  8.4  實驗思考
第9章  信息抽取實踐
  9.1  基於Bi-LSTM和CRF的命名實體識別方法
    9.1.1  任務目標和實現流程
    9.1.2  數據處理
    9.1.3  模型構建
    9.1.4  訓練配置
    9.1.5  模型訓練
    9.1.6  模型評估
    9.1.7  模型預測
  9.2  基於ERNIE-UIE實現實體關係抽取
    9.2.1  任務目標和實現流程
    9.2.2  數據處理
    9.2.3  模型構建
    9.2.4  訓練配置
    9.2.5  模型訓練
    9.2.6  模型評估
    9.2.7  模型預測
  9.3  實驗思考
第10章  文本語義匹配實踐
  10.1  基於SimNet的文本語義匹配
    10.1.1  任務目標和實現流程
    10.1.2  數據處理
    10.1.3  模型構建
    10.1.4  訓練配置
    10.1.5  模型訓練
    10.1.6  模型評估
    10.1.7  模型預測
  10.2  基於RocketQA的文本語義匹配
    10.2.1  任務目標和實現流程
    10.2.2  數據處理
    10.2.3  模型構建
    10.2.4  訓練配置
    10.2.5  模型訓練
    10.2.6  模型評估
    10.2.7  模型預測
  10.3  實驗思老
第11章  基於PEGASUS的中文文本摘要實踐
  11.1  任務目標和實現流程
  11.2  數據處理
    11.2.1  數據集確定
    11.2.2  數據載入
    11.2.3  將數據轉換成特徵形式
    11.2.4  構造DataLoader
  11.3  模型構建
  11.4  訓練配置

    11.4.1  BLEU演算法
    11.4.2  ROUGE演算法
  11.5  模型訓練
  11.6  模型評估
  11.7  模型預測
  11.8  實驗思考
第12章  基於ERNIE3.0實現意圖識別
  12.1  任務目標和實現流程
  12.2  數據處理
    12.2.1  數據集確定
    12.2.2  數據載入
    12.2.3  將數據轉換成特徵形式
    12.2.4  構造DataLoader
  12.3  模型構建
  12.4  訓練配置
  12.5  模型訓練
  12.6  模型評估
  12.7  模型預測
  12.8  實驗思考
第13章  機器閱讀理解實踐
  13.1  任務目標
  13.2  實現流程
  13.3  數據處理
    13.3.1  數據集確定
    13.3.2  數據載入
    13.3.3  將數據轉換成特徵形式
    13.3.4  構造DataLoader
  13.4  模型構建
  13.5  訓練配置
  13.6  模型訓練
  13.7  模型評估
  13.8  模型預測
  13.9  實驗思考
第14章  機器翻譯實踐
  14.1  任務目標和實現流程
  14.2  數據處理
    14.2.1  數據集確定
    14.2.2  數據載入
    14.2.3  將數據轉換成特徵形式
    14.2.4  構建DataLoader
    14.2.5  后處理
  14.3  模型構建
    14.3.1  嵌入層的代碼實現
    14.3.2  組裝Transformer模型
  14.4  訓練配置
  14.5  模型訓練
  14.6  模型評估
    14.6.1  數據讀取
    14.6.2  權重載入
    14.6.3  模型評估

  14.7  模型預測
  14.8  實驗思考
第15章  基於大模型的自動問答實踐
  15.1  任務目標和設計方案
  15.2  通過飛槳零代碼開發工具實現
  15.3  通過PaddleNLP實現
    15.3.1  代碼實現邏輯
    15.3.2  配置大模型
    15.3.3  配置向量檢索模型
    15.3.4  定義documentstore
    15.3.5  構建文檔索引
    15.3.6  構建問答應用
    15.3.7  (可選)在線推理部署
  15.4  實驗思考
附錄  術語與縮略語
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032