幫助中心 | 我的帳號 | 關於我們

從零開始寫大模型(從神經網路到Transformer)

  • 作者:編者:王雙//牟晨//王昊怡|責編:王中英
  • 出版社:清華大學
  • ISBN:9787302695080
  • 出版日期:2025/07/01
  • 裝幀:平裝
  • 頁數:232
人民幣:RMB 69.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書結合豐富的圖示和程序示例,全面、系統地介紹大模型的基本原理,並通過一個極簡大語言模型構建案例帶領讀者上手實踐。本書學習門檻極低,即便零基礎的讀者,也能在本書的引領下比較輕鬆地掌握大模型的基本知識體系,並理解大模型的基本原理,從而為日後進一步學習打好基礎。本書提供配套教學視頻、源代碼和教學PPT等超值配套資源,以方便讀者高效、直觀地學習。
    本書共20章,分為5篇。第1篇神經網路快速入門,介紹神經網路的基礎和結構;第2篇Transformer架構基礎,介紹幾種經典的編解碼架構、Tokenization基礎知識、Transformer架構涉及的數學概念;第3篇Transformer模型剖析,首先介紹大語言模型的概念和參數規模,然後介紹Transformer的辭彙輸入模塊、注意力機制模塊和輸出模塊,最後介紹基於Transformer架構的模型訓練過程、推理過程、優化方法和超參數;第4篇Transformer進階,首先介紹如何使用Python實現一個簡單的Transformer架構,然後介紹BERT和GPT兩種經典大語言模型,最後給出國內一些大公司的高頻面試題;第5篇GPT模型完全體驗之MiniMind,詳細介紹一個開源極簡大語言模型MiniMind的項目情況、代碼結構,以及安裝、訓練、微調與推理過程等,帶領讀者體驗大語言模型的完整構建過程。
    本書內容豐富,通俗易懂,案例典型,講解深入淺出,特別適合零基礎學習大模型的讀者閱讀,也適合IT領域或其他領域向AI轉型但缺乏基礎的程序員、工程師等相關從業人員閱讀,還適合高等院校和培訓機構作為大模型的入門教材或教學參考書。

作者介紹
編者:王雙//牟晨//王昊怡|責編:王中英

目錄
第1篇  神經網路快速入門
  第1章  神經網路基礎
    1.1  神經元
      1.1.1  神經元仿生模型
      1.1.2  神經網路的學習過程
      1.1.3  基本概念與術語
    1.2  手算神經網路
      1.2.1  建立4個神經元網路
      1.2.2  手推訓練過程
    1.3  手推前向傳播
    1.4  手推反向傳播
  第2章  手搓神經網路
    2.1  寫一個神經網路並訓練
      2.1.1  前向傳播的實現
      2.1.2  反向傳播的實現
    2.2  經典神經網路——CNN
      2.2.1  卷積操作
      2.2.2  池化層
      2.2.3  全連接層
      2.2.4  全過程展示
      2.2.5  簡單的CNN代碼示例
    2.3  經典神經網路——RNN
      2.3.1  手算體驗極簡RNN
      2.3.2  RNN的工作原理
      2.3.3  幾種經典結構
      2.3.4  經典的RNN變體——LSTM
      2.3.5  LSTM的變體——Peephole連接、Coupled和GRU
      2.3.6  簡單的RNN代碼示例
第2篇  Transformer架構基礎
  第3章  編解碼架構概述
    3.1  數據處理的高效郵遞員——Auto encoder
      3.1.1  基本原理
      3.1.2  演算法描述
      3.1.3  代碼示例
    3.2  溫故而知新——VAE
      3.2.1  基本原理
      3.2.2  演算法描述
      3.2.3  代碼示例
    3.3  深度學習中的貓鼠遊戲——GAN
      3.3.1  基本原理
      3.3.2  演算法描述
      3.3.3  代碼示例
    3.4  變形金剛——Transformer
      3.4.1  基本原理
      3.4.2  演算法描述
      3.4.3  代碼示例
  第4章  Tokenization基礎
    4.1  文字轉數字
      4.1.1  標記器
      4.1.2  獨熱編碼

    4.2  詞嵌入
      4.2.1  詞嵌入簡介
      4.2.2  Word2Vec詞嵌入方法
  第5章  Transformer架構的數學基礎
    5.1  向量和矩陣相乘的變換
      5.1.1  向量坐標系的轉換
      5.1.2  向量與坐標系的關係
    5.2  空間變化的性質
      5.2.1  二次型空間變換
      5.2.2  特殊情況下的行列式
    5.3  層歸一化
第3篇  Transformer模型剖析
第4篇  Transformer進階
第5篇  GPT模型完全體驗之MiniMind

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032