幫助中心 | 我的帳號 | 關於我們

深度學習與大模型基礎

  • 作者:段小手|責編:劉雲
  • 出版社:北京大學
  • ISBN:9787301349960
  • 出版日期:2024/06/01
  • 裝幀:平裝
  • 頁數:346
人民幣:RMB 89 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書以通俗易懂的語言和有趣的插畫來解釋深度學習中的概念和方法,生動形象的插圖更容易幫助讀者理解和記憶。同時,書中指導讀者將自己的理解製作成短視頻,以加強學習效果。另外,書中還指導讀者在Colab平台上進行實踐。
    本書內容全面,從基礎的神經網路、卷積神經網路、循環神經網路等入門知識,到深度學習的應用領域如電腦視覺、自然語言處理等高級主題都有涉及。
    本書具有豐富的趣味性、互動性和實踐性,可以幫助讀者更好地理解深度學習知識,併為未來的職業發展打下堅實的基礎。

作者介紹
段小手|責編:劉雲
    段小手,君兮科技創始人,畢業於北京大學。具有10余年國內一線互聯網/電子商務公司項目管理經驗。其負責的跨境電子商務項目曾獲得「國家發改委電子商務示範項目」「中關村現代服務業試點項目」「北京市信息化基礎設施提升項目」「北京市外貿綜合公共平台」等專項政策支持。目前重點研究領域為機器學習和深度學習等方面。 

目錄
第1章  緒論
  1.1  深度學習的前世今生
  1.2  模型複雜度的提升
  1.3  深度學習的名人軼事
第2章  深度學習中的線性代數
  2.1  標量、向量、矩陣與張量
  2.2  矩陣的運算
  2.3  單位矩陣與逆矩陣
  2.4  線性相關、生成子空間和范數
  2.5  一些特殊類型的矩陣
  2.6  特徵分解
  2.7  奇異值分解
  2.8  Moore-Penrose偽逆
  2.9  跡運算
  2.10  行列式
  2.11  例子:主成分分析
第3章  概率與資訊理論
  3.1  為什麼要使用概率
  3.2  隨機變數
  3.3  概率分佈
  3.4  邊緣概率
  3.5  條件概率
  3.6  條件概率的鏈式法則
  3.7  條件獨立性
  3.8  期望、方差和協方差
  3.9  常用概率分佈
  3.10  常用函數及性質
  3.11  貝葉斯規則
  3.12  資訊理論中的交叉熵
  3.13  結構化概率模型
第4章  數值計算
  4.1  上溢和下溢
  4.2  病態條件
  4.3  基於梯度的優化方法
  4.4  約束優化
  4.5  實例:線性最小二乘
第5章  機器學習基礎
  5.1  什麼是機器學習演算法
  5.2  模型性能的度量
  5.3  過擬合與欠擬合
  5.4  超參數和交叉驗證
  5.5  最大似然估計
  5.6  什麼是隨機梯度下降
  5.7  貝葉斯統計
  5.8  監督學習演算法
  5.9  無監督學習演算法
  5.10  促使深度學習發展的挑戰
第6章  深度前饋網路
  6.1  什麼是「前饋」
  6.2  隱藏層

  6.3  輸出單元
  6.4  萬能近似性質
  6.5  反向傳播
第7章  深度學習中的正則化
  7.1  參數范數懲罰
  7.2  數據集增強
  7.3  雜訊魯棒性
  7.4  半監督學習
  7.5  多任務學習
  7.6  提前終止
  7.7  參數綁定和參數共享
  7.8  稀疏表示
  7.9  Bagging和其他集成方法
  7.10  Dropout
  7.11  對抗訓練
第8章  深度模型中的優化
  8.1  學習和純優化有什麼不同
  8.2  小批量演算法
  8.3  基本演算法
  8.4  參數初始化策略
  8.5  自適應學習率演算法
  8.6  二階近似方法
  8.7  一些優化策略
第9章  卷積神經網路
  9.1  卷積運算
  9.2  為什麼要使用卷積運算
  9.3  池化
  9.4  基本卷積函數的變體
  9.5  卷積核的初始化
第10章  循環神經網路
  10.1  展開計算圖
  10.2  循環神經網路
  10.3  雙向RNN
  10.4  基於編碼-解碼的序列到序列架構
  10.5  深度循環網路
  10.6  遞歸神經網路
  10.7  長短期記憶網路
  10.8  門控循環單元
  10.9  截斷梯度
第11章  實踐方法論
  11.1  設計流程
  11.2  更多的性能度量方法
  11.3  默認的基準模型
  11.4  要不要收集更多數據
  11.5  超參數的調節
  11.6  模型調試的重要性
第12章  應用
  12.1  大規模深度學習
  12.2  電腦視覺中的預處理
  12.3  語音識別

  12.4  自然語言處理
  12.5  推薦系統
  12.6  知識問答系統
第13章  初識大語言模型
  13.1  大語言模型的背景
  13.2  大語言模型的重要性
  13.3  大語言模型的應用場景
  13.4  大語言模型和傳統方法的區別
第14章  大語言模型原理
  14.1  Transformer架構
  14.2  預訓練
  14.3  微調
  14.4  自回歸訓練
  14.5  掩碼語言模型
第15章  常見的大語言模型
  15.1  GPT系列模型
  15.2  BERT
  15.3  XLNet
第16章  大語言模型應用———自然語言生成
  16.1  自動文本生成
  16.2  對話系統和聊天機器人
  16.3  代碼和技術文檔生成
  16.4  創意內容生成
  16.5  國產優秀大語言模型———文心一言
  16.6  國產優秀大語言模型———訊飛星火認知大模型
後記

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032