幫助中心 | 我的帳號 | 關於我們

深度剖析DeepSeek大模型(原理開發與優化部署)/AIGC與大模型技術叢書

  • 作者:編者:丁小晶//崔遠|責編:丁倫//章承林
  • 出版社:機械工業
  • ISBN:9787111779223
  • 出版日期:2025/04/01
  • 裝幀:平裝
  • 頁數:312
人民幣:RMB 119 元      售價:
放入購物車
加入收藏夾

內容大鋼
    DeepSeek-R1大模型是一款具備強大自然語言處理能力的人工智慧模型,能夠高效完成文本生成、翻譯、問答、代碼編寫等多種任務,適合企業級應用和開發者集成。本書系統性地解析了大模型的核心原理、關鍵技術以及DeepSeek的多個實際應用場景。
    全書共分為12章,首先介紹大模型的基礎知識與發展歷程,從神經網路的起源到大規模預訓練模型的演化,再到Transformer、BERT與GPT等模型架構的深入剖析,幫助讀者理解大模型的技術基石。其次詳細解析了DeepSeek-R1及其Zero版本在強化學習與模型架構上的核心技術,包括混合專家模型、動態學習率調度、分散式訓練及高效推理優化策略等。再次聚焦于模型訓練與開發實踐,介紹API調用、上下文拼接、多輪對話管理、模型微調、知識蒸餾等關鍵技術,並結合DeepSeek實際案例展示其在數學推理、代碼生成等領域的應用。最後著重探討了大模型在商業化落地場景中的高級應用,如FIM補全、多輪對話、業務代碼自動化生成以及基於雲部署的智能推薦搜索系統等。
    本書內容兼具理論深度與實戰價值,同時附贈相關案例代碼、各章思考題及教學視頻等學習資源,適合大模型開發者、AI研究人員、工程師、數據科學家、企業技術決策者以及對人工智慧技術感興趣的高校師生閱讀。無論是希望深入理解大模型技術的專業人士,還是尋求在實際業務中應用AI技術的從業者,都能從中獲得有價值的信息和實踐指導。

作者介紹
編者:丁小晶//崔遠|責編:丁倫//章承林

目錄
前言
第1部分  大模型基礎與核心技術
  第1章  大模型簡介
    1.1  大模型基本概念與發展歷程
      1.1.1  從神經網路到大規模預訓練模型
      1.1.2  深度學習時代:模型規模與數據驅動
      1.1.3  以DeepSeek為例:大模型應用場景擴展及其商業化進程
    1.2  大模型關鍵技術概覽
      1.2.1  Transformer架構簡述
      1.2.2  自監督學習與預訓練技術
      1.2.3  分散式計算與大模型並行化
    1.3  大模型訓練、微調與推理
      1.3.1  數據預處理與模型初始化
      1.3.2  微調技術:全參數微調與參數高效微調
      1.3.3  高效推理優化:量化、剪枝與知識蒸餾
    1.4  對話大模型V3與推理大模型R1
      1.4.1  自然語言理解與自然語言生成模型的異同
      1.4.2  推理大模型的性能優化與低延遲處理
      1.4.3  推理模型在數學推理與代碼編寫中的應用
    1.5  DeepSeek中的模型壓縮與模型蒸餾技術
      1.5.1  模型量化技術:PTQ與QAT
      1.5.2  知識蒸餾:教師模型與學生模型
      1.5.3  壓縮技術對模型性能與推理速度的影響
    1.6  本章小結
  第2章  深度學習與強化學習基礎
    2.1  神經網路與損失函數
      2.1.1  前饋神經網路與卷積神經網路概述
      2.1.2  交叉熵與均方誤差損失
      2.1.3  自適應損失函數與動態權重調整
    2.2  梯度下降、反向傳播與神經網路的訓練
      2.2.1  SGD、Adam與LAMB優化器
      2.2.2  反向傳播演算法與計算圖
      2.2.3  學習率衰減與訓練收斂加速
    2.3  基於PyTorch的深度學習框架簡介
      2.3.1  PyTorch張量操作與自動求導機制
      2.3.2  構建神經網路模型的模塊化設計
      2.3.3  動態計算圖與GPU加速的實現
    2.4  強化學習基礎
      2.4.1  強化學習環境、智能體與獎勵機制
      2.4.2  時間差分學習與Q?Learning詳解
    2.5  監督學習、無監督學習與強化學習對比
      2.5.1  不同學習範式假設
      2.5.2  半監督與自監督學習的實際應用場景
    2.6  基於神經網路的強化學習
      2.6.1  深度Q網路與策略梯度方法融合
      2.6.2  Actor?Critic演算法與優勢函數的優化
      2.6.3  多智能體強化學習框架概述
    2.7  經驗平衡:Epsilon?Greedy
      2.7.1  探索與利用的基本矛盾及其解決思路
      2.7.2  Epsilon參數動態調整策略

      2.7.3  基於分散式系統的Epsilon優化方法
    2.8  基於Q?Learning的神經網路:DQN
      2.8.1  經驗回放機制的實現
      2.8.2  目標網路的穩定性優化
      2.8.3  DQN的改進版本:Double DQN與Dueling DQN
    2.9  本章小結
  第3章  早期自然語言處理與大模型基本網路架構
    3.1  詞嵌入與循環神經網路
      3.1.1  Word2Vec與GloVe詞向量模型的實現原理
      3.1.2  RNN的時間序列數據建模能力
      3.1.3  RNN中的梯度消失與梯度爆炸問題及其緩解策略
    3.2  長短期記憶網路與門控循環單元
      3.2.1  LSTM的門控機制與長期依賴建模
      3.2.2  GRU的簡化結構與性能對比
      3.2.3  LSTM與GRU在自然語言處理任務中的應用場景
    3.3  Transformer與注意力機制
      3.3.1  自注意力機制
      3.3.2  Transformer的編碼器與解碼器架構分析
    3.4  編碼器-解碼器架構
      3.4.1  Seq2Seq模型與注意力機制的結合
      3.4.2  Transformer的編碼器-解碼器架構在機器翻譯中的優勢
    3.5  大模型家族:BERT與GPT簡介
      3.5.1  BERT的預訓練任務:MLM與NSP詳解
      3.5.2  GPT的自回歸語言建模機制與訓練方法
    3.6  本章小結
第2部分  DeepSeek-R1的核心架構與訓練技術
  第4章  基於大規模強化學習的DeepSeek-R1-Zero
    4.1  強化學習演算法
      4.1.1  基於策略優化的強化學習方法:PPO與TRPO
      4.1.2  分散式強化學習架構及其在大模型中的應用
      4.1.3  強化學習演算法的收斂性與穩定性優化策略
    4.2  DeepSeek-R1?Zero獎勵模型
      4.2.1  獎勵建模的理論基礎與設計方法
      4.2.2  DeepSeek-R1?Zero的自適應獎勵函數實現
      4.2.3  獎勵信號稀疏性問題及其改進策略
    4.3  DeepSeek-R1?Zero訓練模板
      4.3.1  基於強化學習的模型訓練流程設計
      4.3.2  模板參數調優與多任務並行訓練策略
      4.3.3  數據採樣與經驗回放在訓練中的作用
      4.3.4  DeepSeek-R1?Zero的自進化過程
    4.4  本章小結
  第5章  基於冷啟動強化學習的DeepSeek-R1
    5.1  冷啟動問題
      5.1.1  冷啟動場景下的數據稀缺
      5.1.2  基於元學習的冷啟動
      5.1.3  遷移學習在冷啟動問題中的應用
    5.2  面向推理的強化學習
      5.2.1  強化學習模型的泛化能力與推理性能優化
      5.2.2  基於推理場景的多任務學習方法
    5.3  拒絕抽樣與監督微調

      5.3.1  拒絕抽樣演算法
      5.3.2  結合監督學習的強化學習模型微調方法
    5.4  全場景強化學習
      5.4.1  多場景強化學習策略設計與泛化能力提升
      5.4.2  動態環境下的適應性強化學習
      5.4.3  面向複雜場景的分層強化學習
    5.5  模型蒸餾:使小模型也具有優秀的推理能力
      5.5.1  基於強化學習的知識蒸餾技術
      5.5.2  蒸餾過程中學生模型的性能優化
    5.6  本章小結
  第6章  DeepSeek-R1架構剖析
    6.1  混合專家架構與Sigmoid路由機制
      6.1.1  混合專家架構的基本原理
      6.1.2  Sigmoid路由機制的動態路由策略優化
      6.1.3  混合專家模型的並行化與擴展能力分析
    6.2  FP8、FP16及混合精度訓練
      6.2.1  低精度數值格式計算
      6.2.2  混合精度訓練與基於FP8/FP16的內存計算
    6.3  DualPipe雙管道處理演算法與All?to?All跨節點通信機制
      6.3.1  雙管道處理架構的設計原理與數據流優化
      6.3.2  All?to?All通信機制
      6.3.3  DeepSeek-R1中的NVLink帶寬優化
    6.4  本章小結
第3部分  DeepSeek-R1的開發與實踐
  第7章  DeepSeek-R1核心訓練技術詳解
    7.1  基於分散式訓練的DeepSeek-R1訓練架構
      7.1.1  分散式數據並行與模型並行的結合策略
      7.1.2  DeepSeek-R1在大規模GPU集群中的訓練優化
      7.1.3  參數伺服器與無中心化訓練架構對比分析
    7.2  動態學習率調度器與緩存機制分析
      7.2.1  動態學習率調整演算法及其理論基礎
      7.2.2  Cosine Annealing與Warmup策略的應用
      7.2.3  基於反饋機制的自適應學習率調度器設計
      7.2.4  KV緩存機制的工作原理與性能提升分析
      7.2.5  緩存機制對多輪對話與長文本生成的影響
    7.3  無輔助損失的負載均衡策略與多令牌預測訓練目標
      7.3.1  無輔助損失機制在負載均衡中的應用
      7.3.2  多令牌預測目標的多樣性提升與優化方法
    7.4  本章小結
  第8章  DeepSeek-R1開發基礎
    8.1  開發前的準備:API Keys的獲取與RESTful API基本調用
      8.1.1  API密鑰生成
      8.1.2  RESTful API基礎調用方法與參數配置
      8.1.3  API許可權控制與安全性優化
    8.2  DeepSeek-R1開發樣例
      8.2.1  基於Python的DeepSeek-R1簡單應用示例
      8.2.2  第三方應用場景
    8.3  本地部署DeepSeek-R1
      8.3.1  DeepSeek-R1模型本地化部署流程
      8.3.2  Docker與虛擬化環境中的部署優化

      8.3.3  模型更新與版本管理
    8.4  本章小結
  第9章  DeepSeek-R1開發進階
    9.1  使用DeepSeek-R1完成數學問題求解
      9.1.1  數學表達式解析與建模方法
      9.1.2  複雜方程求解與邏輯推理能力評估
      9.1.3  數學推理任務中的模型性能優化策略
    9.2  使用DeepSeek-R1編寫代碼實現常見演算法
      9.2.1  代碼補全與常用演算法自動生成實踐
      9.2.2  深度代碼分析與Bug檢測模型優化
    9.3  本章小結
第4部分  DeepSeek-R1的高級應用與商業化落地
  第10章  FIM補全、對話前綴續寫及上下文緩存機制
    10.1  對話補全與FIM補全
      10.1.1  對話補全的上下文管理與連續性優化
      10.1.2  FIM補全技術的原理與應用
      10.1.3  多模態對話系統中的補全策略研究
    10.2  多輪對話與對話前綴續寫
      10.2.1  多輪對話狀態跟蹤與上下文管理機制
      10.2.2  對話前綴續寫模型微調
      10.2.3  高複雜度多輪對話場景下的模型適應性分析
    10.3  JSON文件輸出與函數回調
      10.3.1  JSON數據結構生成與解析策略
      10.3.2  DeepSeek-R1中基於函數回調的互動式開發模式
    10.4  上下文硬碟緩存
      10.4.1  硬碟緩存機制在大規模推理任務中的應用
      10.4.2  緩存一致性管理與數據有效性
    10.5  本章小結
  第11章  後端業務代碼輔助生成插件
    11.1  自動化代碼生成流程
      11.1.1  業務邏輯到代碼生成的映射機制
      11.1.2  代碼模板與領域特定語言的結合使用
      11.1.3  代碼生成質量評估與模型反饋機制
    11.2  API自動化文檔生成
      11.2.1  基於代碼註釋的API文檔自動生成流程
      11.2.2  文檔與代碼同步更新的自動化策略
      11.2.3  API文檔可讀性與交互性優化方法
    11.3  代碼重構與性能優化建議生成
      11.3.1  基於DeepSeek-R1的代碼複雜度分析與優化建議生成
      11.3.2  跨語言代碼轉換
    11.4  智能錯誤檢測與自動修復
      11.4.1  靜態代碼分析中的自動化錯誤檢測
      11.4.2  運行時異常自動識別與修復
    11.5  代碼審計與安全檢測
      11.5.1  代碼安全漏洞自動化檢測技術
      11.5.2  審計規則引擎與合規性分析
    11.6  本章小結
  第12章  DeepSeek-R1&V3的聯合開發:基於雲部署的智能推薦搜索系統
    12.1  雲端部署架構設計
      12.1.1  基於Kubernetes的模型容器化部署方案

      12.1.2  高可用性與彈性擴展的雲端架構
      12.1.3  分散式存儲與數據管理
    12.2  智能搜索引擎開發
      12.2.1  自然語言處理驅動的搜索演算法優化
      12.2.2  基於語義理解的智能檢索與推薦機制
    12.3  數據流與實時處理系統集成
      12.3.1  高併發場景下的數據流處理架構
      12.3.2  Kafka與實時數據處理平台集成
    12.4  智能廣告投放與效果優化
      12.4.1  廣告推薦系統中的模型應用場景
      12.4.2  基於用戶行為數據的廣告投放策略優化
      12.4.3  A/B測試與廣告效果實時評估
    12.5  本章小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032