幫助中心 | 我的帳號 | 關於我們

DeepSeek原理與項目實戰--大模型部署微調與應用開發

  • 作者:編者:未來智能實驗室//代晶|責編:胡俊英
  • 出版社:人民郵電
  • ISBN:9787115665584
  • 出版日期:2025/03/01
  • 裝幀:平裝
  • 頁數:310
人民幣:RMB 99.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    DeepSeek是一種基於Transformer架構的生成式AI(Artificial Intelligence)大模型,融合了MoE架構、混合精度訓練、分散式優化等先進技術,具備強大的文本生成、多模態處理和任務定製化能力。本書系統性地介紹了開源大模型DeepSeek-V3的核心技術及其在實際開發中的深度應用。
    全書分三部分共12章,涵蓋理論解析、技術實現和應用實踐。第一部分從理論入手,詳細解析了Transformer與注意力機制、DeepSeek-V3的核心架構與訓練技術等內容,並探討了Scaling Laws及其在模型優化中的應用。第二部分聚焦于大模型初步體驗、開放平台與API開發、對話生成與代碼補全的實現,以及函數回調與緩存優化(Visual Studio Code),幫助讀者快速掌握關鍵技術的基礎理論和落地實踐。第三部分則通過實際案例剖析DeepSeek在Chat類客戶端、智能AI助理、VSCode編程插件等多領域中的實用集成開發,展示了開源大模型技術在工業與商業場景中的全面應用。
    本書通過深度講解與實用案例相結合的方式,幫助讀者理解DeepSeek大模型從原理到開發的完整流程,學習新技術的實現方法與優化策略,全面提升在大模型領域的理論素養與開發能力。本書適合生成式AI技術研究者、軟體開發工程師、數據科學家,以及希望快速掌握大模型技術並將其應用於實際場景的AI技術愛好者和高校師生閱讀。

作者介紹
編者:未來智能實驗室//代晶|責編:胡俊英

目錄
第一部分  生成式AI的基礎與技術架構
第1章  Transformer與注意力機制的核心原理
  1.1  Transformer的基本結構
    1.1.1  Encoder-Decoder架構
    1.1.2  Self-Attention與Multi-Head機制
    1.1.3  殘差連接與LayerNormalization
  1.2  注意力機制的核心原理
    1.2.1  點積注意力與加性注意力的對比
    1.2.2  Softmax歸一化原理
    1.2.3  注意力矩陣的稀疏性與加速優化
  1.3  Transformer的擴展與優化
    1.3.1  動態注意力的實現
    1.3.2  Long-RangeAttention與Sparse Attention
    1.3.3  多樣化位置編碼
  1.4  上下文窗口
    1.4.1  上下文窗口擴展
    1.4.2  內存與計算複雜度的平衡
    1.4.3  DeepSeek-V3在上下文窗口方面的優化
  1.5  訓練成本與計算效率的平衡
    1.5.1  參數量與計算需求的增長趨勢
    1.5.2  GPU計算架構在Transformer中的應用
    1.5.3  DeepSeek-V3如何降低訓練成本
  1.6  本章小結
第2章  DeepSeek-V3核心架構及其訓練技術詳解
  2.1  MoE架構及其核心概念
    2.1.1  Mixture of Experts(MoE)簡介
    2.1.2  Sigmoid路由的工作機制
    2.1.3  基於MoE的DeepSeek-V3架構設計
  2.2  FP8混合精度訓練的優勢
    2.2.1  混合精度計算的基本原理
    2.2.2  FP8在大模型訓練中的應用
    2.2.3  基於FP8的DeepSeek-V3性能提升策略
  2.3  dualpipe演算法與通信優化
    2.3.1  Dualpipe雙管道處理演算法
    2.3.2  All-to-All跨節點通信機制
    2.3.3  Infiniband與NVLink的帶寬優化
  2.4  大模型的分散式訓練
    2.4.1  數據並行與模型並行的權衡
    2.4.2  DeepSeek-V3的分散式訓練架構
    2.4.3  動態學習率調度器的設計與優化
    2.4.4  無輔助損失的負載均衡策略
    2.4.5  多令牌預測訓練目標
  2.5  緩存機制與Token
    2.5.1  緩存命中與未命中的基本概念
    2.5.2  Token的定義與編碼過程
    2.5.3  DeepSeek-V3的高效緩存機制
  2.6  DeepSeek系列模型
    2.6.1  DeepSeekLLM
    2.6.2  DeepSeekCoder
    2.6.3  DeepSeekMath

    2.6.4  DeepSeekVL
    2.6.5  DeepSeekV
    2.6.6  DeepSeekCoderV
    2.6.7  DeepSeek
  2.7  本章小結
第3章  基於DeepSeek-V3大模型的開發導論
  3.1  大模型應用場景
    3.1.1  文本生成與摘要
    3.1.2  問答系統與對話生成
    3.1.3  多語言編程與代碼生成
  3.2  DeepSeek-V3的優勢與應用方向
    3.2.1  在不同領域的實際表現
    3.2.2  多語言編程能力(基於Aider測評案例)
    3.2.3  代碼與數學任務的應用探索
  3.3  ScalingLaws研究與實踐
    3.3.1  模型規模與性能的關係
    3.3.2  小模型上的ScalingLaws實驗結果
  3.4  模型部署與集成
    3.4.1  API調用與實時生成
    3.4.2  本地化部署
    3.4.3  性能優化策略
  3.5  開發中的常見問題與解決方案
    3.5.1  輸入設計與生成控制
    3.5.2  模型偏差與穩健性問題
    3.5.3  關於DeepSeek-V3特定問題的應對技巧
  3.6  本章小結
第二部分  生成式AI的專業應用與Prompt設計
第4章  DeepSeek-V3大模型初體驗
  4.1  對話與語義理解能力
    4.1.1  單輪對話與多輪對話
    4.1.2  上下文交互
  4.2  數學推理能力
    4.2.1  常規數學題目評估
    4.2.2  複雜難題理解與推理
  4.3  輔助編程能力
    4.3.1  輔助演算法開發
    4.3.2  軟體開發
  4.4  本章小結
第5章  DeepSeek開放平台與API開發詳解
  5.1  DeepSeek開放平台簡介
    5.1.1  平台核心模塊與服務概述
    5.1.2  開放生態中的關鍵角色與協作
  5.2  DeepSeekAPI的基礎操作與API介面詳解
    5.2.1  API調用的認證機制與請求結構
    5.2.2  常用介面的功能解析與示例
  5.3  API性能優化與安全策略
    5.3.1  降低延遲的性能優化技巧
    5.3.2  數據保護與調用許可權管理
  5.4  本章小結
第6章  對話生成、代碼補全與定製化模型開發

  6.1  對話生成的基本原理與實現
    6.1.1  對話模型的輸入輸出設計
    6.1.2  自然語言交互中的上下文管理
  6.2  代碼補全的實現邏輯與優化
    6.2.1  模型對編程語言的適配策略
    6.2.2  深度補全功能的性能優化
  6.3  基於DeepSeek的定製化模型開發
    6.3.1  模型微調與任務特化技術
    6.3.2  定製化對話與補全模型的案例解析
    6.3.3  綜合案例:基於DeepSeek-V3模型的代碼生成與任務特化
  6.4  本章小結
第7章  對話前綴續寫、FIM與JSON輸出開發詳解
  7.1  對話前綴續寫的技術原理與應用
    7.1.1  前綴建模的設計邏輯與實現方案
    7.1.2  多樣化續寫風格的控制與實現
  7.2  Fill-in-the-Middle(FIM)生成模式解析
    7.2.1  FIM任務定義與生成流程
    7.2.2  DeepSeek對FIM任務的優化技術
  7.3  JSON格式輸出的設計與生成邏輯
    7.3.1  結構化數據生成的模型實現
    7.3.2  JSON輸出在實際開發中的應用
    7.3.3  綜合案例:基於DeepSeek模型的多輪對話與結構化數據生成
  7.4  本章小結
第8章  函數回調與上下文硬碟緩存
  8.1  函數回調機制與應用場景
    8.1.1  回調函數原理及其設計原則
    8.1.2  DeepSeek回調優化技巧
  8.2  上下文硬碟緩存的基本原理
    8.2.1  緩存命中與未命中的影響分析
    8.2.2  硬碟緩存實現
  8.3  函數回調與緩存機制的結合應用
    8.3.1  基於上下文的智能緩存調用設計
    8.3.2  高效緩存與回調組合的性能提升案例分析
    8.3.3  綜合案例:智能電站管理系統的DeepSeek集成與優化
  8.4  本章小結
第9章  DeepSeek提示庫:探索Prompt的更多可能
  9.1  代碼相關應用
    9.1.1  代碼改寫
    9.1.2  代碼註釋
    9.1.3  代碼生成
  9.2  內容生成與分類
    9.2.1  內容分類
    9.2.2  結構化輸出
  9.3  角色扮演
    9.3.1  角色扮演(自定義人設)
    9.3.2  角色扮演(情景續寫)
  9.4  文學創作
    9.4.1  散文寫作
    9.4.2  詩歌創作
  9.5  文案與宣傳

    9.5.1  文案大綱生成
    9.5.2  宣傳標語生成
  9.6  模型與翻譯專家
    9.6.1  模型提示詞生成
    9.6.2  中英翻譯專家
  9.7  本章小結
第三部分  實戰與高級集成應用
第10章  集成實戰1:基於LLM的Chat類客戶端開發
  10.1  Chat類客戶端概述與功能特點
    10.1.1  Chat的核心設計理念
    10.1.2  常見應用場景解析
  10.2  DeepSeekAPI的配置與集成
    10.2.1  API密鑰的獲取與配置步驟
    10.2.2  常見介面調用
    10.2.3  Chat類客戶端API集成實現
  10.3  多模型支持與切換實現
    10.3.1  支持多模型切換的架構設計
    10.3.2  不同任務場景下的模型選擇策略
    10.3.3  完整代碼及系統測試
  10.4  本章小結
第11章  集成實戰2:AI智能助理開發
  11.1  AI智能助理:AI時代的啟動器
    11.1.1  AI智能助理的核心功能解讀
    11.1.2  AI助理的商業化應用趨勢
  11.2  DeepSeekAPI在AI智能助理中的配置與應用
    11.2.1  AI智能助理與DeepSeek的API適配流程
    11.2.2  語音識別與自然語言處理的結合應用
  11.3  智能助理功能的實現與優化
    11.3.1  提升問答準確率的優化策略
    11.3.2  持續學習與上下文理解的增強技術
  11.4  本章小結
第12章  集成實戰3:基於VSCode的輔助編程插件開發
  12.1  輔助編程插件概述與核心功能
    12.1.1  輔助編程插件功能定位
    12.1.2  針對開發者的實用功能解析
  12.2  在VSCode中集成DeepSeekAPI的步驟
    12.2.1  插件中調用API的流程
    12.2.2  高效管理API調用的緩存
  12.3  代碼自動補全與智能建議的實現
    12.3.1  深度語義理解下的代碼補全機制
    12.3.2  個性化建議與開發模式靈活配置
  12.4  使用輔助編程插件提升開發效率的技巧
    12.4.1  快速錯誤定位與修復的工具整合
    12.4.2  自動化腳本生成
    12.4.3  快速生成大型項目文檔註釋
    12.4.4  DeepSeek賦能項目構建
    12.4.5  大型項目代碼維護
    12.4.6  多語言支持的智能化代碼生成
    12.4.7  深度整合開發環境的智能化調試工具
    12.4.8  智能化代碼質量評估與優化建議生成

  12.5  本章小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032