幫助中心 | 我的帳號 | 關於我們

這就是DeepSeek(DeepSeek從原理到實踐)/人工智慧與人類未來叢書

  • 作者:王卓//薛棟//隆建|責編:孫金鑫
  • 出版社:北京大學
  • ISBN:9787301361696
  • 出版日期:2025/10/01
  • 裝幀:平裝
  • 頁數:221
人民幣:RMB 69 元      售價:
放入購物車
加入收藏夾

內容大鋼
    這是一本系統講解DeepSeek大模型的技術指南,它全面覆蓋DeepSeek的底層架構、核心原理及實際應用。本書從人工智慧基礎、DeepSeek的技術架構,到多模態模型的訓練與優化,幫助讀者深入理解DeepSeek的工作機制,並掌握DeepSeek在大規模預訓練、推理優化及應用部署中的關鍵技術。全書共有12章,主要包括DeepSeek的使命與願景、人工智慧與大模型、DeepSeek底層架構解密、DeepSeek的工作原理、DeepSeek的內部機制、DeepSeek的架構揭秘、DeepSeek的訓練過程、DeepSeek的訓練優化與成本控制、DeepSeek-R1、稀疏矩陣技術、DeepSeek部署實戰,以及DeepSeek接入實戰。
    本書全面而深入的技術解讀,不僅適用於對大模型感興趣的技術人員,還適合人工智慧研究者、開發者及行業從業者。同時,書中結合實戰案例和對比分析,幫助讀者理解DeepSeek的獨特優勢及未來的發展方向。

作者介紹
王卓//薛棟//隆建|責編:孫金鑫

目錄
第1章  DeepSeek的使命與願景:開闢AI應用新紀元
  1.1  DeepSeek的由來
    1.1.1  DeepSeek的背景與目標
    1.1.2  DeepSeek名稱的由來與理念傳承
    1.1.3  市場機遇與外部環境
    1.1.4  技術貢獻與研發經驗
  1.2  DeepSeek的主要產品和應用場景
    1.2.1  DeepSeek的主要產品
    1.2.2  DeepSeek的應用場景
  1.3  DeepSeek與其他模型的性能對比
  1.4  DeepSeek初體驗
  1.5  DeepSeek API
    1.5.1  DeepSeek API介紹
    1.5.2  DeepSeek API調用方法
    1.5.3  基於DeepSeek API的對話程序
第2章  人工智慧與大模型:智能時代的核心引擎
  2.1  人工智慧基礎介紹
    2.1.1  人工智慧簡介
    2.1.2  傳統機器學習
    2.1.3  深度學習
  2.2  什麼是大模型
    2.2.1  大模型的常用概念
    2.2.2  常見的大模型
  2.3  神經網路
    2.3.1  神經網路的基本概念
    2.3.2  神經網路的訓練過程
  2.4  網路模型
    2.4.1  網路模型、神經網路和大模型的關係
    2.4.2  網路模型的分類
第3章  DeepSeek底層架構解密:探尋大模型的基石
  3.1  基於Transformer架構
    3.1.1  Transformer架構介紹
    3.1.2  Transformer架構的組成
    3.1.3  多頭注意力機制:並行感知的關鍵
    3.1.4  多頭潛在注意力機制:Transformer架構的優化和擴展
  3.2  動態任務分配:智能計算的自適應引擎
    3.2.1  原理剖析
    3.2.2  優勢洞察
    3.2.3  應用場景
  3.3  稀疏激活機制:動態結構感知的高效優化範式
    3.3.1  特性亮點
    3.3.2  實現路徑
  3.4  MoE架構:基於稀疏專家的動態路由系統
    3.4.1  核心原理
    3.4.2  構成要素
    3.4.3  執行流程
    3.4.4  權重分配
    3.4.5  應用落地
    3.4.6  DeepSeek中MoE策略實踐
  3.5  歸一化技術:穩定性與效率的平衡術

    3.5.1  歸一化技術的價值:提升訓練穩定性
    3.5.2  LayerNorm:標準歸一化技術詳解
    3.5.3  RMSNorm:輕量高效的新選擇
  3.6  多令牌預測技術:增強推理能力的新途徑
    3.6.1  技術實現與核心價值
    3.6.2  在DeepSeek中的具體應用
  3.7  高效並行策略:性能極限的系統設計
    3.7.1  專家並行:稀疏模型的併發調度
    3.7.2  流水線並行:跨層任務的持續處理
    3.7.3  數據並行:規模化訓練的利器
  3.8  混合精度與量化:訓練效率的加速器
    3.8.1  混合精度訓練:顯存與性能的理想折中
    3.8.2  精度量化策略:模型壓縮的實用路徑
  3.9  顯存優化與結構共享:資源利用的範式創新
    3.9.1  EMA優化
    3.9.2  頭尾參數共享
第4章  DeepSeek的工作原理:從生成到模型安全的全面解析
  4.1  逐詞生成:DeepSeek的輸出過程
    4.1.1  文本生成的基本機制
    4.1.2  上下文關聯與逐詞生成
    4.1.3  流式輸出與響應速度
  4.2  概率模型:如何生成有意義的文本
    4.2.1  概率分佈與預測機制
    4.2.2  採樣方法與文本多樣性
    4.2.3  生成控制機制與調優策略
  4.3  性能優化與效率提升
    4.3.1  硬體加速與分散式訓練
    4.3.2  模型壓縮與輕量化
    4.3.3  推理優化與實時性
  4.4  模型的安全性與可靠性
    4.4.1  模型的可解釋性與透明度
    4.4.2  模型的偏見與公平性
    4.4.3  模型的魯棒性與安全性
第5章  DeepSeek的內部機制:智能思維的發動機
  5.1  「嵌入」與向量空間
    5.1.1  詞向量的基本概念
    5.1.2  嵌入層的實現原理
    5.1.3  向量空間中的語義關係
  5.2  語義理解與生成
    5.2.1  自然語言的語義理解基礎
    5.2.2  語義編碼與信息捕捉
    5.2.3  生成過程中的語義連貫性
  5.3  模型的決策過程
    5.3.1  內部推理與鏈式思考機制
    5.3.2  決策權重與概率計算
    5.3.3  輸出修正與決策反饋
第6章  DeepSeek的架構揭秘:駕馭大模型的核心
  6.1  探索模型網路:基礎DeepSeekMoE架構剖析
    6.1.1  背景回顧
    6.1.2  專家處理機制

    6.1.3  對比分析
    6.1.4  負載均衡
    6.1.5  微調技術揭秘
    6.1.6  零冗余優化器
  6.2  升級進化:DeepSeek-V3模型全景
    6.2.1  架構縱覽:DeepSeek-V3的設計藍圖
    6.2.2  無輔助損失的負載均衡
    6.2.3  訓練框架搭建
    6.2.4  FPB精度訓練
    6.2.5  推理和部署:規模化應用的落地方案
    6.2.6  模型評估:多維指標下的性能洞察
  6.3  多模態大模型:DeepSeek的跨感知融合
    6.3.1  多模態策略的演進
    6.3.2  基礎模型Janus
    6.3.3  視覺編碼器VQ Tokenizer
    6.3.4  生成適配器
    6.3.5  特徵序列處理
    6.3.6  預訓練策略
  6.4  升級版Janus-Pro:多模態進階的實踐與優化
    6.4.1  關鍵改進:Janus-Pro的性能提升點
    6.4.2  解耦視覺編碼
    6.4.3  初始訓練策略挑戰
    6.4.4  三階段優化:從預熱到精調的訓練全流程
第7章  DeepSeek的訓練過程:從數據到微調的全流程揭秘
  7.1  數據準備與預處理
    7.1.1  數據收集與篩選
    7.1.2  數據清洗與格式化
    7.1.3  數據增強策略
  7.2  基礎訓練:從無到有
    7.2.1  模型初始參數設定
    7.2.2  大規模預訓練過程
    7.2.3  應對訓練難點的解決方案
  7.3  微調與優化:提升性能
    7.3.1  監督微調方法
    7.3.2  強化學習在微調中的應用
    7.3.3  性能評估與迭代優化
第8章  DeepSeek的訓練優化與成本控制:效率與經濟性的雙重探索
  8.1  數據規模、訓練策略與低成本秘訣
    8.1.1  數據規模對性能的影響
    8.1.2  高效訓練策略解析
    8.1.3  低成本計算資源利用方法
  8.2  鏈式思考與可解釋推理:DeepSeek的獨到之處
    8.2.1  鏈式思考原理與實現
    8.2.2  可解釋推理機制的技術亮點
  8.3  開源策略:如何用開放共享降低壁壘
    8.3.1  DeepSeek開源項目簡介
    8.3.2  開源策略的優勢與挑戰
    8.3.3  社區協作與生態建設
    8.3.4  開放共享對行業的推動作用
第9章  DeepSeek-R1:推理模型的革新之旅

  9.1  DeepSeek-R1全景探秘
    9.1.1  DeepSeek-R1的誕生背景
    9.1.2  架構揭秘
  9.2  DeepSeek-R1開源信息概覽
    9.2.1  基礎開源信息介紹
    9.2.2  社區評估報告:項目成熟度與應用前景
  9.3  DeepSeek-R1-Zero自進化訓練體系揭秘
    9.3.1  智能強化學習核心演算法詳解
    9.3.2  精準獎勵機制設計與優化策略
    9.3.3  自監督訓練模板布局
    9.3.4  性能評測
    9.3.5  持續進化之路
  9.4  全場景強化學習:分析完整的訓練策略
    9.4.1  冷啟動突擊
    9.4.2  推理導向訓練範式
    9.4.3  拒絕採樣機制
    9.4.4  監督微調階段
    9.4.5  全場景策略部署
  9.5  蒸餾處理
    9.5.1  技術原理與實施步驟
    9.5.2  精煉小模型實踐
    9.5.3  基礎蒸餾模型
第10章  稀疏矩陣技術:計算效率的新型加速器
  10.1  稀疏矩陣技術概述
    10.1.1  動態稀疏架構
    10.1.2  稀疏矩陣的基礎知識
    10.1.3  稀疏矩陣的存儲格式
    10.1.4  大模型應用場景
  10.2  稀疏矩陣技術在DeepSeek中的應用
    10.2.1  學術洞見如何驅動工程實踐
    10.2.2  NSA的誕生背景
    10.2.3  稀疏注意力方法的重新思考
    10.2.4  NSA的設計理念與創新
    10.2.5  演算法設計要點
    10.2.6  預訓練測試
  10.3  稀疏矩陣技術的前沿探索
    10.3.1  稀疏矩陣技術的性能提升方向
    10.3.2  稀疏矩陣技術與知識圖譜的融合創新
第11章  DeepSeek部署實戰:從本地到雲端的一體化落地
  11.1  基於Ollama的本地部署
    11.1.1  Ollama的主要特點和優勢
    11.1.2  安裝Ollama
    11.1.3  在Ollama部署DeepSeek
    11.1.4  基於本地DeepSeek的對話程序
  11.2  基於Chatbox的本地部署
    11.2.1  基於Chatbox部署的優勢
    11.2.2  基於Chatbox和Ollama本地部署
  11.3  基於LM Studio的本地部署
    11.3.1  安裝LM Studio
    11.3.2  DeepSeek的安裝與配置

    11.3.3  LM Studio API
    11.3.4  基於Dify和LM Studio的DeepSeek聊天程序
  11.4  基於Ollama+Docker+Open WebUI的本地部署
    11.4.1  Open WebUI的特點和功能
    11.4.2  Docker簡介
    11.4.3  使用Docker部署Open WebUI容器
  11.5  DeepSeek的遠程和雲端部署
    11.5.1  常用的遠程和雲端部署平台
    11.5.2  基於騰訊雲創建DeepSeek-R1應用
    11.5.3  基於騰訊雲+ChatbotUI的DeepSeek聊天程序
    11.5.4  基於騰訊雲+CloudStudio的DeepSeek聊天程序
    11.5.5  基於騰訊雲+JupyterLab的DeepSeek聊天程序
第12章  DeepSeek接入實戰:無縫集成與多平台落地指南
  12.1  Chatbox接入實戰
    12.1.1  集成DeepSeek的好處
    12.1.2  接入Chatbox
  12.2  NextChat接入實戰
    12.2.1  NextChat的主要功能
    12.2.2  運行本地源代碼
    12.2.3  本地安裝NextChat
  12.3  通過OfficeAI將DeepSeek接入Office
    12.3.1  OfficeAI功能介紹
    12.3.2  下載並安裝OfficeAI助手
    12.3.3  在Word中應用DeepSeek
    12.3.4  在Excel中應用DeepSeek
  12.4  將DeepSeek接入VS Code
    12.4.1  Continue介紹
    12.4.2  安裝Continue
    12.4.3  調用DeepSeek生成代碼
  12.5  將DeepSeek接入PyCharm
    12.5.1  為PyCharm安裝Continue
    12.5.2  配置DeepSeek
  12.6  基於茴香豆+DeepSeek的微信聊天機器人
    12.6.1  茴香豆介紹
    12.6.2  安裝茴香豆
    12.6.3  微信集成

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032