幫助中心 | 我的帳號 | 關於我們

經典並行與量子並行(提升並挖掘計算系統的潛在性能)/電腦科學前沿叢書

  • 作者:編者:劉宇航|責編:梁偉//舒宜
  • 出版社:機械工業
  • ISBN:9787111750826
  • 出版日期:2024/10/01
  • 裝幀:平裝
  • 頁數:578
人民幣:RMB 129 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書深入淺出介紹后摩爾時代的並行計算核心技術,理論與實踐並重,同時兼顧數學模型、結構模型、編程模型。本書具有以下特色:從概念上明確算勢與算力的聯繫與區別,強調在后摩爾時代背景下從潛在能力(算勢)到實際能力(算力)的充分轉化的重要性;注重量化分析和理論推導,單列一章對計算性能模型和存儲性能進行了介紹;注重並行應用程序的設計,單列一章介紹並對比分析了共享存儲編程與非共享存儲編程的基本原理;注重融會貫通,培養整體觀念,分別考察了共享存儲結構和分散式存儲結構,揭示潛在的可利用的並行硬體資源以及對應的編程方法;編製了大量的原創的有助於提高讀者理解深度和應用知識能力的例題;在國內外同類教材或專著中,率先以算勢和算力的統一的視角,系統對比了經典並行計算與量子並行計算,促進兩個領域的溝通融合。
    本書可供電腦系統和晶元設計人員、期望利用並行計算的思想和技術解決具體領域問題的人員使用,也可作為教材供理工科專業的高年級本科生和研究生及相關專業技術人員使用。

作者介紹
編者:劉宇航|責編:梁偉//舒宜
    劉宇航,中國科學院計算技術研究所副研究員,碩士生導師,研究方向為電腦體系結構,包括高性能計算、數據密集型計算、存儲系統、智能併發系統等。在國內外有影響的期刊和學術會議上發表多篇高水平論文,多項關鍵技術實際落地應用到工業界一線晶元或系統,致力解決卡脖子技術問題。獲中國科學院計算技術研究所「優秀研究人員」「卓越之星」、電腦體系結構國家重點實驗室「優秀研究人員」等榮譽稱號。擔任中國科學院大學崗位副教授(講授研究生必修課「並行處理」)、中國科學院大學「一生一芯」計劃指導教師、《中國電腦學會通訊》專欄作家、中國電腦學會職業倫理和學術道德委員會常務委員、中國電腦學會高級會員、《中國電腦學會通訊》編委。

目錄
推薦序一
推薦序二
前言
第1章  計算概念的譜系
  1.1  引言
  1.2  計算概念譜系化的意義
  1.3  計算概念的譜系
    1.3.1  算勢
    1.3.2  算力
    1.3.3  算術
    1.3.4  演算法
    1.3.5  算禮
  1.4  計算概念譜系組分的相互關係
  1.5  從場的角度認識算勢與算力的異同
  1.6  證明與計算之間的關係
  1.7  本章小結
  1.8  思考題
  參考文獻
第2章  並行處理的意義及挑戰
  2.1  引言
  2.2  並行電腦與應用和工藝的關係
  2.3  並行處理的普遍性
  2.4  多核微處理器技術
  2.5  並行處理需要應對的挑戰
  2.6  並行處理的學科任務
  2.7  本章小結
  2.8  思考題
  參考文獻
第3章  並行處理的一般原理
  3.1  引言
  3.2  馮·諾依曼結構
  3.3  通過實例說明指令級並行與數據依賴
  3.4  通過實例說明線程級並行
  3.5  延遲隱藏和延遲減少
  3.6  並行處理技術的圖形化表示
  3.7  費林分類法
  3.8  指令級並行
    3.8.1  流水線技術
    3.8.2  指令的動態調度
    3.8.3  多發射技術
  3.9  並行電腦系統的分類
    3.9.1  向量電腦
    3.9.2  多處理機
    3.9.3  多主機
    3.9.4  大規模並行處理電腦
  3.10  並行結構的類型
    3.10.1  單處理器的並行結構
    3.10.2  多處理器的並行結構
    3.10.3  處理機結構創新的歷史
    3.10.4  多核共享內存模型

    3.10.5  多核消息傳遞模型
  3.11  本章小結
  3.12  思考題
  參考文獻
第4章  計算性能模型和存儲性能模型
  4.1  引言
  4.2  並行執行時間效率模型
  4.3  可擴展定律
    4.3.1  阿姆達爾定律
    4.3.2  古斯塔夫森-巴西斯定律
    4.3.3  存儲受限的擴展定律(孫-倪定律)
  4.4  並行計算模型
    4.4.1  PRAM模型
    4.4.2  BSP模型
    4.4.3  LogP模型
  4.5  程序性能指標
    4.5.1  單道程序工作負載的性能指標
    4.5.2  多道程序工作負載的性能指標
  4.6  存儲系統的性能指標
    4.6.1  平均存儲訪問時間
    4.6.2  存儲延遲與存儲帶寬
    4.6.3  單位時鐘周期完成的存儲訪問數量
    4.6.4  併發平均存儲訪問時間
    4.6.5  存儲級並行性
    4.6.6  併發感知的局部性
  4.7  基準測試
    4.7.1  基準測試的定義和分類
    4.7.2  基準測試運行的規範
    4.7.3  基準測試程序組的要求
    4.7.4  基準測試的開發者
    4.7.5  性能測試結果的總結
  4.8  性能評估方式
    4.8.1  Roofline模型
    4.8.2  模擬器
    4.8.3  需要避免的4個陷阱
  4.9  本章小結
  4.10  思考題
  參考文獻
第5章  共享存儲結構與編程
  5.1  引言
  5.2  共享存儲體系結構的類型
  5.3  並行編程模型
    5.3.1  抽象與實現的區別及其實例
    5.3.2  通信與協作
    5.3.3  通信層面三種並行編程模型的特點
    5.3.4  混合編程模型
  5.4  並行處理的流程
    5.4.1  思路和實例
    5.4.2  問題分解
    5.4.3  任務分配

    5.4.4  協調
    5.4.5  進程映射
  5.5  並行編程優化
    5.5.1  靜態分配與動態分配
    5.5.2  延遲與帶寬
    5.5.3  內在通信與人為通信
  5.6  減少通信的技術
    5.6.1  利用時間局部性
    5.6.2  利用空間局部性
  5.7  共享內存體系結構
  5.8  共享內存體系結構編程——OpenMP
  5.9  實驗——OpenMP
    5.9.1  實驗——OpenMP求sinx
    5.9.2  實驗——OpenMP求π值
    5.9.3  實驗——OpenMP求斐波那契數列第n項
    5.9.4  實驗——Gauss-Seidel迭代演算法的並行實現及其優化
  5.10  本章小結
  5.11  思考題
  參考文獻
第6章  分散式存儲結構與編程
  6.1  引言
  6.2  向量處理機體系結構
    6.2.1  結構特點
    6.2.2  性能分析
    6.2.3  向量指令並行
    6.2.4  向量鏈
    6.2.5  向量分解strip-mining技術
    6.2.6  向量條件執行
    6.2.7  壓縮/展開操作
    6.2.8  向量歸約
    6.2.9  存儲訪問
    6.2.10  分散和聚集
  6.3  SIMD編程
    6.3.1  SIMD簡介
    6.3.2  實現向量化的幾種方法
    6.3.3  向量化編譯指令
    6.3.4  向量化過程中的主要挑戰
    6.3.5  編譯器向量化方式
    6.3.6  循環變換
    6.3.7  數據地址對齊
    6.3.8  別名
    6.3.9  條件語句
    6.3.10  原生SIMD支持
  6.4  CUDA編程
    6.4.1  異構計算的定義
    6.4.2  CUDA
    6.4.3  GPU的併發控制
    6.4.4  GPU的內存管理
    6.4.5  SIMT
    6.4.6  CUDA編程

    6.4.7  CUDA與GPU硬體之間的映射
    6.4.8  深流水線設計
    6.4.9  GPU內存
    6.4.10  GPU併發策略
    6.4.11  庫函數介紹
  6.5  MPI編程
    6.5.1  MPI在編程模型內的分類定位
    6.5.2  信息交互模型與通信方式
    6.5.3  MPI基本函數
    6.5.4  MPI程序執行(以C on linux為例)
    6.5.5  MPI集群通信函數
  6.6  實驗——編寫MPI並行程序
    6.6.1  編寫MPI程序並行計算平均值
    6.6.2  編寫MPI程序並行計算矩陣向量乘法
    6.6.3  編寫MPI程序並行計算圓周率
  6.7  實驗——基於CUDA併發的矩陣乘法
  6.8  本章小結
  6.9  思考題
第7章  並行電腦系統的互連網路
  7.1  引言
  7.2  互連網路的基本概念
    7.2.1  互連網路分層架構
    7.2.2  互連網路相關參數
  7.3  互連網路物理層
    7.3.1  消息結構
    7.3.2  物理層流控制
  7.4  互連網路交換層
    7.4.1  互連網路交換層功能與架構
    7.4.2  互連網路交換層技術
  7.5  互連網路路由層
    7.5.1  互連網路拓撲結構
    7.5.2  互連網路路由方式
    7.5.3  路由協議結構
    7.5.4  蝴蝶形拓撲結構路由演算法
    7.5.5  維序路由演算法
    7.5.6  死鎖問題
  7.6  互連網路軟體層
    7.6.1  互連網路軟體層架構
    7.6.2  性能分析
  7.7  本章小結
  7.8  思考題
第8章  並行電腦系統的資源調度
  8.1  引言
  8.2  相關工作
    8.2.1  延遲敏感型應用延遲測量與建模
    8.2.2  數據中心干擾的測度方法
    8.2.3  資源管理使能技術
    8.2.4  資源調度策略
  8.3  延遲敏感型應用分析與建模
    8.3.1  延遲敏感型應用概述

    8.3.2  延遲敏感型應用延遲的組成及影響因素
    8.3.3  平均延遲與尾延遲的關係
    8.3.4  Little-s law的尾延遲形式
  8.4  數據中心干擾的測度
    8.4.1  信息熵與系統熵
    8.4.2  場景1:僅存在延遲敏感型應用時
    8.4.3  場景2:僅存在儘力交付型應用時
    8.4.4  場景3:延遲敏感型和儘力交付型應用混合運行時
    8.4.5  系統熵的優點
  8.5  資源調度策略
    8.5.1  調度方法
    8.5.2  實驗驗證
  8.6  本章小結
  8.7  思考題
  參考文獻
第9章  並行輸入輸出
  9.1  引言
  9.2  I/O軟體棧
  9.3  並行文件系統
  9.4  常見並行文件系統
    9.4.1  並行虛擬文件系統PVFS
    9.4.2  通用並行文件系統GPFS
    9.4.3  集群文件系統Lustre
  9.5  POSIX
  9.6  MPI-I/O
    9.6.1  MPI-I/O的特性
    9.6.2  MPI-I/O示例
    9.6.3  MPI-I/O的底層讀寫優化
  9.7  PnetCDF
  9.8  本章小結
  9.9  思考題
  參考文獻
第10章  高速緩存一致性、同步和事務性內存
  10.1  引言
  10.2  高速緩存一致性
    10.2.1  基於匯流排的一致性協議
    10.2.2  基於目錄的一致性協議
  10.3  目錄結構
    10.3.1  全映射位向量目錄
    10.3.2  有限指針目錄
    10.3.3  鏈式目錄
    10.3.4  粗糙向量目錄
    10.3.5  樹形壓縮向量目錄
    10.3.6  單級混合目錄
    10.3.7  多級目錄
  10.4  實現高速緩存一致的典型系統
    10.4.1  Dash
    10.4.2  Origin
    10.4.3  Alewife
    10.4.4  Exemplar X

    10.4.5  NUMA
  10.5  同步原語和鎖機制
    10.5.1  同步原語
    10.5.2  互斥鎖的實現
    10.5.3  柵障
    10.5.4  實驗——無鎖演算法
    10.5.5  並行軟體優化
  10.6  事務性內存
    10.6.1  事務性內存的特性
    10.6.2  事務性內存的優點
    10.6.3  事務性內存的實現
  10.7  本章小結
  10.8  思考題
  參考文獻
第11章  量子並行計算
  11.1  引言
  11.2  對量子力學的基本理解
    11.2.1  量子力學與經典力學有本質區別
    11.2.2  量子計算的優勢在於並行
    11.2.3  量子的概念
    11.2.4  不確定性原理
    11.2.5  對疊加態的理解
    11.2.6  張量積
    11.2.7  左矢與右矢
  11.3  幾種重要的熵及其聯繫
    11.3.1  一些重要的基本問題
    11.3.2  三種熵的定義
    11.3.3  朗道原理
  11.4  量子門
    11.4.1  酉運算元
    11.4.2  量子非門X
    11.4.3  泡利-Y門
    11.4.4  泡利-Z門
    11.4.5  哈達瑪門H
    11.4.6  相移門Rθ
    11.4.7  交換門SWAP
    11.4.8  受控非門CNOT
    11.4.9  受控U門C(U)
    11.4.10  托佛利門CCNOT
  11.5  量子演算法
    11.5.1  最小完全集
    11.5.2  肖爾演算法
    11.5.3  格羅夫演算法
    11.5.4  量子編程
  11.6  本章小結
  11.7  思考題
  參考文獻
術語中英文對照

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032