幫助中心 | 我的帳號 | 關於我們

混合架構超算並行程序設計與應用(新工科建設之路電腦類專業系列教材)

  • 作者:編者:儲根深//胡長軍|責編:張鑫
  • 出版社:電子工業
  • ISBN:9787121451546
  • 出版日期:2023/02/01
  • 裝幀:平裝
  • 頁數:230
人民幣:RMB 52 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書面向國產E級超算的體系結構和高性能計算領域,關注近年來出現的新超算硬體和新軟體技術(如神威E級超算編程模式、DCU編程模式)。本書涵蓋神威、曙光等超算的硬體架構與編程方法,深度結合國產超算體系結構特點,以實例的形式探討異構超算上的高性能演算法設計、優化技術及高性能軟體的開發和優化方法。
    本書可作為高等院校電腦科學與技術、軟體工程等專業本科生或研究生的教材,使其在掌握通用電腦程序設計的基礎上,進一步提升在該領域的理論知識水平和程序優化實踐技能,也可作為從事高性能計算和體系結構研究的科研工作者與工程技術人員的參考資料,同時也能為關注高性能計算與超算技術發展的讀者提供有益參考。

作者介紹
編者:儲根深//胡長軍|責編:張鑫

目錄
第1章  緒論
  1.1  高性能計算應用需求和意義
  1.2  混合架構超算髮展趨勢
  1.3  如何進行異構混合架構上的程序設計
  1.4  本書的內容和安排
第2章  異構混合架構概述
  2.1  國際國內超算現狀
    2.1.1  超算髮展歷程
    2.1.2  超算髮展現狀
    2.1.3  我國超算髮展現狀
  2.2  典型的混合架構電腦
    2.2.1  CPU+GPU架構:以Frontier、Summit、Aurora為代表
    2.2.2  ARM架構:日本富岳
    2.2.3  CPU+DCU:曙光超算
    2.2.4  神威主從核架構:新一代神威超算
    2.2.5  新一代天河超算
  2.3  混合架構程序設計語言與框架概述
    2.3.1  OpenMP
    2.3.2  MPI
    2.3.3  CUDA/HIP
    2.3.4  OpenACC
    2.3.5  Athread
    2.3.6  OpenCL
    2.3.7  oneAPI
  習題
  參考文獻
第3章  異構混合架構性能分析理論
  3.1  並行程序的時間開銷
  3.2  相對性能
  3.3  絕對性能
  3.4  性能瓶頸
    3.4.1  計算密度
    3.4.2  訪存密集與計算密集
    3.4.3  roofline性能模型
    3.4.4  roofline分析示例:SpMV
  習題
  參考文獻
第4章  CPU高性能程序設計
  4.1  內存模型與OpenMP、MPI並行編程方法
  4.2  OpenMP並行編程簡介
    4.2.1  OpenMP的Hello World
    4.2.2  編譯制導指令
    4.2.3  運行時庫函數
    4.2.4  環境變數
    4.2.5  OpenMP offload
  4.3  MPI並行編程簡介
    4.3.1  MPI基本函數
    4.3.2  MPI通信模式
  4.4  SIMD向量化
    4.4.1  CPU向量化指令集發展

    4.4.2  向量化編程實踐
  4.5  性能分析工具
    4.5.1  perf工具
    4.5.2  gprof工具
    4.5.3  IPM工具
    4.5.4  Score-P工具
  習題
第5章  神威異構眾核程序設計
  5.1  神威超算及編程環境概述
    5.1.1  神威超算的背景及歷史
    5.1.2  神威·太湖之光超算架構
    5.1.3  新一代神威超算架構
    5.1.4  神威編程環境
    5.1.5  訪存層次
  5.2  神威眾核編程
    5.2.1  眾核程序結構
    5.2.2  從核函數
    5.2.3  第一個並行程序
    5.2.4  示例:stencil計算優化
  5.3  神威SIMD
    5.3.1  SIMD簡介
    5.3.2  SIMD示例
  習題
第6章  面向DCU架構的程序設計與優化
  6.1  曙光超算及編程環境概述
    6.1.1  曙光超算簡介
    6.1.2  曙光超算節點架構
    6.1.3  ROCm/DTK編程環境
  6.2  HIP編程方法
    6.2.1  HIP與CUDA
    6.2.2  曙光DCU編程模型
    6.2.3  HIP編程
  6.3  利用LDS進行數據共享
    6.3.1  LDS概念
    6.3.2  LDS使用實例
  6.4  線程間通信
    6.4.1  Block級線程通信
    6.4.2  wavefront級線程通信
  6.5  reduce優化
  習題
第7章  異構混合架構上的演算法設計
  7.1  DCU上的前綴和
    7.1.1  Prefix Sum簡介
    7.1.2  並行難點
    7.1.3  wavefront Scan演算法
    7.1.4  Block Scan演算法
    7.1.5  全局Scan演算法
    7.1.6  更高效的Scan演算法
  7.2  通用矩陣乘
    7.2.1  GEMM簡介

    7.2.2  並行難點
    7.2.3  面向DCU的GEMM優化
    7.2.4  BENCHMARK
  7.3  DCU上的稀疏矩陣向量乘
    7.3.1  概述
    7.3.2  稀疏矩陣CSR存儲格式
    7.3.3  並行難點
    7.3.4  高效SpMV演算法實現
  習題
第8章  異構混合架構常用演算法庫
  8.1  演算法庫介紹
    8.1.1  常見演算法庫層次
    8.1.2  國內外典型超算上的演算法庫
  8.2  稠密矩陣計算庫:rocBLAS、cuBLAS、swBLAS
    8.2.1  BLAS介面介紹
    8.2.2  rocBLAS
    8.2.3  cuBLAS
  8.3  稀疏矩陣計算庫:rocSPARSE、cuSPARSE、swSPARSE
    8.3.1  常用的稀疏矩陣的存儲格式
    8.3.2  rocSPARSE
    8.3.3  cuSPARSE
    8.3.4  swSPARSE
  8.4  LAPACK線性代數計算庫:特徵值、LU
    8.4.1  LAPACK介紹
    8.4.2  rocSOLVER
    8.4.3  cuSOLVER
  8.5  線性方程組求解
    8.5.1  常用的求解演算法
    8.5.2  PETSc的層次架構
  習題
第9章  異構混合架構上並行應用程序開發示例
  9.1  MISA-MD分子動力學模擬程序異構優化
    9.1.1  分子動力學模擬概述
    9.1.2  面向DCU的MD優化的挑戰性及優化思路
    9.1.3  主機-設備間通信及其優化
    9.1.4  並行計算策略
    9.1.5  其他訪存優化技術
  9.2  SUMMER-CD
    9.2.1  軟體介紹
    9.2.2  物理模型
    9.2.3  三層並行模型
    9.2.4  自適應異構數據傳輸
    9.2.5  基於Stream的計算通信重疊
  9.3  有限體積法求解聖維南方程組在神威·太湖之光上的優化
    9.3.1  物理模型簡介
    9.3.2  使用Athread線程庫加速
    9.3.3  SIMD
    9.3.4  雙緩衝機制
    9.3.5  優化效果

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032