幫助中心 | 我的帳號 | 關於我們

OpenCL異構計算

  • 作者:賈斯特|譯者:張雲泉//張先軼//龍國平//姚繼鋒
  • 出版社:清華大學
  • ISBN:9787302286851
  • 出版日期:2012/06/01
  • 裝幀:平裝
  • 頁數:277
人民幣:RMB 76 元      售價:
放入購物車
加入收藏夾

內容大鋼
    《OpenCL異構計算》編著者 Benedict R.Gaster、Lee Howes、David、R.Kaeli、 Perhaad Mistry、Dana Schaa 。 
    《opencl異構計算》提供opencl的第一手資料,詳盡闡述了如何在異構環境下進行並行編程。第1章首先介紹如何在並行系統下編程,定義異構編程需要理解的概念。第2?4章循序漸進地介紹opencl的基本架構。第5章和第6章對這些概念加以擴展,旨在幫助讀者更好地理解。第7~10章提供4個更複雜的案例學習,讓讀者理解到opencl具有廣泛的應用。第11~13章鎖定高級主題展開討論。  本書可幫助學生和研究人員更好地理解通用異構計算(尤其是opencl提供的解決方案),尤其是適合不同經驗水平的學生,可以作為opencl課程的教材或其他課程的參考,例如並行編程課程和高級課程。

作者介紹
賈斯特|譯者:張雲泉//張先軼//龍國平//姚繼鋒

目錄
第一章 並行編程入門  
引言  
opencl  
本書目標  
並行思維  
併發編程模型和並行編程模型  
線程和共享內存  
消息傳遞通信  
不同的並行粒度  
數據共享和同步  
本書結構  
參考文獻  
擴展閱讀和相關網站  

第二章 opencl簡介  
引言  
opencl標準  
opencl 規範  
kernel和opencl執行模型  
平台和設備  
主機-設備交互  
執行環境  
上下文  
命令隊列  
事件  
內存對象  
flush命令和finish命令  
新建一個opencl程序對象  
opencl的kernel  
內存模型  
編寫kernel  
向量相加實例的完整代碼  
小結  
參考文獻  

第三章 opencl設備架構  
引言  
硬體權衡  
性能隨頻率的提升及其限制  
超標量執行  
vliw  
simd和向量處理  
硬體多線程  
多核架構  
集成:片上系統和apu  
高速緩存層次和內存系統  
架構設計空間  
cpu設計  
gpu體系結構  
apu和類apu的設計  

小結  
參考文獻  

第四章 opencl基本實例  
引言  
應用實例  
簡單的矩陣相乘  
圖像卷積實例  
小結  

第五章 opencl的併發與執行模型  
引言  
kernel,work_item,workgroup和
執行域  
opencl同步:kernel,fence和barrier  
隊列與全局同步  
opencl內存一致性  事件  
命令barrier與marker  
主機端內存模型  
buffer對象  
image對象  
設備端內存模型  
設備端寬鬆的內存一致性  
全局內存  
本地內存  
常量內存  
私有內存  
小結  

六章 opencl在cpu/gpu
平台上的實現  
引言  
opencl在amd phenom ii x上的
實現  
opencl在amd radeon hd
gpu上的實現  
多線程和內存系統  
基於clause的simd執行  
資源分配  
opencl的內存性能  
opencl全局內存  
本地內存——軟體管理的cache  
小結  
參考文獻  

第七章 opencl案例學習:卷積  
引言  
計算卷積的kernel  
選擇合適的workgroup大小  
將數據緩存到本地內存  

執行卷積  
小結  
代碼清單  
主機端代碼  
kernel代碼  
參考文獻  

第八章 opencl案例學習:
視頻處理  
引言  
獲得視頻幀  
cpu上的解碼  
在gpu上解碼視頻  
在opencl中處理一個視頻  
在多個視頻上處理多個不同effect  
事件鏈  
最終輸出顯示到屏幕  
opencl/opengl協同工作能力  
小結  

第九章 opencl案例學習:直方圖  
引言  
選擇適量的work-group  
選擇最優的work-group大小  
全局內存訪存優化  
使用原子操作計算局部直方圖  
本地內存訪存優化  
局部直方圖的規約  
全局規約  
完整的kernel代碼  
性能和小結  

第十章 opencl案例學習:
混合粒子模擬  
引言  
計算概覽  
gpu實現  
創建buffer  
構造加速結構  
計算碰撞  
合成  
cpu實現  
負載均衡  
性能和小結  
生成均勻網格的kernel代碼  
粒子模擬的kernel代碼  
第十一章 opencl擴展  
引言  
擴展機制概覽  
設備拆分  

雙精度  
參考文獻  

第十二章 opencl的性能剖析和
調試  
引言  
基於事件的剖析  
amd app profiler  
收集opencl程序軌跡  
收集opencl gpu kernel性能
計數器  
amd app kernelanalyzer  
演示amd app profiler  
啟動amd app profiler  
使用應用程序的軌跡數據
以發現性能瓶頸  
使用gpu性能計數器發現kernel的
性能瓶頸  
調試opencl應用程序  
gdebugger概覽  
使用gdebugger調試並行opencl
應用程序  
amd printf擴展  
小結  

第十三章 webcl  
引言  
框架設計  
webcl 實驗性實現  
firefox擴展  
連接javascript和opencl  
webcl動手練習  
web照片編輯器  
討論  
小結  
參考文獻  
擴展閱讀和相關網站  
索引  


  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032