幫助中心 | 我的帳號 | 關於我們

微處理器體系結構專利技術研究方法(第2輯x86多媒體指令集)

  • 作者:編者:徐步陸|責編:趙艷春//霍明亮
  • 出版社:科學
  • ISBN:9787030771377
  • 出版日期:2023/12/01
  • 裝幀:平裝
  • 頁數:294
人民幣:RMB 158 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書研究x86多媒體指令集擴展專利技術實現的思路、方法。MMX與之後的SSE、AVX等一系列x86多媒體擴展指令集使得處理器支持的緊縮數據的數據元素類型從整數擴展到單精度、雙精度浮點數,寬度從8位擴展到16位、32位、64位、512位。本書第1章分析MMX指令集專利技術。第2?7章研究SSE、SSE2、SSE3、SSSE3、SSE4等專利技術。第8?11章研究AVX、AVX2和AVX-512等專利技術。
    上述指令集擴展不但高效地實現多媒體應用處理的初衷,今天更是成功地應用在信號處理、科學計算、人工智慧等高算力領域。本書中相關的專利技術方案是研製x86處理器時難得的一手資料,具有工業實現和科學研究的雙重價值。本書可為從事CPU處理器、異構處理器和人工智慧模型領域研發的相關科研人員、工程師和廣大師生提供參考。

作者介紹
編者:徐步陸|責編:趙艷春//霍明亮

目錄
前言
第1章  多媒體擴展指令集專利技術
  1.1  緊縮數據打包和拆開指令
  1.2  緊縮數據乘加(乘減)指令和運算
  1.3  緊縮數據移位指令
  1.4  緊縮數據加或減指令
  1.5  緊縮數據移動指令
  1.6  清空MMX寄存器狀態指令
  1.7  帶飽和操作類指令
  1.8  緊縮數據數量統計指令
  1.9  MMX指令序列應用
    1.9.1  複數濾波和複數乘累加
    1.9.2  兩緊縮數據對應元素求差的絕對值運算
第2章  流式傳輸SIMD擴展指令集專利技術
  2.1  SIMD單精度浮點指令
    2.1.1  高位或低位緊縮單精度浮點數移動指令
    2.1.2  緊縮浮點混洗指令
    2.1.3  SSE單精度浮點數交織拆開指令
    2.1.4  不同寄存器結構的多種整數和浮點數互相轉換
  2.2  SSE 64位SIMD整型指令
    2.2.1  緊縮絕對差值之和指令
    2.2.2  插入和提取指令
    2.2.3  緊縮整數最小值和最大值指令數據預處理電路優化
  2.3  緩存能力控制和預取指令
    2.3.1  位元組掩碼寫四字指令定義和實現
    2.3.2  使用推測實現位元組掩碼寫操作
  2.4  SSE指令序列應用:矩陣乘法加速
    2.4.1  指令序列實現緊縮數據水平加法
    2.4.2  動態數據重排法實現矩陣乘法
第3章  流式傳輸SIMD擴展2(SSE2)指令集專利技術
  3.1  緊縮和標量雙精度浮點指令
  3.2  128位緊縮整型指令
第4章  流式傳輸SIMD擴展3(SSE3)指令集專利技術
  4.1  128位非對齊整型數據載入指令
  4.2  緊縮數據水平算術指令
    4.2.1  緊縮數據水平加法指令和基於水平加法的矩陣乘法
    4.2.2  緊縮數據水平算術指令和8點時間抽取操作指令序列
  4.3  浮點載入、移動及複製指令
  4.4  改進的線程同步指令
第5章  補充流式傳輸SIMD擴展3(SSSE3)指令集專利技術
  5.1  緊縮數據符號乘法指令和求絕對值指令
  5.2  帶舍入和縮放組合高位乘法指令
  5.3  緊縮位元組整型帶掩碼的混洗指令
第6章  流式傳輸SIMD擴展4(SSE4)指令集專利技術
  6.1  SSE4.1
    6.1.1  緊縮浮點數點積
    6.1.2  邏輯比較並設置零和進位
    6.1.3  帶舍入模式的緊縮和標量浮點值舍入
  6.2  SSE4.2
    6.2.1  字元串和文本比較

    6.2.2  面嚮應用的加速器指令
第7章  其他流式傳輸SIMD指令或指令序列專利技術
  7.1  數據交換取反指令增強複數乘法操作
  7.2  緊縮整數轉換為緊縮浮點數的指令序列優化
  7.3  帶存取模式的存儲器存取指令
  7.4  四像素平均值指令邏輯實現和電路改進
    7.4.1  四像素平均指令FPA實現電路優化
    7.4.2  四數據平均值指令WAVG4電路優化技術和圖像縮小應用
  7.5  移位和異或指令
第8章  高級矢量擴展指令集專利技術
  8.1  掩碼移動指令
  8.2  高精度的浮點倒數計算指令實現方法
  8.3  通道內混洗指令
  8.4  尺寸不同的緊縮浮點和緊縮整型轉換指令
第9章  高級矢量擴展2(AVX2)指令集專利技術
  9.1  聚集和分散指令:跨距訪存支持
    9.1.1  聚集和分散指令集
    9.1.2  聚集和分散擴展:支持原子操作的向量鏈接聚集和條件分散指令
  9.2  置換、移位和循環的實現優化
第10章  高級矢量擴展512(AVX-512)指令集專利技術
  10.1  寫掩碼廣播指令
  10.2  寫掩碼對齊向量指令
  10.3  擴展與壓縮指令
  10.4  寫掩碼混合指令
  10.5  掩碼向量的置換指令
  10.6  掩碼操作類指令
    10.6.1  緊縮數據掩碼移位指令
    10.6.2  緊縮數據掩碼算術組合指令
    10.6.3  緊縮數據掩碼串聯指令
    10.6.4  緊縮數據寫掩碼比特壓縮指令
    10.6.5  掩碼寄存器上的廣播操作
  10.7  無須標記位的操作數基礎系統轉換的向量乘法
  10.8  寫掩碼混洗指令
  10.9  緊縮數據寫掩碼循環指令
  10.10  改進的插入、提取和置換指令
  10.11  衝突檢測和向量緊縮廣播指令
  10.12  雙塊絕對差求和指令
  10.13  向量指令的讀寫掩碼
  10.14  打包存儲和載入拆開
  10.15  混洗和操作組合指令
  10.16  乘乘加法
    10.16.1  乘乘加法指令操作
    10.16.2  乘乘加法指令應用優化
  10.17  共軛複數計算指令
  10.18  索引值
    10.18.1  轉換掩碼寄存器至向量寄存器中的索引值
    10.18.2  產生重排指令相關控制索引的改進
  10.19  寫掩碼提取指令
  10.20  指定數據精度的浮點舍入指令
  10.21  十進位浮點數分解指令

  10.22  二維聚集指令
  10.23  使用掩碼寄存器的條件跳轉指令
  10.24  掩碼向量移動指令和掩碼更新指令加速稀疏向量遞歸運算
  10.25  用戶級線程的即時上下文切換狀態交換指令
  10.26  向量計算和累加指令
  10.27  向量緊縮絕對差指令
  10.28  確定值是否在範圍內的指令
  10.29  單個向量緊縮水平加減指令
  10.30  擴展的向量后綴比較指令
  10.31  向量壓縮和解壓縮演算法相關指令
    10.31.1  向量緊縮一元解碼指令
    10.31.2  向量緊縮增量編碼和解碼指令
    10.31.3  向量行程長度解碼指令和邏輯實現
  10.32  向量緊縮壓縮和重複指令
  10.33  選擇元素指令
  10.34  依賴向量生成指令
  10.35  多寄存器聚集和分散指令
  10.36  轉置指令與高速緩存協處理單元
  10.37  帶選擇與累積功能的精簡指令
  10.38  四操作數整型乘累加指令
  10.39  雙舍入組合乘法和加法(減法或轉換等)指令
  10.40  將多個位向左移並將多個1填充較低位的指令
  10.41  向量壓縮循環指令
  10.42  大整數運算演算法
    10.42.1  大整數乘法運算
    10.42.2  大整數平方運算
  10.43  新型存儲介質相變存儲的非易失性寫入
第11章  其他矢量指令
  11.1  合併的向量轉換指令
  11.2  靈活歸零控制的置換指令
  11.3  範圍檢測指令
  11.4  跨通道交織拆開指令
  11.5  向量比較交換指令
  11.6  二維矩陣乘加
  11.7  複數運算指令改進信號處理
  11.8  歸約指令和加速
    11.8.1  邏輯歸約指令
    11.8.2  通道內向量歸約加速
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032