幫助中心 | 我的帳號 | 關於我們

大規模存儲系統數據消冗(精)/電子信息前沿專著系列

  • 作者:夏文//馮丹//華宇//鄒翔宇|責編:賀瑞君
  • 出版社:人民郵電
  • ISBN:9787115610164
  • 出版日期:2023/05/01
  • 裝幀:精裝
  • 頁數:370
人民幣:RMB 149 元      售價:
放入購物車
加入收藏夾

內容大鋼
    近年來,雲計算、物聯網、區塊鏈和邊緣計算等多種新型應用產生了海量的、有價值的數據,而且呈現出持續增長的趨勢。如何有效地存儲和管理如此龐大數據是現代工業界和學術界共同關注的重點和難點問題。
    本書系統地介紹了數據消冗技術,該技術能夠通過有效地檢測和排除數據中的冗余部分,達到減輕存儲系統的負擔和降低成本的目標,從而應對海量數據增長帶來的挑戰。本書結合作者近十余年在與存儲系統領域相關的國際學術會議和期刊上發表的前沿成果,一方面對單個數據消冗技術問題進行深入的理論剖析,另一方面針對多種常見應用場景的數據消冗需求提供豐富的系統級解決方案和技術思路。

作者介紹
夏文//馮丹//華宇//鄒翔宇|責編:賀瑞君

目錄
第1章  緒論
  1.1  數據增長與數據消冗
  1.2  大規模存儲系統冗余負載分析
  1.3  數據消冗技術的應用與挑戰
  1.4  本章小結
  參考文獻
第2章  從傳統壓縮到大規模數據消冗
  2.1  傳統壓縮技術
  2.2  數據去重技術
  2.3  差量壓縮技術
  2.4  本章小結
  參考文獻
第3章  數據消冗前沿技術概述
  3.1  數據分塊
  3.2  計算加速
  3.3  指紋索引
  3.4  數據恢復
  3.5  垃圾回收
  3.6  安全性
  3.7  可靠性
  3.8  差量壓縮
  3.9  開源社區實踐
  3.10  本章小結
  參考文獻
第4章  極速基於內容分塊演算法
  4.1  技術背景
    4.1.1  FSC演算法
    4.1.2  CDC演算法
  4.2  典型的CDC演算法
    4.2.1  基於拉賓指紋的CDC演算法
    4.2.2  非對稱極值CDC演算法
  4.3  FastCDC演算法的技術框架
    4.3.1  基於齒輪哈希的CDC演算法
    4.3.2  分塊判斷優化
    4.3.3  收斂分塊策略
    4.3.4  循環展開優化
  4.4  性能分析
    4.4.1  實驗設置
    4.4.2  分塊判斷優化評估
    4.4.3  收斂分塊策略評估
    4.4.4  綜合評估
  4.5  本章小結
  參考文獻
第5章  流水線化和並行化數據去重技術
  5.1  數據去重技術面臨的計算挑戰
    5.1.1  數據去重技術的計算瓶頸與研究背景
    5.1.2  數據去重流程的獨立性與依賴性
  5.2  流水線化和並行化數據去重技術的設計與實現
    5.2.1  設計原理
    5.2.2  主要功能模塊

    5.2.3  數據去重子任務的流水線化
    5.2.4  指紋計算的並行化
    5.2.5  分塊的並行化
    5.2.6  並行化過程中的同步和非同步問題
  5.3  性能分析
    5.3.1  實驗設置
    5.3.2  關鍵參數測試
    5.3.3  整體性能測試
    5.3.4  其他CDC演算法的適配性測試
  5.4  本章小結
  參考文獻
第6章  高效的數據去重指紋索引技術
  6.1  數據去重指紋索引的規模與挑戰
  6.2  基於局部性的數據去重指紋索引策略相關研究
    6.2.1  備份數據流的局部性
    6.2.2  典型相關係統介紹
  6.3  基於相似性的數據去重指紋索引策略相關研究
    6.3.1  備份數據流的相似性
    6.3.2  典型相關係統介紹
  6.4  基於局部性和相似性的數據去重指紋索引策略設計與實現
    6.4.1  小文件與大文件的去重策略問題
    6.4.2  局部性與相似性的互補設計
    6.4.3  基於互補設計的指紋索引技術原理與理論剖析
    6.4.4  基於互補設計的指紋索引技術設計與實現
  6.5  性能分析
    6.5.1  測試環境
    6.5.2  相似性與局部性測試分析
    6.5.3  與其他數據去重指紋索引演算法性能比較
  6.6  本章小結
  參考文獻
第7章  面向相似去重的快速差量壓縮技術
  7.1  相似數據差量壓縮的技術背景
  7.2  快速差量壓縮技術的設計原理
  7.3  受數據去重啟發的快速差量壓縮技術
    7.3.1  主要設計思路與模塊介紹
    7.3.2  Gear-CDC演算法
    7.3.3  基於重複數據相鄰區域的貪心檢測演算法
    7.3.4  差量編碼與解碼操作
    7.3.5  差量編碼的總體流程
  7.4  性能分析
    7.4.1  測試環境
    7.4.2  Gear-CDC演算法性能測試
    7.4.3  應用案例一測試:數據去重后的相似數據差量壓縮
    7.4.4  應用案例二測試:文件更新后的差量壓縮
  7.5  本章小結
  參考文獻
第8章  基於數據去重感知的相似數據檢測和差量壓縮技術
  8.1  相似數據消冗技術概述
    8.1.1  相似數據消冗技術的原理與發展趨勢
    8.1.2  基於超級特徵值的相似數據檢測技術分析

    8.1.3  基於數據去重感知的相似數據檢測技術的提出
  8.2  基於數據去重感知的相似數據檢測和差量壓縮技術的設計與實現
    8.2.1  設計原理與結構
    8.2.2  基於數據去重感知的相似數據檢測
    8.2.3  基於超級特徵值的相似數據檢測
    8.2.4  差量壓縮與存儲管理
    8.2.5  整體流程
  8.3  性能分析
    8.3.1  測試環境
    8.3.2  基於超級特徵值的相似數據檢測的驗證學習
    8.3.3  基於數據去重感知的相似數據檢測和差量壓縮性能
    8.3.4  可擴展性測試
    8.3.5  恢復性能測試
  8.4  本章小結
  參考文獻
第9章  受數據去重啟發的輕量級差量同步技術
  9.1  差量同步與數據去重技術
    9.1.1  差量同步與數據去重技術簡介
    9.1.2  本章的主要內容
  9.2  基於內容分塊的差量同步演算法
    9.2.1  CDC演算法回顧與選擇
    9.2.2  用CDC演算法代替FSC演算法
    9.2.3  CDC演算法中的弱指紋復用策略
    9.2.4  改進CDC演算法后的差量同步演算法簡述
  9.3  面向差量同步的協議優化
    9.3.1  強弱指紋比較過程分離
    9.3.2  合併連續相同數據塊
    9.3.3  關於元數據規模
    9.3.4  最終版本
  9.4  性能分析
    9.4.1  測試環境
    9.4.2  整體性能測試
    9.4.3  三種代表性差量同步技術對比
    9.4.4  高帶寬大文件場景下的性能對比
  9.5  本章小結
  參考文獻
第10章  面向人工智慧模型的差量壓縮技術
  10.1  人工智慧模型壓縮技術現狀
    10.1.1  基於輕量化設計的模型壓縮
    10.1.2  基於剪枝技術的模型壓縮
    10.1.3  基於量化技術的模型壓縮
  10.2  基於局部敏感性的網路浮點參數量化壓縮技術
    10.2.1  網路浮點參數壓縮的難點
    10.2.2  神經網路浮點參數的分佈
    10.2.3  局部敏感量化方案設計
    10.2.4  量化壓縮后模型的版本相似性
  10.3  利用版本間相似性的神經網路差量壓縮方案
    10.3.1  現有神經網路差量壓縮方案的不足與改進思路
    10.3.2  基於量化的神經網路差量壓縮方案
    10.3.3  基於誤差反饋的神經網路量化訓練更新演算法

    10.3.4  神經網路的量化及差量壓縮方案
    10.3.5  壓縮時間複雜度分析
  10.4  資源受限場景應用分析
    10.4.1  場景一:減少人工智慧模型快照的存儲開銷
    10.4.2  場景二:減少人工智慧模型傳輸的通信開銷
  10.5  性能分析
    10.5.1  測試環境、數據集與對比方法
    10.5.2  網路浮點參數量化比特數的選擇
    10.5.3  壓縮后網路模型精度測試
    10.5.4  網路模型壓縮性能測試
  10.6  本章小結
  參考文獻
第11章  面向時序資料庫的有損壓縮技術
  11.1  時序數據特性和有損浮點數壓縮編碼器
    11.1.1  資料庫浮點數壓縮現狀
    11.1.2  有損浮點數壓縮演算法簡介
    11.1.3  時序資料庫場景簡介
    11.1.4  有損浮點數壓縮演算法在時序資料庫中的應用
  11.2  典型的有損浮點數壓縮演算法
  11.3  在線化設計與實現
    11.3.1  特殊值編碼器在線化方案
    11.3.2  哈夫曼編碼器在線化方案
    11.3.3  無損編碼器在線化方案
    11.3.4  自適應算術編碼方案
    11.3.5  對比測試
  11.4  預測器的改進
    11.4.1  預測器方案介紹
    11.4.2  對比測試
  11.5  資料庫中的性能測試
    11.5.1  測試環境與方案
    11.5.2  測試結果
  11.6  本章小結
  參考文獻
第12章  面向非易失性內存場景的數據消冗技術
  12.1  NVM文件系統與數據消冗技術
    12.1.1  NVM的發展及其結構與特性
    12.1.2  NVM文件系統研究現狀
    12.1.3  面向NVM的數據消冗技術研究現狀
    12.1.4  本章的主要內容
  12.2  NVM文件系統在數據消冗方面的性能與一致性挑戰
    12.2.1  面向NVM的高吞吐率數據消冗技術難點分析
    12.2.2  面向NVM的數據消冗一致性技術難點分析
  12.3  支持數據消冗的NVM文件系統設計與實現
    12.3.1  輕量級的數據消冗框架設計
    12.3.2  高效的冗余檢測優化策略
    12.3.3  NVM友好的去重元數據管理
    12.3.4  高性能的NVM去重索引構建
    12.3.5  輕量級一致性的設計與恢復
  12.4  性能分析
    12.4.1  測試環境

    12.4.2  整體測試
    12.4.3  高吞吐率設計的有效性測試
    12.4.4  一致性設計的有效性測試
    12.4.5  恢復時間測試
    12.4.6  交織模式的影響
  12.5  本章小結
  參考文獻
第13章  面向圖像存儲的細粒度數據去重技術
  13.1  圖像去重的研究現狀
  13.2  圖像去重的特性與挑戰
    13.2.1  圖像場景的特性
    13.2.2  圖像去重的挑戰
  13.3  細粒度圖像去重框架
  13.4  基於特徵點陣圖的相似性檢測器
    13.4.1  相似性檢測器的框架
    13.4.2  生成二維特徵
    13.4.3  基於特徵點陣圖的指紋演算法
    13.4.4  基於特徵點陣圖的相似性檢測器的優點
  13.5  與圖像編碼兼容的差量壓縮器
    13.5.1  差量壓縮器的框架
    13.5.2  差量壓縮器的細節
    13.5.3  針對連續重複塊的優化
    13.5.4  與圖像編碼兼容的差量壓縮器的優點
  13.6  性能分析
    13.6.1  系統原型的實現和具體配置
    13.6.2  測試環境與數據集介紹
    13.6.3  關鍵性能測試指標
    13.6.4  針對相似性檢測器的測試
    13.6.5  針對差量壓縮器的測試
    13.6.6  與粗粒度圖像去重技術對比
  13.7  本章小結
  參考文獻
第14章  總結與展望
  14.1  面向存儲系統的通用數據消冗技術
  14.2  針對特定場景的專用數據消冗技術
附錄  主要術語表

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032