幫助中心 | 我的帳號 | 關於我們

複雜數據質量控制技術(精)

  • 作者:曹建軍//鄭奇斌//劉藝//翁年鳳|責編:賈斌
  • 出版社:清華大學
  • ISBN:9787302623342
  • 出版日期:2023/09/01
  • 裝幀:精裝
  • 頁數:436
人民幣:RMB 168 元      售價:
放入購物車
加入收藏夾

內容大鋼
    複雜性是大數據區別于小數據的本質特性,也是當前大數據質量控制與數據治理面臨的核心挑戰。本書圍繞大數據的複雜性開展研究,旨在探索當前數據資源建設與利用過程中面臨的挑戰和技術難題,促進數據價值的充分釋放。
    全書分為6部分,共24章。第1部分概述(第1、2章),綜述所研究數據控制技術的基本概念和任務定位,以及國內外的研究進展;第2部分實體分辨技術(第3?13章),研究了高維數據實體分辨、名稱分辨、XML數據實體分辨和跨模態數據實體分辨等;第3部分真值發現技術(第14?18章),研究了單真值發現、多真值發現、文本數據真值發現,以及基於多蟻群優化和基於深度神經網路的真值發現等;第4部分基於數據依賴的數據質量控制技術(第19?21章),研究了數據錄入輔助預測與推理方法、不一致數據檢測與修復方法,以及有限先驗知識下的全局數據質量評估;第5部分系統與平台(第22、23章),介紹了數據質量控制系統,以及數據治理平台的設計與實現;第6部分結束語(第24章),歸納總結了當前面臨的風險和挑戰。
    本書務實求新,系統性強,易讀性和可操作性好,既可作為數據質量控制與數據治理領域的進階用書,又可作為數據資源建設與利用、信息技術等相關學科領域的教學參考或工程實踐指導用書。

作者介紹
曹建軍//鄭奇斌//劉藝//翁年鳳|責編:賈斌

目錄
第1部分  概述
  第1章  緒論
    1.1  研究背景及意義
    1.2  基本概念和任務定位
      1.2.1  實體分辨
      1.2.2  高維數據實體分辨
      1.2.3  名稱分辨
      1.2.4  XML數據實體分辨
      1.2.5  跨模態數據實體分辨
      1.2.6  衝突消解與真值發現
      1.2.7  不一致數據檢測與修復
      1.2.8  數據錄入輔助預測與修復
      1.2.9  數據質量評估
    1.3  本書內容結構安排
    本章參考文獻
  第2章  國內外研究進展
    2.1  引言
    2.2  高維數據實體分辨的研究進展
      2.2.1  實體分辨方法
      2.2.2  多目標蟻群演算法
      2.2.3  特徵選擇穩定性
      2.2.4  不平衡數據分類方法
    2.3  名稱分辨的研究進展
      2.3.1  機構名稱分辨的研究現狀
      2.3.2  姓名消歧的研究現狀
    2.4  XML數據實體分辨的研究進展
      2.4.1  文本比較方法
      2.4.2  結構比較方法
    2.5  跨模態數據實體分辨的研究進展
      2.5.1  單模態表徵
      2.5.2  相似性度量方法
      2.5.3  相似性匹配方法
    2.6  真值發現的研究進展
      2.6.1  結構化數據真值發現
      2.6.2  文本數據真值發現
      2.6.3  特殊場景下的真值發現
    2.7  不一致數據檢測與修復的研究進展
      2.7.1  數據檢測
      2.7.2  數據修復
    2.8  數據錄入輔助預測與推理的研究進展
      2.8.1  數據預測模型
      2.8.2  智能人機介面
    2.9  全局數據質量評估的研究進展
    本章小結
    本章參考文獻
第2部分  實體分辨技術
  第3章  高維數據特徵選擇的多目標蟻群演算法
    3.1  引言
    3.2  理論方法
      3.2.1  兩檔案設置

      3.2.2  等效路徑信息素增強策略
      3.2.3  多樣性度量指標
    3.3  演算法描述
      3.3.1  路徑選擇概率公式
      3.3.2  變異機制
      3.3.3  兩檔案更新
      3.3.4  信息素更新方式
      3.3.5  演算法偽代碼及時間複雜度分析
    3.4  實驗與分析
    本章小結
    本章參考文獻
  第4章  高維數據特徵選擇穩定性研究
    4.1  引言
    4.2  特徵選擇穩定性指標分析
    4.3  特徵選擇穩定性集成方法分析
    4.4  演化演算法特徵選擇穩定性提升方法
      4.4.1  系統描述
……
第3部分  真值發現技術
第4部分  基於數據依賴的數據質量控制技術
第5部分  系統與平台
第6部分  結束語
附錄  項目資助

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032