幫助中心 | 我的帳號 | 關於我們

大數據清洗技術/航天先進技術研究與應用系列

  • 作者:王宏志
  • 出版社:哈爾濱工業大學
  • ISBN:9787560377537
  • 出版日期:2020/01/01
  • 裝幀:平裝
  • 頁數:308
人民幣:RMB 88 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書主要介紹了大數據清洗方面的研究成果。全書共分7章,重點面向大數據清洗中計算困難、錯誤混雜、缺少知識等難題,針對實體識別、真值發現、缺失值填充、不一致檢測與修復等問題提出了相應的技術和演算法,並在第7章提出了多數據質量問題綜合清洗與優化技術。?
    本書可作為高等院校和科研機構大數據、數據質量管理、數據治理等方面的教學和科研參考書。

作者介紹
王宏志
    王宏志,哈爾濱工業大學電腦科學與技術學院副教授、博士生導師。研究方向包括大數據管理、數據質量、圖數據管理。發表學術論文140余篇,出版學術專著兩本,參與翻譯《演算法導論(第3版)》。在愛課程網、學堂在線、好大學在線上首次開設「大數據演算法」在線課程,出版《大數據演算法》教材。

目錄
第1章  緒論
  1.1  大數據的定義及其應用
  1.2  數據質量問題
  1.3  大數據的質量問題與挑戰
  1.4  數據清洗研究進展
  1.5  本書的內容
  本章參考文獻?
第2章  大數據處理技術概述
  2.1  大數據並行計算平台
  2.2  眾包技術
  本章參考文獻
第3章  實體識別
  3.1  實體識別概述
  3.2  串列實體識別演算法
  3.3  並行實體識別演算法
  3.4  增量實體識別演算法
  3.5  基於眾包的實體識別
  本章參考文獻
第4章  真值發現
  4.1  真值發現演算法概述
  4.2  並行真值發現演算法
  4.3  增量真值發現演算法
  4.4  基於眾包的真值發現
  本章參考文獻
第5章  缺失值填充
  5.1  缺失值填充演算法概述
  5.2  基於貝葉斯網路的串列缺失值填充演算法
  5.3  實驗結果及分析
  5.4  並行缺失值填充演算法
  5.5  基於眾包的缺失值填充演算法
  本章參考文獻
第6章  不一致數據檢測與修復
  6.1  不一致數據檢測與修復概述
  6.2  並行不一致數據檢測與修復演算法
  6.3  基於眾包的不一致數據檢測與修復演算法
  6.4  掃描數據一次的大數據不一致檢測演算法
  本章參考文獻
第7章  多數據質量問題綜合清洗與優化
  7.1  數據質量維度的關聯
  7.2  基於任務合併的並行數據清洗優化
  7.3  綜合大數據清洗系統
本章參考文獻
名詞索引

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032