幫助中心 | 我的帳號 | 關於我們

大數據搜索引擎原理分析

  • 作者:編者:劉凡平
  • 出版社:電子工業
  • ISBN:9787121352454
  • 出版日期:2019/01/01
  • 裝幀:平裝
  • 頁數:339
人民幣:RMB 69 元      售價:
放入購物車
加入收藏夾

內容大鋼
    劉凡平編著的《大數據搜索引擎原理分析》是暢銷書升級版,向讀者提供了一套完整的大數據時代背景下的搜索引擎解決方案,詳盡地介紹了搜索引擎的技術架構、演算法體系及取得的成果,並以模塊化的方式進行組織。本書著重介紹了機器學習在搜索引擎中的應用,包括中文分詞、聚類、分類等核心的機器學習演算法,並結合示例加以介紹和分析,使讀者可以更好地理解機器學習在搜索引擎中的價值;同時,闡述了大數據給搜索引擎帶來的新特性,結合目前大數據分析的主流工具,在搜索引擎中構建知識圖譜,以及進行日誌反饋學習,可以使得搜索引擎更加智能。
    本書不僅適合作為互聯網行業從業者的技術參考書,也適合作為搜索引擎愛好者的參考讀物。

作者介紹
編者:劉凡平
    劉凡平:碩士,畢業於中國科學技術大學軟體系統設計專業。曾任職于微軟亞太研發集團、百度(中國)有限公司。現任薇問(北京)科技有限公司首席技術官,負責搜索引擎技術與大數據人工智慧平台研發工作。擅長於搜索引擎、大數據分析、分散式計算等相關研發工作,是Iveelv開源搜索引擎的主要貢獻者之一,也是執著于將互聯網技術演繹為藝術的完美追求者。

目錄
第1章  引論
  1.1  搜索引擎的過去
  1.2  搜索引擎的現在
  1.3  搜索引擎的未來
  1.4  大數據與搜索引擎
    1.4.1  搜索價值提升
    1.4.2  用戶價值提升
  1.5  大數據與人工智慧
    1.5.1  人工智慧的發展
    1.5.2  人工智慧技術
  1.6  搜索引擎與人工智慧
  1.7  本章小結
第2章  搜索引擎原理與技術
  2.1  基本工作原理
  2.2  基本模塊結構
    2.2.1  網路爬蟲服務
    2.2.2  索引服務
    2.2.3  緩存服務
    2.2.4  搜索服務
    2.2.5  日誌服務
  2.3  技術概要
    2.3.1  自然語言處理
    2.3.2  知識圖譜
    2.3.3  海量數據存儲
    2.3.4  分散式計算
    2.3.5  搜索排序
  2.4  開源技術
    2.4.1  Apache Lucene
    2.4.2  Apache Nutch
    2.4.3  Sphinx
    2.4.4  Elastic Search
  2.5  本章小結
第3章  自然語言處理框架
  3.1  英文分詞
  3.2  中文分詞
    3.2.1  中文分詞概述
    3.2.2  基於詞庫的分詞技術
    3.2.3  基於條件隨機場模型的中文分詞
    3.2.4  分詞粒度
  3.3  詞性標注
    3.3.1  隱馬爾科夫模型概要
    3.3.2  隱馬爾科夫模型與詞性標注
  3.4  語義相似度
  3.5  依存句法分析
    3.5.1  依存句法分析概要
    3.5.2  依存句法分析實現
……
第4章  構建大數據存儲引擎
第5章  構建分散式實時計算
第6章  分散式可擴展爬蟲

第7章  大數據構建知識圖譜
第8章  索引構建機制
第9章  搜索服務構建
第10章  基於用戶日誌的反饋學習
致謝

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032