幫助中心 | 我的帳號 | 關於我們

新一代人工智慧與語音識別

  • 作者:編者:馬延周
  • 出版社:清華大學
  • ISBN:9787302523840
  • 出版日期:2019/08/01
  • 裝幀:平裝
  • 頁數:145
人民幣:RMB 44.5 元      售價:
放入購物車
加入收藏夾

內容大鋼
    有關俄語語音識別的研究在中國尚處於起步階段,此技術在中俄兩國的民間交流和軍事交往中發揮著重要作用。本書充分利用了新一代人工智慧技術的研究成果,介紹了基於新聞語料的俄語連續語音識別技術。本書的目標是建立基於Kaldi環境設計並實現的俄語連續語音識別原型系統,使其同時具備在線識別功能和離線識別功能,以驗證聲學模型和語言模型的優化演算法的有效性,進而為面向特定領域的俄語語音識別實用系統的研發提供理論方法、實驗數據和關鍵技術支撐。為了實現上述目標,本書詳細介紹了俄語語音語料的採集、加工、處理,俄語文本語料的採集、清洗、過濾,俄語發音詞典的自動預測、生成,聲學模型建模基本單元(音素集)的確定,聲學模型和語言模型的優化。
    本書可作為高等院校外國語言學及應用語言學專業、電子信息和通信類專業本科生及研究生的教學參考書,也可供語音信息處理與應用開發等領域的研究人員使用。

作者介紹
編者:馬延周

目錄
第0章  緒論
  0.1  研究依據
  0.2  研究對象與研究目標
  0.3  研究方法
  0.4  研究意義
  0.5  本書的創新點
  0.6  語料來源
  0.7  本書的結構
第1章  語音識別技術研究綜述
  1.1  語音識別的定義與分類
    1.1.1  語音識別的定義
    1.1.2  語音識別的分類
  1.2  語音識別技術的研究進展
    1.2.1  語音識別技術的發展概況
    1.2.2  國外俄語語音識別技術的研究進展
    1.2.3  中國俄語語音識別技術的研究進展
  1.3  語音識別系統的基本原理
    1.3.1  特徵提取
    1.3.2  聲學模型
    1.3.3  語言模型
    1.3.4  解碼
  1.4  語音識別技術研究所關注的關鍵問題
  本章小結
第2章  語音數據的加工處理
  2.1  問題描述
  2.2  眾包的定義及內涵
    2.2.1  眾包的基本概念
    2.2.2  眾包的基本流程
    2.2.3  眾包的關鍵問題
  2.3  解決方案
    2.3.1  質量控制
    2.3.2  語音標注平台的架構
    2.3.3  標注平台的設計與實現
  2.4  語音標注
    2.4.1  語音有效性判斷
    2.4.2  語音轉寫規範
    2.4.3  語音標注規範
  2.5  實驗設計與結果分析
    2.5.1  實驗設計
    2.5.2  結果分析
    2.5.3  結論
  本章小結
第3章  俄語聲學模型的建立
  3.1  連續語音識別
    3.1.1  連續語音識別的整體模型
    3.1.2  聲學模型訓練的HMM-GMM方法
    3.1.3  聲學模型訓練中的HMM-DNN方法
  3.2  俄語語音學概述
    3.2.1  俄語的使用及分佈情況
    3.2.2  俄語語音的基本特點

    3.2.3  俄語音素的發音特徵
    3.2.4  俄語母音音素的隨位變化
    3.2.5  俄語輔音音素的隨位變化
  3.3  俄語聲學單元的選擇
    3.3.1  俄語SAMPA音素集
    3.3.2  俄語音系表
  3.4  實驗設計與結果分析
    3.4.1  實驗設計
    3.4.2  結果分析
  本章小結
第4章  俄語語言模型的建立
  4.1  文本語料的準備與清洗
    4.1.1  數據來源的篩選
    4.1.2  數據爬取
    4.1.3  數據的去重與清洗
    4.1.4  格式化處理
  4.2  語言模型簡述
    4.2.1  語言模型的平滑技術
    4.2.2  語言模型的剪枝演算法
  4.3  語言模型的訓練流程
    4.3.1  語言模型的訓練實現
    4.3.2  詞典的選擇
    4.3.3  LM的剪枝與優化
  4.4  實驗結果分析
    4.4.1  詞典規模測試
    4.4.2  語料規模測試
    4.4.3  語言模型剪枝測試
  本章小結
第5章  基於Kaldi的俄語語音識別原型系統
  5.1  系統設計的目標與原則
    5.1.1  系統設計的目標
    5.1.2  系統設計的原則
  5.2  系統的開發環境與整體架構
    5.2.1  系統的開發環境
    5.2.2  系統的整體架構
  5.3  Kaldi環境的搭建
    5.3.1  Kaldi及實驗環境
    5.3.2  Kaldi訓練伺服器的搭建
    5.3.3  AM訓練數據及參數設置
    5.3.4  LM訓練數據及參數設置
  5.4  Kaldi訓練優化
    5.4.1  Kaldi聲學建模
    5.4.2  GPU加速
  5.5  語音識別原型系統的設計
    5.5.1  系統GUI的設計
    5.5.2  在線識別功能
    5.5.3  離線識別功能
  5.6  實驗設計與結果分析
    5.6.1  實驗設計
    5.6.2  實驗結果

    5.6.3  結果分析
  本章小結
第6章  總結與展望
  6.1  本書的主要成果
  6.2  未來的研究計劃
附錄A  英漢術語對照表
附錄B  其他相關資料
  B.1  俄語發音詞典(76277個詞形)示例
  B.2  俄語解碼詞表(189971個詞形)示例
  B.3  俄語字元Unicode編碼對照表
  B.4  俄語語音格式化程序(轉換為16KB、16b)
  B.5  俄語文本轉Unicode編碼程序
  B.6  從https://twitter.com網站上下載的部分網頁文件(json格式)示例
  B.7  從http://www.interfax.ru網站上下載的部分網頁文件(json格式)示例
  B.8  俄語拉丁字母轉寫表
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032