幫助中心 | 我的帳號 | 關於我們

聽覺信息處理研究前沿(精)/類腦計算與類腦智能研究前沿系列

  • 作者:編者:黨建武//俞凱|責編:楊建霞|總主編:張鈸
  • 出版社:上海交大
  • ISBN:9787313222060
  • 出版日期:2019/12/01
  • 裝幀:精裝
  • 頁數:531
人民幣:RMB 248 元      售價:
放入購物車
加入收藏夾

內容大鋼
    聽覺信息處理技術的創新能夠推動實現高度智能化機器感知系統的發展,本分冊主要介紹了國內外聽覺信息處理方面的研究現狀和階段性成果,通過對人類言語產生與聽覺機理,聽覺機理的計算理論與方法,語音信號處理,語音識別聲學建模,特殊場景語音識別,聲紋與語種識別,韻律、情緒及音樂分析,統計語音合成,口語對話系統等技術研究成果的闡述與分析,展示我國在這些研究領域的優勢與特色,並提出未來的技術挑戰與發展方向。

作者介紹
編者:黨建武//俞凱|責編:楊建霞|總主編:張鈸

目錄
1  言語產生和聽覺的機理及其研究/黨建武趙彬魏建國
  1.1  言語產生和感知的機理
    1.1.1  有聲語言產生的條件
    1.1.2  語音產生的機理
    1.1.3  語音感知的機理
  1.2  聲源的產生與聲道的調製
    1.2.1  聲源產生機理與感知
    1.2.2  聲道的調製機理
  1.3  言語產生與感知的相互作用
    1.3.1  言語鏈
    1.3.2  言語感知運動理論
    1.3.3  言語感知機理研究的發展與挑戰
    1.3.4  鏡像神經元和言語聽覺-運動整合
  1.4  言語的腦功能研究
    1.4.1  言語的腦認知研究發展
    1.4.2  言語的認知神經機理
    1.4.3  言語功能障礙及康復訓練
  1.5  語音信號處理方法簡介
    1.5.1  基於產生機理的信號處理方法
    1.5.2  基於感知機理的信號處理方法
參考文獻
2  語音增強與麥克風陣列信號處理/付中華
  2.1  信號模型
    2.1.1  時域信號模型
    2.1.2  頻域信號模型與短時傅里葉變換技術
  2.2  評價方法
    2.2.1  主觀評價方法與指標
    2.2.2  客觀評價方法與指標
  2.3  單聲道語音增強
    2.3.1  時域維納濾波器增強原理
    2.3.2  頻域維納濾波器增強原理
    2.3.3  雜訊功率譜的估計
    2.3.4  基於深度學習的語音增強
  2.4  麥克風陣列語音增強
    2.4.1  固定波束
    2.4.2  自適應波束
    2.4.3  後置濾波技術
參考文獻
3  語音識別聲學建模/俞凱徐波戴禮榮
  3.1  統計語音識別概述
  3.2  基於隱馬爾可夫模型的經典聲學建模方法
    3.2.1  HMM
    3.2.2  GMM—IMM在語音識別中的使用
    3.2.3  模型改進及問題分析
    3.2.4  自適應技術
    3.2.5  鑒別性訓練技術
  3.3  結合深度學習的聲學建模方法
    3.3.1  深度學習基礎
    3.3.2  CD-DNN-HMM混合建模
    3.3.3  深度學習在聲學建模中的綜合應用

    3.3.4  深度學習訓練加速
    3.3.5  深度學習自適應技術
    3.3.6  深度學習框架下的序列鑒別性訓練
    3.3.7  端到端聲學建模
參考文獻
4  特殊場景語音識別(抗噪、低資源)/謝磊張鵬遠錢彥曼杜俊
  4.1  魯棒語音識別前端
    4.1.1  雜訊魯棒性語音識別方法
    4.1.2  魯棒性特徵
    4.1.3  信號域增強
    4.1.4  特徵增強/補償方法
  4.2  環境表達與聲學模型自適應
    4.2.1  自適應與魯棒性
    4.2.2  基於保守訓練的自適應
    4.2.3  基於線性變換的自適應
    4.2.4  基於環境感知的自適應
    4.2.5  參數結構化自適應及自適應訓練
  4.3  多語種聲學與語言建模
    4.3.1  基於知識共享的多語言聲學建模技術
    4.3.2  小語種語言模型建模技術
參考文獻
5  聲紋識別與語種識別/王龍標  李明  鄭  方  程星亮  李藍天
  5.1  聲紋識別與語種識別簡介
    5.1.1  傳統方法
    5.1.2  深度學習方法
    5.1.3  遷移學習、多任務學習及多資料庫聯合學習
  5.2  聲紋識別經典演算法
    5.2.1  特徵提取
    5.2.2  GMM—LJBM—MAP
    5.2.3  i—vector
    5.2.4  PLDA
  5.3  魯棒性聲紋識別演算法
    5.3.1  複雜環境聲紋識別
    5.3.2  時變聲紋識別
    5.3.3  短語音聲紋識別
    5.3.4  防聲紋假冒闖人對策
  5.4  基於深度學習的聲紋及語種識別演算法
    5.4.1  正義統計量
    5.4.2  Tandem及Bottleneck特徵
    5.4.3  典型模型結構
  5.5  評價指標、資料庫及工具包
    5.5.1  評價指標
    5.5.2  資料庫及工具包
參考文獻
6  韻律、情緒及音樂分析/陶建華  李愛軍  李偉
  6.1  言語韻律
    6.1.1  言語韻律基本概念與理論
    6.1.2  韻律分析與建模
    6.1.3  韻律標注系統
    6.1.4  漢語韻律研究的挑戰

  6.2  情感語音
    6.2.1  情感語音的聲學特徵
    6.2.2  語音的情感分類與識別
    6.2.3  情感語音合成
  6.3  音樂內容分析理解
    6.3.1  音樂和語音的關係
    6.3.2  音樂旋律分析
    6.3.3  音樂節奏分析
參考文獻
7  統計語音合成/凌震華  陶建華
  7.1  語音合成概述
  7.2  基於隱馬爾可夫模型的統計語音合成方法
    7.2.1  隱馬爾可夫模型
    7.2.2  基於HMM的統計參數語音合成
    7.2.3  基於HMM的統計參數語音合成關鍵技術
    7.2.4  基於HMM的語音合成靈活性
    7.2.5  基於HMM的統計參數語音合成方法的優缺點
  7.3  結合深度學習的統計語音合成方法
    7.3.1  深度學習關鍵技術
    7.3.2  基於深度學習的聲學建模方法
    7.3.3  基於深度學習的頻譜特徵提取與頻譜生成后濾波
    7.3.4  基於神經網路的波形生成方法
  7.4  基於神經網路的語音合成前端處理
    7.4.1  基於深度學習的字音轉換
    7.4.2  基於深度學習的韻律邊界預測
  7.5  基於神經網路的語音合成端到端建模方法
參考文獻
8  人機口語對話系統/俞凱陳  露
  8.1  人機口語對話系統概述
    8.1.1  人機口語對話系統發展歷史及分類
    8.1.2  任務型人機口語對話系統的基本架構
    8.1.3  對話系統的評估
  8.2  口語理解
    8.2.1  口語理解基本概念
    8.2.2  口語理解演算法前沿
    8.2.3  口語理解中的不確定性建模
    8.2.4  上下文建模及領域自適應
    8.2.5  研究展望
  8.3  對話狀態跟蹤
    8.3.1  基於部分可觀測馬爾可夫決策過程(POMDP)的對話管理框架概述
    8.3.2  對話狀態跟蹤
    8.3.3  對話狀態跟蹤挑戰賽
    8.3.4  基於統計的DsT模型
    8.3.5  基於規則的DST模型
    8.3.6  基於規則與統計相結合的DsT模型
    8.3.7  端到端的DST模型
    8.3.8  多領域DST模型
  8.4  對話策略優化
    8.4.1  強化學習及其在對話策略優化中的應用
    8.4.2  深度強化學習在對話策略優化中的應用

    8.4.3  對話策略優化的高級技術
    8.4.4  用戶模擬器
參考文獻
9  面向健康醫療的語音技術/賈珈
  9.1  言語感知的腦機制
    9.1.1  言語感知機理
    9.1.2  言語感知障礙的腦機制
  9.2  助聽技術與聽障評估
    9.2.1  人工電子耳的構成
    9.2.2  人工電子耳語音信號編碼方案
    9.2.3  人工電子耳的當前技術挑戰
    9.2.4  聽障評估技術
  9.3  嗓音障礙產生機制與客觀評估技術
    9.3.1  嗓音障礙產生機制
    9.3.2  嗓音障礙的聲學客觀評估方法
  9.4  言語康復訓練與學習
    9.4.1  言語康復技術概述
    9.4.2  可視化言語康復訓練
參考文獻
索引

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032