幫助中心 | 我的帳號 | 關於我們

終端智能語音處理技術與應用/智能機器人關鍵技術叢書

  • 作者:納躍躍//王子騰//付強//王亮//馬麗艷|責編:劉皎
  • 出版社:電子工業
  • ISBN:9787121498060
  • 出版日期:2025/04/01
  • 裝幀:平裝
  • 頁數:361
人民幣:RMB 109 元      售價:
放入購物車
加入收藏夾

內容大鋼
    語音是最有效的人機交互方式之一。人工智慧與傳統語音技術相結合使其在家居、可穿戴、機器人、車載等智能終端設備上得到了普及。終端設備具有低資源、實時性、應用場景複雜多變等特點,對演算法提出了更嚴格的要求。
    本書介紹了面向端側設備的若干智能語音處理技術,書中主要採用了傳統信號處理與深度學習相結合的方法論,並且介紹了在實際工程應用中的若干心得,適合於理工科高年級本科生、研究生,以及語音領域的工程師閱讀。

作者介紹
納躍躍//王子騰//付強//王亮//馬麗艷|責編:劉皎

目錄
  1  終端智能語音處理概述
    1.1  引言
    1.2  問題和挑戰
    1.3  發展歷史概要
    1.4  本書的組織結構
    1.5  本書的適用人群
    1.6  常用表示和符號對照
      1.6.1  默認符號
      1.6.2  對離散時間序列的表示
      1.6.3  關於索引序號從0還是1開始的說明
    1.7  關於中英文混寫的說明
    1.8  免責聲明
    1.9  本章小結
理論篇
  2  子帶濾波
    2.1  離散傅里葉變換與短時傅里葉變換
      2.1.1  離散傅里葉變換
      2.1.2  短時傅里葉變換
      2.1.3  輸出延時
      2.1.4  頻譜泄漏
      2.1.5  時域卷積與頻域點積的近似關係
    2.2  多相濾波器組
      2.2.1  對頻譜泄漏的數學解釋
      2.2.2  扇形損失
      2.2.3  重採樣
      2.2.4  多相濾波器組
    2.3  濾波器設計基礎
    2.4  本章小結
  3  固定波束形成
    3.1  多通道語音增強的基本原理
      3.1.1  物理解釋
      3.1.2  幾何解釋
    3.2  遠場模型
    3.3  波束形成及陣列性能評價
      3.3.1  beampattern
      3.3.2  directivity index
      3.3.3  white noise gain
      3.3.4  effective rank
    3.4  波束形成演算法的求解形式
      3.4.1  superdirective beamforming
      3.4.2  差分波束形成
    3.5  本章小結
  4  自適應波束形成
    4.1  遞推求平均
    4.2  典型自適應波束形成演算法
      4.2.1  MVDR演算法
      4.2.2  PMWF演算法
    4.3  共軛對稱矩陣求逆
      4.3.1  1×1和2×2矩陣求逆
      4.3.2  Cholesky分解

      4.3.3  矩陣求逆引理
      4.3.4  IQRD方法
      4.3.5  誤差與穩定性
    4.4  本章小結
  5  盲源分離
    5.1  信號模型
      5.1.1  瞬時模型
      5.1.2  卷積模型
    5.2  獨立成分分析
      5.2.1  獨立性假設與中心極限定理
      5.2.2  ICA的目標函數
      5.2.3  AuxICA演算法
      5.2.4  2×2廣義特徵分解問題
      5.2.5  排列歧義性與尺度歧義性
    5.3  獨立向量分析
      5.3.1  IVA的目標函數
      5.3.2  AuxIVA演算法
      5.3.3  兩級架構
    5.4  盲源分離與波束形成的聯繫和區別
    5.5  本章小結
  6  回聲消除與去混響
    6.1  信號模型
      6.1.1  回聲消除信號模型
      6.1.2  去混響信號模型
    6.2  LMS與NLMS演算法
    6.3  RLS演算法
      6.3.1  最小二乘法
      6.3.2  RLS演算法
    6.4  一種基於盲源分離的回聲消除方法
      6.4.1  問題背景
      6.4.2  演算法推導
      6.4.3  對比實驗
    6.5  本章小結
  7  數據模擬
    7.1  信號模型和系統框架
    7.2  傳函的模擬與測量
      7.2.1  鏡像法傳函模擬
      7.2.2  傳函測量
      7.2.3  分塊卷積
    7.3  非線性回聲模擬
    7.4  散射雜訊模擬
    7.5  信噪比和音量
    7.6  本章小結
  8  深度語音增強
    8.1  信號模型
    8.2  時頻掩蔽
    8.3  損失函數
    8.4  深度回聲殘餘抑制
      8.4.1  數據準備
      8.4.2  輸入特徵

      8.4.3  模型結構
    8.5  多通道語音增強模型
      8.5.1  基於掩蔽的波束形成演算法
      8.5.2  深度神經網路空域濾波演算法
    8.6  歌曲成分分離
    8.7  本章小結
  9  語音活動性檢測
    9.1  HMMVAD
      9.1.1  HMM基礎
      9.1.2  前向演算法與後向演算法
      9.1.3  Viterbi演算法
      9.1.4  Baum-Welch演算法
      9.1.5  下溢問題
      9.1.6  在線HMMVAD
    9.2  NNVAD
      9.2.1  一種NNVAD模型
      9.2.2  一種NN和HMM結合的VAD
    9.3  VAD性能評價
    9.4  本章小結
  10  關鍵詞檢測
    10.1  特徵提取
    10.2  聲學模型
      10.2.1  建模單元
      10.2.2  聲學模型
      10.2.3  關於聲學模型工作原理的討論
    10.3  解碼器
      10.3.1  閾值與動態閾值
      10.3.2  關於ROC曲線與閾值選擇的討論
    10.4  虛警問題
      10.4.1  對虛警現象的直觀解釋
      10.4.2  減少虛警的方法
      10.4.3  對比實驗
    10.5  多通道關鍵詞檢測與通道選擇
      10.5.1  問題背景
      10.5.2  模型與訓練方法
      10.5.3  實驗與分析
    10.6  本章小結
  11  聯合優化方法
    11.1  盲源分離統一框架
      11.1.1  信號模型
      11.1.2  問題拆解
      11.1.3  對比實驗
    11.2  語音增強與關鍵詞檢測聯合優化
      11.2.1  系統框架
      11.2.2  語音增強模塊
      11.2.3  關鍵詞檢測模塊
      11.2.4  實驗現象
    11.3  本章小結
  12  模型量化
    12.1  模型量化方法

      12.1.1  訓練后量化
      12.1.2  訓練時量化
      12.1.3  無數據量化
    12.2  關鍵詞檢測模型的無數據量化方法
      12.2.1  時序數據生成器
      12.2.2  中心距離約束與雙生成器
      12.2.3  高質量篩選
      12.2.4  時間掩碼量化蒸餾
      12.2.5  無數據量化流程
      12.2.6  無數據量化實驗
    12.3  本章小結
工程篇
  13  終端智能語音處理工具包
    13.1  系統框架
    13.2  配置參數詳解
      13.2.1  通用參數
      13.2.2  回聲消除
      13.2.3  去混響
      13.2.4  多通道語音增強
      13.2.5  深度語音增強
      13.2.6  后濾波
      13.2.7  自動增益控制
      13.2.8  音量計算
      13.2.9  聲源定位
      13.2.10  語音活動性檢測
      13.2.11  關鍵詞檢測
      13.2.12  命令詞檢測
      13.2.13  產線測試,模型訓練
    13.3  主要離線工具示例
      13.3.1  SoundConnect離線工具
      13.3.2  批處理工具
    13.4  示常式序
      13.4.1  從配置文件初始化
      13.4.2  從Params.c文件初始化
    13.5  本章小結
  14  模型訓練
    14.1  數據準備
      14.1.1  正樣本數據
      14.1.2  負樣本和雜訊數據
    14.2  環境配置
      14.2.1  傳函模擬
      14.2.2  目標語音模擬
      14.2.3  干擾信號模擬
      14.2.4  回聲模擬
      14.2.5  雜訊模擬
      14.2.6  音量和增益
      14.2.7  生成模擬音頻
    14.3  模型訓練
      14.3.1  訓練環境
      14.3.2  訓練流程

      14.3.3  模型訓練技巧總結
    14.4  模型測試
      14.4.1  測試環境
      14.4.2  評價指標
      14.4.3  測試集的錄製與準備
      14.4.4  測試流程
    14.5  模型發布
    14.6  本章小結
附錄A
  A.1  複數求偏導和共軛偏導
  A.2  共軛求導示例
    A.2.1  向量求導
    A.2.2  二次型求導

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032