內容大鋼
語音技術的進步使科幻電影中人機對話的場景正在逐漸走進現實生活。我們生活中用到的智能手機、電腦、音箱以及汽車等很多設備和工具都已經配備了語音界面,我們經常在商場里看到的導購機器人或者玩具機器人,也支持人機對話,支持用戶語音搜索或者下達指令。
語音界面看似簡單,但其開發卻蘊含著很多我們意想不到的問題和困難。《語音界面衝擊》這本書將帶領我們全面了解:
語音界面的歷史;
語音界面的現狀及未來;
語音界面的功能、優勢和特點;
需要使用何種技術才能實現語音界面;
語音界面面臨的課題和問題;
實現「語音交互」以及人機對話面臨哪些障礙;
語音界面的商業用途;
……
語音界面的商用前景也令人憧憬。語音經濟的規模將會超過移動應用。據預測,僅僅在美國和英國,語音電商的規模就將從2018年的20億美元增長至2022年的400億美元。語音技術創業公司的數量和融資規模也在飛速上升。未來,我們將看到人機互動的另一種無限可能。
作者介紹
(日)河野道成|責編:張亞捷|譯者:范俏蓮
河野道成,Neoma設計公司董事長,beyondUX設計者、創意總監和IT顧問。橫濱國立大學畢業後進入索尼公司,從事用戶界面、網路、空間等的研究開發。擔任使用觸摸、手勢、語音識別人機交互開發小組組長。隨後,在索尼集團內建立了第一語音UX設計團隊,負責製作了PlayStation4的語音UI,也帶頭啟動了以語音對話和AI為基礎的新一代家電項目。
2014年成立Neoma 設計公司。從事語音UI/UX設計的咨詢和研發工作,同時參與健身俱樂部的空間製造、主題公園人機交互,以及互動數字顯示屏的設計。
目錄
第1章 語音界面的現狀和未來
時代在語言中流轉
哆啦A夢的神奇道具成為現實
語音免觸成為快捷方式
Chatbot已經開始實際應用
語音界面變身「傳話遊戲」
不能和平時一樣說話
留言電話登記的表達問題
AI技術助力語音交互的進化
第2章 語音界面的歷史
早期語音交互系統「VOYAGER」
2011年iPhone開始支持「Siri」
物理UI-CUI-GUI-手勢UI-語音UI
AI和語音——剪不斷的關係
智能音箱和仿生機器人的出現
語音界面走進銀行和零售店
小結
第3章 語音界面的特點與優勢
減少文字輸入時間
方便快捷(減少步驟)
免觸操作(同時操作)
操作姿勢自由
支持附加條件指令
支持模糊表達
創造人機對話價值體驗
支持反映感情和心理狀況
受文化和語言差異的影響
符合人類認知水平的媒介
第4章 支持語音界面的商品
語音界面的六個基本功能
除六大基本功能外的其他功能
智能音箱
AlexaSkill擴展Echo功能
AI機器人
支持語音辨認功能的智能家電
遊戲機
其他
小結
第5章 語音界面技術
采音信號處理
語音識別
語義理解
對話應答/對話生成
語音合成
小結
第6章 語音界面面臨的問題
語音界面是一場傳話遊戲
何時說?說什麼?怎麼說?
不明現狀的問題
尚不準確的語音識別
說話也費力
語音操作手法單一
喚醒詞太俗氣
不自然的自然表達問題
對發聲環境的依賴
發聲前間隔過長
語音輸入無法處理中斷和取消
小結
第7章 語音助手/機器人語音界面「對話」
「會話」和「對話」的區別
任務型和非任務型
語音界面衝擊
所謂聊天
會話的分類
報告型會話較多的原因
談話內容無聊的原因
自然對話(談話)必要的六大要素
會話方案
對話表現
交互作用分析
違和感:兒童角色口出術語
語音界面和對話中的語言文化差異
恐怖谷現象與對話
小結
第8章 語音界面商業勢力圖
語音識別技術開發企業
語音合成技術開發企業
語音界面解決方案供應企業
小結
第9章 語音界面的未來
語音界面尚在起步階段
語音商業的未來
對話商業未來
面向自然對話時代
小結