幫助中心 | 我的帳號 | 關於我們

Python語言數據分析(新核心翻譯碩士MTI系列教材)

  • 作者:管新潮|責編:臧燕陽|總主編:陶慶//李明
  • 出版社:上海交大
  • ISBN:9787313248916
  • 出版日期:2021/05/01
  • 裝幀:平裝
  • 頁數:258
人民幣:RMB 68 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書分為上下篇,共計十章,以如何將Python編程技術融入語言學/翻譯學教學科研活動為線索,展開涉及短語學、情感分析、相似性度量、語義分析、主題建模、語言學變數等方面的語言數據分析。上篇為語言數據分析的基礎性知識,旨在構建後續深入分析的技術性前提條件;下篇為語言數據分析的理論與應用,專註于探索語言知識與技術的融合性分析路徑。本書以案例講解為特點,其中的工具案例用於描述技術工具的適用性和可靠性,解決技術應用之前有關編程技術的知識問題;語言學路徑案例則緊密結合語言學/翻譯學知識探索如何以技術手段解決教學科研中的相關問題。案例的呈現也同時說明演算法在解決案例問題中的重要性。
    本書適合高等院校語言學、翻譯學等專業的師生以及從事語言或翻譯實踐活動的社會人士閱讀使用。

作者介紹
管新潮|責編:臧燕陽|總主編:陶慶//李明

目錄
上篇  語言數據分析基礎
  第1章  語言數據結構
    1.1  一維數據結構
    1.1.1  單詞列表
    1.1.2  術語列表
    1.1.3  句子列表
    1.1.4  段落列表
    1.1.5  語篇列表
    1.1.6  其他一維數據結構
    1.2  二維數據結構
    1.2.1  字典結構
    1.2.2  元組列表結構
    1.2.3  二維數據的遍歷
    1.3  多維數據結構
    1.3.1  元組字典結構
    1.3.2  列表元組列表結構
    1.3.3  Brown語料庫詞性標記訓練集
    1.4  數據結構轉換
    1.4.1  多連詞的轉換
    1.4.2  矩陣結構的轉換
    1.4.3  spaCy列表到NLTK列表的轉換
  第2章  語言數據清洗
    2.1  Python數據清洗方法
    2.1.1  無效字元清除方法
    2.1.2  字元判斷方法
    2.1.3  替換方法
    2.1.4  標點符號清除方法
    2.1.5  停用詞方法
    2.2  無效信息的清洗
    2.2.1  何為無效信息
    2.2.2  新聞文本的語言數據清洗
    2.2.3  中文動詞的清洗
    2.3  有效信息的清洗
    2.3.1  何為有效信息
    2.3.2  英文動詞片語的清洗
    2.3.3  詞形還原法
    2.3.4  特徵值清洗
  第3章  語言數據可視化
    3.1  數字結果可視化
    3.1.1  語篇辭彙密度分佈及其柱狀圖可視化
    3.1.2  作業分數統計及其正態分佈擬合可視化
    3.1.3  語篇詞長分佈及其折線圖可視化
    3.1.4  信息貢獻度分佈對比及其散點圖可視化
    3.1.5  語篇長句界定及其句長分佈可視化
    3.2  文字結果可視化
    3.2.1  辭彙相似性及其相關矩陣可視化
    3.2.2  主題詞凸顯及其分散式可視化
    3.2.3  評價語句的相似性及其聚類可視化
    3.2.4  語篇語義分析及其語義網路可視化
  第4章  數據分析可選方法

    4.1  Python+Excel應用
    4.1.1  長句文字內容和句長分佈
    4.1.2  上下文關鍵詞呈現
    4.1.3  多文本對比呈現
    4.1.4  過程prdndas數據結構呈現
    4.2  正則表達式方法
    4.2.1  概述
    4.2.2  案例1——首字母為母音的單詞提取
    4.2.3  案例2——主題詞L5R5搭配提取
    4.3  文本分類方法
    4.3.1  以關鍵詞實現大文本分類
    4.3.2  以情感極性實現小文本分類
    4.3.3  樸素貝葉斯分類法
    4.4  語言數據檢驗
下篇  語言數據分析理論與應用
  第5章  短語學及其計算語言學方法
    5.1  短語學與計算語言學
    5.1.1  語料庫與短語學
    5.1.2  計算語言學
    5.1.3  基於意義單位的研究
    5.1.4  短語學技術應用
    5.2  短語數據處理工具
    5.2.1  全額提取方法
    5.2.2  分類提取方法
    5.3  短語學分析路徑
    5.3.1  學術文本模糊短語的弱化表述手段
    5.3.2  話語分析及其ngrms()短語數據清洗
    5.3.3  多詞術語的結構語義消歧
  第6章  情感分析理論、方法與路徑
    6.1  情感分析與接受度定位
    6.1.1  情感與情感分析
    6.1.2  國際關係領域
    6.1.3  市場營銷領域
    6.1.4  教育領域
    6.1.5  應用與不足
    6.2  情感分析工具
    6.2.1  中文類工具
    6.2.2  英文類工具
    6.2.3  混合類工具——樸素貝葉斯分類法
    6.3  情感分析路徑
    6.3.1  情感分析與傳統民意調查比較
    6.3.2  基於文本情感分析的商品評價
    6.3.3  樸素貝葉斯分類法與情感分析
    6.3.4  擇校行為影響因素與情感分類
  第7章  相似性度量理論與應用
    7.1  相似性度量與文本分析
    7.1.1  基於語義信息的相似性
    7.1.2  三個層級的度量路徑
    7.1.3  文本數據和知識庫
    7.2  相似性度量工具

    7.2.1  辭彙相似性度量
    7.2.2  句子相似性度量
    7.2.3  語篇相似性度量
    7.3  文本相似性分析路徑
    7.3.1  多譯本相似性度量
    7.3.2  著作權法/版權法概念copyright及其搭配的相似性
    7.3.3  語料庫的平衡性問題
  第8章  語義分析與文本探究
    8.1  語義分析與相關模型
    8.1.1  語義遷移與分散式詞向量
    8.1.2  語義主題詞與信息貢獻度
    8.1.3  語義關係與語義網
    8.1.4  文本語義與語義網路分析
    8.2  語義分析工具
    8.2.1  詞向量(詞嵌入)模型
    8.2.2  語義網資源
    8.2.3  spaCy方法
    8.2.4  向量模型
    8.3  文本語義分析路徑
    8.3.1  著作權法/版權法概念copyright詞向量關聯性
    8.3.2  語義遷移描述與代碼融合
    8.3.3  漢英法律語義檢索詞典構建
  第9章  主題建模與文本主題
    9.1  主題建模中的主題挖掘
    9.1.1  語料庫主題概述
    9.1.2  主題建模方法論啟示
    9.1.3  歷時性文本主題
    9.1.4  共時性文本主題
    9.1.5  討論與總結
    9.2  主題建模工具
    9.2.1  Gensim主題建模方法
    9.2.2  Sklearn主題建模方法
    9.2.3  中文主題模型方法
    9.3  主題建模實現路徑
    9.3.1  話語分析中的主題建模適用性
    9.3.2  文本主題差異性驗證
    9.3.3  新聞文本歷時主題演變
  第10章  語料庫語言學變數設置
    10.1  變數設置的學理意義
    10.1.1  概率及其分佈變數概述
    10.1.2  多變數分析
    10.1.3  變數設置的技術現實
    10.2  變數設置工具
    10.2.1  辭彙層面變數
    10.2.2  句子層面變數
    10.2.3  語篇層面變數
    10.3  變數設置路徑
    10.3.1  辭彙複雜性/成熟度的教材辭彙評估應用
    10.3.2  辭彙抽象性/具體性
    10.3.3  句法複雜性

附錄  漢英對照術語表

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032