幫助中心 | 我的帳號 | 關於我們

基於自然語言處理的智能司法文本分析及應用

  • 作者:高冠東|責編:馮高瓊
  • 出版社:法律
  • ISBN:9787524401261
  • 出版日期:2025/08/01
  • 裝幀:平裝
  • 頁數:406
人民幣:RMB 88 元      售價:
放入購物車
加入收藏夾

內容大鋼
    自然語言處理(NLP)是近年來人工智慧技術發展的前沿領域之一,隨著NLP技術逐漸成熟,深度學習算力逐漸增強,將文本分類技術、情感分析引入到犯罪領域中,能夠對大量的犯罪文本進行深度挖掘,將其應用於司法領域能夠提升智慧司法建設水平。本書以司法文本分析為核心,著重介紹自然語言處理技術的基本理論、演算法和應用方法,並結合作者多年的研究成果,提出了一些智能司法文本分析的應用案例,為推進司法行政工作智能化,以智能技術減輕基層幹警工作壓力提出一種技術可行性發展路徑。本書將文本分析技術與司法行政工作實務相結合,以司法行政相關文本數據設計案例,以案例詮釋技術理論,並以案例引入司法應用,為相關從業人員和後備人才培養提供了技術理論和應用方案。

作者介紹
高冠東|責編:馮高瓊

目錄
第一章  面向司法的NLP技術概述及應用
  1.1  自然語言及語義
    1.1.1  自然語言與文字信息
    1.1.2  自然語言與數學
    1.1.3  自然語言語義
  1.2  自然語言處理
    1.2.1  早期自然語言研究
    1.2.2  基於統計方法的自然語言處理
    1.2.3  自然語言處理技術的應用
  1.3  文本分析及其應用
    1.3.1  文本分析的相關概念
    1.3.2  文本分析的流程
    1.3.3  文本分析的應用方向
  1.4  文本分析在司法工作智能化中的應用
    1.4.1  人工智慧技術的司法應用
    1.4.2  司法領域的文本分析應用研究
第二章  Python開發環境構建
  2.1  Python環境的選擇
    2.1.1  Python的開發環境
    2.1.2  Python編程所需軟體
    2.1.3  Python版本的選擇
  2.2  開發環境安裝及配置方法
    2.2.1  安裝Anaconda
    2.2.2  安裝PyCharm
    2.2.3  配置環境
    2.2.4  安裝jupyter notebook
    2.2.5  scikit-learn開發環境配置
  2.3  基本操作方法
    2.3.1  Anaconda界面介紹
    2.3.2  Anaconda編寫代碼的過程
第三章  構建司法文本語料庫
  3.1  語料庫概述
    3.1.1  語料的概念
    3.1.2  語料的收集
    3.1.3  語料庫
    3.1.4  語料庫構建原則
    3.1.5  語料庫的種類
  3.2  分詞方法介紹
    3.2.1  分詞概述
    3.2.2  為什麼要分詞
    3.2.3  中英文分詞的區別
    3.2.4  中文分詞演算法
  3.3  利用分詞器構建語料庫
    3.3.1  jieba分詞器
    3.3.2  語料庫的製作
  3.4  語料庫數據管理
    3.4.1  語料庫的數據管理方式的發展階段
    3.4.2  語料庫的物理結構
    3.4.3  語料庫數據管理系統應具備的功能
  3.5  語料庫讀取器

第四章  文本摘要
  4.1  文本摘要技術簡介
  4.2  文本摘要方法分類
  4.3  關鍵短語提取
    4.3.1  詞語搭配
    4.3.2  基於權重標籤的短語提取
  4.4  TextRank文本摘要實例
    4.4.1  TextRank關鍵詞提取原理
    4.4.2  提取關鍵詞、短語和文本摘要實例
  4.5  主題模型
    4.5.1  主題模型演算法介紹
    4.5.2  LSI演算法理論及實例
    4.5.3  LDA演算法
  4.6  基於Gensim庫的主題模型實例
    4.6.1  實例數據準備
    4.6.2  語料庫的製作
    4.6.3  LSI主題模型實例代碼
    4.6.4  LDA主題模型實例代碼
  4.7  基於scikit-learn庫的主題模型
第五章  詞向量推理方法
  5.1  傳統特徵工程模型
    5.1.1  詞袋模型
    5.1.2  n-gram詞袋模型
    5.1.3  one-hot模型
    5.1.4  TF-IDF模型
  5.2  高級特徵工程模型
    5.2.1  Word2Vec模型
    5.2.2  GloVe模型
    5.2.3  FastText模型
    5.2.4  ELMO模型
    5.2.5  OpenAI-GPT模型
    5.2.6  BERT模型
第六章  基於深度學習的NLP方法
  6.1  神經網路基礎知識
    6.1.1  感知機
    6.1.2  認知偏置
    6.1.3  反向傳播演算法
    6.1.4  誤差曲面
    6.1.5  多種梯度下降演算法
    6.1.6  案例
  6.2  卷積神經網路
    6.2.1  卷積神經網路的發展
    6.2.2  卷積神經網路在自然語言處理上的應用
    6.2.3  卷積神經網路的結構
    6.2.4  卷積神經網路的主要特點
    6.2.5  案例
  6.3  循環神經網路
    6.3.1  循環神經網路的記憶功能
    6.3.2  隨時間反向傳播演算法
    6.3.3  權重更新

    6.3.4  循環神經網路的難點
    6.3.5  案例
  6.4  長短期記憶網路(LSTM)
    6.4.1  長短期記憶
    6.4.2  隨時間反向傳播演算法
    6.4.3  字元級建模
    6.4.4  其他記憶機制
    6.4.5  案例
  6.5  注意力機制
    6.5.1  注意力機制簡介
    6.5.2  注意力機制基本原理
    6.5.3  注意力機制的各種方法
    6.5.4  多頭注意力機制應用實例
第七章  基於文本分類的犯罪心理歸因及風險評估
  7.1  文本分類
    7.1.1  文本分類框架
    7.1.2  數據預處理和規範化
    7.1.3  構建訓練和測試集
    7.1.4  特徵工程技術
    7.1.5  構建分類模型
    7.1.6  評估分類模型
  7.2  犯罪心理歸因分析實戰
    7.2.1  載入和查看數據集
    7.2.2  文本預處理
    7.2.3  特徵工程的構建及分類
    7.2.4  模型訓練及測試
    7.2.5  雷達圖表示
  7.3  犯罪心理歸因結果分析
第八章  基於相似性聚類的司法案例智能推薦
  8.1  基本概念
    8.1.1  信息檢索
    8.1.2  特徵工程
    8.1.3  相似度度量
    8.1.4  無監督的機器學習演算法
  8.2  文本相似度
  8.3  分析詞項相似度
    8.3.1  漢明距離
    8.3.2  曼哈頓距離
    8.3.3  歐幾里得距離
    8.3.4  萊文斯坦編輯距離
    8.3.5  餘弦距離和相似度
  8.4  分析文檔相似度
  8.5  構建司法案例推薦系統
    8.5.1  司法案例數據集構建
    8.5.2  司法案例數據集預處理
    8.5.3  目標案例預處理
    8.5.4  成對文檔相似度的餘弦相似度計算
    8.5.5  司法案例推薦
  8.6  文檔聚類
    8.6.1  k均值聚類

    8.6.2  近鄰傳播演算法
    8.6.3  凝聚層次聚類
第九章  基於語言情感分析的親情電話異常偵測
  9.1  前期準備
    9.1.1  需求分析
    9.1.2  多模態情感分析簡介
    9.1.3  項目數據集
    9.1.4  框架流程介紹
  9.2  基於多模態的情感分析案例
    9.2.1  案例創建
    9.2.2  BERT模型模塊介紹
    9.2.3  小腳本文件介紹
    9.2.4  run_classifier主函數
    9.2.5  結果分析
  9.3  情感分析面臨的挑戰及研究方向
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032