幫助中心 | 我的帳號 | 關於我們

大數據應用與實訓教程(電子與信息類新編21世紀高等職業教育精品教材)

  • 作者:編者:于曉荷//辛向麗|責編:蘇昌盛
  • 出版社:中國人民大學
  • ISBN:9787300318875
  • 出版日期:2023/07/01
  • 裝幀:平裝
  • 頁數:137
人民幣:RMB 35 元      售價:
放入購物車
加入收藏夾

內容大鋼
    在大數據和人工智慧時代,海量的數據無處不在,人們可以通過對數據的收集、分析、統計和可視化,從海量的數據中挖掘有價值的信息,發現其中的規律,對事件進行預測,進而制定有針對性的決策。
    Python語言功能強大、可讀性高,且在數據分析和數據可視化等方面有許多成熟的第三方庫和活躍的社區,因此各行各業越來越多的人使用Python 進行數據分析。
    本書共分為6個項目,除了項目一講解環境搭建外,其餘5個項目均基於具有實用性和普適性的案例來編寫,將數據的收集、獲取、預處理、分析與可視化貫穿其中。

作者介紹
編者:于曉荷//辛向麗|責編:蘇昌盛

目錄
項目一 大數據分析開發環境的搭建
    知識鏈接
    一、數據分析的概念
    二、數據分析的應用
    三、數據分析的流程
    四、數據分析前的準備
  項目實施
    一、Python的下載及安裝
    二、PyCharm的下載及安裝
    三、Anaconda的下載及安裝
    四、Jupyter Notebook的使用
  項目拓展
    一、插件的安裝
    二、常用的插件
項目二 Beautiful Soup庫和Matplotlib庫的使用
    知識鏈接
    一、Requests庫
    二、Beautiful Soup庫
    三、Pandas庫的concat()函數
    四、數據的聚合與分組運算
    五、Matplotlib庫
    六、bar0函數
    七、plotO函數
  項目實施
    一、新建項目
    二、安裝Requests庫
    三、使用Requests庫獲取頁面HTML標籤
    四、使用Beautiful Soup庫對頁面進行解析
    五、將獲取的信息保存為csv格式文件
    六、在Jupyter中處理數據並進行可視化分析
  項目拓展
    一、find_all0方法速查表(見表2-2)
    二、find0方法速查表(見表2-3)
    三、selectO方法速查表(見表2-4)
    四、其他方法
    五、HTML速查表(見表2-6)
項目三 Scrapy框架與Matplotlib庫中bar函數的使用
    知識鏈接
    一、Scrapy框架
    二、jieba庫
    三、Matplotlib庫中pyplot模塊的bar函數
  項目實施
    一、創建Scrapy項目
    二、創建爬蟲文件
    三、參數配置
    四、編寫爬蟲文件,獲取第1頁的20條詩詞信息
    五、分頁信息的獲取
    六、爬取信息的保存
    七、在Jupyter中處理文本並進行可視化分析
  項目拓展

    一、創建Scrapy項目和爬蟲文件
    二、配置settings.py文件
    三、編寫items.py文件
    四、編寫pipelines.py文件
    五、編寫爬蟲文件
項目四 Selenium庫和Matplotlib庫的使用
    知識鏈接
    一、Selenium庫
    二、Selenium庫的常用操作
    三、Pandas庫的sort_values()函數
    四、Matplotlib庫的pie()函數
    五、使用loc和iloc進行索引
  項目實施
    一、新建項目
    二、安裝Selenium庫
    三、下載Chrome瀏覽器和瀏覽器驅動
    四、使用Selenium庫獲取第1頁的文本信息
    五、獲取前3個頁面的頁面文本信息
    六、將獲取的信息保存為csv格式文件
    七、在Jupyter中處理數據並進行可視化分析
項目五 XPath和Matplotib庫中barh函數的使用
    知識鏈接
    一、lxml庫
    二、XPath
    三、Xpath的路徑表達式
    四、Matplotlib庫的barhO函數
  項目實施
    一、新建項目
    二、安裝Ixml庫和Requests庫
    三、使用Requests庫獲取第1頁的HTML標籤信息
    四、用etree模塊的HTMLO方法對獲取的標籤進行解析
    五、使用XPath提取解析后的HTML中的文本信息
    六、獲取所有頁面的信息
    七、將獲取的信息保存為csv格式文件
    八、在Jupyter中處理數據並進行可視化分析
項目六 pyecharts庫的使用
    知識鏈接
    一、pyecharts概述
    二、柱狀圖的繪製
    三、折線圖的繪製
    四、餅圖和環形圖的繪製
    五、多圖疊加
  項目實施
    一、使用柱狀圖可視化「平均每股收益(元)」和「平均每股凈資產(元)」
    二、使用柱狀圖與折線圖對「營業收入(元)」「營業成本(元)」
    「營業利潤(元)」進行數據可視化分析
    三、使用餅圖可視化2018至2021年的毛利率
  項目拓展
    一、其他類型圖表的繪製
    二、組合圖的創建

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032