幫助中心 | 我的帳號 | 關於我們

大模型應用開發(動手做AI Agent)

  • 作者:黃佳|責編:秦健
  • 出版社:人民郵電
  • ISBN:9787115642172
  • 出版日期:2024/05/01
  • 裝幀:平裝
  • 頁數:272
人民幣:RMB 89.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    人工智慧時代一種全新的技術——Agent正在崛起。這是一種能夠理解自然語言並生成對應回復以及執行具體行動的人工智慧體。它不僅是內容生成工具,而且是連接複雜任務的關鍵紐帶。本書將探索Agent的奧秘,內容包括從技術框架到開發工具,從實操項目到前沿進展,通過帶著讀者動手做7個功能強大的Agent,全方位解析Agent的設計與實現。本書最後展望了Agent的發展前景和未來趨勢。
    本書適合對Agent技術感興趣或致力於該領域的研究人員、開發人員、產品經理、企業負責人,以及高等院校相關專業師生等閱讀。讀者將跟隨咖哥和小雪的腳步,踏上饒有趣味的Agent開發之旅,零距離接觸GPT-4模型、OpenAI Assistants API、LangChain、LlamaIndex和MetaGPT等尖端技術,見證Agent在辦公自動化、智能調度、知識整合以及檢索增強生成(RAG)等領域的非凡表現,攜手開啟人工智慧時代的無限可能,在人機協作的星空中共同探尋那顆最閃亮的Agent之星!

作者介紹
黃佳|責編:秦健
    黃佳,人稱咖哥,埃森哲公司資深顧問,在IT界耕耘近二十載,自詡為一朵有「後浪」心態的「前浪」。為人謙虛,好學,有時也好為人師。曾撰寫一系列SAPERP書籍,啟蒙了大批中國早期ABAP技術人才。近年來投身數據科學、人工智慧及雲計算領域,願將自己的所學所感與大家分享。

目錄
第1章  何謂Agent,為何Agent
  1.1  大開腦洞的演講:Life 3.0
  1.2  那麼,究竟何謂Agent
  1.3  Agent的大腦:大模型的通用推理能力
    1.3.1  人類的大腦了不起
    1.3.2  大模型出現之前的Agent
    1.3.3  大模型就是Agent的大腦
    1.3.4  期望頂峰和失望低谷
    1.3.5  知識、記憶、理解、表達、推理、反思、泛化和自我提升
    1.3.6  基於大模型的推理能力構築AI應用
  1.4  Agent的感知力:語言交互能力和多模態能力
    1.4.1  語言交互能力
    1.4.2  多模態能力
    1.4.3  結合語言交互能力和多模態能力
  1.5  Agent的行動力:語言輸出能力和工具使用能力
    1.5.1  語言輸出能力
    1.5.2  工具使用能力
    1.5.3  具身智能的實現
  1.6  Agent對各行業的效能提升
    1.6.1  自動辦公好助手
    1.6.2  客戶服務革命
    1.6.3  個性化推薦
    1.6.4  流程的自動化與資源的優化
    1.6.5  醫療保健的變革
  1.7  Agent帶來新的商業模式和變革
    1.7.1  Gartner的8項重要預測
    1.7.2  Agent即服務
    1.7.3  多Agent協作
    1.7.4  自我演進的AI
    1.7.5  具身智能的發展
  1.8  小結
第2章  基於大模型的Agent技術框架
  2.1  Agent的四大要素
  2.2  Agent的規劃和決策能力
  2.3  Agent的各種記憶機制
  2.4  Agent的核心技能:調用工具
  2.5  Agent的推理引擎:ReAct框架
    2.5.1  何謂ReAct
    2.5.2  用ReAct框架實現簡單Agent
    2.5.3  基於ReAct框架的提示
    2.5.4  創建大模型實例
    2.5.5  定義搜索工具
    2.5.6  構建ReAct Agent
    2.5.7  執行ReAct Agent
  2.6  其他Agent認知框架
    2.6.1  函數調用
    2.6.2  計劃與執行
    2.6.3  自問自答
    2.6.4  批判修正
    2.6.5  思維鏈

    2.6.6  思維樹
  2.7  小結
第3章  OpenAI API、LangChain和Llamalndex
  3.1  何謂 OpenAI API
    3.1.1  說說 OpenAl這家公司
    3.1.2  OpenAI API和Agent開發
    3.1.3  OpenAI API的聊天程序示例
    3.1.4  OpenAI API的圖片生成示例
    3.1.5  OpenAI API實踐
  3.2  何謂LangChain
    3.2.1  說說LangChain
    3.2.2  LangChain中的六大模塊
    3.2.3  LangChain和Agent開發
    3.2.4  LangSmith的使用方法
  3.3  何謂Llamalndex
    3.3.1  說說Llamalndex
    3.3.2  Llamalndex和基於RAG的A1開發
    3.3.3  簡單的Llamalndex開發示例
  3.4  小結
第4章  Agent 1:自動化辦公的實現——通過Assistants API和DALL·E3模型創作PPT
  4.1  OpenAI公司的Assistants是什麼
  4.2  不寫代碼,在Playground中玩Assistants
  4.3  Assistants API的簡單示例
    4.3.1  創建助手
    4.3.2  創建線程
    4.3.3  添加消息
    4.3.4  運行助手
    4.3.5  顯示響應
  4.4  創建一個簡短的虛構PPT
    4.4.1  數據的收集與整理
    4.4.2  創建OpenAI助手
    4.4.3  自主創建數據分析圖表
    4.4.4  自主創建數據洞察
    4.4.5  自主創建頁面標題
    4.4.6  用DALL·E3模型為PPT首頁配圖
    4.4.7  自主創建PPT
  4.5  小結
第5章  Agent 2:多功能選擇的引擎——通過Function Calling調用函數
  5.1  OpenAl中的Functions
    5.1.1  什麼是Functions
    5.1.2  Function的說明文字很重要
    5.1.3  Function定義中的Sample是什麼
    5.1.4  什麼是Function Calling
  5.2  在Playground中定義Function
  5.3  通過Assistants API實現Function Calling
    5.3.1  創建能使用Function的助手
    5.3.2  不調用Function,直接運行助手
    5.3.3  在Run進入requires_action狀態之後跳出循環
    5.3.4  拿到助手返回的元數據信息
    5.3.5  通過助手的返回信息調用函數

    5.3.6  submit_tool_outputs R
  5.4  ChatCompletion API Tool Calls
    5.4.1  初始化對話和定義可用函數
    5.4.2  第一次調用大模型,向模型發送對話及工具定義,並獲取響應
    5.4.3  調用模型選擇的工具並構建新消息
    5.4.4  第二次向大模型發送對話以獲取最終響應
  5.5  小結
第6章  Agent 3:推理與行動的協同——通過LangChain中的ReAct框架實現自動定價
  6.1  複習ReAct框架
  6.2  LangChain中ReAct Agent的實現
  6.3  LangChain中的工具和工具包
  6.4  通過create_react_agent創建鮮花定價Agent
  6.5  深挖AgentExecutor的運行機制
    6.5.1  在AgentExecutor中設置斷點
    6.5.2  第一輪思考:模型決定搜索
    6.5.3  第一輪行動:工具執行搜索
    6.5.4  第二輪思考:模型決定計算
    6.5.5  第二輪行動:工具執行計算
    6.5.6  第三輪思考:模型完成任務
  6.6  小結
第7章  Agent 4:計劃和執行的解耦——通過LangChain中的Plan-and-Execute實現智能調度庫存
  7.1  Plan-and-Solve策略的提出
  7.2  LangChain中的Plan-and-Execute Agent
  7.3  通過Plan-and-Execute Agent實現物流管理
    7.3.1  為Agent定義一系列進行自動庫存調度的工具
    7.3.2  創建Plan-and-Execute Agent並嘗試一個「不可能完成的任務」
    7.3.3  完善請求,讓Agent完成任務
  7.4  從單Agent到多Agent
  7.5  小結
第8章  Agent 5:知識的提取與整合——通過Llamalndex實現檢索增強生成
  8.1  何謂檢索增強生成
    8.1.1  提示工程、RAG與微調
    8.1.2  從技術角度看檢索部分的Pipeline
    8.1.3  從用戶角度看RAG流程
  8.2  RAG和Agent
  8.3  通過Llamalndex的ReAct RAG Agent實現花語秘境財報檢索
    8.3.1  獲取井載入電商的財報文件
    8.3.2  將財報文件的數據轉換為向量數據
    8.3.3  構建查詢引擎和工具
    8.3.4  配置文本生成引擎大模型
    8.3.5  創建Agent以查詢財務信息
  8.4  小結
第9章  Agent 6:GitHub的網紅聚落一-AutoGPT、BabyAGI和CAMEL
  9.1  AutoGPT
    9.1.1  AutoGPT簡介
    9.1.2  AutoGPT實戰
  9.2  BabyAGI
    9.2.1  BabyAGI簡介
    9.2.2  BabyAGI實戰
  9.3  CAMEL

    9.3.1  CAMEL簡介
    9.3.2  CAMEL論文中的股票交易場景
    9.3.3  CAMEL實戰
  9.4  小結
第10章  Agent 7:多Agent框架-AutoGen和MetaGPT
  10.1  AutoGen
    10.1.1  AutoGen簡介
    10.1.2  AutoGen實戰
  10.2  MetaGPT
    10.2.1  MetaGPT簡介
    10.2.2  MetaGPT實戰
  10.3  小結
附錄A  下一代Agent的誕生地:科研論文中的新思路
  A.1  兩篇高質量的Agent綜述論文
  A.2  論文選讀:Agent自主學習、多Agent合作、Agent可信度的評估、邊緣系統部署以及具身智能落地
  A.3  小結
參考文獻
後記  創新與變革的交匯點

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032