前言
自大語言模型爆紅之後,AI 已不再是程式設計師和科學研究人員的專屬工具,越來越多的業務人員開始使用AI 工具和各種大語言模型框架來提高工作效率。近年來,各種AI 工具層出不窮,基本上已經滲透到各行各業。AI 工具雖多,卻不是為每個業務人員量身定做的,很難與實際業務場景相結合,並且業務人員無法針對現有工具進行最佳化,使得AI 工具經常在各個業務場景中只是曇花一現,無法與實際業務場景深度結合。
那麼「AI+ 企業」這條路該如何走呢?絕對不是只依賴大語言模型與AI工具。現有的大語言模型雖然能力很強,能理解的知識面也很廣,但它就像一個光桿司令,只能回答人們提出的問題,無法實際執行各項任務。與之相反,AI 工具(當然也包括其他軟體、程式等)雖然可以執行各項任務,但其並不是Agent,通常需要人們預先定義好參數、設置好流程,然後才能執行實際的任務。總而言之,其還需要人參與到實際任務中,並不是真正意義上的全流程自動化。那麼能否將大語言模型與AI 工具結合在一起,讓大語言模型自己使用各種各樣的外部工具來完成任務呢?(就像人一樣,不僅擁有大腦,還具備雙手來使用各種工具,從而完成不同業務場景的任務。)目前的答案只有一個詞,那就是Agent。
Agent 具備哪些能力?為什麼它是目前「AI+ 行業」的唯一答案呢?下面列舉幾個關鍵字:感知、記憶、決策、回饋、工具呼叫、大語言模型、多Agent 協作。掌握了這些關鍵字,對Agent 就有了一個基本認識。
感知:能獲取周圍環境的資訊,如使用者輸入的資料、上傳的照片,或一個網頁連結,感知就是能夠理解使用者的輸入。
記憶:Agent 做過什麼事,得到過什麼樣的回饋,中間經歷了哪些過程,Agent 都需要記住,後面在做決策的時候還會參考之前的記憶,人類能「吾日三省吾身」,它也可以!
決策:現在Agent 配置了很多工具,它需要知道什麼時候用什麼工具,透過呼叫不同的工具來完成使用者交給它的任務。
回饋:這一次跌倒,下一次還要再跌倒嗎?既然有記憶,就要根據記憶進行反思,接下來做這件事的時候是不是該最佳化一下了。
工具呼叫:常見的方式就是使用API,讓Agent 具備各種各樣的能力,並且可以讓它根據感知和記憶的資訊來填寫其中的參數,從而實現自動化。
大語言模型:Agent 是如何完成感知、記憶和決策的呢?這些事都需要交給「大腦」,也就是大語言模型。
多Agent 協作:單兵作戰是可以完成一些工作的,但是面對複雜業務,就需要多個角色透過互動和分析來一起完成相應工作。
讀者不僅要從概念上理解Agent,還要動手跟著本書內容做一些實際業務場景的應用,包括使用各種Agent 框架實現實際的業務需求,以及外部工具的呼叫、大語言模型的微調、本地知識庫的架設,從而理解建構Agent 的全流程。接下來就一起動手來建構Agent 吧!
繁體中文出版說明
本書作者為中國大陸人士,書中部分使用服務、網站及軟體為中國大陸特有。為保持全書之完整及確保程式碼執行正確,本書部分圖片維持簡體中文介面,讀者可根據上下文閱讀,特此說明。