Lawrence Jengar
2025年12月09日 16:49 (UTC +8)
代理工程正在成為開發可靠 AI 系統的關鍵學科。了解它如何將產品思維、工程和數據科學結合起來,用於非確定性系統。
根據 LangChain 最近的一篇部落格文章,代理工程正被認為是開發可靠 AI 系統的重要學科。這一新興領域解決了從開發到生產的過渡挑戰,特別是對於依賴大型語言模型 (LLM) 並表現出非確定性行為的系統。
什麼是代理工程?
代理工程被定義為將非確定性 LLM 系統精煉為可靠生產體驗的迭代過程。這個過程是循環的,包括構建、測試、發布、觀察、改進和重複的階段。目標不僅僅是發布產品,而是通過從生產環境中的表現獲得洞見來持續改進它。
這一新學科結合了三個關鍵技能集:
- 產品思維:涉及定義範圍和塑造代理行為。它需要編寫引導代理行動的提示,並理解代理應執行的工作。
- 工程:專注於建立代理在生產中運行所需的基礎設施。這包括開發用戶界面以及管理記憶和執行。
- 數據科學:隨著時間測量和改進代理性能,使用 A/B 測試和錯誤分析等工具來精煉代理行為。
代理工程的出現與必要性
代理工程的必要性源於兩個重大轉變。首先,LLM 已能夠處理複雜的多步驟工作流程,正如 LinkedIn 和 Clay 等公司所展示的那樣,它們使用代理執行從 CRM 更新到人才庫掃描等任務。其次,LLM 固有的不可預測性需要一種新方法來確保在生產環境中的可靠性。
代理與傳統軟件不同,因為它們可以以各種方式解釋輸入並根據上下文進行調整。這種靈活性意味著每個用戶輸入都可能是一個邊緣情況,而傳統的調試方法通常無效。因此,代理工程強調觀察真實世界的行為並基於這些觀察來改進系統。
代理工程的實際應用
在實踐中,代理工程涉及構建、測試和改進的循環。最初,工程師必須建立代理的基礎架構,無論是涉及簡單的 LLM 調用還是更複雜的系統。針對假設場景進行測試有助於發現初始問題,但真實世界的部署對於理解實際用戶互動是必要的。
在生產中持續觀察和評估代理性能允許系統性改進。這種方法確保代理不僅功能正確,還能提供有意義的商業價值。正如 LangChain 所指出的,成功的團隊是那些擁抱快速迭代並將生產視為持續學習過程的團隊。
工程的新標準
代理工程有望成為 AI 開發中的標準實踐,這是由對能夠可靠處理需要人類般判斷任務的系統需求所驅動的。該學科強調從生產中學習的重要性,並快速迭代以提高代理的可靠性和功能性。
隨著組織越來越依賴代理處理複雜的工作流程,採用代理工程實踐將在充分利用 LLM 潛力的同時,確保生產環境中的信任和可靠性方面至關重要。
圖片來源:Shutterstock
來源:https://blockchain.news/news/agent-engineering-bridging-development-production







