Agent Engineering: 彌合開發與生產之間的差距

Lawrence Jengar
2025年12月09日 16:49 (UTC +8)

代理工程正在成為開發可靠 AI 系統的關鍵學科。了解它如何將產品思維、工程和數據科學結合起來，用於非確定性系統。

根據 LangChain 最近的一篇部落格文章，代理工程正被認為是開發可靠 AI 系統的重要學科。這一新興領域解決了從開發到生產的過渡挑戰，特別是對於依賴大型語言模型 (LLM) 並表現出非確定性行為的系統。

什麼是代理工程？

代理工程被定義為將非確定性 LLM 系統精煉為可靠生產體驗的迭代過程。這個過程是循環的，包括構建、測試、發布、觀察、改進和重複的階段。目標不僅僅是發布產品，而是通過從生產環境中的表現獲得洞見來持續改進它。

這一新學科結合了三個關鍵技能集：

代理工程的必要性源於兩個重大轉變。首先，LLM 已能夠處理複雜的多步驟工作流程，正如 LinkedIn 和 Clay 等公司所展示的那樣，它們使用代理執行從 CRM 更新到人才庫掃描等任務。其次，LLM 固有的不可預測性需要一種新方法來確保在生產環境中的可靠性。

代理與傳統軟件不同，因為它們可以以各種方式解釋輸入並根據上下文進行調整。這種靈活性意味著每個用戶輸入都可能是一個邊緣情況，而傳統的調試方法通常無效。因此，代理工程強調觀察真實世界的行為並基於這些觀察來改進系統。

在實踐中，代理工程涉及構建、測試和改進的循環。最初，工程師必須建立代理的基礎架構，無論是涉及簡單的 LLM 調用還是更複雜的系統。針對假設場景進行測試有助於發現初始問題，但真實世界的部署對於理解實際用戶互動是必要的。

在生產中持續觀察和評估代理性能允許系統性改進。這種方法確保代理不僅功能正確，還能提供有意義的商業價值。正如 LangChain 所指出的，成功的團隊是那些擁抱快速迭代並將生產視為持續學習過程的團隊。

代理工程有望成為 AI 開發中的標準實踐，這是由對能夠可靠處理需要人類般判斷任務的系統需求所驅動的。該學科強調從生產中學習的重要性，並快速迭代以提高代理的可靠性和功能性。

隨著組織越來越依賴代理處理複雜的工作流程，採用代理工程實踐將在充分利用 LLM 潛力的同時，確保生產環境中的信任和可靠性方面至關重要。

圖片來源：Shutterstock

來源：https://blockchain.news/news/agent-engineering-bridging-development-production