文章作者、来源:Andrew's Letters,DeepLearning AI
随着 LLM 的不断进化,它们直接完成复杂任务的能力也在不断变强。通过 zero-shot 或 few-shot 的简单 prompt,就可以让大模型生成高质量长文、总结长篇论文、生成和分析一长段代码等等。
但这都是相对单一的任务(尽管它很复杂)。如果需要更多的工作流程、反复的迭代、不同数据源的获取分析、调用不同的工具配合呢?LLM 直接完成的准确度就变低了很多,甚至不能完成。
这就是 AI Agent 的存在价值和发展方向,也是近期讨论很多的话题。吴恩达老师推出了一个关于「Agentic 设计模式」的系列文章,讲解了四个重点设计模式:
LLM 可以通过反思自己的行为而成为更有效的 Agent。利用 LLM 对输出的评价能力,提供评价上下文和反思建议,经过多次评价反思迭代后,输出质量更高的内容。
LLM 拥有网络搜索、代码执行或任何其他功能等工具来帮助其收集信息、采取行动或处理数据。最新的 LLM 基本都具备工具使用能力,而 @langchain、@llama_index 等大模型开发框架也会提供更统一的工具使用接口,帮助开发者更容易地使用 LLM。
LLM 可以提出并执行一个多步骤计划来实现目标(例如,撰写论文大纲,然后进行在线研究,然后撰写草稿,等等)。
多个 Agent 一起工作,分解任务并讨论和辩论想法,以提出比单个 Agent 更好的解决方案。@pyautogen、@crewAIInc 和 LangGraph 等新兴框架提供了丰富的方法来构建问题的多智能体解决方案。

