OpenAI 与能源部实验室合作,将联邦许可时间缩短 15%
Tony Kim 2026年3月4日 17:29
OpenAI 和太平洋西北国家实验室推出 DraftNEPABench,显示 AI 代理可在联邦环境审查中每个小节节省 1-5 小时。
OpenAI 和美国能源部的太平洋西北国家实验室开发了一个基准测试,显示 AI 编码代理可将联邦环境许可草案减少多达 15%。该合作于 2026 年 2 月 26 日宣布,产生了 DraftNEPABench——一个评估来自 18 个联邦机构 102 项起草任务的 AI 性能的测试框架。
该基准测试专门针对《国家环境政策法》工作流程,这是一个已有 50 年历史的流程,要求联邦机构在批准发电厂、桥梁和制造设施等基础设施项目之前记录环境影响。这些审查通常需要数年时间,并涉及数百页的技术报告。
测试显示的结果
19 名 NEPA 主题专家按 1-5 分制评估 AI 生成的草案,衡量结构、清晰度、准确性和适当的参考使用。这些代理——运行在 OpenAI 的 Codex CLI 和 GPT-5 上——展示了每个文件小节可节省 1-5 小时的潜力。
这听起来并不引人注目,直到你考虑到规模。环境影响声明包含数十个小节,每个小节都需要交叉参考技术报告、监管要求和多个数据来源。每个部分节省几个小时,在目前需要数月或数年才能完成的项目中迅速累积。
AI 代理被要求阅读和综合跨越数百页的文件,验证环境和监管来源的事实,并生成符合特定法律标准的结构化报告。任务涵盖了联邦政府各机构的文件部分。
值得注意的局限性
PNNL 和 OpenAI 坦率地说明了这个基准测试没有证明什么。它评估的是在有相关背景的明确指定起草任务上的性能——而不是真实许可决策中混乱的模糊性。
在审查失败案例时,研究人员发现一些"错误"源于过时的参考资料和薄弱的评估标准,而不是模型错误。实际部署将涉及专家反馈循环,预计会改善超出基准测试结果的性能。
如果源材料不完整或不一致,模型不一定会在没有明确指示的情况下标记问题。人工监督仍然至关重要。
更大的图景
这一合作伙伴关系属于 PNNL 更广泛的 PermitAI 计划的一部分,由能源部政策办公室资助。目标不是取代人工审查员——而是为政府工作人员提供 AI 团队,处理耗时的文件工作,使他们能够专注于判断和复杂决策。
OpenAI 表示,合作将继续完善 PermitAI 应用程序。这些公司预计联邦审查的基础设施项目的平均批准时间最终将从数月降至数周,尽管没有提供实现这一减少的具体时间表。
对于 AI 行业来说,这代表了另一个政府验证用例——证明前沿模型可以处理真实的监管工作流程,而不仅仅是聊天机器人对话。这是否转化为更广泛的联邦 AI 采用取决于后续试点在实际许可条件下的表现。
图片来源:Shutterstock- openai
- 人工智能
- 联邦许可
- nepa
- 政府技术

