OpenAI ने संघीय अनुमति समय को 15% कम करने के लिए DOE लैब के साथ साझेदारी की

Tony Kim Mar 04, 2026 17:29

OpenAI और Pacific Northwest National Laboratory ने DraftNEPABench लॉन्च किया, जो दिखाता है कि AI एजेंट संघीय पर्यावरण समीक्षाओं पर प्रति उपखंड 1-5 घंटे बचा सकते हैं।

OpenAI ने संघीय अनुमति समय को 15% कम करने के लिए DOE लैब के साथ साझेदारी की

OpenAI और U.S. Department of Energy की Pacific Northwest National Laboratory ने एक बेंचमार्क विकसित किया है जो दिखाता है कि AI कोडिंग एजेंट संघीय पर्यावरण अनुमति ड्राफ्ट को 15% तक कम कर सकते हैं। 26 फरवरी, 2026 को घोषित इस सहयोग ने DraftNEPABench का निर्माण किया—एक परीक्षण ढांचा जिसने 18 संघीय एजेंसियों से 102 ड्राफ्टिंग कार्यों में AI प्रदर्शन का मूल्यांकन किया।

यह बेंचमार्क विशेष रूप से National Environmental Policy Act वर्कफ़्लो को लक्षित करता है, जो 50 साल पुरानी प्रक्रिया है जिसमें संघीय एजेंसियों को बिजली संयंत्रों, पुलों और विनिर्माण सुविधाओं जैसी बुनियादी ढांचा परियोजनाओं को मंजूरी देने से पहले पर्यावरणीय प्रभावों का दस्तावेजीकरण करना होता है। इन समीक्षाओं में अक्सर वर्षों लगते हैं और सैकड़ों पृष्ठों की तकनीकी रिपोर्ट शामिल होती हैं।

परीक्षण ने क्या दिखाया

उन्नीस NEPA विषय विशेषज्ञों ने संरचना, स्पष्टता, सटीकता और उचित संदर्भ उपयोग को मापने वाले 1-5 पैमाने पर AI-जनरेटेड ड्राफ्ट का मूल्यांकन किया। GPT-5 के साथ OpenAI के Codex CLI पर चलने वाले एजेंटों ने प्रति दस्तावेज़ उपखंड 1-5 घंटे बचाने की क्षमता प्रदर्शित की।

यह नाटकीय नहीं लगता जब तक आप पैमाने पर विचार नहीं करते। पर्यावरणीय प्रभाव विवरणों में दर्जनों उपखंड होते हैं, जिनमें से प्रत्येक को तकनीकी रिपोर्ट, नियामक आवश्यकताओं और कई डेटा स्रोतों को क्रॉस-रेफरेंस करने की आवश्यकता होती है। प्रति खंड कुछ घंटे बचाना उन परियोजनाओं पर तेजी से जुड़ता है जिन्हें वर्तमान में स्वीकृत होने में महीनों या वर्षों लगते हैं।

AI एजेंटों को सैकड़ों पृष्ठों में फैले दस्तावेजों को पढ़ने और संश्लेषित करने, पर्यावरणीय और नियामक स्रोतों में तथ्यों की पुष्टि करने, और विशिष्ट कानूनी मानदंडों को पूरा करने वाली संरचित रिपोर्ट तैयार करने की आवश्यकता थी। कार्यों में पूरे संघीय सरकार की एजेंसियों के दस्तावेज़ अनुभाग शामिल थे।

ध्यान देने योग्य सीमाएं

PNNL और OpenAI इस बारे में स्पष्ट थे कि यह बेंचमार्क क्या साबित नहीं करता है। यह अच्छी तरह से निर्दिष्ट ड्राफ्टिंग कार्यों पर प्रदर्शन का मूल्यांकन करता है जहां प्रासंगिक संदर्भ उपलब्ध है—वास्तविक अनुमति निर्णयों की गड़बड़ अस्पष्टता नहीं।

विफलता के मामलों की समीक्षा करते समय, शोधकर्ताओं ने पाया कि कुछ "त्रुटियां" मॉडल की गलतियों के बजाय पुराने संदर्भों और कमजोर मूल्यांकन मानदंडों से उत्पन्न हुईं। वास्तविक तैनाती में विशेषज्ञ फीडबैक लूप शामिल होंगे जो बेंचमार्क परिणामों से परे प्रदर्शन में सुधार करने की उम्मीद है।

यदि स्रोत सामग्री अधूरी या असंगत है, तो मॉडल स्पष्ट निर्देशों के बिना समस्याओं को आवश्यक रूप से फ्लैग नहीं करेंगे। मानव निरीक्षण आवश्यक बना रहता है।

बड़ी तस्वीर

यह साझेदारी PNNL की व्यापक PermitAI पहल के भीतर है, जिसे Department of Energy के Office of Policy द्वारा वित्त पोषित किया गया है। लक्ष्य मानव समीक्षकों को बदलना नहीं है—यह सरकारी कर्मचारियों को AI टीमें देना है जो समय लेने वाले दस्तावेज़ कार्य को संभालती हैं ताकि वे निर्णय लेने और जटिल निर्णयों पर ध्यान केंद्रित कर सकें।

OpenAI का कहना है कि सहयोग PermitAI अनुप्रयोगों को परिष्कृत करना जारी रखेगा। कंपनियां अपेक्षा करती हैं कि संघीय रूप से समीक्षा की गई बुनियादी ढांचा परियोजनाओं के लिए औसत अनुमोदन समय अंततः महीनों से सप्ताह तक गिर जाएगा, हालांकि उस कमी को प्राप्त करने के लिए कोई विशिष्ट समयरेखा प्रदान नहीं की गई थी।

AI उद्योग के लिए, यह एक और सरकारी सत्यापन उपयोग मामला दर्शाता है—यह प्रदर्शित करता है कि फ्रंटियर मॉडल वास्तविक नियामक वर्कफ़्लो को संभाल सकते हैं, न कि केवल चैटबॉट बातचीत। क्या यह व्यापक संघीय AI अपनाने में तब्दील होता है यह इस पर निर्भर करता है कि बाद के पायलट वास्तविक अनुमति स्थितियों में कैसा प्रदर्शन करते हैं।

छवि स्रोत: Shutterstock