\ यह बदलाव किसी के अनुमान से तेज़ी से हुआ। एक दिन, AI हमारे वाक्यों को स्वतः पूरा कर रही थी। अगले दिन, यह हमारी बैठकों में शामिल हो रही थी, हमारी बातचीत का सारांश दे रही थी, और हमारी ओर से फॉलो-अप संदेश तैयार कर रही थी। अब यह निर्णय ले रही है।
मैंने वर्षों तक इस बात पर शोध किया है कि टीमें बुद्धिमान प्लेटफॉर्म के माध्यम से कैसे सहयोग करती हैं, और आज मैं जो देख रहा हूं वह ईमेल के आगमन के बाद से कार्यस्थल की गतिशीलता में सबसे महत्वपूर्ण परिवर्तन है। AI एजेंट अब वे उपकरण नहीं हैं जिन्हें हम उपयोग करते हैं। वे प्रतिभागी हैं जिनके साथ हम काम करते हैं।
यह अंतर UX शोधकर्ताओं के लिए बहुत महत्वपूर्ण है। सॉफ्टवेयर सुविधाओं का मूल्यांकन करने के लिए हमने जो विधियां विकसित की हैं, वे तब लागू नहीं होतीं जब वह सॉफ्टवेयर टीम के सदस्य की तरह व्यवहार करना शुरू कर देता है।
पारंपरिक UX शोध ऐसे प्रश्न पूछता है जैसे: क्या यह सुविधा खोजने योग्य है? क्या इंटरैक्शन सहज है? क्या यह वर्कफ़्लो में घर्षण को कम करता है?
ये प्रश्न मानते हैं कि AI निष्क्रिय है, प्रतिक्रिया देने से पहले उपयोगकर्ता के इनपुट का इंतज़ार कर रही है। लेकिन AI एजेंट अलग तरह से काम करते हैं। वे अवलोकन करते हैं, व्याख्या करते हैं, निर्णय लेते हैं और कार्य करते हैं। MIT स्लोन मैनेजमेंट रिव्यू और बोस्टन कंसल्टिंग ग्रुप के 2025 के शोध के अनुसार, 35% संगठनों ने पहले से ही एजेंटिक AI का उपयोग करना शुरू कर दिया है, और 44% जल्द ही इसे अपनाने की योजना बना रहे हैं। फिर भी 47% संकेत देते हैं कि उनके पास AI के साथ क्या करना है, इसके लिए कोई रणनीति नहीं है। अपनाने और समझने के बीच यह अंतर वही है जहां UX शोध को कदम रखना चाहिए।
जब एक AI एजेंट सहयोग प्लेटफॉर्म में शामिल होता है, तो यह टीम की सामाजिक गतिशीलता को बदल देता है। यह प्रभावित करता है कि कौन बोलता है, कब बोलता है, और वे क्या कहने में सहज महसूस करते हैं। इन बदलावों का मूल्यांकन करने के लिए ऐसी विधियों की आवश्यकता होती है जो उपयोगिता परीक्षण से कहीं अधिक हों।
\ 
बुद्धिमान सहयोग प्लेटफॉर्म के लिए UX शोध का नेतृत्व करने के अपने काम में, मैंने विशेष रूप से एंटरप्राइज़ वातावरण में काम करने वाले AI एजेंटों के लिए मूल्यांकन फ्रेमवर्क विकसित किए हैं। यह काम उत्पाद रणनीति, AI विकास और मानव कारक अनुसंधान के चौराहे पर है।
इस संदर्भ में AI मूल्यांकन पारंपरिक मॉडल बेंचमार्किंग से मौलिक रूप से भिन्न है। जब एक AI एजेंट सहयोग प्लेटफॉर्म के भीतर काम करता है, तो हम केवल सटीकता या प्रतिक्रिया गुणवत्ता को अलग-थलग मापने भर से काम नहीं चला सकते। हमें यह मूल्यांकन करना होगा कि एजेंट वास्तविक टीमों की जटिल सामाजिक और परिचालन गतिशीलता के भीतर कैसा प्रदर्शन करता है।
मैं एंटरप्राइज़ सहयोग के लिए AI मूल्यांकन को तीन परस्पर जुड़े परतों के माध्यम से देखता हूं। पहली परत कार्यात्मक प्रदर्शन की जांच करती है: क्या एजेंट कार्य आइटम को सही ढंग से पहचानता है, चर्चाओं का सटीक सारांश देता है, और उचित क्षणों में प्रासंगिक जानकारी सामने लाता है? दूसरी परत एकीकरण गुणवत्ता का आकलन करती है: एजेंट मौजूदा वर्कफ़्लो के भीतर बिना घर्षण पैदा किए या उपयोगकर्ताओं से व्यवहार परिवर्तन की आवश्यकता के बिना कितनी सहजता से काम करता है? तीसरी परत, और जिसे अक्सर नज़रअंदाज़ किया जाता है, प्रणालीगत प्रभाव का मूल्यांकन करती है: एजेंट की उपस्थिति समय के साथ टीम की गतिशीलता, निर्णय की गुणवत्ता और सहयोगी प्रभावशीलता को कैसे प्रभावित करती है?
मई 2025 के हार्वर्ड बिजनेस रिव्यू के शोध में AI एजेंटों को "डिजिटल टीममेट्स" के रूप में वर्णित किया गया है जो प्रतिभा की एक उभरती श्रेणी का प्रतिनिधित्व करते हैं। यह फ्रेमिंग मांग करती है कि हम AI एजेंटों का मूल्यांकन न केवल कार्य पूर्णता पर करें, बल्कि इस बात पर भी करें कि वे टीम के प्रतिभागियों के रूप में कितनी अच्छी तरह कार्य करते हैं। मेरे मूल्यांकन प्रोटोकॉल में व्यवहारिक अवलोकन, अनुदैर्ध्य ट्रैकिंग और परिणाम विश्लेषण शामिल हैं जिन्हें पारंपरिक AI बेंचमार्क पूरी तरह से याद करते हैं।
सबसे मजबूत परिणाम प्राप्त करने वाले संगठन वे हैं जो UX शोध को सीधे अपने AI मूल्यांकन चक्रों में एम्बेड करते हैं, तकनीकी प्रदर्शन उपायों के साथ मानव-केंद्रित मेट्रिक्स का उपयोग करते हैं।
\
एंटरप्राइज़ सहयोग प्लेटफॉर्म के लिए अगली सीमा हाइपर-व्यक्तिगत AI एजेंट हैं जो व्यक्तिगत उपयोगकर्ताओं, टीम संस्कृतियों और संगठनात्मक संदर्भों के अनुकूल होते हैं। यहीं पर UX शोध केवल मूल्यांकनात्मक नहीं बल्कि जनरेटिव भी बन जाता है, जो सीधे आकार देता है कि इन एजेंटों को कैसे डिज़ाइन और तैनात किया जाता है।
मैं ऐसी शोध पहलों का नेतृत्व कर रहा हूं जो सहयोग प्लेटफॉर्म के लिए व्यक्तिगत AI एजेंटों के रणनीतिक विकास को सूचित करती हैं। इस काम में यह समझना शामिल है कि विभिन्न प्रकार के उपयोगकर्ता AI के साथ कैसे बातचीत करते हैं, टीम संचार शैलियां कार्यों और भौगोलिक क्षेत्रों में कैसे भिन्न होती हैं, और संगठनात्मक संस्कृति उपयोगकर्ताओं को AI सहायता से क्या अपेक्षा है, इसे कैसे प्रभावित करती है।
AI साझेदारी पर मैकिन्से के नवंबर 2025 के शोध में कहा गया है कि AI की क्षमता को साकार करने के लिए वर्कफ़्लो को फिर से डिज़ाइन करने की आवश्यकता है ताकि लोग, एजेंट और रोबोट प्रभावी ढंग से एक साथ काम कर सकें। उत्पाद रणनीति के दृष्टिकोण से, इसका मतलब है कि AI एजेंट एक-आकार-सभी के लिए फिट नहीं हो सकते। उन्हें अपनी संचार शैली, हस्तक्षेप आवृत्ति और स्वायत्तता के स्तर को उपयोगकर्ता प्राथमिकताओं और संदर्भगत कारकों के आधार पर अनुकूलित करना होगा।
मेरे शोध ने कई व्यक्तिगतकरण आयामों की पहचान की है जो एंटरप्राइज़ सहयोग संदर्भों में सबसे अधिक मायने रखते हैं। संचार शैली मिलान यह सुनिश्चित करता है कि एजेंट उपयोगकर्ताओं के स्वाभाविक रूप से खुद को व्यक्त करने के तरीके को दर्शाता है, चाहे वह औपचारिक हो या आकस्मिक, विस्तृत हो या संक्षिप्त। हस्तक्षेप समय कैलिब्रेशन सीखता है कि व्यक्तिगत उपयोगकर्ता कब सक्रिय सहायता पसंद करते हैं बनाम जब वे बिना रुकावट के काम करना चाहते हैं। विश्वास सीमा समायोजन पहचानता है कि विभिन्न उपयोगकर्ताओं के AI स्वायत्तता के साथ अलग-अलग आराम स्तर होते हैं और तदनुसार कैलिब्रेट करता है।
रणनीतिक निहितार्थ महत्वपूर्ण हैं। सहयोग प्लेटफॉर्म के लिए AI एजेंट बनाने वाली उत्पाद टीमों को यह समझने के लिए निरंतर UX शोध इनपुट की आवश्यकता होती है कि व्यक्तिगतकरण सुविधाएं विविध उपयोगकर्ता आबादी में कैसा प्रदर्शन करती हैं। इस शोध आधार के बिना, व्यक्तिगतकरण प्रयास ऐसे एजेंट बनाने का जोखिम उठाते हैं जो कुछ उपयोगकर्ताओं के लिए अनावश्यक महसूस करते हैं जबकि अन्य के लिए अनुपयोगी लगते हैं।
अपने सहयोग वर्कफ़्लो में AI एजेंटों को अपनाने वाली क्रॉस-फंक्शनल टीमों के साथ व्यापक फील्ड रिसर्च के माध्यम से, मैंने चार आयामों के आधार पर एक मूल्यांकन फ्रेमवर्क विकसित किया है जिन्हें पारंपरिक तरीके अनदेखा करते हैं।
मैंने हाल ही में एक वितरित उत्पाद टीम के साथ आठ सप्ताह का अध्ययन किया जो अपने सहयोग प्लेटफॉर्म में एक AI एजेंट को लागू कर रही थी। एजेंट को बैठकों में भाग लेने, सारांश तैयार करने, निर्णयों को ट्रैक करने और सक्रिय रूप से प्रासंगिक जानकारी सामने लाने के लिए डिज़ाइन किया गया था।
प्रारंभिक मेट्रिक्स उत्कृष्ट दिखाई दिए: 94% कार्य आइटम सटीकता, 5 में से 4.2 संतुष्टि रेटिंग। लेकिन व्यवहारिक अवलोकन ने डैशबोर्ड के लिए अदृश्य समस्याओं का खुलासा किया। बैठक की अवधि 18% कम हो गई क्योंकि टीम के सदस्यों ने चर्चाओं में जल्दबाजी की, यह जानते हुए कि हर शब्द कैप्चर किया जा रहा था। तीसरे सप्ताह तक, एक एट्रिब्यूशन त्रुटि ने एक सत्यापन बोझ को ट्रिगर किया जो उस दस्तावेज़ीकरण से अधिक समय लेता था जिसे इसने प्रतिस्थापित किया था। टीम के सदस्यों ने यह भी विकसित किया जिसे मैं "सारांश निर्भरता सिंड्रोम" कहता हूं, पूरी तरह से AI सारांशों पर निर्भर करना और महत्वपूर्ण संदर्भ को याद करना।
इन निष्कर्षों के आधार पर, टीम ने AI एजेंट को पुनर्गठित किया, उसके कार्यात्मक दायरे को 60% कम कर दिया। उन्होंने सक्रिय सुविधाओं को हटा दिया जबकि दस्तावेज़ीकरण कार्यों को बरकरार रखा जहां सटीकता उच्च थी। पारंपरिक अपनाने के मेट्रिक्स इसे विफलता के रूप में चिह्नित करेंगे। लेकिन टीम प्रभावशीलता के उपायों ने एक अलग कहानी बताई: निर्णय की गुणवत्ता में सुधार हुआ, बैठक की भागीदारी अधिक न्यायसंगत हो गई, और सत्यापन का बोझ टिकाऊ स्तर तक गिर गया।
सबसे महत्वपूर्ण निष्कर्ष साक्षात्कारों से निकला। कई टीम के सदस्यों ने पूर्ण-स्वायत्तता चरण के दौरान "देखे जाने" का अनुभव बताया। प्रामाणिक संचार पर यह शीतलन प्रभाव कभी भी किसी डैशबोर्ड मेट्रिक में नहीं दिखाई दिया।
\ 
\
इस शोध और इसी तरह के अध्ययनों के आधार पर, मैं सहयोगी सेटिंग्स में AI एजेंटों का मूल्यांकन करने के लिए निम्नलिखित विधियों की सिफारिश करता हूं।
AI एजेंट एंटरप्राइज़ सहयोग में सर्वव्यापी हो जाएंगे। शोध का प्रश्न यह नहीं है कि क्या संगठन उन्हें अपनाएंगे, बल्कि वे उन्हें प्रभावी ढंग से कैसे एकीकृत करेंगे।
UX शोधकर्ताओं की इस एकीकरण को आकार देने में महत्वपूर्ण भूमिका है। हमारे पास मानव व्यवहार को समझने की विधियां और अनुभव गुणवत्ता का मूल्यांकन करने के लिए फ्रेमवर्क हैं। जो संगठन इसे सही करते हैं, वे ऐसी सहयोग प्रणालियां बनाएंगे जहां मनुष्य और AI एजेंट वास्तव में एक-दूसरे के पूरक हैं। जो AI एजेंटों को बस एक और सुविधा के रूप में मानते हैं, वे पाएंगे कि उनकी टीमें प्रौद्योगिकी के आने से पहले की तुलना में कम प्रभावी ढंग से काम करती हैं।
\


