डेरियस बारुओ
19 दिसंबर, 2025 02:12
Together AI ने एंटरप्राइज़ एप्लिकेशन के लिए बेहतर अभिव्यक्ति और उच्चारण नियंत्रण प्रदान करते हुए टेक्स्ट-टू-स्पीच क्षमताओं में सुधार के लिए Rime Arcana v2 और Mist v2 मॉडल के एकीकरण की घोषणा की।
Together AI ने अपने प्लेटफ़ॉर्म में दो उन्नत Rime टेक्स्ट-टू-स्पीच (TTS) मॉडल, Arcana v2 और Mist v2 पेश किए हैं, जो इसके AI Native Cloud ऑफरिंग को बढ़ाते हैं। Together AI द्वारा रिपोर्ट किए गए इन मॉडल का उद्देश्य बेहतर अभिव्यक्ति और उच्चारण सटीकता के साथ एंटरप्राइज़-ग्रेड वॉयस समाधान प्रदान करना है।
TTS प्रौद्योगिकी में प्रगति
Arcana v2 और Mist v2 को मौजूदा लार्ज लैंग्वेज मॉडल (LLM) और स्पीच-टू-टेक्स्ट (STT) सिस्टम के साथ सहजता से एकीकृत करने के लिए डिज़ाइन किया गया है, जिससे उपयोगकर्ता अपनी वॉयस टेक्नोलॉजी इंफ्रास्ट्रक्चर को अधिक कुशलता से प्रबंधित कर सकते हैं। ये मॉडल Together AI के समर्पित क्लाउड इंफ्रास्ट्रक्चर पर होस्ट किए गए हैं, जो एंटरप्राइज़ एप्लिकेशन के लिए आवश्यक कम लेटेंसी और उच्च विश्वसनीयता सुनिश्चित करते हैं।
Arcana v2: उन्नत संवादात्मक अभिव्यक्ति
Arcana v2 को अभिव्यक्ति के लिए तैयार किया गया है, जो विविध ग्राहक सेवा परिदृश्यों को पूरा करने के लिए कई भाषाओं और बोलियों में 40 से अधिक आवाज़ें प्रदान करता है। यह विशेष रूप से उन वातावरणों में प्रभावी है जहां सूक्ष्म संवादात्मक क्षमताओं की आवश्यकता होती है, जैसे बिक्री और सहायता, जहां इसने बिक्री रूपांतरण और कॉल सफलता दर जैसे मेट्रिक्स में सुधार दिखाया है।
Mist v2: उच्चारण में सटीकता
Mist v2 निर्धारक उच्चारण पर केंद्रित है, जो उच्च-मात्रा वाले अनुप्रयोगों के लिए आवश्यक है जहां स्थिरता महत्वपूर्ण है। यह मॉडल उपयोगकर्ताओं को एक बार उच्चारण परिभाषित करने की अनुमति देता है, जो विभिन्न आवाज़ों और प्लेटफ़ॉर्म में एकरूपता सुनिश्चित करता है। ऐसी सटीकता स्वास्थ्य सेवा और वित्त जैसे क्षेत्रों में महत्वपूर्ण है, जहां सटीक संचार अत्यावश्यक है।
एंटरप्राइज़ एप्लिकेशन पर प्रभाव
दोनों मॉडल पहले से ही विभिन्न उद्योगों में तैनात हैं, Fortune 500 कंपनियों से लेकर स्टार्टअप तक। Arcana v2 की संवादात्मक इंटरैक्शन को बढ़ाने की क्षमता ने ग्राहक जुड़ाव में महत्वपूर्ण सुधार किए हैं। इस बीच, Mist v2 की उच्चारण नियंत्रण में विश्वसनीयता ग्राहक सेवा और इंटरैक्टिव वॉयस रिस्पांस (IVR) सिस्टम जैसे उच्च-दांव वाले वातावरण का समर्थन करती है।
इंफ्रास्ट्रक्चर और अनुपालन
Together AI इन मॉडल का समर्थन करने वाला एक मजबूत इंफ्रास्ट्रक्चर प्रदान करता है, जिसमें समर्पित GPU संसाधन और SOC 2 Type II और HIPAA मानकों के साथ अनुपालन शामिल है। यह सेटअप सुनिश्चित करता है कि एंटरप्राइज़ उच्च प्रदर्शन और अपटाइम बनाए रखते हुए कड़े नियामक आवश्यकताओं को पूरा करने वाले वॉयस समाधान तैनात कर सकते हैं।
भविष्य की संभावनाएं
इन मॉडल के एकीकरण के साथ, Together AI अपने प्लेटफ़ॉर्म को आगे बढ़ाना जारी रखता है, जो एंटरप्राइज़ की विविध आवश्यकताओं को पूरा करने वाले वॉयस समाधानों का एक व्यापक सूट प्रदान करता है। यह विकास AI-संचालित वॉयस तकनीकों के विकास में एक महत्वपूर्ण कदम है, जो स्वचालित सिस्टम में अधिक प्राकृतिक और प्रभावी इंटरैक्शन का वादा करता है।
छवि स्रोत: Shutterstock
स्रोत: https://blockchain.news/news/together-ai-integrates-rime-voice-models-enhanced-tts-solutions


