MaGGIe, I-HIM50K और M-HIM2K डेटासेट पेश करता है, जिसमें इंस्टेंस मैटिंग मजबूती का मूल्यांकन करने के लिए 180,000 से अधिक संश्लेषित मानव मास्क शामिल हैं।MaGGIe, I-HIM50K और M-HIM2K डेटासेट पेश करता है, जिसमें इंस्टेंस मैटिंग मजबूती का मूल्यांकन करने के लिए 180,000 से अधिक संश्लेषित मानव मास्क शामिल हैं।

MaskRCNN और BG20K के साथ मल्टी-इंस्टेंस ह्यूमन मैटिंग डेटा का संश्लेषण

2025/12/20 02:30

सार और 1. परिचय

  1. संबंधित कार्य

  2. MaGGIe

    3.1. कुशल मास्क्ड गाइडेड इंस्टेंस मैटिंग

    3.2. फीचर-मैट टेम्पोरल कंसिस्टेंसी

  3. इंस्टेंस मैटिंग डेटासेट

    4.1. इमेज इंस्टेंस मैटिंग और 4.2. वीडियो इंस्टेंस मैटिंग

  4. प्रयोग

    5.1. इमेज डेटा पर प्री-ट्रेनिंग

    5.2. वीडियो डेटा पर ट्रेनिंग

  5. चर्चा और संदर्भ

\ पूरक सामग्री

  1. आर्किटेक्चर विवरण

  2. इमेज मैटिंग

    8.1. डेटासेट जनरेशन और तैयारी

    8.2. ट्रेनिंग विवरण

    8.3. मात्रात्मक विवरण

    8.4. प्राकृतिक छवियों पर अधिक गुणात्मक परिणाम

  3. वीडियो मैटिंग

    9.1. डेटासेट जनरेशन

    9.2. ट्रेनिंग विवरण

    9.3. मात्रात्मक विवरण

    9.4. अधिक गुणात्मक परिणाम

8. इमेज मैटिंग

यह खंड इमेज मैटिंग प्रक्रिया पर विस्तार करता है, डेटासेट जनरेशन और मौजूदा विधियों के साथ व्यापक तुलना में अतिरिक्त जानकारी प्रदान करता है। हम I-HIM50K और M-HIM2K डेटासेट के निर्माण में गहराई से जाते हैं, विस्तृत मात्रात्मक विश्लेषण प्रदान करते हैं, और हमारे दृष्टिकोण की प्रभावशीलता को रेखांकित करने के लिए आगे गुणात्मक परिणाम प्रस्तुत करते हैं।

8.1. डेटासेट जनरेशन और तैयारी

I-HIM50K डेटासेट को HHM50K [50] डेटासेट से संश्लेषित किया गया था, जो मानव छवि मैट्स के व्यापक संग्रह के लिए जाना जाता है। हमने एकल-व्यक्ति छवियों को फ़िल्टर करने के लिए COCO डेटासेट पर प्रशिक्षित MaskRCNN [14] Resnet-50 FPN 3x मॉडल का उपयोग किया, जिसके परिणामस्वरूप 35,053 छवियों का एक उपसमुच्चय प्राप्त हुआ। InstMatt [49] पद्धति का पालन करते हुए, इन छवियों को BG20K [29] डेटासेट से विविध पृष्ठभूमि के खिलाफ कंपोजिट किया गया, प्रति छवि 2-5 विषयों के साथ मल्टी-इंस्टेंस परिदृश्य बनाए गए। विषयों को यथार्थवादी पैमाने बनाए रखने और अत्यधिक ओवरलैप से बचने के लिए आकार और स्थिति दी गई, जैसा कि इंस्टेंस IoUs 30% से अधिक न होने से संकेत मिलता है। इस प्रक्रिया ने 49,737 छवियां उत्पन्न कीं, प्रति छवि औसतन 2.28 इंस्टेंस। ट्रेनिंग के दौरान, गाइडेंस मास्क अल्फा मैट्स को बाइनराइज़ करके और रैंडम ड्रॉपआउट, डाइलेशन और इरोशन ऑपरेशन लागू करके उत्पन्न किए गए। I-HIM50K से नमूना छवियां चित्र 10 में प्रदर्शित की गई हैं।

\ M-HIM2K डेटासेट को विभिन्न मास्क गुणवत्ता के खिलाफ मॉडल रोबस्टनेस का परीक्षण करने के लिए डिज़ाइन किया गया था। इसमें प्रति इंस्टेंस दस मास्क शामिल हैं, जो विभिन्न MaskRCNN मॉडल का उपयोग करके उत्पन्न किए गए हैं। इस जनरेशन प्रक्रिया के लिए उपयोग किए गए मॉडल के बारे में अधिक जानकारी तालिका 8 में दिखाई गई है। मास्क को ग्राउंड ट्रुथ अल्फा मैट्स के साथ उच्चतम IoU के आधार पर इंस्टेंस से मिलाया गया, 70% का न्यूनतम IoU थ्रेशोल्ड सुनिश्चित करते हुए। जो मास्क इस थ्रेशोल्ड को पूरा नहीं करते थे, उन्हें ग्राउंड ट्रुथ से कृत्रिम रूप से उत्पन्न किया गया। इस प्रक्रिया के परिणामस्वरूप 134,240 मास्क का एक व्यापक सेट प्राप्त हुआ, जिसमें कंपोजिट के लिए 117,660 और प्राकृतिक छवियों के लिए 16,600 शामिल हैं, जो मास्क्ड गाइडेड इंस्टेंस मैटिंग के मूल्यांकन के लिए एक मजबूत बेंचमार्क प्रदान करता है। पूर्ण डेटासेट I-HIM50K और M-HIM2K इस कार्य की स्वीकृति के बाद जारी किया जाएगा।

\ चित्र 10. I-HIM50K डेटासेट के उदाहरण। (रंग में सर्वोत्तम रूप से देखा गया।)

\ तालिका 8. MHIM2K में विभिन्न मास्क गुणवत्ता वाले दस मॉडल का उपयोग किया गया है। MaskRCNN मॉडल विभिन्न सेटिंग्स के साथ COCO पर प्रशिक्षित detectron2 से हैं।

\

:::info लेखक:

(1) Chuong Huynh, University of Maryland, College Park (chuonghm@cs.umd.edu);

(2) Seoung Wug Oh, Adobe Research (seoh,jolee@adobe.com);

(3) Abhinav Shrivastava, University of Maryland, College Park (abhinav@cs.umd.edu);

(4) Joon-Young Lee, Adobe Research (jolee@adobe.com).

:::


:::info यह पेपर arxiv पर उपलब्ध है CC by 4.0 Deed (Attribution 4.0 International) लाइसेंस के तहत।

:::

\

मार्केट अवसर
Multichain लोगो
Multichain मूल्य(MULTI)
$0.03875
$0.03875$0.03875
+4.11%
USD
Multichain (MULTI) मूल्य का लाइव चार्ट
अस्वीकरण: इस साइट पर बाहर से पोस्ट किए गए लेख, सार्वजनिक प्लेटफार्म से लिए गए हैं और केवल सूचना देने के उद्देश्यों के लिए उपलब्ध कराए गए हैं. वे निश्चित तौर पर MEXC के विचारों को नहीं दिखाते. सभी संबंधित अधिकार मूल लेखकों के पास ही हैं. अगर आपको लगता है कि कोई कॉन्टेंट तीसरे पक्ष के अधिकारों का उल्लंघन करता है, तो कृपया उसे हटाने के लिए service@support.mexc.com से संपर्क करें. MEXC किसी कॉन्टेंट की सटीकता, पूर्णता या समयबद्धता के संबंध में कोई गारंटी नहीं देता है और प्रदान की गई जानकारी के आधार पर की गई किसी भी कार्रवाई के लिए जिम्मेदार नहीं है. यह कॉन्टेंट वित्तीय, कानूनी या अन्य प्रोफ़ेशनल सलाह नहीं है, न ही इसे MEXC द्वारा अनुशंसा या समर्थन माना जाना चाहिए.

आपको यह भी पसंद आ सकता है

2026 में लाइसेंस प्राप्त क्रिप्टो बेटिंग साइट कैसे चुनें

2026 में लाइसेंस प्राप्त क्रिप्टो बेटिंग साइट कैसे चुनें

2026 में लाइसेंस प्राप्त क्रिप्टो बेटिंग साइट चुनने का तरीका जानें। मुख्य कारकों में नियामक, सुरक्षा, भुगतान, पारदर्शिता और विश्वसनीय क्रिप्टो स्पोर्ट्सबुक शामिल हैं।
शेयर करें
Cryptodaily2025/12/20 17:57
प्राइवेसी कॉइन्स फोकस में: Monero और ZCash प्रमुख सपोर्ट बनाए रखते हैं जबकि अपसाइड बढ़ रहा है

प्राइवेसी कॉइन्स फोकस में: Monero और ZCash प्रमुख सपोर्ट बनाए रखते हैं जबकि अपसाइड बढ़ रहा है

मुख्य बिंदु Monero ने $420 के स्तर को पुनः प्राप्त किया, जो 2017 से एक दीर्घकालिक प्रतिरोध था, जिससे इसकी तकनीकी संरचना तेजी की ओर स्थानांतरित हो गई। के लिए मोमेंटम संकेतक
शेयर करें
Coinstats2025/12/20 17:46
SEC ने कथित धोखाधड़ी के लिए FTX के पूर्व अधिकारियों के खिलाफ अंतिम दंड का प्रस्ताव दिया

SEC ने कथित धोखाधड़ी के लिए FTX के पूर्व अधिकारियों के खिलाफ अंतिम दंड का प्रस्ताव दिया

SEC ने कथित धोखाधड़ी के लिए FTX के पूर्व अधिकारियों के खिलाफ अंतिम दंड का प्रस्ताव दिया यह पोस्ट BitcoinEthereumNews.com पर प्रकाशित हुई। यू.एस. सिक्योरिटीज एंड एक्सचेंज कमीशन
शेयर करें
BitcoinEthereumNews2025/12/20 18:38