MaGGIe, I-HIM50K और M-HIM2K डेटासेट पेश करता है, जिसमें इंस्टेंस मैटिंग मजबूती का मूल्यांकन करने के लिए 180,000 से अधिक संश्लेषित मानव मास्क शामिल हैं।MaGGIe, I-HIM50K और M-HIM2K डेटासेट पेश करता है, जिसमें इंस्टेंस मैटिंग मजबूती का मूल्यांकन करने के लिए 180,000 से अधिक संश्लेषित मानव मास्क शामिल हैं।

MaskRCNN और BG20K के साथ मल्टी-इंस्टेंस ह्यूमन मैटिंग डेटा का संश्लेषण

2025/12/20 02:30
3 मिनट पढ़ें
इस कॉन्टेंट के संबंध में प्रतिक्रिया या चिंताओं के लिए, कृपया crypto.news@mexc.com पर हमसे संपर्क करें

सार और 1. परिचय

  1. संबंधित कार्य

  2. MaGGIe

    3.1. कुशल मास्क्ड गाइडेड इंस्टेंस मैटिंग

    3.2. फीचर-मैट टेम्पोरल कंसिस्टेंसी

  3. इंस्टेंस मैटिंग डेटासेट

    4.1. इमेज इंस्टेंस मैटिंग और 4.2. वीडियो इंस्टेंस मैटिंग

  4. प्रयोग

    5.1. इमेज डेटा पर प्री-ट्रेनिंग

    5.2. वीडियो डेटा पर ट्रेनिंग

  5. चर्चा और संदर्भ

\ पूरक सामग्री

  1. आर्किटेक्चर विवरण

  2. इमेज मैटिंग

    8.1. डेटासेट जनरेशन और तैयारी

    8.2. ट्रेनिंग विवरण

    8.3. मात्रात्मक विवरण

    8.4. प्राकृतिक छवियों पर अधिक गुणात्मक परिणाम

  3. वीडियो मैटिंग

    9.1. डेटासेट जनरेशन

    9.2. ट्रेनिंग विवरण

    9.3. मात्रात्मक विवरण

    9.4. अधिक गुणात्मक परिणाम

8. इमेज मैटिंग

यह खंड इमेज मैटिंग प्रक्रिया पर विस्तार करता है, डेटासेट जनरेशन और मौजूदा विधियों के साथ व्यापक तुलना में अतिरिक्त जानकारी प्रदान करता है। हम I-HIM50K और M-HIM2K डेटासेट के निर्माण में गहराई से जाते हैं, विस्तृत मात्रात्मक विश्लेषण प्रदान करते हैं, और हमारे दृष्टिकोण की प्रभावशीलता को रेखांकित करने के लिए आगे गुणात्मक परिणाम प्रस्तुत करते हैं।

8.1. डेटासेट जनरेशन और तैयारी

I-HIM50K डेटासेट को HHM50K [50] डेटासेट से संश्लेषित किया गया था, जो मानव छवि मैट्स के व्यापक संग्रह के लिए जाना जाता है। हमने एकल-व्यक्ति छवियों को फ़िल्टर करने के लिए COCO डेटासेट पर प्रशिक्षित MaskRCNN [14] Resnet-50 FPN 3x मॉडल का उपयोग किया, जिसके परिणामस्वरूप 35,053 छवियों का एक उपसमुच्चय प्राप्त हुआ। InstMatt [49] पद्धति का पालन करते हुए, इन छवियों को BG20K [29] डेटासेट से विविध पृष्ठभूमि के खिलाफ कंपोजिट किया गया, प्रति छवि 2-5 विषयों के साथ मल्टी-इंस्टेंस परिदृश्य बनाए गए। विषयों को यथार्थवादी पैमाने बनाए रखने और अत्यधिक ओवरलैप से बचने के लिए आकार और स्थिति दी गई, जैसा कि इंस्टेंस IoUs 30% से अधिक न होने से संकेत मिलता है। इस प्रक्रिया ने 49,737 छवियां उत्पन्न कीं, प्रति छवि औसतन 2.28 इंस्टेंस। ट्रेनिंग के दौरान, गाइडेंस मास्क अल्फा मैट्स को बाइनराइज़ करके और रैंडम ड्रॉपआउट, डाइलेशन और इरोशन ऑपरेशन लागू करके उत्पन्न किए गए। I-HIM50K से नमूना छवियां चित्र 10 में प्रदर्शित की गई हैं।

\ M-HIM2K डेटासेट को विभिन्न मास्क गुणवत्ता के खिलाफ मॉडल रोबस्टनेस का परीक्षण करने के लिए डिज़ाइन किया गया था। इसमें प्रति इंस्टेंस दस मास्क शामिल हैं, जो विभिन्न MaskRCNN मॉडल का उपयोग करके उत्पन्न किए गए हैं। इस जनरेशन प्रक्रिया के लिए उपयोग किए गए मॉडल के बारे में अधिक जानकारी तालिका 8 में दिखाई गई है। मास्क को ग्राउंड ट्रुथ अल्फा मैट्स के साथ उच्चतम IoU के आधार पर इंस्टेंस से मिलाया गया, 70% का न्यूनतम IoU थ्रेशोल्ड सुनिश्चित करते हुए। जो मास्क इस थ्रेशोल्ड को पूरा नहीं करते थे, उन्हें ग्राउंड ट्रुथ से कृत्रिम रूप से उत्पन्न किया गया। इस प्रक्रिया के परिणामस्वरूप 134,240 मास्क का एक व्यापक सेट प्राप्त हुआ, जिसमें कंपोजिट के लिए 117,660 और प्राकृतिक छवियों के लिए 16,600 शामिल हैं, जो मास्क्ड गाइडेड इंस्टेंस मैटिंग के मूल्यांकन के लिए एक मजबूत बेंचमार्क प्रदान करता है। पूर्ण डेटासेट I-HIM50K और M-HIM2K इस कार्य की स्वीकृति के बाद जारी किया जाएगा।

\ चित्र 10. I-HIM50K डेटासेट के उदाहरण। (रंग में सर्वोत्तम रूप से देखा गया।)

\ तालिका 8. MHIM2K में विभिन्न मास्क गुणवत्ता वाले दस मॉडल का उपयोग किया गया है। MaskRCNN मॉडल विभिन्न सेटिंग्स के साथ COCO पर प्रशिक्षित detectron2 से हैं।

\

:::info लेखक:

(1) Chuong Huynh, University of Maryland, College Park (chuonghm@cs.umd.edu);

(2) Seoung Wug Oh, Adobe Research (seoh,jolee@adobe.com);

(3) Abhinav Shrivastava, University of Maryland, College Park (abhinav@cs.umd.edu);

(4) Joon-Young Lee, Adobe Research (jolee@adobe.com).

:::


:::info यह पेपर arxiv पर उपलब्ध है CC by 4.0 Deed (Attribution 4.0 International) लाइसेंस के तहत।

:::

\

मार्केट अवसर
MemeCore लोगो
MemeCore मूल्य(M)
$1.51261
$1.51261$1.51261
+1.12%
USD
MemeCore (M) मूल्य का लाइव चार्ट
अस्वीकरण: इस साइट पर बाहर से पोस्ट किए गए लेख, सार्वजनिक प्लेटफार्म से लिए गए हैं और केवल सूचना देने के उद्देश्यों के लिए उपलब्ध कराए गए हैं. वे निश्चित तौर पर MEXC के विचारों को नहीं दिखाते. सभी संबंधित अधिकार मूल लेखकों के पास ही हैं. अगर आपको लगता है कि कोई कॉन्टेंट तीसरे पक्ष के अधिकारों का उल्लंघन करता है, तो कृपया उसे हटाने के लिए crypto.news@mexc.com से संपर्क करें. MEXC किसी कॉन्टेंट की सटीकता, पूर्णता या समयबद्धता के संबंध में कोई गारंटी नहीं देता है और प्रदान की गई जानकारी के आधार पर की गई किसी भी कार्रवाई के लिए जिम्मेदार नहीं है. यह कॉन्टेंट वित्तीय, कानूनी या अन्य प्रोफ़ेशनल सलाह नहीं है, न ही इसे MEXC द्वारा अनुशंसा या समर्थन माना जाना चाहिए.

आपको यह भी पसंद आ सकता है

WhiteBIT फैन बेनिफिट्स अनलॉक करता है: यूक्रेनी राष्ट्रीय फुटबॉल टीम की एक्सक्लूसिव कार्ड स्किन और मैच टिकट गिवअवे

WhiteBIT फैन बेनिफिट्स अनलॉक करता है: यूक्रेनी राष्ट्रीय फुटबॉल टीम की एक्सक्लूसिव कार्ड स्किन और मैच टिकट गिवअवे

[प्रेस विज्ञप्ति – विनियस, लिथुआनिया, 6 मार्च, 2026] WhiteBIT, ट्रैफ़िक के हिसाब से यूरोप का सबसे बड़ा क्रिप्टोकरेंसी एक्सचेंज और आधिकारिक टाइटल क्रिप्टो पार्टनर
शेयर करें
CryptoPotato2026/03/07 03:50
बिटकॉइन रिकवरी: DeFi में तनाव बढ़ा, Aave विवाद गहराया

बिटकॉइन रिकवरी: DeFi में तनाव बढ़ा, Aave विवाद गहराया

इस सप्ताह Bitcoin और व्यापक क्रिप्टो कॉम्प्लेक्स ने सतर्क रिकवरी दर्ज की क्योंकि निवेशकों ने ईरान के साथ अमेरिका-इज़राइल संघर्ष के बाद जोखिम का पुनर्मूल्यांकन किया। प्रमुख
शेयर करें
Crypto Breaking News2026/03/07 03:39
क्रिप्टोकरेंसी बाजार के लिए सभी सकारात्मक समाचारों के बावजूद Bitcoin और Altcoins ऊपर क्यों नहीं जा रहे हैं?

क्रिप्टोकरेंसी बाजार के लिए सभी सकारात्मक समाचारों के बावजूद Bitcoin और Altcoins ऊपर क्यों नहीं जा रहे हैं?

अमेरिका में चल रही क्रिप्टो-समर्थक शासन और अपनाने की प्रक्रिया के बावजूद, Bitcoin और altcoins क्यों नहीं बढ़ रहे हैं? आगे पढ़ें: Bitcoin और Altcoins क्यों नहीं
शेयर करें
Bitcoinsistemi2026/03/07 04:40