MaGGIe, I-HIM50K और M-HIM2K डेटासेट पेश करता है, जिसमें इंस्टेंस मैटिंग मजबूती का मूल्यांकन करने के लिए 180,000 से अधिक संश्लेषित मानव मास्क शामिल हैं।MaGGIe, I-HIM50K और M-HIM2K डेटासेट पेश करता है, जिसमें इंस्टेंस मैटिंग मजबूती का मूल्यांकन करने के लिए 180,000 से अधिक संश्लेषित मानव मास्क शामिल हैं।

MaskRCNN और BG20K के साथ मल्टी-इंस्टेंस ह्यूमन मैटिंग डेटा का संश्लेषण

2025/12/20 02:30
3 मिनट पढ़ें
इस कॉन्टेंट के संबंध में प्रतिक्रिया या चिंताओं के लिए, कृपया crypto.news@mexc.com पर हमसे संपर्क करें

सार और 1. परिचय

  1. संबंधित कार्य

  2. MaGGIe

    3.1. कुशल मास्क्ड गाइडेड इंस्टेंस मैटिंग

    3.2. फीचर-मैट टेम्पोरल कंसिस्टेंसी

  3. इंस्टेंस मैटिंग डेटासेट

    4.1. इमेज इंस्टेंस मैटिंग और 4.2. वीडियो इंस्टेंस मैटिंग

  4. प्रयोग

    5.1. इमेज डेटा पर प्री-ट्रेनिंग

    5.2. वीडियो डेटा पर ट्रेनिंग

  5. चर्चा और संदर्भ

\ पूरक सामग्री

  1. आर्किटेक्चर विवरण

  2. इमेज मैटिंग

    8.1. डेटासेट जनरेशन और तैयारी

    8.2. ट्रेनिंग विवरण

    8.3. मात्रात्मक विवरण

    8.4. प्राकृतिक छवियों पर अधिक गुणात्मक परिणाम

  3. वीडियो मैटिंग

    9.1. डेटासेट जनरेशन

    9.2. ट्रेनिंग विवरण

    9.3. मात्रात्मक विवरण

    9.4. अधिक गुणात्मक परिणाम

8. इमेज मैटिंग

यह खंड इमेज मैटिंग प्रक्रिया पर विस्तार करता है, डेटासेट जनरेशन और मौजूदा विधियों के साथ व्यापक तुलना में अतिरिक्त जानकारी प्रदान करता है। हम I-HIM50K और M-HIM2K डेटासेट के निर्माण में गहराई से जाते हैं, विस्तृत मात्रात्मक विश्लेषण प्रदान करते हैं, और हमारे दृष्टिकोण की प्रभावशीलता को रेखांकित करने के लिए आगे गुणात्मक परिणाम प्रस्तुत करते हैं।

8.1. डेटासेट जनरेशन और तैयारी

I-HIM50K डेटासेट को HHM50K [50] डेटासेट से संश्लेषित किया गया था, जो मानव छवि मैट्स के व्यापक संग्रह के लिए जाना जाता है। हमने एकल-व्यक्ति छवियों को फ़िल्टर करने के लिए COCO डेटासेट पर प्रशिक्षित MaskRCNN [14] Resnet-50 FPN 3x मॉडल का उपयोग किया, जिसके परिणामस्वरूप 35,053 छवियों का एक उपसमुच्चय प्राप्त हुआ। InstMatt [49] पद्धति का पालन करते हुए, इन छवियों को BG20K [29] डेटासेट से विविध पृष्ठभूमि के खिलाफ कंपोजिट किया गया, प्रति छवि 2-5 विषयों के साथ मल्टी-इंस्टेंस परिदृश्य बनाए गए। विषयों को यथार्थवादी पैमाने बनाए रखने और अत्यधिक ओवरलैप से बचने के लिए आकार और स्थिति दी गई, जैसा कि इंस्टेंस IoUs 30% से अधिक न होने से संकेत मिलता है। इस प्रक्रिया ने 49,737 छवियां उत्पन्न कीं, प्रति छवि औसतन 2.28 इंस्टेंस। ट्रेनिंग के दौरान, गाइडेंस मास्क अल्फा मैट्स को बाइनराइज़ करके और रैंडम ड्रॉपआउट, डाइलेशन और इरोशन ऑपरेशन लागू करके उत्पन्न किए गए। I-HIM50K से नमूना छवियां चित्र 10 में प्रदर्शित की गई हैं।

\ M-HIM2K डेटासेट को विभिन्न मास्क गुणवत्ता के खिलाफ मॉडल रोबस्टनेस का परीक्षण करने के लिए डिज़ाइन किया गया था। इसमें प्रति इंस्टेंस दस मास्क शामिल हैं, जो विभिन्न MaskRCNN मॉडल का उपयोग करके उत्पन्न किए गए हैं। इस जनरेशन प्रक्रिया के लिए उपयोग किए गए मॉडल के बारे में अधिक जानकारी तालिका 8 में दिखाई गई है। मास्क को ग्राउंड ट्रुथ अल्फा मैट्स के साथ उच्चतम IoU के आधार पर इंस्टेंस से मिलाया गया, 70% का न्यूनतम IoU थ्रेशोल्ड सुनिश्चित करते हुए। जो मास्क इस थ्रेशोल्ड को पूरा नहीं करते थे, उन्हें ग्राउंड ट्रुथ से कृत्रिम रूप से उत्पन्न किया गया। इस प्रक्रिया के परिणामस्वरूप 134,240 मास्क का एक व्यापक सेट प्राप्त हुआ, जिसमें कंपोजिट के लिए 117,660 और प्राकृतिक छवियों के लिए 16,600 शामिल हैं, जो मास्क्ड गाइडेड इंस्टेंस मैटिंग के मूल्यांकन के लिए एक मजबूत बेंचमार्क प्रदान करता है। पूर्ण डेटासेट I-HIM50K और M-HIM2K इस कार्य की स्वीकृति के बाद जारी किया जाएगा।

\ चित्र 10. I-HIM50K डेटासेट के उदाहरण। (रंग में सर्वोत्तम रूप से देखा गया।)

\ तालिका 8. MHIM2K में विभिन्न मास्क गुणवत्ता वाले दस मॉडल का उपयोग किया गया है। MaskRCNN मॉडल विभिन्न सेटिंग्स के साथ COCO पर प्रशिक्षित detectron2 से हैं।

\

:::info लेखक:

(1) Chuong Huynh, University of Maryland, College Park (chuonghm@cs.umd.edu);

(2) Seoung Wug Oh, Adobe Research (seoh,jolee@adobe.com);

(3) Abhinav Shrivastava, University of Maryland, College Park (abhinav@cs.umd.edu);

(4) Joon-Young Lee, Adobe Research (jolee@adobe.com).

:::


:::info यह पेपर arxiv पर उपलब्ध है CC by 4.0 Deed (Attribution 4.0 International) लाइसेंस के तहत।

:::

\

मार्केट अवसर
MemeCore लोगो
MemeCore मूल्य(M)
$4.12602
$4.12602$4.12602
+15.28%
USD
MemeCore (M) मूल्य का लाइव चार्ट
अस्वीकरण: इस साइट पर बाहर से पोस्ट किए गए लेख, सार्वजनिक प्लेटफार्म से लिए गए हैं और केवल सूचना देने के उद्देश्यों के लिए उपलब्ध कराए गए हैं. वे निश्चित तौर पर MEXC के विचारों को नहीं दिखाते. सभी संबंधित अधिकार मूल लेखकों के पास ही हैं. अगर आपको लगता है कि कोई कॉन्टेंट तीसरे पक्ष के अधिकारों का उल्लंघन करता है, तो कृपया उसे हटाने के लिए crypto.news@mexc.com से संपर्क करें. MEXC किसी कॉन्टेंट की सटीकता, पूर्णता या समयबद्धता के संबंध में कोई गारंटी नहीं देता है और प्रदान की गई जानकारी के आधार पर की गई किसी भी कार्रवाई के लिए जिम्मेदार नहीं है. यह कॉन्टेंट वित्तीय, कानूनी या अन्य प्रोफ़ेशनल सलाह नहीं है, न ही इसे MEXC द्वारा अनुशंसा या समर्थन माना जाना चाहिए.

आपको यह भी पसंद आ सकता है

'सुरक्षा बनाम गति': Vitalik Buterin के narrative बदलाव का Ethereum के लिए क्यों है महत्व

'सुरक्षा बनाम गति': Vitalik Buterin के narrative बदलाव का Ethereum के लिए क्यों है महत्व

यह पोस्ट 'Security over speed': Why Vitalik Buterin's narrative shift matters for Ethereum BitcoinEthereumNews.com पर प्रकाशित हुई। 2026 के मध्य तक, वर्ष पहले से ही
शेयर करें
BitcoinEthereumNews2026/04/21 17:11
ईरान ने अविश्वास के बीच होर्मुज नाकाबंदी हटाने की सार्वजनिक घोषणा करने की अमेरिका से मांग की

ईरान ने अविश्वास के बीच होर्मुज नाकाबंदी हटाने की सार्वजनिक घोषणा करने की अमेरिका से मांग की

यह पोस्ट Iran demands US publicly announce Hormuz blockade lift amid distrust BitcoinEthereumNews.com पर प्रकाशित हुई। ईरान ने सार्वजनिक रूप से ट्रंप की विश्वसनीयता को खारिज कर दिया है
शेयर करें
BitcoinEthereumNews2026/04/21 17:18
अमेरिका-ईरान शांति समझौता भी अब तेल मार्केट को बचाने के लिए काफी नहीं, जानिए वजह

अमेरिका-ईरान शांति समझौता भी अब तेल मार्केट को बचाने के लिए काफी नहीं, जानिए वजह

HFI Research ने कहा है कि ऑयल मार्केट अपना ‘breaking point’ पार कर चुका है, जो कि मिड-अप्रैल के आसपास प्रोजेक्ट किया गया था। इस एनालिसिस में कहा गया है कि ये इन
शेयर करें
Beincrypto HI2026/04/21 17:07

24/7 लाइव न्यूज़

अधिक

USD1 Genesis: 0 Fees + 12% APR

USD1 Genesis: 0 Fees + 12% APRUSD1 Genesis: 0 Fees + 12% APR

New users: stake for up to 600% APR. Limited time!