2 पॉइंट द्वारा GN⁺ 2024-12-24 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Infinigen एक "procedural 3D scene generator" है, जो कंप्यूटर विज़न शोध के लिए उच्च गुणवत्ता वाला 3D training data बनाता है
  • यह Blender पर आधारित है और BSD 3-Clause License के तहत मुफ़्त तथा ओपन सोर्स उपलब्ध है

मुख्य विशेषताएँ और खास बातें

प्रक्रियात्मक निर्माण (Procedural)

  • सभी आकार और मैटेरियल गणितीय नियमों से यादृच्छिक रूप से उत्पन्न होते हैं।
  • मैक्रो स्ट्रक्चर से लेकर सूक्ष्म विवरण तक निर्माण संभव है।
  • असीमित वेरिएशन और यूज़र-कस्टमाइज़ेशन की सुविधा।

विविध डेटा निर्माण (Diverse)

  • प्राकृतिक दुनिया के पौधे, जानवर, भू-आकृति, आग, बादल, बारिश, बर्फ आदि विभिन्न ऑब्जेक्ट और सीन बनाना संभव है।
  • शुरुआती फोकस प्राकृतिक पर्यावरण पर है, लेकिन इसे कृत्रिम वस्तुओं और वास्तु परिवेश तक भी विस्तारित करने की योजना है।

वास्तविक ज्यामिति (Real Geometry)

  • हर डिटेल ज्यामिति वास्तविक रूप से लागू होती है, जिससे सही 3D डेटा सुनिश्चित होता है।
  • कोई bump map, normal map जैसी वर्चुअल डिटेल रिप्रेज़ेंटेशन तकनीक का उपयोग नहीं होता।
  • कंप्यूटर विज़न, खासकर 3D vision शोध के लिए ऑप्टिमाइज़्ड।

ऑटोमैटिक एनोटेशन (Automatic Annotations)

  • ऑप्टिकल फ्लो, 3D सीन फ्लो, depth, surface normals, panoptic segmentation, occlusion boundaries जैसे उच्च गुणवत्ता वाले एनोटेशन स्वतः निर्मित होते हैं।
  • रेंडरिंग पाइपलाइन के पूरे एक्सेस को यूज़र के लिए उपलब्ध कराने के कारण एनोटेशन को कस्टमाइज़ करना आसान है।

--

शोध पत्र

  1. Infinite Photorealistic Worlds Using Procedural Generation

    • IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2023 में प्रस्तुत
    • 3D प्रक्रियात्मक निर्माण की असीम संभावनाओं पर केंद्रित पेपर।
  2. Infinigen Indoors: Photorealistic Indoor Scenes using Procedural Generation

    • CVPR 2024 में प्रस्तुत होने की घोषणा
    • इंडोर सीन निर्माण के प्रक्रियात्मक दृष्टिकोण पर शोध।

1 टिप्पणियां

 
GN⁺ 2024-12-24
Hacker News टिप्पणियाँ
  • यह सच में एक शानदार प्रोजेक्ट है

    • ML/AI शोधकर्ताओं से एक सवाल: क्या इसके साथ कोई संबंधित ML/AI पेपर है, जैसे कि वर्चुअल एन्वायरनमेंट में रोबोट को ट्रेन करना
    • वर्तमान ML/AI क्षेत्र में रोबोट को ट्रेन करने के लिए कौन-से dataset इस्तेमाल हो रहे हैं, यह जानना चाहता हूँ
  • इनडोर दृश्यों में काफी वास्तविकता है, लेकिन आउटडोर दृश्यों में काफी कमी है। यह मौजूदा तकनीक के हिसाब से पीछे लगता है

  • लेखकों की सूची में कई प्रसिद्ध चीनी विश्वविद्यालय दिखाई दिए। क्या यह chip sanctions/export controls के उल्लंघन का संकेत है?

  • यह पहले कहीं पोस्ट किया गया था क्या, यह जानना चाहता हूँ। बहुत अच्छा लगता है, लेकिन लगता है कि यह कुछ साल पहले से मौजूद था। क्या कोई अपडेट हुआ है?

  • पूर्व पोस्ट का लिंक: https://news.ycombinator.com/item?id=36373494

  • README से स्पष्ट नहीं हो पाता। यह जानना चाहता हूँ कि क्या इसका मतलब infinite variations बनाना है या infinite world बनाना है

  • मेन्टा टैग विवरण अपडेट की जरूरत है, क्योंकि शेयर करने पर प्लेसहोल्डर कंटेंट दिखता है

  • इसका संभव होना ब्रह्मांड के बारे में किसी चीज़ की ओर इशारा करता है। पर्यावरण में उतनी जानकारी नहीं है जितना हम सोचते हैं

    • यह खासकर यह समझा सकता है कि छोटे आकार के दिमाग वाले जानवर दुनिया को मॉडल करने और काम करने में क्यों असाधारण रूप से प्रभावी होते हैं
  • मैट्रिक्स जैसी शुरुआत में एकदम भी subtle होना दिखाई नहीं देता