3 पॉइंट द्वारा GN⁺ 2025-03-24 | 2 टिप्पणियां | WhatsApp पर शेयर करें
  • Mozilla.ai का मानना है कि आर्टिफिशियल इंटेलिजेंस (AI) ओपन सहयोग के माध्यम से कम्युनिटी को मज़बूत करने के कई अवसर प्रदान कर सकता है।
  • इन अवसरों को सावधानी से डिज़ाइन किया जाना चाहिए, और AI के अत्यधिक उपयोग को लेकर चिंताएँ बढ़ रही हैं।
  • इसी पृष्ठभूमि में OpenStreetMap AI Helper Blueprint को विकसित और जारी किया गया।
  • OpenStreetMap क्यों?
    • डेटा AI एप्लिकेशन का एक महत्वपूर्ण घटक है, और OpenStreetMap के पास सबसे पूर्ण ओपन मैप डेटाबेस को बनाए रखने वाली एक सक्रिय कम्युनिटी है।
    • OpenStreetMap सड़कें, रेलवे स्टेशन जैसी विविध जानकारी प्रदान करता है, और सैटेलाइट इमेजरी के साथ मिलकर विभिन्न AI मॉडल्स को ट्रेन करने की असीम संभावनाएँ देता है।
    • लक्ष्य यह है कि AI का उपयोग करके मैपिंग प्रक्रिया के धीमे हिस्सों को तेज किया जाए, जबकि महत्वपूर्ण हिस्सों में मानवीय सत्यापन बनाए रखा जाए।
  • कंप्यूटर विज़न क्यों?
    • कई मैप फीचर्स को polygon के रूप में दर्शाया जाता है, और उन्हें ढूँढने व ड्रॉ करने का काम बहुत समय लेता है।
    • यदि पर्याप्त डेटा दिया जाए, तो कंप्यूटर विज़न मॉडल इन कामों को आसानी से कर सकते हैं।
    • ऑब्जेक्ट डिटेक्शन और segmentation के लिए YOLOv11 और SAM2 मॉडल का उपयोग किया जाता है, और ये मॉडल हल्के, तेज़ और लोकल-फ्रेंडली हैं।
  • OpenStreetMap AI Helper Blueprint
    • चरण 1: OpenStreetMap से ऑब्जेक्ट डिटेक्शन डेटासेट बनाना
      • OpenStreetMap डेटा को सैटेलाइट इमेजरी के साथ जोड़कर ट्रेनिंग के लिए उपयुक्त फ़ॉर्मेट में बदला जाता है।
      • Nominatim API और Overpass API का उपयोग करके रुचि वाले क्षेत्र का डेटा डाउनलोड किया जाता है, और उसे Ultralytics YOLO फ़ॉर्मेट में सेव किया जाता है।
    • चरण 2: ऑब्जेक्ट डिटेक्शन मॉडल को fine-tune करना
      • YOLOv11 मॉडल को fine-tune करके Hugging Face Hub पर अपलोड किया जाता है।
    • चरण 3: OpenStreetMap में योगदान
      • fine-tune किए गए मॉडल का उपयोग करके कई tiles पर inference चलाया जाता है, और नए ऑब्जेक्ट्स को मैन्युअली सत्यापित करने के बाद OpenStreetMap पर अपलोड किया जाता है।
  • अंतिम विचार
    • OpenStreetMap कम्युनिटी-नेतृत्व वाले विश्व मानचित्र को बनाने में ओपन सहयोग का एक शक्तिशाली उदाहरण है।
    • OpenStreetMap AI Helper Blueprint दिखाता है कि AI किस तरह मानवीय योगदान को बेहतर बना सकता है, और यह high-quality डेटा के मूल्य पर ज़ोर देता है।
    • Blueprint का उपयोग करने पर, उसी समय में मैन्युअल काम की तुलना में लगभग 5 गुना अधिक swimming pools को मैप किया जा सकता है।
    • अन्य मैप फीचर्स के लिए मॉडल ट्रेनिंग के साथ प्रयोग करने की सिफारिश की जाती है, और प्रोजेक्ट में योगदान या उसका विस्तार किया जा सकता है।

2 टिप्पणियां

 
depth221 2025-03-24

देखने पर लगा कि Map Feature का अनुवाद आम तौर पर (मानचित्र) भू-तत्व के रूप में किया जाता है।

 
GN⁺ 2025-03-24
Hacker News राय
  • OpenStreetMap Foundation की ओर से नमस्कार। AI से पहचाने गए features को सीधे database में नहीं जोड़ना चाहिए

    • algorithms में false positives की समस्या होती है और वे सीधी रेखा या आयताकार objects को टेढ़ा-मेढ़ा map कर देते हैं
    • यह छूटे हुए features का पता लगाने वाले tool के रूप में उपयोगी है, लेकिन यह जांचने के लिए कि पहचाना गया object सही तरीके से खींचा गया है या नहीं, मानवीय हस्तक्षेप ज़रूरी है
    • संबंधित guidelines OpenStreetMap wiki पर देखी जा सकती हैं
  • swimming pool detection के बाद solar detection भी आज़माना चाहूँगा

    • इस विचार का काफ़ी विरोध है कि OSM सिर्फ़ manual work से बढ़ सकता है
    • मैंने 10 साल में 60,000 edits किए हैं, लेकिन सिर्फ़ मानव volunteers का उत्साह global scale mapping की समस्या हल नहीं कर सकता
    • एक scalable framework चाहिए जिसमें data quality, source, bug report करने का तरीका, और consumer guidelines को annotate किया जा सके
    • उदाहरण के लिए, अगर मैं query करना चाहूँ कि "पिछले 1 साल में इंसानों द्वारा map किए गए type X के businesses", तो यह कुछ हद तक "check date" से संभव है
    • लेकिन इससे यह पता नहीं चलता कि attributes कितने accurate हैं या mapper ने सिर्फ़ name/location verify किया था
    • हो सकता है कि हर महीने अपने-आप data बनाए रखने के लिए सभी जगहों के business hours इकट्ठा करना बेहतर हो
    • अगर data consumer के रूप में मैं सिर्फ़ कुछ भरोसेमंद sources को filter कर सकूँ, तो यह बेहतर हो सकता है
    • AI से inferred POI जैसी सीमाएँ होने पर भी data का उपयोग किया जा सकता है
  • automated mapping का प्रत्यक्ष अनुभव होने के बाद मैं इसे लेकर बहुत सतर्क हो गया हूँ

    • मैंने मोटरसाइकिल से South America की यात्रा की थी, और OSM पर ऐसे बहुत से edits थे जो automated लगते थे, इसलिए कुछ क्षेत्रों में वह लगभग बेकार था
    • यह सिर्फ़ ग्रामीण सड़कों पर नहीं, बल्कि काफ़ी बड़े शहरों में भी होता है
  • कुछ साल पहले मैंने इस क्षेत्र में काम किया था

    • पहले से बहुत से models, datasets, tools आदि मौजूद हैं
    • संबंधित सामग्री GitHub पर देखी जा सकती है
  • हम satellite imagery में दिखने वाली चीज़ों को map नहीं कर रहे, बल्कि ज़मीन पर मौजूद वास्तविक जानकारी को map कर रहे हैं

    • AI द्वारा कल्पना की गई चीज़ों का योगदान नहीं करना चाहिए
  • Google इसकी अनुमति नहीं देता, लेकिन Mapbox गैर-व्यावसायिक उद्देश्यों के लिए या OSM में इस्तेमाल होने पर इसकी अनुमति देता है

    • Mapbox की satellite imagery का उपयोग करके derived vector datasets बनाए जा सकते हैं
  • काश Mozilla एक अच्छा browser बनाने पर ध्यान देता

  • कुछ महीने पहले मैंने ऐसा ही काम किया था (छोटे पैमाने के geo data पर)

    • संबंधित सामग्री GitHub पर देखी जा सकती है
  • मैं यह देखना चाहूँगा कि SAM/2 को fine-tune करके swimming pools या solar arrays का पता कैसे लगाया गया

    • यह community resilience projects के लिए उपयोगी है, लेकिन मैं SAM2 fine-tuning को follow नहीं कर पाया
    • Yolov8 model solar को अच्छी तरह ढूँढता और segment करता है, लेकिन किनारे बहुत ख़राब आते हैं, इसलिए काफ़ी काम करना पड़ता है
    • SAM2 से trained परिणाम काफ़ी बेहतर दिखते हैं
    • accuracy की समस्या के कारण मैं इसे OSM में नहीं जोड़ूँगा, लेकिन कहीं और इसका उपयोग हो सकता है
  • इसे 'head-up digitizing' कहा जाता था