14 पॉइंट द्वारा darjeeling 2025-10-01 | 1 टिप्पणियां | WhatsApp पर शेयर करें

🏀 बास्केटबॉल खिलाड़ियों की पहचान के लिए कंप्यूटर विज़न सिस्टम का सारांश

यह ब्लॉग पोस्ट कंप्यूटर विज़न तकनीक का उपयोग करके बास्केटबॉल मैच के वीडियो में खिलाड़ियों का डिटेक्शन, ट्रैकिंग और पहचान करने वाले एक जटिल सिस्टम को बनाने की प्रक्रिया का विस्तार से वर्णन करती है। यह सिस्टम कई आधुनिक AI मॉडलों को पाइपलाइन के रूप में जोड़कर खिलाड़ियों की तेज़ मूवमेंट, शारीरिक संपर्क के कारण होने वाला ओक्लूज़न, मिलती-जुलती यूनिफॉर्म, कैमरा मूवमेंट जैसी कठिन समस्याओं को हल करता है।


मुख्य तकनीकें और पाइपलाइन

यह सिस्टम कई चरणों वाली परिष्कृत प्रक्रिया के माध्यम से खिलाड़ियों की पहचान करता है।

  1. ऑब्जेक्ट डिटेक्शन (Object Detection):

    • वीडियो में खिलाड़ी, जर्सी नंबर, बास्केटबॉल, रिम जैसे प्रमुख ऑब्जेक्ट्स की स्थिति को सटीक रूप से खोजने के लिए RF-DETR मॉडल का उपयोग किया जाता है।
  2. प्लेयर ट्रैकिंग (Player Tracking):

    • SAM2 (Segment Anything Model 2) का उपयोग करके हर फ्रेम में खिलाड़ियों को ट्रैक किया जाता है। SAM2 की आंतरिक मेमोरी क्षमता की वजह से, भले ही कोई खिलाड़ी कुछ समय के लिए दूसरे खिलाड़ियों या ऑब्जेक्ट्स से ढक जाए, सिस्टम उसे उसी खिलाड़ी के रूप में पहचानते हुए ट्रैकिंग जारी रख सकता है।
  3. टीम विभाजन (Team Clustering):

    • यूनिफॉर्म के रंग के आधार पर दो टीमों को अलग करने के लिए unsupervised learning clustering approach का उपयोग किया जाता है।
    • SigLIP मॉडल से हर खिलाड़ी की visual features को embedding vectors में बदला जाता है।
    • UMAP का उपयोग करके high-dimensional embedding data को low-dimensional रूप में घटाया जाता है।
    • K-means clustering एल्गोरिदम लागू करके खिलाड़ियों को दो समूहों (टीमों) में बाँटा जाता है।
  4. प्लेयर पहचान (Player Identification):

    • खिलाड़ियों की अंतिम पहचान के लिए जर्सी नंबर को पहचाना जाता है।
    • शुरुआत में OCR (optical character recognition) के लिए SmolVLM का उपयोग किया गया था, लेकिन जर्सी नंबर classification के लिए fine-tune किया गया ResNet मॉडल अधिक सटीक निकला, इसलिए अंततः उसे अपनाया गया।
    • IoS (Intersection over Smaller Area) नामक मेट्रिक का उपयोग यह सुनिश्चित करने के लिए किया जाता है कि डिटेक्ट किया गया जर्सी नंबर सही खिलाड़ी mask से सटीक रूप से जुड़ा हो।
    • सिस्टम की विश्वसनीयता बढ़ाने के लिए, किसी खिलाड़ी का नंबर तभी पक्का माना जाता है जब वही जर्सी नंबर कई बार लगातार प्रेडिक्ट हो।

निष्कर्ष और सोर्स कोड

यह सिस्टम कई अत्याधुनिक कंप्यूटर विज़न मॉडलों को रचनात्मक रूप से एकीकृत करके जटिल वास्तविक खेल विश्लेषण समस्याओं को हल करने की क्षमता दिखाने वाला एक सफल उदाहरण है। हालांकि, प्रोसेसिंग की जटिलता के कारण यह रीयल-टाइम में काम नहीं करता।

1 टिप्पणियां

 
shakespeares 2025-10-06

सोर्स कोड लिंक जोड़ा नहीं जा रहा है।