- म्यूज़िक सर्च सिस्टम दो चरणों से बना होता है: रजिस्ट्रेशन और सर्च
- रजिस्ट्रेशन: मौजूदा ऑडियो स्रोत को Audio Fingerprint में बदलकर डेटाबेस में स्टोर करना
- सर्च: इनपुट ऑडियो स्रोत को Audio Fingerprint में बदलने के बाद डेटाबेस से तुलना करके मिलते-जुलते ऑडियो स्रोत खोजना
- पृष्ठभूमि ज्ञान
- WAV फ़ाइल: अनकम्प्रेस्ड PCM फ़ॉर्मेट, जो बिना डेटा बदले मूल को सुरक्षित रखता है
- सैंपलिंग(Sampling): analog signal को digital में बदलना; sampling rate जितनी अधिक होगी, सटीकता उतनी बढ़ेगी
- स्पेक्ट्रोग्राम(Spectrogram): frequency और amplitude में बदलाव को visualise करने वाला ग्राफ
- Fourier transform: signal को frequency domain में बदलकर ध्वनि का विश्लेषण करना
- पीक(Peak): प्रमुख frequency components को दर्शाने वाला डेटा, जिससे noise हटाया जा सकता है और compression संभव होता है
- ऑडियो फ़िंगरप्रिंट(Audio Fingerprint): peak data को hash करके बनाया जाता है, और डेटाबेस स्टोरेज व सर्च में उपयोग होता है
- इम्प्लीमेंटेशन प्रक्रिया
- WAV फ़ाइल को पढ़कर sampling data तैयार करें
- sampling data पर Fourier transform लागू करके spectrogram बनाएं
- spectrogram से peak निकालें
- peak data को hash करके audio fingerprint बनाएं
- audio fingerprint को डेटाबेस में स्टोर करें या सर्च करके मिलते-जुलते ऑडियो स्रोत की पुष्टि करें
1 टिप्पणियां
उमी