- ChatGPT की मदद से Coupang के product information इकट्ठा करने वाला crawling bot विकसित करना
- इकट्ठा किए जाने वाले columns हैं: product name, list price, selling price, rating, review count, card discount information, rewards information, delivery information
- token count limit से बचने के लिए HTML size कम करने के तरीके और prompt लिखते समय ध्यान रखने वाली बातें
- sponsored products को skip करना
- DOM structure अलग होने पर exception handling
- required columns की जाँच (product name, price)
- ChatGPT बहुत उपयोगी tool है, लेकिन थोड़ी debugging और modification की ज़रूरत होती है (आखिरकार experts को ही इससे बड़ा फायदा मिलता है)
- बड़ी मात्रा में data इकट्ठा करने के लिए blocking avoidance पर विचार करना होगा
5 टिप्पणियां
लगता है यहाँ का पूरा लेख ही GPT से लिखा गया है।
लगता है कि इसका सार यही है..
मैं ChatGPT से एक crawler बना रहा हूँ, और parsing व XPath extraction में इससे बहुत मदद मिल रही है।
GPT से क्रॉलिंग बनाने पर लेख है, लेकिन आखिरकार यह HashScraper का विज्ञापन ही लगता है।
टेक ब्लॉग तो ऐसे ही होते हैं न.. हाहाहा