17 पॉइंट द्वारा bamchi 2023-08-29 | 5 टिप्पणियां | WhatsApp पर शेयर करें
  • ChatGPT की मदद से Coupang के product information इकट्ठा करने वाला crawling bot विकसित करना
    • इकट्ठा किए जाने वाले columns हैं: product name, list price, selling price, rating, review count, card discount information, rewards information, delivery information
  • token count limit से बचने के लिए HTML size कम करने के तरीके और prompt लिखते समय ध्यान रखने वाली बातें
  • sponsored products को skip करना
  • DOM structure अलग होने पर exception handling
  • required columns की जाँच (product name, price)
  • ChatGPT बहुत उपयोगी tool है, लेकिन थोड़ी debugging और modification की ज़रूरत होती है (आखिरकार experts को ही इससे बड़ा फायदा मिलता है)
  • बड़ी मात्रा में data इकट्ठा करने के लिए blocking avoidance पर विचार करना होगा

5 टिप्पणियां

 
freedomzero 2023-08-30

लगता है यहाँ का पूरा लेख ही GPT से लिखा गया है।

 
roxie 2023-08-30

(आखिरकार ज़्यादा मदद तो विशेषज्ञ को ही मिलती है)

लगता है कि इसका सार यही है..

 
superyang 2023-08-30

मैं ChatGPT से एक crawler बना रहा हूँ, और parsing व XPath extraction में इससे बहुत मदद मिल रही है।

 
kernel00 2023-08-30

GPT से क्रॉलिंग बनाने पर लेख है, लेकिन आखिरकार यह HashScraper का विज्ञापन ही लगता है।

 
superwoou 2023-08-30

टेक ब्लॉग तो ऐसे ही होते हैं न.. हाहाहा