चाहे जाने वाली सुविधा नीचे दी गई है.
- इनपुट के रूप में Hacker News लिंक डालना
- टिप्पणियों का सारांश बनाकर उसे हिंदी में अनुवाद करना. हिंदी अनुवाद करते समय अंत ~किया गया, ~हुआ, ~किया गया है जैसे रूप में होना अच्छा रहेगा.
अगर साझा किया जाए तो लगता है कि GeekNews पर और अधिक पोस्ट आ सकेंगी!
धन्यवाद.
4 टिप्पणियां
Hacker News के पहले पेज पर अपडेट होने वाली जानकारी की मात्रा बहुत ज़्यादा है, इसलिए LLM इस्तेमाल करना थोड़ा चिंता की बात लगती है।
इस बार जारी हुआ gpt-4.1-nano इनपुट 1M token पर $0.1 जैसी पागलपन वाली कीमत पर है, इसलिए लगता है कि summary/translation/categorization सब कुछ काफ़ी सस्ते में किया जा सकता है।
यह कीमत इतनी अविश्वसनीय है कि मैंने अपने ब्लॉग पर translation API और 4.1-nano मॉडल की कीमत की तुलना पोस्ट की है।
अगर आपकी रुचि हो, तो एक बार देख सकते हैं: https://dev-wiki.dev/reading/tech/16
सच कहूँ तो, nano model का इस्तेमाल करते समय मैं यह मानकर चलता हूँ कि HTML के पूरे टैग ठूँसकर डालने के बजाय, साफ-सुथरी जानकारी पर extraction/summary/categorization करना तो लगभग मुफ़्त ही है।
टोकन शेयरिंग सेट कर दें तो शायद 2.5 मिलियन टोकन मुफ़्त होंगे। 4.1 mini nano है।
HTML में comment की position को identify करना आसान है क्या?
इस हिस्से तक अगर firecrawl जैसी चीज़ इस्तेमाल करें, तो लगता है कि पैसों की काफी बर्बादी होगी।
अगर किसी तरह HTML tags को ठीक से handle करके उसे identify किया जा सके, तो उसके बाद लगता है कि main text लेकर nano model से वह काम किया जा सकता है जो मैं करना चाहता हूँ।