इंटरनेट सर्च टिप्स

(gwern.net)

35 पॉइंट द्वारा xguru 2021-04-26 | 1 टिप्पणियां | WhatsApp पर शेयर करें

इंटरनेट पर शोधपत्र, वेबपेज, किताब आदि की जानकारी खोजने की बुनियादी बातों से लेकर मुख्य टिप्स तक को संक्षेप में व्यवस्थित किया गया है
यह लेख Gwern Branwen* ने लिखा है, जिन्हें मेरी राय में व्यक्तिगत वेबसाइटों में सर्वश्रेष्ठ कहना उचित होगा। यहाँ केवल कुछ हिस्से ही लाए गए हैं, इसलिए मूल लेख ज़रूर देखें

[ शोधपत्र खोज ]

सर्च व्याकरण: Boolean operators, मुख्य Google commands (" सटीक मिलान के लिए, - निषेध/बहिष्करण के लिए, site: किसी खास वेबसाइट में खोज के लिए)
तेज़ खोज के लिए hotkeys सेट करना: AutoHotkey, Quicksilver, XMonad आदि
वेबब्राउज़र शॉर्टकट: C-l, C-PgUp/C-PgDwn, C-w, C-t/C-T, M-[1–9]
Google Scholar में खोजते समय HTML view देखना
शोधपत्र शीर्षक खोजने की टिप्स

→ परिणाम कम करने के लिए शीर्षक को छोटा करके खोजें या AND/OR तथा - आदि का उपयोग करें

→ Year जोड़कर/हटाकर देखें..

→ Google की date range सुविधा का उपयोग करें

→ site:archive.org जोड़कर Internet Archive में खोजें

मुश्किल केस

→ Reverse citations: Google Scholar के related articles और cited by देखें

→ मास्टर/PhD thesis के लिए ProQuest

→ Reverse image search: Google Images, TinEye, Yandex का उपयोग करें

डोमेन-विशेष खोज टिप्स

→ Twitter: Google में भी कुछ मिलता है, लेकिन अगर अतिरिक्त जानकारी पता हो तो Twitter advanced search भी शानदार है (from:, to:, since:, until:, near:, url: ..)

→ अमेरिकी संघीय अदालतें: Pacer में साइनअप ज़रूरी है। यह paid है ($0.1/page), लेकिन कुल $15 से कम होने पर मुफ़्त है। Recap नाम का एक public mirror भी है। Recap browser extension भी उपलब्ध है

→ Wellcome Library: पुरानी पत्रिकाएँ/किताबें बहुत हैं। SEO बहुत खराब है, इसलिए Google आदि में खोज अच्छी नहीं होती, फिर भी ध्यान से देखना चाहिए

→ पुरानी पत्रिकाएँ: site:pdf-giant.net, शिक्षा-संबंधी खोज के लिए ERIC (site:eric.ed.gov)

Paywall से निपटना

→ किताब/शोधपत्र के मामले में Libgen / Sci-Hub से bypass किया जा सकता है। Z-Library के ज़रिए full-text search भी संभव है

जब ऊपर के सभी तरीकों से भी कुछ न मिले, तब दूसरों से मदद माँगने की जगहें

→ subreddit: /r/scholar

→ Twitter: #icanhazpdf

→ Wikipedia Resource Request

→ LessWrong HelpDesk

Full-text copy मिल जाने के बाद क्या करें

→ अविश्वसनीय host को लिंक न करें: Libgen/Sci-Hub, Nber, Scribed, ResearchGate..

→ यदि scan copy हो तो gscan2pdf से संपादन और OCR करें

→ metadata जोड़ें: ExifTool, pdftk

→ संभव हो तो उसे public hosting पर रखें और Wikipedia/Reddit पर लिंक साझा करें

→ PDF लिंक टिप: URL के अंत में #page=N जोड़कर पेज निर्धारित किया जा सकता है

उन्नत

→ Archiver-Bot का उपयोग करके search history को अपने-आप archive करें

→ GCSE(Google Custom Search Engine) बनाना

[वेबपेज]

यदि शीर्षक पता हो, तो सिर्फ़ शीर्षक से खोजें
URL खोजते समय अनावश्यक parameters हटा दें
Google search में site: का उपयोग करके डोमेन-सीमा और तारीख-सीमा लगाएँ
Google के अलावा अन्य search का उपयोग

→ DuckDuckGo: Bangs फीचर से बाहरी साइटों पर सीधे खोज की जा सकती है (फ़िलहाल 13000 से अधिक बाहरी साइटों का समर्थन)

→ Bing/Yandex भी उपयोगी हैं

archive जाँचें: Internet Archive या Memento meta-archive

→ IA पूरे डोमेन के URL जाँचने की सुविधा देता है। wayback_machine_downloader (Ruby) से पूरा डाउनलोड किया जा सकता है

→ Google Reader बंद होने से पहले Archive Team ने Google Reader के काफ़ी RSS बैकअप लेकर उन्हें IA पर host किया था (WARC से भी संभव, और अंत में download/search टिप्स भी दिए गए हैं)

→ archive.today: IA जैसा एक समान mirror

→ और कुछ न हो तो Google Cache भी उपयोगी हो सकता है

[डिजिटल किताबें]

किताबें Google Scholar में नहीं मिलतीं। Google search का उपयोग करें.
पहले filetype:pdf से खोजें, फिर Libgen का उपयोग करें
IA में भी बहुत-सी किताबें हैं, लेकिन शायद SEO कमजोर है इसलिए खोज अच्छी नहीं होती। "किताब का शीर्षक" site:archive.org

→ अगर IA की किताब पर DRM लगा हो, तो Calibre का De-DRM plugin उपयोग किया जा सकता है

HathiTrust में भी बहुत-सी scanned किताबें हैं

→ पूरा download संभव नहीं है, लेकिन wget के ज़रिए workaround है। यह तरीका Wellcome Library पर भी लागू किया जा सकता है

[प्रकाशित मुद्रित किताबें]

पुरानी/used किताबें खोजने के लिए Google Books या find-more-books.com का उपयोग करें

→ eBay & Amazon पुरानी किताबें खरीदने के लिए अच्छे नहीं हैं। सिर्फ़ जानकारी देखें

→ AbeBooks, Thrift Books, Better World Books, B&N आदि खरीद के लिए बेहतर हैं

किताब स्कैन करना: destructive vs non-destructive, cutting tools, metadata और PDF बनाने की टिप्स

Gwern Branwen एक freelance लेखक और researcher हैं। वे व्यक्तिगत वेबसाइट https://www.gwern.net/ चलाते हैं, और वह सचमुच बहुत अनोखी है

मेरे हिसाब से व्यक्तिगत वेबपेज/ब्लॉग की दुनिया में यह बिल्कुल शीर्ष स्तर की है। किसी खास विषय को पकड़कर उसे बहुत बारीकी से खंगालना, व्यवस्थित करना और प्रकाशित करना उनकी खासियत है.

→ GoodReads से पता किए गए "लोगों ने पढ़ते-पढ़ते छोड़ दीं Top 5 किताबें" https://hi.news.hada.io/topic?id=1231

1 टिप्पणियां

gguimoon 2021-04-28

पहले पोस्ट किया गया "डेवलपर्स के लिए जानकारी खोजने के टिप्स" भी साथ में सुझाता हूँ। https://hi.news.hada.io/topic?id=2932

इंटरनेट सर्च टिप्स

संबंधित पढ़ाई

1 टिप्पणियां