इंटरनेट सर्च टिप्स
(gwern.net)-
इंटरनेट पर शोधपत्र, वेबपेज, किताब आदि की जानकारी खोजने की बुनियादी बातों से लेकर मुख्य टिप्स तक को संक्षेप में व्यवस्थित किया गया है
-
यह लेख Gwern Branwen* ने लिखा है, जिन्हें मेरी राय में व्यक्तिगत वेबसाइटों में सर्वश्रेष्ठ कहना उचित होगा। यहाँ केवल कुछ हिस्से ही लाए गए हैं, इसलिए मूल लेख ज़रूर देखें
[ शोधपत्र खोज ]
-
सर्च व्याकरण: Boolean operators, मुख्य Google commands (
"सटीक मिलान के लिए,-निषेध/बहिष्करण के लिए,site:किसी खास वेबसाइट में खोज के लिए) -
तेज़ खोज के लिए hotkeys सेट करना: AutoHotkey, Quicksilver, XMonad आदि
-
वेबब्राउज़र शॉर्टकट: C-l, C-PgUp/C-PgDwn, C-w, C-t/C-T, M-[1–9]
-
Google Scholar में खोजते समय HTML view देखना
-
शोधपत्र शीर्षक खोजने की टिप्स
→ परिणाम कम करने के लिए शीर्षक को छोटा करके खोजें या AND/OR तथा - आदि का उपयोग करें
→ Year जोड़कर/हटाकर देखें..
→ Google की date range सुविधा का उपयोग करें
→ site:archive.org जोड़कर Internet Archive में खोजें
- मुश्किल केस
→ Reverse citations: Google Scholar के related articles और cited by देखें
→ मास्टर/PhD thesis के लिए ProQuest
→ Reverse image search: Google Images, TinEye, Yandex का उपयोग करें
- डोमेन-विशेष खोज टिप्स
→ Twitter: Google में भी कुछ मिलता है, लेकिन अगर अतिरिक्त जानकारी पता हो तो Twitter advanced search भी शानदार है (from:, to:, since:, until:, near:, url: ..)
→ अमेरिकी संघीय अदालतें: Pacer में साइनअप ज़रूरी है। यह paid है ($0.1/page), लेकिन कुल $15 से कम होने पर मुफ़्त है। Recap नाम का एक public mirror भी है। Recap browser extension भी उपलब्ध है
→ Wellcome Library: पुरानी पत्रिकाएँ/किताबें बहुत हैं। SEO बहुत खराब है, इसलिए Google आदि में खोज अच्छी नहीं होती, फिर भी ध्यान से देखना चाहिए
→ पुरानी पत्रिकाएँ: site:pdf-giant.net, शिक्षा-संबंधी खोज के लिए ERIC (site:eric.ed.gov)
- Paywall से निपटना
→ किताब/शोधपत्र के मामले में Libgen / Sci-Hub से bypass किया जा सकता है। Z-Library के ज़रिए full-text search भी संभव है
- जब ऊपर के सभी तरीकों से भी कुछ न मिले, तब दूसरों से मदद माँगने की जगहें
→ subreddit: /r/scholar
→ Twitter: #icanhazpdf
→ Wikipedia Resource Request
→ LessWrong HelpDesk
- Full-text copy मिल जाने के बाद क्या करें
→ अविश्वसनीय host को लिंक न करें: Libgen/Sci-Hub, Nber, Scribed, ResearchGate..
→ यदि scan copy हो तो gscan2pdf से संपादन और OCR करें
→ metadata जोड़ें: ExifTool, pdftk
→ संभव हो तो उसे public hosting पर रखें और Wikipedia/Reddit पर लिंक साझा करें
→ PDF लिंक टिप: URL के अंत में #page=N जोड़कर पेज निर्धारित किया जा सकता है
- उन्नत
→ Archiver-Bot का उपयोग करके search history को अपने-आप archive करें
→ GCSE(Google Custom Search Engine) बनाना
[वेबपेज]
-
यदि शीर्षक पता हो, तो सिर्फ़ शीर्षक से खोजें
-
URL खोजते समय अनावश्यक parameters हटा दें
-
Google search में
site:का उपयोग करके डोमेन-सीमा और तारीख-सीमा लगाएँ -
Google के अलावा अन्य search का उपयोग
→ DuckDuckGo: Bangs फीचर से बाहरी साइटों पर सीधे खोज की जा सकती है (फ़िलहाल 13000 से अधिक बाहरी साइटों का समर्थन)
→ Bing/Yandex भी उपयोगी हैं
- archive जाँचें: Internet Archive या Memento meta-archive
→ IA पूरे डोमेन के URL जाँचने की सुविधा देता है। wayback_machine_downloader (Ruby) से पूरा डाउनलोड किया जा सकता है
→ Google Reader बंद होने से पहले Archive Team ने Google Reader के काफ़ी RSS बैकअप लेकर उन्हें IA पर host किया था (WARC से भी संभव, और अंत में download/search टिप्स भी दिए गए हैं)
→ archive.today: IA जैसा एक समान mirror
→ और कुछ न हो तो Google Cache भी उपयोगी हो सकता है
[डिजिटल किताबें]
-
किताबें Google Scholar में नहीं मिलतीं। Google search का उपयोग करें.
-
पहले
filetype:pdfसे खोजें, फिर Libgen का उपयोग करें -
IA में भी बहुत-सी किताबें हैं, लेकिन शायद SEO कमजोर है इसलिए खोज अच्छी नहीं होती।
"किताब का शीर्षक" site:archive.org
→ अगर IA की किताब पर DRM लगा हो, तो Calibre का De-DRM plugin उपयोग किया जा सकता है
- HathiTrust में भी बहुत-सी scanned किताबें हैं
→ पूरा download संभव नहीं है, लेकिन wget के ज़रिए workaround है। यह तरीका Wellcome Library पर भी लागू किया जा सकता है
[प्रकाशित मुद्रित किताबें]
- पुरानी/used किताबें खोजने के लिए Google Books या find-more-books.com का उपयोग करें
→ eBay & Amazon पुरानी किताबें खरीदने के लिए अच्छे नहीं हैं। सिर्फ़ जानकारी देखें
→ AbeBooks, Thrift Books, Better World Books, B&N आदि खरीद के लिए बेहतर हैं
- किताब स्कैन करना: destructive vs non-destructive, cutting tools, metadata और PDF बनाने की टिप्स
- Gwern Branwen एक freelance लेखक और researcher हैं। वे व्यक्तिगत वेबसाइट https://www.gwern.net/ चलाते हैं, और वह सचमुच बहुत अनोखी है
मेरे हिसाब से व्यक्तिगत वेबपेज/ब्लॉग की दुनिया में यह बिल्कुल शीर्ष स्तर की है। किसी खास विषय को पकड़कर उसे बहुत बारीकी से खंगालना, व्यवस्थित करना और प्रकाशित करना उनकी खासियत है.
→ GoodReads से पता किए गए "लोगों ने पढ़ते-पढ़ते छोड़ दीं Top 5 किताबें" https://hi.news.hada.io/topic?id=1231
1 टिप्पणियां
पहले पोस्ट किया गया "डेवलपर्स के लिए जानकारी खोजने के टिप्स" भी साथ में सुझाता हूँ। https://hi.news.hada.io/topic?id=2932