मशीन लर्निंग जॉब इंटरव्यू - एक परफेक्ट गाइड
(silviasapora.github.io)- Machine Learning PhD के बाद Research Scientist भूमिका पाने की पूरी प्रक्रिया पर आधारित व्यावहारिक अनुभवों का संकलन
- DeepMind, Isomorphic Labs, Cohere, Meta और stealth startup समेत जिन सभी कंपनियों में इंटरव्यू पूरा किया, उन सब से ऑफर मिले — इसी अनुभव पर आधारित
- इंटरव्यू हासिल करने के मानदंड, तकनीकी·भावनात्मक·लॉजिस्टिक तैयारी, startup vs big tech तुलना, और salary negotiation तक चरण-दर-चरण व्यवस्थित विवरण
- RSU और stock option के tax·structure के अंतर, transformer·attention को सीधे implement करना जैसे ठोस तैयारी बिंदु भी शामिल
- इंटरव्यू मूल रूप से stochastic होते हैं, और उनका परिणाम एक researcher के रूप में आपकी कीमत तय नहीं करता — इस संदेश पर जोर
पूरे इंटरव्यू परिणाम और पृष्ठभूमि
- ML PhD के बाद Research Scientist नौकरी खोजने की प्रक्रिया को स्वयं अनुभव कर व्यवस्थित किया; शुरुआत में संदर्भ सामग्री लगभग नहीं थी
- जिन सभी कंपनियों में इंटरव्यू पूरा किया, उन सब से ऑफर मिला — DeepMind (स्वीकार किया), Isomorphic Labs, Cohere, Meta, और stealth startup शामिल
- Anthropic, Mistral, TeslaAI से संपर्क देर से आया, इसलिए process पूरा नहीं हुआ
- ReflectionAI एकमात्र RS भूमिका थी जहाँ अस्वीकृति मिली; इसके बदले Engineering track पर जाने का सुझाव मिला
- SpaceXAI, Waymo, Wayve से इंटरव्यू निमंत्रण नहीं मिला
- Waymo में PhD के पूरे दौरान हर 6 महीने में आवेदन किया, लेकिन एक बार भी जवाब नहीं मिला
इंटरव्यू कैसे हासिल करें
- इंटरव्यू पाने का सबसे बड़ा lever है ज़्यादा papers, trendy topics, और बेहतर internships
- PhD के दौरान ICLR / NeurIPS / ICML में प्रकाशित 4 first-author (या co-first-author) papers थे (LLM, RL, Meta-Learning, Evolution Strategies)
- Apple internship और Meta software engineer अनुभव भी था
- मोटा मानदंड: 3 या उससे अधिक first-author papers + कम-से-कम 1 internship या industry experience हो तो top labs से लगातार callback मिल सकते हैं
- अगर आपको पहले से इंटरव्यू मिल रहे हैं, तो अतिरिक्त papers ज़्यादा मदद नहीं करेंगे → research नहीं, इंटरव्यू तैयारी पर फोकस करें; कभी पूरी तरह तैयार महसूस नहीं होगा, इसलिए अभी शुरू करें
Cover letter, referrals, cold emails, LinkedIn/X
- LinkedIn / X: कई कंपनियाँ यहाँ job postings डालती हैं, और internships के लिए कभी-कभी यही एकमात्र आवेदन मार्ग होता है
- posting से जुड़े Google form को भरना जरूरी होता है, तभी उसे वास्तविक आवेदन माना जाता है
- Referrals: हों तो अच्छा है, पर अनिवार्य नहीं
- DeepMind में referral वाले और बिना referral वाले दोनों roles के लिए इंटरव्यू निमंत्रण मिला
- Cold emails: recruiter या team members को सीधे email भेजना अक्सर स्वागतयोग्य होता है
- सिर्फ CV दोहराने के बजाय यह बताना चाहिए कि आप उस team के लिए क्यों उपयुक्त हैं और उसमें आपकी रुचि क्यों है
- Cover letters: कम ही मांगे जाते हैं, लेकिन मांगे जाएँ तो ठीक से लिखें
- Claude / Gemini / ChatGPT से पूरा का पूरा लिखवाने की गलती न करें, पहले खुद लिखें और उन्हें सिर्फ polish करने के लिए इस्तेमाल करें
Startup vs big tech
- startup ढूँढना ज्यादा मुश्किल है, क्योंकि कोई केंद्रीकृत खोज स्थान नहीं होता → सहकर्मियों·दोस्तों·पूर्व सहकर्मियों के माध्यम से मिलने वाली जानकारी सबसे अच्छा तरीका है, और इसी वजह से प्रतिस्पर्धा भी कुछ कम होती है
- startup के इंटरव्यू processes में काफी variation होता है, जबकि big tech अपेक्षाकृत अधिक predictable होता है
- अगर process बहुत आसान लगे, तो यह वास्तविक काम की जटिलता के बारे में एक संकेत हो सकता है
- काम की प्रकृति दोनों दिशाओं में जा सकती है — सही startup में अधिक रोचक और impact वाला research संभव है, लेकिन साथ ही ज्यादा दबाव, infra work, और research direction में बार-बार बदलाव भी हो सकता है
- इंटरव्यू में पूछें कि research priorities कौन तय करता है, monetization path क्या है, और competitors कौन हैं
- growth opportunities: startup में तेज़ी से growth, अधिक responsibility, और काम की दिशा तय करने का मौका मिलता है; big tech में आप कई लोगों में से एक हो सकते हैं
- CV recognition: OpenAI या Anthropic तुरंत पहचाने जाते हैं, लेकिन किसी अनजान stealth startup को समझाना पड़ सकता है
- job stability: big tech भी बार-बार बड़े layoffs कर चुका है, इसलिए कोई भी पक्ष 100% सुरक्षित नहीं है
Compensation: RSU vs Stock Option (UK के संदर्भ में)
- RSU (आमतौर पर big tech में): vesting schedule के अनुसार वास्तविक shares मिलते हैं, और vesting के समय लगभग आधे shares income tax चुकाने के लिए तुरंत बेच दिए जाते हैं — RSU पर income की तरह tax लगता है
- Stock option (आमतौर पर startup में): shares नहीं मिलते, बल्कि तय कीमत X पर खरीदने का अधिकार मिलता है
- अगर market price Y > X हो, तो X पर खरीदकर Y पर बेचने से लाभ होता है; Y < X हो, तो option बेकार हो जाता है
- Stock option अक्सर नौकरी छोड़ने के 90 दिन बाद expire हो जाते हैं, और अगर कंपनी unlisted है तो खरीदने के बाद भी बेचना संभव नहीं होता
- UK में option exercise करते ही, एक पैसा हाथ में आए बिना भी Y−X के लाभ पर income tax लग सकता है
- unlisted company में 2 साल काम करने के बाद नौकरी छोड़कर exercise करने पर, (X × options की संख्या) खरीद लागत + (Y−X) × options की संख्या × tax rate के बराबर income tax, किसी वास्तविक payout से पहले भरना पड़ सकता है
- ज़्यादातर कंपनियाँ cashless exercise option देती हैं, और कई अपनी shares buyback (liquidity event) भी कराती हैं
- लेकिन हर funding round में dilution होता है, अतिरिक्त लाभ पर लगभग 20% capital gains tax लगता है, और liquidity event का valuation आम तौर पर आधिकारिक company valuation से कम होता है
- सार: अगर recruiter startup equity शामिल करके total compensation का बड़ा नंबर बताए, तो विनम्रता से मुस्कुराइए, लेकिन उसे काफी discount के साथ ही मानिए
इंटरव्यू संरचना
- ज़्यादातर कंपनियाँ मिलती-जुलती संरचना अपनाती हैं, लेकिन हर चरण का महत्व अलग हो सकता है
- Recruiter screen: आम तौर पर हल्की बातचीत, जिसमें यह देखा जाता है कि आपकी skills role से कितनी मेल खाती हैं और आप अपने papers को कितनी स्पष्टता से समझा सकते हैं
- Technical interviews: process का अधिकांश हिस्सा, और तैयारी के लिहाज़ से सबसे महत्वपूर्ण; कंपनी के अनुसार 3 से 8 rounds
- Coding: LeetCode शैली, आम तौर पर Medium या Hard
- ML coding/debugging: attention implement करना, backward pass लिखना, training loop bugs पकड़ना
- ML knowledge: fundamentals, theory, applied ML, systems design
- Behavioural interviews: पारंपरिक behavioural questions और research-oriented questions (रुचि के विषय, क्षेत्र का भविष्य) — technical interviews की तुलना में casual लग सकते हैं, लेकिन इन्हें हल्के में न लें
तकनीकी तैयारी
- यह सबसे महत्वपूर्ण हिस्सा है, इसे छोड़ें नहीं — बेहतरीन researchers भी तैयारी की कमी से बाहर हो चुके हैं; रोज़ ML पर काम करना और attention को शुरुआत से implement कर पाना, दोनों अलग बातें हैं; कम-से-कम एक महीना नियमित तैयारी के लिए रखें
- meta strategy: सामान्य तैयारी को न्यूनतम रखें और अगले specific इंटरव्यू·कंपनी के लिए targetted तैयारी करें, ताकि सामग्री दिमाग में ताज़ा रहे
- RS / Engineer इंटरव्यू में overfitting जैसे fundamentals से लेकर LeetCode, transformer implementation, और Griffin·TransformerXL·S4 जैसे modern architectures तक लगभग कुछ भी पूछा जा सकता है
Flashcards
- ML fundamentals, applied ML, और research discussion की तैयारी में उपयोगी; Anki की तुलना में physical flashcards अधिक प्रभावी लगे
- कार्ड्स खुद लिखना ही आधी पढ़ाई है, किसी और का deck डाउनलोड न करें
- review करते समय खुद से सवाल पूछकर गहराई से समझें; पढ़ते समय जो सवाल आपने खुद से पूछे, उनमें से कई वास्तविक इंटरव्यू में आए
LLM mock interviews (Claude / Gemini)
- हर इंटरव्यू से पहले role·interview·company description को LLM (मुख्यतः Claude) में paste करके mock interview कराया; practice questions और वास्तविक questions में अक्सर overlap मिला
- अगर difficulty level ठीक न लगे, तो नई chat में अपना level और background और स्पष्ट लिखें
- पढ़ाई के लिए Claude सबसे अच्छा लगा और उसका feedback भी अपेक्षाकृत निष्पक्ष था, जबकि Gemini कभी-कभी ज़रूरत से ज्यादा प्रशंसा करता था
LeetCode / NeetCode
- कम-से-कम Blind 75, और चाहें तो NeetCode 150; मुख्य फोकस Medium पर
- हर problem का optimal solution लक्ष्य रखें (TwoSum का O(N²) solution स्वीकार्य नहीं), Hard पर अधिक समय न लगाएँ
- DFS, BFS, Graphs, Backtracking, DP, Binary Search जैसे मूल patterns जल्दी implement कर पाना चाहिए; Medium प्रति 20 मिनट से कम का लक्ष्य रखें
- 15 मिनट से अधिक अटकें तो solution देख लें, mark करें और आगे बढ़ें
- depth से ज्यादा breadth महत्वपूर्ण है, कुल मिलाकर लगभग 150 Medium problems हल की गईं
Books
- Designing Machine Learning Systems (Chip Huyen): fundamentals और applied ML के कई सवाल कवर करती है
- The JAX Scaling Book: इंटरव्यू के बाद मिली, लेकिन बहुत अच्छी; पहले पता होती तो ज़रूर इस्तेमाल करता
- Reinforcement Learning (Sutton & Barto): सिर्फ RL beginners के लिए अनुशंसित, पहले से इस क्षेत्र में काम कर रहे लोगों के लिए शायद ज़्यादा
Courses
- Linear Algebra: Gilbert Strang की YouTube lectures, 2x speed पर एक दिन में पूरी की जा सकती हैं
- Diffusion / Flow Matching: MIT, Stanford दोनों की lectures अच्छी हैं, लेकिन गणित काफी भारी है; अगर आप इस क्षेत्र में researcher नहीं हैं, तो diffusion SDE·flow matching ODE जैसी मूल intuition और मुख्य अवधारणाएँ याद रखना पर्याप्त हो सकता है
ML coding और debugging
- यह वह क्षेत्र है जहाँ अच्छी सामग्री सबसे कम है और वास्तविक अनुभव सबसे अधिक मायने रखता है; debugging interviews की practice कठिन थी, क्योंकि LLM भरोसेमंद ढंग से यथार्थवादी buggy code नहीं बना पा रहे थे
- अपनी या सहकर्मियों की codebase reviews सबसे अच्छा अभ्यास है; DeepML और Tensor Puzzles भी मददगार हैं
- baseline goals
- transformer को end-to-end implement करना
- causal, cross, self attention implement करना
- flash attention implement करना
- attention backward pass implement करना
- MLP forward / backward pass implement करना
- PyTorch या JAX में SGD training loop implement करना
- अगर आप ऊपर की चीज़ें समय के दबाव में खुद implement कर सकते हैं, तो आपकी तैयारी अच्छी मानी जा सकती है
भावनात्मक तैयारी
- अगर आप भावनात्मक रूप से ठीक हैं, तो यह section छोड़ दें; अनावश्यक चिंता पैदा करना उद्देश्य नहीं है
- सबसे बड़ी समस्या नींद थी — इंटरव्यू से पिछली रात नींद नहीं आती थी, और हफ्ते में 10 इंटरव्यू होने पर यह गंभीर समस्या बन गई; खाना भी मुश्किल हो गया और मतली होने लगी
- नियमित exercise, एक consistent शाम की routine, और social isolation से बचना मददगार है
- इंटरव्यू से पहले दौड़ना nervous energy कम करने और दिमाग reset करने में मदद करता था
- pre-interview routine बनाए रखने से बहुत स्थिरता मिली — background में ताज़े फूल रखना, makeup या skincare करना, और वही सुकून देने वाला वीडियो देखना
- एक बिंदु के बाद anxiety, तैयारी से भी ज़्यादा बड़ी बाधा बन गई, और इंटरव्यू के दौरान दिमाग पूरी तरह blank हो जाता था
- अपने triggers, failure के साथ अपने संबंध, और self-worth के आधार पर शुरू करने से पहले विचार करना फायदेमंद हो सकता है
- मुख्य संदेश: एक इंसान के रूप में आपकी कीमत इन इंटरव्यू से तय नहीं होती, यह process मूल रूप से stochastic है; जो चीज़ आप अच्छी तरह जानते हैं, उसमें भी गलती हो सकती है, और यह ठीक है
- मददगार किताबें: The Now Habit, The Gifts of Imperfection, Mindset, The Tyranny of Merit
लॉजिस्टिक तैयारी
- दिन में सिर्फ एक इंटरव्यू: इंटरव्यू थका देने वाले होते हैं, इसलिए दिन के तीसरे इंटरव्यू तक प्रदर्शन स्वाभाविक रूप से गिरने लगता है; सुबह का इंटरव्यू होने पर बाकी समय अगले की तैयारी में लगाएँ
- कम रुचि वाली कंपनियों से शुरुआत करें: छोटे startup या कम पसंदीदा locations जैसी जगहों से process की समझ, confidence, और salary benchmark पहले से सेट हो जाते हैं
- timing पर ध्यान दें: हर कंपनी की गति अलग होती है, इसलिए कोशिश करें कि offers लगभग एक ही समय पर आएँ, ताकि वास्तविक leverage बन सके
- हर कंपनी को बताइए कि आप अन्य processes में भी हैं: timeline स्पष्ट होती है, process तेज़ होता है, और आप अधिक serious candidate माने जाते हैं
Negotiation
- सामान्य सलाह यह होती है कि competing offers छिपाए जाएँ, लेकिन कई कंपनियों ने बढ़ोतरी से पहले दूसरे offers का प्रमाण स्पष्ट रूप से मांगा, और एक ने तो screenshot की authenticity तक पूछी
- कंपनियाँ जिस candidate को चाहती हैं, उसके लिए numbers काफ़ी हिला सकती हैं, इसलिए पूछना हमेशा सार्थक है; अधिकांश negotiation के लिए तैयार थीं
- deadlines 1–2 हफ्तों से लेकर अस्पष्ट "reasonable period" तक अलग-अलग थीं, और extension देने में ज़्यादातर कंपनियाँ लचीली नहीं थीं
- recruiters candidate की preferences बहुत अच्छी तरह पढ़ लेते हैं; कंपनी का नाम कितनी बार लेते हैं, बोलने का tone कैसा है — ऐसे छोटे संकेत भी नोट किए जाते हैं
- कंपनियों के पास candidate choice का historical data होता है → केवल समान स्तर के competitors (जैसे OpenAI) के offers का वास्तविक वजन होता है; अवास्तविक तुलना काम नहीं करती
निर्णय लेने की प्रक्रिया
- शुरुआत में anxiety के कारण जल्दी मिले offer को तुरंत स्वीकार करने का प्रलोभन था, लेकिन अंततः instinct पर भरोसा करके बेहतर विकल्प खोजे गए
- offer चुनने के मानदंड व्यक्ति-व्यक्ति पर निर्भर करते हैं — location, compensation, reputation, काम का प्रकार आदि; team, culture, और compensation को समझते-समझते preference order बदल भी सकता है
- दोनों कंपनियों में लगभग हर व्यक्ति से बात की, लेकिन सभी ने स्वाभाविक रूप से अपनी ही कंपनी चुनने की बात कही, इसलिए बहुत मदद नहीं मिली → अंततः जो आपको अच्छी तरह जानते हों, उनके साथ चर्चा सबसे उपयोगी रही
अगर दोबारा करना हो तो क्या बदलूँगा
- spreadsheet बनाए रखता: सब कुछ दिमाग में संभालने की सीमा होती है; अगर कंपनियों·stages·deadlines·contacts को व्यवस्थित किया होता, तो जिन जगहों में रुचि थी वहाँ आवेदन छूटते नहीं
- सिर्फ तकनीकी नहीं, भावनात्मक तैयारी भी करता: इंटरव्यू ऐसे लगने लगते हैं जैसे वे researcher के रूप में क्षमता और PhD की कीमत पर अंतिम फैसला हों, जबकि यह तर्कहीन framing है; शुरू करने से पहले reflection या counselling मददगार होती
- जो कंपनियाँ जवाब नहीं दे रहीं, उनके साथ अधिक सक्रिय रहता: सिर्फ application पर निर्भर न रहकर सीधे cold email से रुचि जताना चाहिए था ताकि उनके radar पर आ सकूँ
तकनीकी विषयों की सूची
- इंटरव्यू शुरू होने से पहले बनाई गई अध्ययन-विषयों की सूची; पृष्ठभूमि के कारण LLM और RL पर सबसे अधिक सवाल आए, और लगभग हर पढ़ा हुआ विषय कम-से-कम एक बार पूछा गया
- Reinforcement Learning: Q-Learning / TD Learning, Bellman Equations, PPO, GRPO, GAE, DPO, Policy Gradient Theorem, On/Off-Policy, MuZero, Dreamer, AlphaGo, Soft Actor-Critic, MDP आदि
- LLMs: Flash Attention, LoRA, TransformerXL, Griffin, Perceiver, Scaling Laws, Mixture of Experts, RoPE, S4, Tokenisation, RLHF, Causal/Cross Attention आदि
- Generative Modelling: GANs, VAE और ELBO, Score Function, Diffusion Forward/Reverse Process (DDIM/DDPM), Diffusion SDE, Flow Matching ODE, Classifier Free Guidance
- Applied ML: Tensor Parallelism, FSDP, DDP, Pipeline Parallelism, Mixed precision training, Gradient checkpointing/accumulation/clipping, JAX·PyTorch·TensorFlow आदि
- General ML: Curse of dimensionality, CNN, RNN/LSTM, MLE vs MAP, Bias-Variance Tradeoff, Backprop, BatchNorm/LayerNorm/RMSNorm, Adam/AdamW, KL Divergence, Precision/Recall/F1/AUC-ROC आदि
- Linear Algebra: Positive Semi-Definite, Jacobian, Eigenvectors/Eigenvalues, Hessian, Null/Image space, Rank/Span, Determinant आदि
अभी कोई टिप्पणी नहीं है.