9 पॉइंट द्वारा GN⁺ 2025-06-19 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • हाल में यह दावा कि AI प्रोग्रामर की नौकरियाँ ले लेगा और उसके जवाब में कई प्रतिवाद बढ़े हैं
  • Google Translate के विकास के उदाहरण के ज़रिए ऑटोमेशन टूल्स के वास्तविक प्रभाव और सीमाओं पर रोशनी डाली गई है
  • अनुवादकों और दुभाषियों की नौकरी की मांग उलटे बढ़ रही है
  • मशीन अनुवाद सांस्कृतिक संदर्भ, अस्पष्टता और सूक्ष्म बारीकियों को संभाल नहीं पाता
  • यह ज़ोर दिया गया है कि प्रोग्रामिंग में भी अनुवाद जैसे रचनात्मक और अमूर्तीकरण वाले काम की ज़रूरत होती है

Google Translate हमें vibecoding के बारे में क्या बताता है

हाल की AI और प्रोग्रामिंग नौकरियों पर बहस

  • हाल में large language model (LLM) प्रोग्रामरों की जगह ले लेंगे, ऐसी भविष्यवाणियाँ और इसके विरुद्ध तर्क दोनों साथ-साथ उभरे हैं
  • एक पक्ष का कहना है कि LLM से साधारण टूल बनाए जा सकते हैं, इसलिए सभी प्रोग्रामर जल्द ही बेरोज़गार हो जाएंगे
  • दूसरी ओर, कुछ आवाज़ें ऐसे टूल्स की उपयोगिता को पूरी तरह नकारती भी हैं
  • इन ध्रुवीकृत रायों के बीच, अधिक सूक्ष्म दृष्टिकोण की ज़रूरत पर ज़ोर दिया गया है

मशीन अनुवाद की प्रगति और उसका वास्तविक प्रभाव

  • Google Translate ने 2016 में neural machine translation (NMT) अपनाने के बाद बड़ी प्रगति की
  • बहुत से लोगों ने अनुमान लगाया कि AI translation technology मानव अनुवादकों और दुभाषियों की नौकरियाँ समाप्त कर देगी
  • लेकिन वास्तव में, ऐसा दावा करने वालों में से काफ़ी लोगों ने अनुवादक या दुभाषिया का काम कभी किया ही नहीं है
  • मशीन अनुवाद की उपयोगिता स्वीकार की जाती है, लेकिन “अब दुभाषियों की ज़रूरत नहीं रही” जैसी बातें असल अनुवाद कार्य के स्वभाव को गलत समझती हैं

मानव अनुवादक और मशीन अनुवाद के बीच अंतर

  • अनुवादक और दुभाषिए का वास्तविक काम सिर्फ़ शब्दों और व्याकरण को बदलना नहीं है, बल्कि संदर्भ समझना, अस्पष्टता दूर करना और सांस्कृतिक संवेदनशीलता पर केंद्रित होता है
  • उदाहरण के तौर पर, अंग्रेज़ी से मिलती-जुलती Norwegian जैसी भाषा में भी विनम्र अभिव्यक्ति जैसी सांस्कृतिक भिन्नताओं के कारण मशीन अनुवाद सूक्ष्म अर्थों को ठीक से नहीं पहुँचा पाता
    • Norwegian का “Jeg vil ha potetene(मुझे आलू दीजिए)” अगर अंग्रेज़ी में शाब्दिक रूप से अनुवाद किया जाए तो वह रूखा लग सकता है, जबकि वास्तविक बातचीत में संदर्भ के अनुसार भावानुवाद ज़रूरी होता है
    • Google Translate ऐसी सूक्ष्म बारीकियों को संभाल नहीं पाता
  • वास्तव में, रोज़मर्रा की बातचीत या औपचारिक परिस्थितियों में केवल मशीन अनुवाद पर निर्भर रहने से गलतफ़हमियाँ पैदा हो सकती हैं
  • Japanese जैसी भाषा, जिसकी व्याकरण और संदर्भ प्रणाली बहुत अलग है, उसमें मशीन अनुवाद अर्थ को गलत पहुँचा सकता है या व्याकरण की दृष्टि से गलत वाक्य बना सकता है

मशीन अनुवाद का वास्तविक उपयोग कैसे होता है

  • इसका मतलब यह नहीं कि Google Translate एक खराब टूल है
  • इस टूल के उपयोगी होने का एक उदाहरण यह है कि जो व्यक्ति पहले से भाषाई और सांस्कृतिक संदर्भ जानता है, वह अपनी अभिव्यक्ति को निखारने के लिए इसका सहारा ले सकता है
  • काम के उदाहरण के रूप में, “मुझे पहले से पता है कि मैं क्या कहना चाहता हूँ, लेकिन उसे थोड़ा और स्वाभाविक ढंग से कैसे कहा जाए, यह देखना है” जैसी स्थिति दी गई है
  • मानव अनुवादक भी AI को अपने workflow में शामिल करके इस्तेमाल करते हैं
  • मानव विशेषज्ञ की भूमिका है AI द्वारा दिए गए परिणाम का मूल्यांकन करना और उसे संदर्भ व उद्देश्य के अनुसार समायोजित करना

प्रोग्रामिंग और अनुवाद कार्य की समानताएँ

  • प्रोग्रामर भी मूल रूप से एक ‘अनुवादक’ की तरह काम करते हैं, जो अस्पष्ट और जटिल मानवीय आवश्यकताओं को कंप्यूटर द्वारा समझी जा सकने वाली एकदम सटीक भाषा में बदलते हैं
  • मनुष्यों की अस्पष्टता और सांस्कृतिक संदर्भ को कंप्यूटर की स्पष्ट भाषा में बदलने वाला रचनात्मक काम ही प्रोग्रामिंग है
  • प्रोग्रामिंग भाषाओं में अमूर्तीकरण का स्तर अधिक होने के कारण, मशीन अनुवाद की तुलना में प्रवेश बाधा ऊँची थी, लेकिन हाल के AI टूल्स के विकास से यह बाधा कम हो रही है
  • फिर भी AI अभी उस स्तर पर नहीं है कि वह संदर्भ और जटिलता को पूरी तरह समझकर मनुष्यों की जगह ले सके

भविष्य की दिशा

  • कभी न कभी AI संदर्भ और अस्पष्टता तक को संभाल सकेगा, लेकिन फिलहाल उसकी सीमाएँ स्पष्ट हैं और वहाँ तक पहुँचने में अभी समय लगेगा
  • AI टूल्स की प्रगति तेज़ है, लेकिन नैतिक मुद्दे और टूल्स का ज़िम्मेदाराना उपयोग अब भी महत्वपूर्ण विषय हैं

1 टिप्पणियां

 
GN⁺ 2025-06-19
Hacker News राय
  • इस बात से सहमति जताई गई कि अनुवादक और दुभाषिए का काम संदर्भ समझना, अस्पष्टता दूर करना और सांस्कृतिक संवेदनशीलता संभालना है, और यही वह क्षेत्र हैं जहाँ Google Translate अभी तक नहीं पहुँच पाया है। लेकिन अगर LLM को सही तरीके से prompt दिया जाए, तो वह इन क्षमताओं की काफी अच्छी नकल कर सकता है। जापानी-से-अंग्रेज़ी अनुवाद का अनुभव रखने वाले एक व्यक्ति ने ज़ोर देकर कहा कि LLM अनुवाद में कहीं अधिक सक्षम है। उन्होंने Claude Code के साथ कई LLM को मिलाकर एक अनुवाद प्रणाली खुद बनाई है, जो पहले उपयोगकर्ता से अनुवाद का उद्देश्य, सांस्कृतिक adaptation चाहिए या नहीं, annotations चाहिए या नहीं जैसे विकल्प पूछती है, फिर उसी के अनुसार तीन मॉडलों (OpenAI, Anthropic, Google) को prompt भेजती है, तीनों के अनुवादों को मिलाकर एक draft बनाती है, और उसके बाद कई rounds में उसे refine करती है। छोटे परीक्षणों में यह तरीका अलग-अलग मॉडलों से स्पष्ट रूप से बेहतर निकला, Google Translate से बहुत बेहतर था, और शीर्ष स्तर के पेशेवर अनुवादकों जैसी गुणवत्ता का परिणाम मिला। हालांकि, interpretation—खासकर आमने-सामने की दुभाषिया सेवा—एक अलग मामला है, और ऐसे सामान्य अनुवादों में जहाँ मानवीय अनुवादक की व्यक्तित्व और पहचान बहुत महत्वपूर्ण नहीं होती, वहाँ इंसानों के लिए प्रतिस्पर्धा करना धीरे-धीरे कठिन होता जा रहा है

    • अपने learning app nuenki.app में LLM अनुवाद पर गहन शोध कर रहे हैं। कई शीर्ष मॉडलों को चुनकर उनसे अलग-अलग अनुवाद करवाए जाते हैं, और अंत में एक मॉडल ‘judge’ की भूमिका निभाकर उन अनुवादों की तुलना करता है, उन्हें मिलाता है, और सबसे अच्छा अनुवाद चुनता है—इसके लिए एक open source tool बनाया गया है। इसे सीधे आजमा सकते हैं और शोध सामग्री यहाँ उपलब्ध है
    • कई मॉडलों को बार-बार टेक्स्ट भेजकर सुधार-समीक्षा-परिष्कार की प्रक्रिया वाला सिस्टम बनाने की बात सुनकर, वैश्विक बिजली खपत के लिए RIP जैसी प्रतिक्रिया दी गई
    • अनुवाद करते समय अतिरिक्त संदर्भ देना, follow-up सवाल पूछ पाने की संभावना, और टेक्स्ट के बारे में तर्क कर सकने की क्षमता कितनी महत्वपूर्ण है, यह जापान में सीधे अनुभव से महसूस हुआ। रोज़मर्रा में अक्सर यह सवाल उठता है कि किसी खास संदर्भ में जापानी अभिव्यक्ति का क्या मतलब है, या किसी खास माध्यम के लिए उसे कैसे व्यक्त करना चाहिए। लगता है कि इस तरह की बातचीत custom instructions के ज़रिए और अधिक automated हो सकती है
    • LLM अनुवाद की समस्या के रूप में यह बताया गया कि यदि अनुवादित विषय को policy violation माना जाए, तो संदर्भ कितना भी उपयुक्त हो, मॉडल अनुवाद से इनकार कर देता है। उदाहरण के लिए केवल धार्मिक सामग्री होने पर भी सीमाएँ लग जाती हैं
    • बहुत लंबे टेक्स्ट, जो सामान्य context window में फिट नहीं होते, उनके अनुवाद को कैसे संभालें—इस पर सवाल उठाया गया। अगर टेक्स्ट को कई हिस्सों में बाँटा जाए, तो हर हिस्से के साथ पहले के भाग का सार देना पड़ता है; लेकिन वह सार कितना विस्तृत होना चाहिए, यही दुविधा है
  • उदाहरण देकर कहा गया कि machine translation उपयोगी tool है, लेकिन यह पेशेवर लोगों को पूरी तरह replace नहीं कर सकता। AI coding assistants के साथ भी शायद यही होगा, और इसके लिए भी एक और बड़ा technological leap चाहिए होगा, तभी यह चिंता वास्तविक बनेगी कि मौजूदा विशेषज्ञ पूरी तरह गायब हो जाएँगे। वर्षों तक यह भविष्यवाणी की जाती रही कि radiology AI इंसानों को पूरी तरह replace कर देगा, लेकिन वास्तव में imaging diagnosis की माँग उलटे बढ़ी है, और AI efficiency की वजह से कभी भी कम लोगों की ज़रूरत नहीं पड़ी। बल्कि radiologists की कमी और गंभीर हुई है

    • 15 साल पहले जब उन्होंने जापानी सीखना शुरू किया था, तब Google Translate बुनियादी वाक्य भी ठीक से अनुवाद नहीं कर पाता था, लेकिन आज यह उनके लिखे जटिल वाक्यों का भी native speaker के काफ़ी करीब परिणाम देता है। Native speakers के साथ जाँचने पर प्रतिक्रिया मिली कि यह ‘अपूर्ण है, लेकिन बहुत शानदार है और अर्थ स्पष्ट है’। आजकल कानूनी contracts जैसे बहुत संवेदनशील दस्तावेज़ों को छोड़ दें, तो पेशेवर अनुवादकों का भविष्य ईमानदारी से अंधकारमय लगता है
    • radiology AI पर NYT लेख का उदाहरण दिया गया। अभी भी अधिकांश सिस्टम 2010 के दशक के मध्य से पहले आए छोटे CNN (convolutional neural network) का उपयोग करते हैं, और आम लोग ‘AI’ = ChatGPT समझते हैं, जबकि पीछे की वास्तविक architecture बहुत पुरानी है। Transformer जैसे आधुनिक AI radiology में लागू होने पर कितनी प्रगति होगी यह स्पष्ट नहीं, लेकिन performance improvement की संभावना लगभग निश्चित मानी गई
  • अनुवाद का काम कल्पना और वास्तविकता में कितना अलग होता है, यह Pixar फ़िल्मों के ‘localization’ उदाहरण से याद आया। जैसे जापानी संस्करण में वह dining scene, जहाँ पश्चिमी बच्चे broccoli से नफ़रत करते हैं, उसे बदलकर वह चीज़ दिखाया गया जिसे जापानी बच्चे नापसंद करते हैं—green beans

    • green bean localization का उदाहरण सच है या नहीं, इस पर जिज्ञासा जताई गई। विदेशी फ़िल्मों के ज़रिए दूसरी संस्कृतियों से परिचित होना और अंतर सीखना अच्छी बात है, इसलिए localization करके उस अंतर को मिटा देना थोड़ा अफ़सोसनाक लगा
    • Pokémon में ‘Brock’s jelly filled donuts’ meme (असल में ‘onigiri’ था, लेकिन अमेरिकी संस्करण में उसे donuts कहा गया) संबंधित लिंक
  • लेख की कई बातों से सहमति जताते हुए एक कमी की ओर इशारा किया गया। उदाहरण के लिए, “Google Translate के बिना भी जापानी सीखने या अनुवादक रखने वाले लोग बहुत कम होते” इस तर्क को अगर software development पर लागू करें, तो संभव है कि ‘AI से बने low-quality apps’ के अधिकतर उपयोगकर्ता वे लोग हों जिन्हें मूलतः software development में रुचि ही नहीं थी। इस कारण यह ज़रूरी नहीं कि software developers की नौकरियाँ बहुत कम हो जाएँ। लेकिन software development में business opportunities के scale, cost जैसी बुनियादी विशेषताएँ अलग हैं, इसलिए AI वास्तव में मौजूदा developer jobs की demand को प्रभावित कर सकता है

    • इसके उलट यह भी लगा कि AI का प्रसार नई नौकरियाँ बढ़ा सकता है। अगर users खुद software बना पाएँगे, तो भी ऐसे बहुत से मौके आते रहेंगे जहाँ विशेषज्ञों को उस code और system को polish करना, extend करना, और security मज़बूत करनी होगी—इसे ‘elephant parade’ जैसी उपमा से समझाया गया
    • Google Translate भी शुरुआती लोगों के लिए बहुत उपयोगी है, लेकिन यह पेशेवर अनुवादकों के स्तर को replace नहीं कर सकता। जापानी में शुरुआती स्तर होने के बावजूद कई बार यह समझ में आया कि स्थानीय संदर्भ समझे बिना असली अर्थ सामने नहीं आता। पिछले 15 सालों में बड़े सुधार की बजाय बस speed बढ़ी है, ऐसा महसूस हुआ। image OCR real-time translation फीचर खुद का विकास नहीं बल्कि किसी खरीदे गए app (Magic Lens?) से आया था। LLM-आधारित automated coding भी शायद 10 साल तक काफी ठीक-ठाक रहेगी, लेकिन हमेशा थोड़ी कमतर बनी रह सकती है
    • मौजूदा coders के लिए AI से खतरा महसूस करने का सबसे तर्कसंगत कारण यह है कि AI की वजह से productivity में भारी वृद्धि सीधे jobs में कमी से जुड़ सकती है। code लिखना अपने आप में लक्ष्य नहीं है; लक्ष्य ‘काम करने वाला तैयार product’ है। इसलिए quality थोड़ी कम भी हो, तो भी लोगों की ज़रूरत घटती है—यही मूलभूत अंतर है
    • यह राय भी आई कि AI art और AI code generation मूल रूप से अलग चीज़ें हैं। कला का उद्देश्य कला स्वयं है, और उसमें सांस्कृतिक परंपरा तथा artist का अस्तित्व केंद्रीय है; लेकिन software development में code स्वयं लक्ष्य नहीं, बल्कि चाहा गया परिणाम—यानी app—लक्ष्य है। इस अर्थ में इंसानों की आवश्यकता ही घट सकती है। इसे photography आने के बाद painters की भूमिका में बदलाव और elevator operator के button से replace हो जाने के फर्क से तुलना की गई
    • AI website generators के विज्ञापनों जैसे ‘AI’ marketing को लेकर संदेहपूर्ण नज़रिया व्यक्त किया गया
  • आँकड़ों का औपचारिक आधार तो नहीं है, लेकिन आसपास के translator दोस्तों को सचमुच लग रहा है कि काम लगभग गायब हो रहा है, और LLM आने के बाद यह स्थिति अचानक तेज़ हुई है। translators से जुड़े forums, Facebook groups, और यह Reddit thread—सब जगह निराशावादी प्रतिक्रियाएँ भरी पड़ी हैं। अब भी विशेषज्ञों के अनुवाद बहुत बेहतर होते हैं, लेकिन कुछ संवेदनशील कामों को छोड़कर बाज़ार का बड़ा हिस्सा लगभग खत्म हो चुका है। अपने बच्चों को translator का career सुझाना मुश्किल लग रहा है

    • पेशेवर translation teams में भी LLM की वजह से एक व्यक्ति कई लोगों का काम संभाल पा रहा है, और quality improvement पुराने machine translation से तुलना के बाहर है। केवल एक reviewer हो तो LLM द्वारा किए गए अनुवाद को tone और dialect के अनुसार fine-tune किया जा सकता है, और मॉडल पहले से ही यह काफी अच्छे स्तर पर कर रहा है
  • यह भी बताया गया कि अनुवाद का काम—चाहे इंसान करे या मशीन—ऐसा है जिसमें अपने आप यह सत्यापित करना कठिन होता है कि परिणाम सही है या नहीं। अंततः या तो अनुवाद को बिना शर्त भरोसे से स्वीकार करना पड़ता है, या फिर यह तय करना पड़ता है कि इंसान और मशीन में किस पर अधिक भरोसा करें; आम तौर पर लोग इंसान पर ज़्यादा भरोसा करते हैं। लेकिन कभी-कभी ऐसा अनुभव भी हुआ कि अनुवादक ने बहुत सतही अनुवाद कर दिया और किसी दूसरे ने आकर बताया। यही बात vibe coding पर भी लागू होती है: उपयोगकर्ता के लिए यह तय करना कठिन है कि परिणाम सही है या नहीं, इसलिए अंततः सत्यापित की जा सकने वाली विशेषज्ञता की ज़रूरत पड़ती है

    • मशीन पर कम भरोसा होने का कारण उलटे उसकी accuracy के बारे में पर्याप्त समझ का न होना भी है। जैसे multiplication जैसी स्पष्ट गणना में हम गणितज्ञ से ज़्यादा calculator पर भरोसा करते हैं—कुछ वैसी ही मनोवृत्ति
    • machine translation के परिणाम को जाँचने के लिए ‘round-trip translation (A->B->A)’ आज़माया जा सकता है; यह perfect नहीं है, लेकिन विश्वास का स्तर काफ़ी बढ़ा सकता है
    • यह भी कहा गया कि अनुवादित परिणाम को वास्तव में लागू करके—code हो तो चलाकर, अनुवाद हो तो संदर्भ में रखकर—एक स्तर तक accuracy का अंदाज़ लगाया जा सकता है
  • यह राय उद्धृत की गई कि भविष्य का AI संदर्भ और अस्पष्टता को इंसानों की तरह संभालने में असमर्थ नहीं होगा, लेकिन फिर भी देर रात 2 बजे service outage संभालने का अनुभव रखने वाले veteran developer की परिपक्वता को replace करना कठिन है। vibe coder अच्छा माहौल बना सकता है, पर अंततः वह बड़े legacy codebase का व्यापक refactoring अकेले नहीं कर पाएगा—इस बात पर ज़ोर दिया गया

  • अनुवादक वास्तव में जो काम करते हैं, उसमें ‘idioms का अनुवाद’, ‘सांस्कृतिक references (कला, इतिहास, भोजन आदि) की व्याख्या’, ‘हर देश के सांस्कृतिक मूल्यों (स्वतंत्रता, जुनून, resilience आदि) को संदर्भानुसार समझकर ढालना’, ‘dubbing में अभिनेता के होंठों के अनुरूप tone सेट करना’, और ‘सुंदर गद्य (Artful prose) रचना’ जैसी कई मानवीय सूक्ष्मताएँ शामिल हैं। माना गया कि LLM के लिए इन क्षेत्रों में सीधे चुनौती देना कठिन है

  • Google Translate की सीमाओं और गुणवत्ता में गिरावट पर प्रतिक्रिया आई, खासकर यह कि Chrome translation feature कभी-कभी Traditional Chinese को Japanese समझ लेता है, और यह त्रुटि गंभीर है। पहले यह अच्छा काम करता था, लेकिन हाल में बिना किसी स्पष्ट बदलाव के उलटे पीछे चला गया है, जिससे असंतोष है। सबसे निराशाजनक बात यह है कि उपयोगकर्ता को इस गलती को सीधे सुधारने का कोई तरीका भी नहीं दिया जाता

    • एक राय यह थी कि यह Google Translate की मूल समस्या नहीं, बल्कि Chrome में translation से पहले language detection के लिए इस्तेमाल होने वाले local model की समस्या है। उस local model CLD3 के बारे में जानकारी साझा की गई
    • यह तर्क दिया गया कि Unicode में अलग-अलग भाषाओं के characters को और स्पष्ट रूप से अलग प्रबंधित किया जाना चाहिए। मौजूदा संरचना में LLM जब Chinese और Japanese को साथ सीखते हैं, तो शायद भ्रमित हो जाते हैं। grammar structures भी एक-दूसरे से उलटी हैं, और modifier relationships भी अलग हैं, इसलिए भ्रम होना स्वाभाविक है
    • अंततः यह अनुमान लगाया गया कि जैसे ही तेज़, सस्ता और पर्याप्त गुणवत्ता वाला LLM आ जाएगा, Google Translate का मौजूदा engine बदल दिया जाएगा। शायद पिछले एक साल में translation engine पर एक घंटे का काम भी नहीं किया गया होगा
  • machine translation की विफलता से जुड़ा एक अनुभव भी साझा किया गया। OSNews का मज़ेदार translation accident case