3 पॉइंट द्वारा GN⁺ 21 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • फ़्रीलांस अनुवाद दस्तावेज़ को AI में डालकर किया जाने वाला साधारण रूपांतरण नहीं है, बल्कि यह संदर्भ की समझ, localization, शब्दावली शोध और consistency की जाँच वाला पेशेवर काम है
  • ChatGPT अनूदित दस्तावेज़ आउटपुट कर सकता है, लेकिन formatting की समस्या आ सकती है और अनुवाद की गुणवत्ता भी संदिग्ध हो सकती है
  • AI का इस्तेमाल spelling जाँच, वाक्य सुधार सुझाव, style guide जाँच, और technical terms निकालने जैसे tool के रूप में किया जा सकता है, लेकिन हर परिणाम को फिर से जाँचना ज़रूरी है
  • AI संक्षेपाक्षर और संस्थाओं के नाम गढ़ सकता है, पूरे वाक्य छोड़ सकता है, दिए गए terms को नज़रअंदाज़ कर सकता है, और मुख्य बात चूक सकता है, इसलिए उसे लगातार coaching की ज़रूरत होती है
  • सिर्फ़ AI के मौजूद होने भर से अनुवादकों, लेखकों और संपादकों जैसे विशेषज्ञों की फ़ीस कम नहीं होनी चाहिए; यह उस विरोधाभास को दिखाता है जिसमें लोग AI को दूसरों के काम के लिए पर्याप्त मानते हैं, लेकिन अपने काम के लिए उसे अविश्वसनीय समझते हैं

जिम में शुरू हुआ एक सवाल

  • मैं हर मंगलवार शाम boxing और “body sculpt” क्लास लगातार लेता/लेती हूँ, लेकिन एक दिन शाम 4 बजे से अनुवाद के तीन काम आ गए और तीनों की deadline अगली सुबह थी, इसलिए दूसरी क्लास रद्द करनी पड़ी
  • जब किसी ने पूछा कि मैं क्लास क्यों छोड़ रहा/रही हूँ, तो मैंने बताया कि मैं फ़्रीलांस अनुवादक हूँ और अगली सुबह तक तीन deadlines हैं
  • सामने वाले ने पूछा, “क्या दस्तावेज़ ChatGPT पर अपलोड कर देना काफी नहीं है?”, और फिर जवाब में समझाना पड़ा कि अनुवाद का काम ऐसे नहीं चलता

अनुवाद सिर्फ़ व्याकरणिक रूप से सही वाक्य बनाने का काम नहीं है

  • ChatGPT तकनीकी रूप से अनूदित दस्तावेज़ निकाल सकता है, लेकिन सबसे पहले formatting की समस्या पैदा हो सकती है
  • उससे भी बड़ी समस्या यह है कि अनुवाद की गुणवत्ता संदिग्ध हो सकती है
  • अनुवाद वह काम है जिसमें एक इंसान जो कहना चाहता है उसे दूसरे इंसान तक समझ में आने लायक पहुँचाया जाता है; यह सिर्फ़ दूसरी भाषा में व्याकरणिक रूप से सही वाक्य बनाने तक सीमित नहीं है
  • अनुवादक मूल संदेश को स्वाभाविक और अर्थपूर्ण ढंग से पहुँचाने के लिए अनुकूलन, localization और अभिव्यक्ति का चयन करता है
  • technical terms पर शोध करना और पूरे दस्तावेज़ में शब्दावली की consistency बनाए रखना भी अनुवादक के काम का हिस्सा है

AI विकल्प नहीं, एक tool है

  • AI काम की जगह नहीं ले सकता, लेकिन सही तरह से इस्तेमाल किया जाए तो उपयोगी tool बन सकता है
  • 15 साल पहले जब मैंने अनुवाद शुरू किया था, तब भी मैं कठिन वाक्यों को Google Translate में डालकर अलग अभिव्यक्तियों के तरीके देखता/देखती था/थी, और बाद में DeepL का भी इसी तरह इस्तेमाल किया
  • विशेषज्ञ tools का इस्तेमाल करते हैं; यह उसी तरह है जैसे कोई accountant Excel formulas इस्तेमाल करता है, कोई manager PowerPoint formatting का सहारा लेता है, या कोई restaurant चलाने वाला ट्रेंडिंग recipes खोजता है
  • यह दस्तावेज़ मैंने खुद लिखा है, लेकिन spelling check Antidote से किया जा सकता है और Claude से राय पूछकर उपयोगी सुझाव हों तो अपनाए जा सकते हैं
  • पैराग्राफ हटाने या वाक्य को अधिक स्पष्ट बनाने जैसे समझदार सुझाव स्वीकार किए जा सकते हैं, लेकिन अंतिम फ़ैसला इंसान ही करता है

वास्तविक उपयोग के उदाहरण और सीमाएँ

  • एक ग्राहक कंपनी के पास कई 500-पेज के style guides हैं, जिनमें उद्धरण formatting और footnotes डालने के तरीके तक तय हैं
  • यदि style guide को ChatGPT में देकर अंतिम जाँच के लिए इस्तेमाल किया जाए, तो वह कुछ हद तक नियम उल्लंघन चिन्हित कर सकता है
  • AI की मदद से reference documents से technical terms निकाले जा सकते हैं और अपना glossary बनाया जा सकता है; यह तरीका Ctrl+F से तेज़ और कम झुंझलाहट भरा है
  • AI के हर परिणाम को दो-तीन बार जाँचना पड़ता है; AI का इस्तेमाल कोई magic button नहीं, बल्कि काम करने का एक अलग तरीका है
  • AI संक्षेपाक्षर और संस्थाओं के नाम गढ़ देता है, पूरे वाक्य अनुवाद किए बिना छोड़ देता है, बार-बार न कहो तो दिए गए terms को नज़रअंदाज़ कर देता है, और कभी-कभी मुख्य बात पूरी तरह चूक जाता है

फ़ीस और विश्वसनीयता का विरोधाभास

  • सिर्फ़ AI के मौजूद होने से अनुवादकों, लेखकों, संपादकों और अन्य विशेषज्ञों की फ़ीस कम नहीं की जानी चाहिए
  • यह वैसा ही तर्क है जैसे हथौड़ा इस्तेमाल करने वाले छत मरम्मत करने वाले को सिर्फ़ इसलिए कम पैसे देना कि वह नंगे हाथों से काम नहीं कर रहा
  • सामने वाले ने कहा, “AI लगातार बेहतर हो रहा है,” लेकिन जब पूछा गया कि क्या वह अपने काम में AI का बहुत इस्तेमाल करता है, तो उसने जवाब दिया कि वह अभी इतना विश्वसनीय नहीं है कि उस पर भरोसा किया जा सके
  • उस व्यक्ति का पद Human Resources and Corporate Services के Director General का है, और वह इस समय Workforce Planning and Resources Management का कार्यवाहक पद भी संभाल रहा/रही है
  • जब AI को दूसरों के काम के लिए पर्याप्त, लेकिन अपने काम के लिए पर्याप्त विश्वसनीय नहीं माना जाता है, तब पेशेवर काम के मूल्य को आसानी से कम करके आँका जाता है

1 टिप्पणियां

 
Hacker News की राय
  • अंत में जो निष्कर्ष है, वह सच में बहुत असरदार है। लगता है ज़्यादातर लोग दो बातों से सहमत हैं: AI उन कामों में बड़ा वरदान है जो मैं नहीं कर सकता, क्योंकि अगर वह आपका domain नहीं है तो आउटपुट की कमियां पकड़ना मुश्किल होता है, और किसी इंसान को पैसे देकर इंतज़ार करने की ज़रूरत भी कम हो जाती है
    दूसरी तरफ, वे मानते हैं कि AI मुझे replace करने लायक अभी बहुत कमजोर है। उनकी skill level इतनी ऊंची है कि वह उस काम के 90% को, जिसके लिए उन्हें पैसे मिलते हैं, replace कर दे — इसकी संभावना लगभग सिर्फ सैद्धांतिक है; ज़्यादा से ज़्यादा वह एक tool है
    इसलिए मैं medical सवालों के लिए AI का इस्तेमाल करता हूं, और डॉक्टर software लिखने के लिए AI का इस्तेमाल करता है, फिर हम दोनों एक-दूसरे को मिलने वाली quality देखकर हल्का-सा मुस्कुरा लेते हैं

    • एक दिलचस्प तीसरी category भी उभर रही है। ये लोग quality की समस्या मानते तो हैं, लेकिन उन्हें लगता है कि आउटपुट पर और AI लगा देने से समस्या हल हो जाएगी
      जैसे बहुत सारे “agents” चलाकर उन्हें security lead या quality lead जैसी भूमिकाएं दे देना। असल में यह security review या quality check के लिए LLM sessions खोलने का एक बेवजह जटिल और unpredictable तरीका है
      कुछ लोग यह भी जानते हैं कि उनके app में bugs भरे पड़े हैं, लेकिन सोचते हैं कि जब-जब bug आएगा, AI से fix करा लेंगे। इन्होंने अभी तक कोई security breach या data loss bug नहीं झेला है, और Claude को बस center-aligned न होने वाले div को ठीक करने या कभी-कभार आने वाले error code संभालने वाली चीज़ की तरह देखते हैं
    • बहुत सही ढंग से कहा गया। हर कोई सोचता है कि AI उसका अपना काम नहीं कर सकता, इसलिए आखिरकार AI दूसरों का काम करता है
      अभी ठीक से formalize कैसे करूं, यह पता नहीं, लेकिन Peter Principle या Gell-Mann effect का कोई AI वाला corollary जरूर लगता है। शायद कुछ ऐसा: “AI उपयोगकर्ता की अक्षमता के स्तर तक उन्नत हो जाता है,” या “AI आउटपुट पर भरोसा, उसे verify करने की क्षमता के उल्टे अनुपात में होता है”
    • क्या सच में ज़्यादातर लोग अपने core high-level skills का इस्तेमाल 90% समय करते हैं? बाकी लोग इसे कैसे देखते हैं, जानने की उत्सुकता है
      मैं एक professor हूं, जिसे intellectually demanding काम करने वाला माना जाता है, और NLP/AI research करता हूं। मुझे नहीं लगता कि निकट भविष्य में AI मेरा core intellectual work replace कर देगा, लेकिन यह core work मेरे समय का 10% भी नहीं लेता
      ज़्यादातर समय bureaucratic reports लिखने, grant applications लिखने और polish करने, exams और assignments check करने, posters design करने, किसी खास साल का lecture schedule plan करने, slides के लिए figures बनाने, assignments और exams तैयार करने, और teaching coordination meetings attend करने में जाता है। ये सब automate हो सकते हैं, या होने चाहिए
      एक ही course को कई बार दोहराकर पढ़ाना भी वस्तुनिष्ठ रूप से automate किया जा सकता है। motivation से जुड़े human factors की वजह से हम इसे करते रहेंगे, लेकिन यह ज़रूरी नहीं कि इंसान द्वारा पढ़ाया गया lecture बौद्धिक रूप से बेहतर ही हो
    • यह एक सामान्य सिद्धांत जैसा लगता है। अगर AI मुझसे बेहतर करता है, तो मैं उसे इस्तेमाल करता हूं; नहीं तो नहीं
      जब भी state-of-the-art models बेहतर होते हैं, AI skeptics की एक नई लहर अचानक believers बन जाती है। वे कहते हैं, “पिछले साल AI coding नहीं कर पाता था, लेकिन अब मैं हर जगह इसका इस्तेमाल करता हूं!”
      दिलचस्प बात यह है कि इससे पता चलता है कि यह कहने वाले की coding ability, उस मोड़ पर Claude Opus 4.5 या जो भी उस समय state of the art था, उसके स्तर की थी
      बाकी लोग meanwhile लेख में मौजूद व्यक्ति की तरह AI को एक साधारण tool की तरह इस्तेमाल करते रहते हैं। सोचता हूं, computer मेरे मुकाबले programming में सचमुच बेहतर हो जाए तो मुझे बदलने में कितना समय लगेगा
    • क्या सिर्फ मैं ही ऐसा हूं जिसे लगता है कि AI वह काम, जो मुझे करना होता है, वास्तव में मुझसे कहीं बेहतर करता है? यह सिर्फ latest-generation models की वजह से नहीं है; मैं कुछ सालों से ऐसा महसूस कर रहा हूं
      इस समय मुझे एक भी ऐसा काम याद नहीं आता जिसमें मैं AI से ठीक से compete कर सकूं। पता नहीं मेरी skill कम है या बाकी लोग ज़रूरत से ज़्यादा आत्मविश्वासी हैं। हो सकता है मेरे जैसा महसूस करने वाले लोग बस खुलकर बोलते न हों
  • थोड़ा translation की बात पर जाऊं तो, मैंने The Master and Margarita को दो translations में पढ़ा है। पहला इतना उबाऊ था कि पहला chapter खत्म होने से पहले ही छोड़ना पड़ा, और translator का नाम भी नहीं मिला, लेकिन वह वही edition था जिसमें सारे Russian nicknames का अनुवाद कर दिया गया था
    उसमें बार-बार “homeless” नाम के आदमी की बात होती रही, तो मैंने सोचा किताब ही खराब है और कई साल तक उसे नज़रअंदाज़ किया
    मुझे समझ ही नहीं आया कि इस किताब को लेकर इतना उत्साह क्यों है
    फिर संयोग से Diana Burgin और Katherine Tiernan O'Connor का translation मिला, और मुझे Russian नहीं आती, लेकिन यह लगभग सर्वोत्तम के करीब लगा। यह सच में कमाल का काम था
    Yevgeny Zamyatin की We की machine translation में भी वही असर दिखता है। अगर सरकार को “United State” अनुवाद किया जाए, तो वह आसानी से “United States” से गड़बड़ा सकता है, लेकिन “One State” वाला अनुवाद कहीं बेहतर था

    • मुझे अभी भी साफ याद है कि 20s की शुरुआती उम्र में यह जानकर झटका लगा था कि Astérix comics मूल रूप से French में लिखी गई थीं और बाद में अनुवादित हुई थीं। druid के नामों को अंग्रेज़ी में Getafix जैसा बना देना — incroyable
  • यह सचमुच किसी इंसान द्वारा लिखा गया लेख है, लेकिन इसमें em dash भरे पड़े हैं। AI की वजह से नहीं, बल्कि इसलिए कि लेखक ने वाक्यों को स्वाभाविक ढंग से बहने देने के बजाय em dash का सहारा लिया है — यह सोचकर तो लगभग रोना आ जाए

    • पहला वाक्य: “In my Ottawa life, every Tuesday evening, I take two gym classes back to back—boxing and the pompously named “body sculpt,” which makes me discover muscles I didn’t know I had.”
      यहां em dash वास्तव में बोलचाल की rhythm से मेल खाता है। आप कहेंगे, “मैं हर मंगलवार दो classes back to back लेता हूं, boxing और ‘body sculpt’. नाम भी कितना अजीब है”
      वाक्य के flow का कुछ हिस्सा awkward है, लेकिन उसकी वजह em dash नहीं है। grammar purists कह सकते हैं कि बिना extra words जोड़े इसे अलग sentence नहीं बनाया जा सकता, और न जाने किन-किन वजहों से comma से भी नहीं जोड़ा जा सकता। इसलिए वहां em dash है
      sentence को rewrite करने से उसके ज़्यादा natural होने के बजाय कम natural होने की संभावना है
    • काश ज़्यादा लोगों ने कभी professional translators से, चाहे हल्के स्तर पर ही सही, सामना किया होता। वे मानवता का बहुत छोटा लेकिन गहराई से महत्वपूर्ण समूह हैं, और कम-से-कम हज़ारों साल से ऐसा ही है। आगे भी रहेगा
    • जब मैं sentence लिखता हूं, तो सबसे पहले यह देखता हूं कि क्या elements को rearrange करके em dash को हटाया जा सकता है
      अपडेट: अगर यह पर्याप्त स्पष्ट न हो, तो माफ कीजिए। मैं खुद को रोक नहीं पाया
    • em dash वास्तव में बहुत अच्छा होता है, खासकर अमेरिका के बाहर की non-technical writing में यह एक standard stylistic choice है
    • अंग्रेज़ी मेरी मातृभाषा नहीं है। और मुझे em dash पसंद है। अगर यही मेरा सबसे बड़ा पाप है, तो फिर जो है सो है
  • अगर 2024 में कोई कहता कि ChatGPT graduate-level गणित में मदद कर सकता है, तो उस पर हंसी उड़ती, लेकिन इस साल AI models एक साधारण prompt से पहले अनसुलझी Erdos problem हल कर रहे हैं
    यह कल्पना करना मूर्खतापूर्ण लगता है कि मानव बुद्धि और AI के बीच कोई बुनियादी दीवार है, जिसकी वजह से AI कभी भी इंसानों के किए जा सकने वाले कई काम नहीं कर पाएगा। जिन चीज़ों को हम उदाहरण के तौर पर गिनाते हैं—जैसे intention inference, भावनाओं को समझना, सांस्कृतिक मूल्यों को प्रतिबिंबित करना—उन्हें भी आज का AI पर्याप्त context दिए जाने पर कर सकता है
    और इससे भी महत्वपूर्ण बात यह है कि ऐसे काम इंसानी खोपड़ी के अंदर होने वाला कोई जादू नहीं, बल्कि information processing का परिणाम हैं। बस यह उस तरह की information processing है जिसमें कंप्यूटर को अच्छा बनाना कठिन था, और अभी तक तो AI लगातार बेहतर होता दिख रहा है
    मैं इस बात से पूरी तरह सहमत हूँ कि इंसानों का विशेष मूल्य उपयोगी काम करने की क्षमता से बंधा नहीं है। लेकिन AI models की क्षमताओं से इनकार करना बहुत लोगों की आम गलती लगता है, और दुर्भाग्य से हकीकत अक्सर उन्हें भावनात्मक रूप से तैयार होने से पहले ही पकड़ लेती है

  • यह ध्यान देने लायक है कि “पर्याप्त context दिए जाने पर” वाले वाक्य में context की जगह “dollars” भी रखा जा सकता है। लगता है, इन प्रभावशाली उपलब्धियों का बड़ा हिस्सा वहीं से आता है
    हमेशा की तरह, हाल की सारी breakthroughs “और ज्यादा सोचने” वाली श्रेणी की लगती हैं, इसलिए models बेहतर होते हुए भी सस्ते होंगे या नहीं, यह साफ नहीं है। अनुवाद के मामले में output की per-unit pricing expectation को देखते हुए, “और ज्यादा सोचने” वाला LLM मददगार होगा, इस पर काफी संदेह है

  • सहमत हूँ, लेकिन यह याद रखने लायक है कि brain, खासकर human brain, बेहद बड़ा है, और एक-एक token में एक-एक बहुत छोटे muscle twitch की तुलना में कहीं ज्यादा अर्थ समाया होता है
    इसलिए बेहद primitive “cognition” भी वास्तव में जितना है, उससे कहीं ज्यादा काम करता हुआ दिख सकता है

  • अगर “2024 में कोई कहता कि ChatGPT graduate-level गणित में मदद कर सकता है, तो उस पर हंसी उड़ती, लेकिन इस साल AI models एक साधारण prompt से पहले अनसुलझी Erdos problem हल कर रहे हैं,” तो मैं पूछना चाहता हूँ, क्या गणित में कोई graduate degree भी है?

  • सही है। मानो लोग सोचते हों कि AI हमेशा के लिए सिर्फ LLM तक ही सीमित रहेगा, और कभी ऐसा world model विकसित नहीं करेगा जिसमें current state evaluation, dynamic next-state prediction, causal reasoning, object permanence वगैरह शामिल हों
    मैं AI industry में नहीं हूँ, लेकिन साफ है कि इस दिशा में काफी research और काम चल रहा होगा

  • सच कहूँ तो Fable ने मुझे काफी डरा दिया। यह असली coding में नहीं, बल्कि किसी और पहलू में एक और बड़ी छलांग है
    मैं उस स्थिति में काफी सहज था जहाँ “implementation तुम करो, meta work और दिशा-समायोजन मैं करूँ,” लेकिन अब तो direction adjustment की भी जरूरत नहीं और meta work की भी नहीं। backlog यहाँ है, खत्म हो जाए तो बता देना, तब तक क्या मैं घास ही छूता फिरूँ जब तक review और polishing की जरूरत न पड़े? शायद कल तक?
    इससे मुझे 2023 के आसपास का वह समय याद आता है जब मैंने पहली बार coding agent को किसी issue को लड़खड़ाते हुए सुलझाते देखा था और सोचा था, “यह बड़ी बात है।” शुरुआती GPT ने जब वास्तव में किसी हद तक काम करने वाले jokes बनाने शुरू किए थे, तब भी ऐसा ही लगा था
    अगर क्लासिक “greentext बना दो” का modern version लिखें: मैं एक senior software engineer हूँ, मेरी जिम्मेदारी है कि tickets सच में implement हों, कभी-कभी IDE खोलकर खुद code भी लिखता हूँ, एक दिन IDE खोला तो ticket पहले ही बंद था, agent ने रात भर में निपटा दिया, direction adjustment भी नहीं, review notes भी नहीं, करने को कुछ नहीं, distress.jpg, manager से पूछा अब मुझे क्या करना चाहिए, उसने कहा “high-level architecture पर ध्यान दो,” मैंने पूछा “कौन-सा high-level architecture?”, उसने कहा “पता नहीं, तुम ही तो senior engineer हो,” rage.jpg, नौकरी छोड़ दी, prompt engineer बन गया, बस क्या बनाना है यह सरल तरीके से बताना होता है, पहले दिन prompt लिखने बैठा तो AI उसे पहले ही लिख चुकी थी

  • मुझे इसमें कोई संदेह नहीं कि लेखक AI से बेहतर अनुवाद करता है, लेकिन AI अनुवाद इतना अच्छा हो गया है कि पता नहीं अनुवाद का काम और कितना बचेगा, या अंततः यह review/editing-केंद्रित काम बन जाएगा
    उदाहरण के लिए, मैंने हाल ही में Lawrence Ellsworth का अनूदित The Three Musketeers बहुत आनंद लेकर पढ़ा। मैं फ़्रेंच बोल या पढ़ नहीं सकता, लेकिन मेरी समझ यह है कि Ellsworth का अनुवाद उस कृति के अधिक सटीक अनुवादों में से एक माना जाता है
    जिज्ञासा में मैंने फ़्रेंच मूल The Three Musketeers को Claude Fable में डाला और कहा कि इसे सटीक रूप से अनुवाद करो, मूल की चंचल tone बनाए रखो, और कुछ भी censor मत करो। मैंने पूरा नहीं पढ़ा, लेकिन कुछ अध्यायों की Ellsworth अनुवाद और Fable अनुवाद से तुलना की
    सच कहूँ तो, वे हैरान कर देने वाली हद तक समान थे। मेरी नज़र में Ellsworth अनुवाद और Fable अनुवाद के बीच व्यावहारिक रूप से कोई वास्तविक अंतर नहीं था। मुझे लगता है Ellsworth के वाक्य थोड़े बेहतर थे, लेकिन Fable की गद्य भी पूरी तरह पढ़ने लायक थी
    फिर से कहूँ, मैं फ़्रेंच नहीं जानता, इसलिए निश्चित नहीं हो सकता, लेकिन अगर मैंने Fable संस्करण पढ़ा होता तो शायद Ellsworth संस्करण से बहुत अलग अनुभव नहीं होता
    हालांकि, यह कुछ हद तक self-fulfilling भी हो सकता है। संभव है Fable ने Ellsworth अनुवाद पर training ली हो और इसलिए उसे बहुत सीधे तौर पर नकल किया हो। मुझे अंग्रेज़ी के अलावा दूसरी भाषाएँ नहीं आतीं, इसलिए इसमें एक जाल है। अनुवाद की accuracy की तुलना करने के लिए आपको दूसरे अनुवाद से तुलना करनी पड़ती है, लेकिन अगर दूसरा अनुवाद मौजूद है तो उसके परिणाम को प्रभावित करने की संभावना बहुत अधिक है, और अगर अनुवाद है ही नहीं तो review करने का तरीका नहीं है
    फिर भी, मैं sequels Ellsworth अनुवाद में ही पढ़ना जारी रखूँगा। वह मुझे अधिक authoritative लगता है, और उसके वाक्य भी थोड़े बेहतर लगते हैं

    • यह अच्छा test नहीं है। Claude के training data में लगभग निश्चित रूप से The Three Musketeers के कई अनुवाद शामिल होंगे
    • अगर आप कहते हैं कि “AI अनुवाद बहुत अच्छा हो गया है” और साथ में यह भी कहते हैं कि “मुझे अंग्रेज़ी के अलावा कोई भाषा नहीं आती,” तो आपके पास यह निर्णय देने की बिल्कुल योग्यता नहीं है
      ऊपर से आप खुद मान रहे हैं कि test इतना त्रुटिपूर्ण है कि लगभग बेकार है, और फिर भी quality पर बड़े-बड़े दावे कर रहे हैं
    • Ellsworth अनुवाद के corpus में होने की संभावना बहुत अधिक है। आप मूलतः Claude से उसे उगलने के लिए कह रहे थे
      LLMs ने प्रसिद्ध किताबें सब याद कर रखी हैं। सही तरह से prompt करें तो उन्हें लगभग शब्द-शब्द दोहरवाया जा सकता है
    • जो व्यक्ति अक्सर अनूदित रचनाएँ पढ़ता है और कभी-कभी machine translation भी पढ़ता है, उसके नज़रिए से machine translation बहुत खास नहीं है। जैसा कि आपने खुद माना, परिणाम बहुत biased था
      अनुवाद कठिन काम है। अगर आप किसी खास भाषा से आए अनुवाद अक्सर पढ़ते हैं, तो machine translation की एक अलग सी गंध होती है; उसे समझाना मुश्किल है, लेकिन वह होती ज़रूर है। अच्छा अनुवाद machine translation से कहीं ऊपर होता है
      हो सकता है नए LLMs में अनुवाद क्षमता बेहतर हो, लेकिन अभी कुल मिलाकर वे आम तौर पर कमजोर हैं। बहुत छोटे लेखों के लिए ठीक हो सकते हैं, लेकिन लंबे content के लिए बिल्कुल नहीं
    • मुख्य बात यह है कि पूरा अनुवाद ChatGPT के training set में था। recall machine learning में काफ़ी हद तक हल की जा चुकी समस्या है
      कल प्रकाशित हुई किसी फ़्रेंच novel का यह कितना अच्छा अनुवाद करेगा? न मूल novel और न उसका अनुवाद अभी training set में होगा, या शायद अनुवाद का अस्तित्व ही न हो
      इस सप्ताहांत मैंने ChatGPT से स्लोवेनियाई में लिखे एक पत्र का अनुवाद करने को कहा था। उसने कुल मिलाकर gist तो पकड़ ली, लेकिन nuance बहुत छूट गया। synonym चुनने से जो छोटे tonal संकेत बहुत-सी जानकारी देते हैं, वे पूरी तरह छूट गए
  • दिलचस्प दृष्टिकोण है। मेरी जानकारी में अनुवाद (a) AI की वजह से सबसे पहले काम खोने वाले पेशों में से एक है, और (b) LLM तथा AI-generated art को लेकर संशय रखने वाले लोग इसे अक्सर “acceptable” AI उदाहरण के रूप में पेश करते हैं

    • ऐसे लोगों में से एक होने के नाते, मुझे लगता है यहाँ nuance है। अपने लिए अनुवाद करने में AI शानदार है
      लेकिन जब आप दूसरों के लिए अनुवाद करते हैं, तो ज़्यादा सावधानी और मानवीय judgment की ज़रूरत होती है। खासकर उन मामलों में, जैसे user manual, जहाँ खराब wording की वजह से किसी को चोट लग सकती है
    • अनुवादकों के भी अलग-अलग प्रकार होते हैं। legal/business documents का अनुवाद, film/book/game translation से पूरी तरह अलग होता है
      कम-से-कम जब मूल अंग्रेज़ी में हो, तो मैं पूरे भरोसे से कह सकता हूँ कि LLM हमारे यहाँ पारंपरिक रूप से प्रकाशित होने वाले औसत उपन्यास अनुवाद से बेहतर करते हैं। जब भी subtitles वाली फ़िल्म देखता हूँ, साफ़ तौर पर गलत संवाद हमेशा दिखते हैं
    • LLMs आने से पहले भी, लगभग 10 साल पहले से अनुवादक DeepL जैसे machine translation tools की वजह से काम खोने लगे थे। काम के प्रस्ताव आते रहे, लेकिन भुगतान घटता गया, और उसी समय से केवल अनुवादक के रूप में जीविका चलाना कठिन होता गया
    • उदाहरण के लिए, किसी webpage को पढ़ने के लिए किया गया अनुवाद काफ़ी स्वीकार्य है, लेकिन पेशेवर रूप से प्रकाशित करने लायक नहीं
      यह वैसा ही है जैसे तेज़ी में भेजे गए text message या email में typo और grammar mistakes बहुत बड़ी बात नहीं होतीं, लेकिन advertising copy, résumé, या medicine label जैसी प्रकाशित चीज़ों में typo बहुत खराब लगते हैं
    • हर अनुवाद एक जैसा नहीं होता। literary translation अक्सर अपने-आप में एक कला-कृति होती है, और उसे automate करना वैसा है जैसे homework या gym में weight lifting को automate करना—यानी बात का मूल अर्थ ही खो देना
      मुझे नहीं पता वर्तमान state of the art कहाँ तक पहुँचा है, लेकिन toaster manual या सामान्य copy के अनुवाद के जल्द automate हो जाने की बात मुझे विश्वसनीय लगती है
  • मुझे अभी-अभी पता चला कि यहाँ मेरे लेख पर चर्चा हो रही है, तो स्वाभाविक है कि मुझे आना ही था
    आपने समय निकालकर लेख पढ़ा, तो मैं भी thread ठीक से पढ़ने की कोशिश करूँगा। मुझे पढ़ना सच में पसंद है, और यह जानने में दिलचस्पी है कि आप AI के बारे में क्या सोचते हैं
    लेख में जो anecdote है, वह वास्तविक है। मैंने सिर्फ़ job title बदला था
    AI के बारे में मैं “यह तो निश्चित ही मुझ पर असर नहीं डालेगा” से “AI बेवकूफ़ है” तक गया, फिर समझ आया कि असल में बेवकूफ़ मैं था और मुझे prompt लिखना नहीं आता था। अब मैं इसे अपने लिए उपयोगी कैसे बनाऊँ वाले चरण में हूँ
    फिर भी, मैं चाहता हूँ कि employer, client, और पूरी दुनिया यह समझे कि यह जादुई बटन नहीं है
    यह कितना unstable हो सकता है, यह पागल कर देने वाला है। हाँ, यह इस अर्थ में अनुवाद कर सकता है कि आपको मोटे तौर पर समझ आ जाए कि क्या कहा गया था। लेकिन इसका मतलब यह नहीं कि वह अच्छा अनुवाद है। ऐसे उदाहरण मैं लाखों दे सकता हूँ

    • अब तक आपकी राय में हुए बदलाव को देखते हुए, क्या आपको लगता है कि अगले साल तक आप “अरे, यह तो मुझ जितना अच्छा काम बहुत कम समय में कर रहा है?” वाले चरण तक पहुँच सकते हैं?
      pure coding में मेरे साथ ऐसा हुआ था। यह ऐसी चीज़ थी जिसे मैंने कभी संभव नहीं माना था
      हो सकता है यह instability सिर्फ़ शुरुआती दौर की अस्थायी समस्या हो
  • जिज्ञासा में, इस थ्रेड को देखने से कुछ मिनट पहले मैंने एक फ़्रेंच लेख, जो मैं पढ़ रहा था, ChatGPT में पेस्ट किया और उससे उसे अंग्रेज़ी में अनुवाद करने को कहा। कार्यात्मक रूप से यह निश्चित ही उपयोगी था, और जिस भाषा को मैं नहीं जानता, उस भाषा के लेखों का अनुवाद करने में इसे इस्तेमाल करने से मैं हिचकिचाऊँगा नहीं।
    लेकिन यह विशेषज्ञ स्तर का नहीं था। फ़्रेंच व्याकरण के कुछ हिस्सों का गलत अनुवाद हुआ था, और वाक्य भी दफ्तरनुमा थे। हर वाक्य को शब्दशः उठाने के बजाय उसे ऐसे बहने देने की कोई कोशिश नहीं थी जैसे लेख मूल रूप से अंग्रेज़ी में लिखा गया हो।
    अगर पूछें कि क्या मैं इस तरह लिखा लेख पढ़ूँगा, तो छोटा लेख पढ़ लूँगा। उपन्यास तो बिल्कुल नहीं।

    • समस्या यह है कि बहुत-सा पेशेवर काम ऐसे हालात में किया जाता है जहाँ ग्राहक गैर-पेशेवर काम से भी पूरी तरह संतुष्ट हो सकता है।
      कलात्मक अनुवाद के लिए हमेशा जगह रहेगी, लेकिन जल्दबाज़ी में किए जाने वाले अनुवाद के लिए भी जगह है।
  • मुझे नहीं लगता कि LLM उन भाषाओं के अनुवादकों की जगह ले पाएँगे जिन्हें कम उपयोगकर्ता बोलते हैं।
    मैं एक ऐसे व्यक्ति को जानता हूँ जो दो पूर्वी यूरोपीय भाषाओं के बीच अनुवाद करता है, और कुछ कामों में विशेषज्ञ शब्दकोश की ज़रूरत पड़ती है। ऐसे मामलों में LLM का इस्तेमाल बहुत अविश्वसनीय होगा, और शुरू से सही करने की तुलना में जाँचने और सुधारने में ज़्यादा मेहनत लगेगी।
    इसके अलावा, मुझे इस बात पर भी बहुत शक है कि अमेरिकी टेक कंपनियाँ ऐसी भाषा पर LLM को ट्रेन कर रही होंगी जिसे “सिर्फ” 60 लाख लोग बोलते हैं।
    मनोरंजन की तरफ़ जाएँ तो, जो लोग पूर्वी यूरोप में पायरेटेड फ़िल्मों के नाक-बंद, सपाट अनुवाद या machine-translated गेम्स देखते हुए बड़े हुए हैं, वे अच्छी तरह जानते हैं कि वे अनुभव को कितना कमज़ोर कर देते हैं। हाँ, यह कहा जा सकता है कि “AI इससे बेहतर कर सकता है”, लेकिन क्या वह निरंतरता बनाए रख पाएगा और सांस्कृतिक बारीकियाँ व मुहावरे आदि पकड़ पाएगा?

    • सिर्फ़ बोलचाल वाली भाषाओं में तो यह और भी सच होगा।
  • “जिम के कपड़े पहनने पर हम आम तौर पर सब एक जैसे दिखते हैं।”
    मुझे नहीं पता मेरा दिमाग़ लेखक से अलग तरह से काम करता है या नहीं, लेकिन इस वाक्य ने मुझे चौंका दिया। जिम के कपड़े मेरे लिए पहचान पर असर नहीं डालते। चेहरा, शरीर और हाव-भाव महत्वपूर्ण हैं, कपड़े मुश्किल से ध्यान में आते हैं। मुझे यह इतना अविश्वसनीय लगता है कि शक होता है।
    मानवीय नज़रिए से दुखद बात यह नहीं है कि आप किसी को पहचान नहीं पाते, बल्कि यह है कि शायद आप सोचते हैं कि उसकी कोई कीमत नहीं, क्योंकि आप उससे फिर कभी नहीं मिलेंगे। यह समुदाय के अभाव की स्थिति है। समुदाय और लोगों के बीच के पारस्परिक संबंध अब भी वे चीज़ें हैं जिन्हें हम महत्व देते हैं।

    • वह लेख मैंने लिखा था। मैं सचमुच एक इंसान हूँ।
      और जिन लोगों से मेरी बातचीत नहीं होती, उन्हें पहचानने में मैं वास्तव में बहुत खराब हूँ। ज़रा कल्पना कीजिए कि आईने के सामने काली leggings पहने 50 लोग खड़े हों।