AI इंजीनियर ने दावा किया कि उसने Linear A को डिकोड कर लिया है
(aiclambake.com)- कांस्य युग की मिनोअन लिपि Linear A 100 साल से अधिक समय से अबूझ बनी हुई है, और अगर Tom Di Mino का डिकोडिंग प्रस्ताव सही निकलता है, तो यह भाषाविज्ञान के लिए एक बड़ी घटना हो सकती है
- Di Mino, Linear A को बाइबिलीय हिब्रू से पहले की भाषा के करीब एक लुप्त सेमिटिक भाषा मानते हैं, और Rutgers व Cambridge के भाषाविज्ञान विशेषज्ञ इसकी समीक्षा कर रहे हैं
- डिकोडिंग की कठिनाई कम सामग्री, इन्वेंटरी-लिस्ट केंद्रित अभिलेखों, और Linear B में न मिलने वाले 13 अतिरिक्त चिह्नों की वजह से बढ़ी; पहले के सेमिटिक सिद्धांत भी व्यापक रूप से स्वीकार नहीं किए गए थे
- मुख्य सुराग 22 मई 2026 को Linear A प्रार्थना-सूत्र से मिला, जहाँ Di Mino ने विशेष चिह्न
*301कोnaपढ़ते हुए N-W-Y मूल और “निवास करना” अर्थ के बीच संबंध जोड़ा - Claude Code से GORILA और SigLA आधारित corpus को query और cross-reference करने के बाद, Di Mino ने 40 चिह्नों की reading, 408 शब्दों के अंग्रेज़ी अनुवाद, और 9 पन्नों का शोध-पत्र मसौदा तैयार किया
Linear A डिकोडिंग प्रस्ताव की वर्तमान स्थिति
- Tom Di Mino Hudson Valley में रहने वाले स्वशिक्षित AI इंजीनियर और शौकिया भाषाविज्ञानी हैं, जो दावा करते हैं कि उन्होंने कांस्य युग की मिनोअन लिपि Linear A को डिकोड कर लिया है
- इस प्रस्ताव की फिलहाल Rutgers और Cambridge के भाषाविज्ञान विशेषज्ञ समीक्षा कर रहे हैं
- Di Mino ने 18 साल की उम्र से शास्त्रीय इतिहास, भाषाविज्ञान और भाषाओं का अध्ययन किया, 7 वर्षों तक Linear A का अध्ययन किया, और Crete की दो बार यात्रा की
- उनका कहना है कि उन्होंने जनवरी 2026 में Linear A डिकोडिंग पर काम शुरू किया और 22 मई को मुख्य अंतर्दृष्टि हासिल की
- अगर यह डिकोडिंग सत्यापित हो जाती है, तो यह भाषाविज्ञान के क्षेत्र में बड़ी घटना हो सकती है
- संबंधित मिनोअन लिपि Linear B 1952 में डिकोड की गई थी, और उस समय यह New York Times के पहले पन्ने पर छपी थी
Di Mino की भाषा-वंश संबंधी व्याख्या
- Di Mino, Linear A को लुप्त सेमिटिक भाषा परिवार का मानते हैं
- उनके अनुसार यह बाइबिलीय हिब्रू से पहले की भाषा है, जैसा संबंध Latin और Italian के बीच होता है
- Linear A के सेमिटिक सिद्धांत कोई नया दावा नहीं है
- Cyrus Gordon ने 1957 में Antiquity शोध-पत्र में इसी तरह की व्याख्या दी थी
- पहले के प्रयास Di Mino के समाधान की तरह अनुवाद तक नहीं पहुँच सके, और Gordon का काम भी अकादमिक जगत में व्यापक रूप से स्वीकार नहीं किया गया
जहाँ Linear A और Linear B अलग होते हैं
- Linear A लगभग 1800 ईसा पूर्व में उभरी और 1450 ईसा पूर्व तक इस्तेमाल हुई मिनोअन लिपि है
- 1450 ईसा पूर्व में Crete पर Mycenaean यूनानियों के कब्ज़े के बाद इसका उपयोग समाप्त हो गया
- Mycenaean यूनानियों ने कुछ मिनोअन चिह्नों को संशोधित कर अपनाया, और यही Mycenaean-Greek संस्करण Linear B कहलाया
- दोनों लिपियाँ tablets, घड़ों और उस समय की अन्य वस्तुओं पर मिली हैं
- इनकी मूल इकाई अक्षर नहीं बल्कि syllable है
- syllable आम तौर पर व्यंजन-स्वर जोड़े से बना होता है
- दोनों प्रणालियाँ 60 मूल syllabic चिह्न साझा करती हैं, और पूरे शब्द को दर्शाने वाले logogram भी साथ इस्तेमाल करती हैं
पहले डिकोडिंग क्यों अटकी रही
- Linear B को 1952 में ब्रिटिश वास्तुकार, क्रिप्टोग्राफर और शौकिया भाषाविज्ञानी Michael Ventris ने यूनानी भाषा के रूप में पहचानकर डिकोड किया
- Brooklyn College की प्रोफेसर Alice Kober का पूर्ववर्ती शोध Ventris की सफलता में सहायक रहा हो सकता है
- Kober और Ventris ने चिह्नों की स्थिति और बदलाव के पैटर्न खोजने के लिए व्याकरणिक और सांख्यिकीय विश्लेषण का उपयोग किया
- उन्होंने ऐसे पैटर्न देखे जैसे पहला syllable संभवतः स्वर हो सकता है
- Linear B के अभिलेख Linear A की तुलना में बहुत अधिक हैं, जिससे डिकोडिंग आसान हुई
- Linear A के काफ़ी अभिलेख वस्तु-लेनदेन दर्ज करने वाली इन्वेंटरी सूचियाँ हैं, इसलिए उनसे भाषा को समझने के सुराग कम मिलते हैं
- चूँकि दोनों लिपियाँ 60 चिह्न साझा करती हैं और Linear B पहले से डिकोड थी, विशेषज्ञ overlapping Linear A चिह्नों की ध्वनियाँ कुछ हद तक अनुमानित कर सके
- समस्या यह थी कि उन ध्वनियों का अर्थ क्या है, यह पता नहीं था
- Linear A में Linear B से अलग 13 अतिरिक्त चिह्न हैं, और इनके ध्वनि-मूल्य की कोई व्यापक रूप से स्वीकृत व्याख्या नहीं थी
22 मई का प्रार्थना-सूत्र सुराग
- Di Mino, 22 मई 2026 को एक क्रमिक Linear A प्रार्थना-अभिलेख का विश्लेषण कर रहे थे, जो एक निश्चित सूत्र का पालन करता था
- उस सूत्र में हर पंक्ति के सभी शब्द, Linear B syllables के साथ समानता के आधार पर ज्ञात थे, लेकिन पहला शब्द ही अनसुलझा था
- पहला शब्द एक ही क्रिया-मूल का रूप लगता था, जो द्वीप के पाँच पवित्र स्थलों में अलग-अलग स्थानीय रूपों में दिखाई देता था
- उस क्रिया में पाँच ज्ञात Linear B चिह्न और एक Linear A-विशिष्ट चिह्न
*301शामिल था- Di Mino ने
*301कोnaपढ़ा - इसके आधार पर उन्होंने
nawayaमूल की व्याख्या की और इसका अर्थ “निवास करना” माना - हिब्रू, Akkadian और अन्य सेमिटिक भाषाओं में 3-व्यंजन मूल संरचना होती है, और N-W-Y का उपयोग “निवास करना” या “रहना” अर्थ वाले क्रिया और संज्ञा रूपों में होता है
- Di Mino ने
- डिकोडिंग के बाद Di Mino ने इस प्रार्थना-सूत्र को बाद की हिब्रू प्रार्थनाओं से मिलता-जुलता माना, लेकिन इसका संबोधन देवी की ओर बताया
पुराने सेमिटिक सिद्धांतों से अलग क्या है
- Cyrus Gordon ने कभी Linear A अर्पण tablets और Akkadian व Phoenician की उन जैसी tablets, जिनका उन्होंने अनुवाद किया था, के बीच संबंध प्रस्तावित किया था
- Di Mino का दावा है कि Linear A अभिलेखों और हिब्रू प्रार्थनाओं के बीच संबंध पहचानने वाले वे पहले व्यक्ति हैं
- यह अंतर्दृष्टि सिर्फ प्रार्थना-अभिलेखों की क्रिया सुलझाने तक सीमित नहीं है, बल्कि Linear A में logogram के उपयोग को व्यापक रूप से समझने में भी मदद कर सकती है
- Di Mino का मानना है कि Linear A logogram पर उनकी व्याख्या, Linear B के कुछ अनुवाद संबंधी प्रश्न भी सुलझाती है, जिससे उनके परिणामों का सत्यापन होता है
AI tools से बना corpus कार्य और परिणाम
- Di Mino ने Claude Code की मदद से Python scripts का एक संग्रह बनाया
- ये scripts GORILA और SigLA डेटाबेस से लिए गए डिजिटल Linear A corpus को query, cross-reference और व्यवस्थित करती हैं
- इससे उस पैमाने पर व्यवस्थित hypothesis testing संभव हुई, जो हाथ से करना अव्यावहारिक था
- शोध के परिणामस्वरूप उन्होंने 40 लिपि-चिह्नों की reading प्रस्तावित की
- इनमें वे 13 चिह्न भी शामिल हैं, जिनके ध्वनि-मूल्य पहले ज्ञात नहीं थे
- उनका दावा है कि अब तक अज्ञात रहे Linear B के 5 चिह्नों के ध्वनि-मूल्य भी उन्होंने सुलझा लिए हैं
- उन्होंने 408 Linear A शब्दों के अंग्रेज़ी अनुवाद वाला एक शब्द-संग्रह तैयार किया
- उन्होंने Ya Diktu: Grammar of the Minoan Peak Sanctuary Libation Formula शीर्षक से 9 पन्नों का मसौदा भी लिखा
- यह मसौदा peer-reviewed journal में submission के लिए आधार बन सकता है
1 टिप्पणियां
Hacker News की राय
इस पहेली से मोहित एक शौकिया व्यक्ति के रूप में, इस दावे की विश्वसनीयता का आकलन करने में मददगार कुछ पृष्ठभूमि इस प्रकार है
लेखक ने अनुवाद की आधारशिला के रूप में जिस Libation Formula का उपयोग किया है, वह Linear A में सबसे अधिक अध्ययन किया गया वाक्यांश है, क्योंकि व्याकरणिक रूपांतरों सहित बार-बार दिखाई देने वाला यह लगभग एकमात्र सूत्र है
पूरा corpus बेहद खंडित है, लंबे पाठ भी बहुत कम हैं, और वे भी औसत अंग्रेज़ी वाक्य जितने ही लंबे हैं। अधिकांश सामग्री inventory, कर्मियों या अर्पण जैसी सूचियाँ हैं, और लंबे पाठों में शब्दों के बीच दिखने वाले punctuation चिह्न हैं, इसलिए वे काफ़ी vocabulary देते हैं, लेकिन वह किसी भी ज्ञात भाषा से मेल नहीं खाती
जब उपलब्ध सामग्री इतनी कम हो, तो a) जिन सभी पाठों को हम Linear A कहते हैं क्या वे सचमुच एक ही भाषा में हैं, और b) जो पहचाने जा सकने वाले शब्द दिखते हैं वे कहीं संक्षेप तो नहीं हैं — इस पर भी भरोसे से कहना मुश्किल है
लेखक ने यह मान लिया कि जिन Linear A चिह्नों के Linear B में समकक्ष अक्षर हैं, उनके ध्वनि-मूल्य भी समान होंगे। इसलिए वह उस अक्षर का उपयोग कर सकता है जो पहले से “NA” को दर्शाता था। “डुप्लिकेट” अक्षर केवल P-श्रृंखला में दिखते हैं, और अनुमान है कि वे ऐसी syllables को दर्शाते थे जो Linear A की भाषा में अलग थीं लेकिन Greek में नहीं, जैसे aspirated/unaspirated P। Linear B में “NWA” अक्षर है, और Linear A में भी इसके उदाहरण मिलते हैं
प्राचीन Greek में बहुत से ऐसे शब्द हैं जिनकी व्युत्पत्ति अज्ञात है, और माना जाता है कि वे उस substrate language से आए हैं जो उस क्षेत्र में तब बोली जाती थी जब Greek लोग अपने वर्तमान निवास-क्षेत्र में आए। Linear A की भाषा ऐसे substrate की एक मज़बूत उम्मीदवार हो सकती है। अगर Linear A कोई Semitic भाषा होती, तो Greek में बचे उसके रूपों से ही उन शब्दों की Semitic व्युत्पत्ति पहले से स्थापित हो जानी चाहिए थी। बेशक, वे शब्द किसी दूसरी ऐसी भाषा से भी आए हो सकते हैं जिसने लिपि नहीं अपनाई, या जिसकी लिपि हमारे पास नहीं पहुँची
मैंने Dr. Ester Salgarella से भी संपर्क किया है, इसलिए मैं corpus पर computational analysis लागू करने के प्रयासों और पहले के approaches कहाँ ग़लत हुए, इससे परिचित हूँ
अगर Crete की pre-Greek आबादी Semitic बोलती थी, तो विशेषकर स्थान-नामों में ऐसे उधार-शब्द कहीं अधिक संख्या में मिलने चाहिए थे
Greek, Linear B और Semitic को साथ देखें, तो संबंधित Cypriot syllabary का पाठ-भेदन Phoenician-Greek bilingual inscription की मदद से हुआ था: https://en.wikipedia.org/wiki/Idalion_bilingual
और Crete की तरह, उसी लिपि में लिखी गई लेकिन अब तक अपठित एक pre-Greek भाषा भी है: https://en.wikipedia.org/wiki/Eteocypriot_language
उस समय की बोलचाल की Greek ने लगभग निश्चित रूप से, Proto-Indo-European और बाद की Classical Greek की तरह, aspirated और unaspirated voiceless stops में भेद किया होगा; अगर Linear A की भाषा में भी ऐसा भेद था, तो Greek लोगों ने उसे Linear B में क्यों नहीं अपनाया? इसके बजाय यह मानना कहीं अधिक plausible लगता है कि Linear A की भाषा या लिपि में यह भेद था ही नहीं, और इसी कारण वह Linear B में भी नहीं दिखता
यह तथ्य कि प्रगति एक पहले से बहुत अधिक अध्ययन किए गए वाक्यांश पर हुई है, मुझे तो उलटे संदेह का कारण लगता है; आप इसे कैसे देखते हैं, यह जानने की जिज्ञासा है
ऐसे दावे करने वाले सनकी लोग बहुत होते हैं, लेकिन Tom का काम इतना भरोसेमंद है कि Rutgers और Cambridge के linguistics विशेषज्ञ इसे देख रहे हैं
अतिरिक्त सत्यापन के आधार के तौर पर, उसके approach ने परिणाम दिए हैं। उसने 300 से अधिक शब्दों का अनुवाद किया है, जो पहले कोई नहीं कर पाया था, और उसका समाधान वास्तव में Linear B की कुछ समस्याएँ भी सुलझाता है
Tom एक AI engineer है, और Claude Code इस काम का केंद्रीय हिस्सा था। हितों का खुलासा: मैं Tom को निजी तौर पर जानता हूँ, और लिंक किया गया लेख मैंने लिखा है
क्या इसका मतलब है कि इसे Rutgers और Cambridge के कुछ लोगों को email किया गया है, या यह किसी प्रकार की non-anonymous peer review से गुजर रहा है?
पहेली सुलझाने में Claude का उपयोग कैसे किया गया, इसके बारे में और सुनना चाहूँगा
निंदक नज़रिए से देखें, तो यह पूरी तरह पुष्टि से पहले कुछ ज़्यादा जल्दी घोषणा करके उनके श्रेय का थोड़ा हिस्सा छीनने जैसा भी लग सकता है
“Di Mino used Claude Code to build a suite of Python scripts that query, cross-reference, and organize the digitized Linear A corpus (drawn from the GORILA and SigLA databases), enabling systematic hypothesis testing at a scale that would have been impractical to do manually.”
अगर Claude का इस्तेमाल ऐसे project में हुआ है, तो मैं ठीक इसी तरह का उपयोग देखना चाहूँगा। समस्या को black box की तरह “solve” करने के लिए नहीं, बल्कि tools बनाने के लिए
Linear A को समझना मुश्किल होने का कारण यह है कि बचे हुए पूरे text में लगभग 7,500 अक्षर ही हैं, और वे भी करीब 1,500 अभिलेखों में बिखरे हुए हैं
अगर आपके पास 4K स्क्रीन हो, तो बचे हुए पूरे Linear A text को 14-point font में एक ही स्क्रीन पर दिखाया जा सकता है
एक और आम प्रकार छोटे मिट्टी के seals हैं जिन पर 1–2 अक्षर उकेरे गए हैं। दोनों ही मामलों में संभव है कि हम संक्षेपों से निपट रहे हों
कुछ सूचियाँ “ku-ro” और एक संख्या पर खत्म होती हैं, जहाँ वह संख्या पहले की संख्याओं का योग होती है, और अजीब तरह से अक्सर 1 से गलत होती है
Minoan लोगों ने Hebrew क्यों लिखा होगा, यह समझ नहीं आता। जहाँ तक मुझे पता है, Minoan सभ्यता और Hebrew बोलने वालों के बीच व्यापक सांस्कृतिक आदान-प्रदान के संकेत नहीं हैं
मृत लिपियों के अनुवाद की कठिनाई में काफ़ी स्पष्ट hierarchy होती है। आसान से कठिन क्रम में: a) जब यह भी पता हो कि लिपि किस भाषा को कैसे लिखती है, b1) जब भाषा न पता हो लेकिन writing system कैसे दर्ज करती है यह पता हो, b2) जब भाषा पता हो लेकिन writing system न पता हो, c) जब न भाषा पता हो न writing system
b1 और b2 मोटे तौर पर समान कठिनाई के हैं, और Linear A c) में आता है। Linear A के बारे में हमें लिपि और भाषा, दोनों के बारे में लगभग कुछ नहीं पता, सिवाय इसके कि बाद में Linear B में उसी का इस्तेमाल Mycenaean Greek लिखने के लिए किया गया था
यह पूरी तरह वैसा नहीं है, लेकिन text इतना कम है कि कई संभावित व्याख्याएँ बची रहती हैं
जहाँ तक मुझे पता है, मुख्य समस्या यह है कि Linear A inscriptions का corpus काफ़ी छोटा है। दूसरे comment के अनुसार पूरे corpus में सिर्फ 7,500 symbols हैं और वे 1,500 inscriptions में बँटे हैं, यानी प्रति inscription औसतन केवल 5 symbols
दूसरी अजीब बात यह है कि यह Semitic निकला बताया जा रहा है। अगर यह Semitic होता, तो उम्मीद थी कि अब तक इसे decipher कर लिया गया होता। भाषाविदों ने Semitic भाषाओं को स्वाभाविक रूप से, और बहुत गहराई से, ज़रूर जाँचा होगा
और अगर यह Semitic था, तो फिर यह consonantal script की बजाय vowels वाला syllabary क्यों था, यह भी सवाल है। आम तौर पर Semitic भाषाओं में, शायद Egyptian में भी, roots तीन consonants की होती हैं और vowels उनके बीच बुने जाते हैं, इसलिए सिर्फ consonants लिखे जाते हैं
उदाहरण के लिए Semitic root K-T-B से kataba, yaktubu, kitāb, kutub, kātib, maktūb, maktab, maktabah जैसे शब्द बनते हैं। D-R-S से darasa, yadrusu, dirāsah, dāris, madrūs, madrasah जैसी रूप-भिन्नताएँ बनती हैं
इसी त्रिव्यंजन मूल प्रणाली की वजह से Semitic भाषाएँ आम तौर पर vowels नहीं लिखतीं; तो अगर Linear A Semitic था, तो वह consonant+vowel syllabary क्यों होता?
क्योंकि इससे tense, passive/active, nominalization आदि को अलग किया जा सकता है; दूसरे शब्दों में, एक ही root से निकले अलग-अलग शब्दों में भेद किया जा सकता है
बहुत दिलचस्प, और Tom को इस उपलब्धि पर बधाई
लेकिन स्पष्ट कर दूँ, यह एक decipherment attempt है। यह अभी सिद्ध नहीं हुआ है, और जब तक इस क्षेत्र के experts इसकी जाँच न कर लें, तब तक यह नहीं मानना चाहिए कि Linear A “solve” हो गया है
दरअसल, जब तक और अधिक Linear A texts न मिलें और वे प्रस्तावित पद्धति से मेल न खाएँ, तब तक इसे “सिद्ध” मानना कठिन होगा। अभी निश्चित रूप से सिर्फ इतना कहा जा सकता है कि यह एक दिलचस्प hypothesis है
फिर भी, इस पर नज़र बनाए रखने लायक कहानी है। यह सच भी हो सकता है। आगे और research और verification की ज़रूरत है, और आने वाले हफ्तों या महीनों में हमें बेहतर पता चलेगा कि क्या Linear A सचमुच पढ़ लिया गया है। कम से कम यह एक रोचक प्रयास है, और आशावादी नज़रिए से देखें तो यह Minoan संस्कृति पर वास्तविक insight दे सकता है
क्या Linear A की बड़ी समस्या यह नहीं है कि symbols इतने कम हैं कि इसे अपेक्षाकृत आसानी से “solve” तो किया जा सकता है, लेकिन यह जानने का कोई तरीका नहीं कि वह सही है या नहीं?
अगर यह सच साबित होता है, तो Indo-European और Semitic language families के बीच एक छोटा-सा दरवाज़ा खुल सकता है
पिछली सदी की शुरुआत में इन दोनों families को संबंधित माना जाता था, फिर यह विचार चलन से बाहर हो गया। शुरुआत में लोग इतने गलत क्यों हो सकते थे, उसका कारण यह हो सकता है कि दोनों families आपस में उलझी हुई थीं। अब genetic evidence है कि दोनों भाषाएँ Caucasus के बहुत पास के इलाकों से फैलीं
ज़्यादातर लोगों के लिए यह शायद पुरानी बात हो, लेकिन पिछले 15 वर्षों में यह काफ़ी स्पष्ट हुआ है कि Europe एक बार Anatolian लोगों द्वारा, और बाद में आंशिक रूप से Indo-European लोगों द्वारा, पूरी तरह फिर से बसाया गया था। Anatolian लोगों की भाषा अभी तक ज्ञात नहीं है
संयोगवश समानता, कभी-कभी वास्तविक loanwords, और कुछ लोगों का bias
ज़रा ठहरिए, मुझे याद है कि Phaistos disc पर भी वही Libation Formula दिखी थी। जिन लगभग 10 लोगों के लिए font installed है, उनके लिए यहाँ लिख रहा हूँ
𐇑 𐇘 𐇪 𐇐 | 𐇬 𐇳 𐇖 𐇗𐇽 | 𐇬 𐇗 𐇜 | 𐇬 𐇼 𐇖𐇽 | 𐇥 𐇬 𐇳 𐇖 𐇗𐇽 | 𐇪 𐇱 𐇦 𐇨 | 𐇖 𐇡 𐇲 | 𐇖 𐇼 𐇖𐇽 | 𐇖 𐇡 𐇲 | 𐇥 𐇬 𐇳 𐇖 𐇗𐇽
i-𐇘-wi-jeʳ | ʰau-ni-ti-noʳ au-no-pa au-ndi-tiʳ 𐇥-au-ni-ti-noʳ wa-pi-naᵐwa ti-ru-te ti-nd-tri ti-na-ru-he ʰau-ni-ti-noʳ
i-301-wa-ja/e | ʰau-... jaᵘ-di-ki-to i-pi-na-ma si-ru-te ta-na-ra te-ti-u ta-na-te i-da
𐘚 ᴴI 𐘮 WA 𐘱 JA 𐘱 JA 𐘆 DI 𐘸 KI 𐘹 TU 𐘚 ᴴI 𐘢 PI 𐘅 NA 𐙁 MA ()
यहाँ Phaistos के phonetic values शायद similarity के आधार पर तय किए गए लगते हैं
सिर्फ आख़िरी अक्षर () अभी भी गायब है; वह किस font का है, यह जानने की जिज्ञासा है