एर्डोश समस्या #728, AI ने लगभग स्वायत्त रूप से हल की
(mathstodon.xyz)- एर्डोश समस्या #728 को हाल ही में AI टूल्स की मदद से लगभग स्वायत्त रूप से हल किया गया, जिससे गणितीय शोध के ऑटोमेशन में एक नया मील का पत्थर स्थापित हुआ
- यह समस्या मूल रूप से Erdős, Graham, Ruzsa, Strauss द्वारा 1975 में उठाया गया binomial coefficient के prime factorization से जुड़ा प्रश्न था, लेकिन अस्पष्ट शर्तों के कारण इसे लंबे समय तक स्पष्ट रूप से नहीं सुलझाया जा सका
- ChatGPT ने समायोजित constraints के तहत एक proof तैयार किया, और Aristotle ने उसे Lean formal proof में रूपांतरित करते हुए त्रुटियों को स्वतः सुधारा
- इसके बाद कई प्रतिभागियों ने ChatGPT की मदद से इसे natural language में फिर से लिखा, और literature connections तथा narrative structure को मजबूत करने वाले संस्करणों को बार-बार बेहतर बनाया
- Terence Tao ने आकलन किया कि यह प्रक्रिया AI की तेज proof drafting और revision क्षमता दिखाती है, जो शोध-पत्र लिखने के तरीके को ही बदल सकती है
AI ने हल की एर्डोश समस्या #728
- हाल में AI टूल्स के उपयोग से एर्डोश समस्या के समाधान में नई प्रगति देखी गई, और समस्या #728 को लगभग स्वायत्त रूप से AI द्वारा हल किया गया
- शुरुआती प्रयासों के बाद feedback को शामिल कर संशोधित संस्करण में सफलता मिली
- परिणाम मौजूदा literature में ठीक उसी रूप में पुनरुत्पादित नहीं हुआ, हालांकि मिलते-जुलते तरीकों से समान परिणाम मौजूद थे
- यह मामला दिखाता है कि पिछले कुछ महीनों में गणितीय समस्याएँ हल करने में AI की क्षमता वास्तव में बेहतर हुई है
- पहले भी AI द्वारा एर्डोश समस्याएँ हल करने के दावे हुए थे, लेकिन उनमें से अधिकांश बाद में existing literature में पहले से मौजूद समाधान निकले
- इस बार की समस्या में मूल एर्डोश विवरण गलत रूप में प्रस्तुत किया गया था, और हाल ही में ही उसे इच्छित रूप में पुनर्निर्मित किया गया
- इसी वजह से मौजूदा literature में संबंधित शोध कम होने की व्याख्या मिलती है
समस्या का इतिहास और शुरुआती दृष्टिकोण
- 1975 में Erdős, Graham, Ruzsa, Strauss ने binomial coefficient (2n choose n) के prime factorization का अध्ययन करते हुए कई संबंधित समस्याएँ रखीं
- उनमें से एक यह पूछती थी कि क्या ऐसे अनंत a, b, n मौजूद हैं जो a!b! | n!(a+b−n)! शर्त और a+b > n + C log n को संतुष्ट करते हों
- लेकिन C का परिमाण (छोटा या बड़ा) जैसी कई बातें अस्पष्ट रूप से लिखी गई थीं
- कुछ महीने पहले AlphaProof टीम ने समस्या का एक सरल समाधान पाया, लेकिन वह समस्या की मूल भावना से मेल नहीं खाता था, इसलिए a,b ≤ (1−ε)n constraint जोड़ा गया
- इसके बाद AI-सहायित literature search में भी संबंधित शोध लगभग नहीं मिला
ChatGPT और Aristotle का सहयोग
- 4 जनवरी को ChatGPT ने समायोजित constraints के तहत छोटे C के मामले के लिए एक proof तैयार किया
- इस proof को Aristotle ने Lean formal proof के रूप में औपचारिक बनाया
- बाद में मूल लेख को दोबारा देखने पर पुष्टि हुई कि original paper पहले से ही छोटे C वाले मामले को कवर करता था
- एक अन्य प्रतिभागी ने Lean proof को ChatGPT से natural language में बदला, और आगे की बातचीत के जरिए बेहतर संस्करण तैयार किया
- इस संस्करण ने proof की कुछ कमियाँ भरीं, लेकिन उसमें अब भी AI-विशिष्ट अटपटी शैली और literature citations की कमी थी
- फिर भी यह मुख्य विचार समझने लायक पर्याप्त पठनीय स्तर तक पहुँच गया
बड़े पैमाने पर पुनर्लेखन और बेहतर परिणाम
- अतिरिक्त prompts के जरिए ChatGPT ने बड़े C के मामले तक विस्तारित proof तैयार किया
- कुछ त्रुटियाँ थीं, लेकिन Aristotle ने उन्हें स्वतः ठीक कर Lean-verified proof पूरा किया
- तीसरे प्रतिभागी ने Lean proof को संक्षिप्त किया, फिर एक अन्य प्रतिभागी ने ChatGPT के साथ लंबी बातचीत के माध्यम से
- इसे literature connections और narrative structure को मजबूत करने वाले अधिक परिपक्व paper रूप में फिर से लिखा
- परिणाम को AI-जनित होने का एहसास कम, और research paper स्तर के करीब गुणवत्ता वाला माना गया
- Tao ने कहा कि उन्होंने इस text की एर्डोश समस्या फोरम में समीक्षा की
AI कैसे बदल रहा है research paper लिखने का तरीका
- Tao का मानना है कि अंतिम paper में अब भी मुख्य हिस्से इंसानों को ही लिखने होंगे, लेकिन
- AI और Lean का संयोजन proof लिखने और संशोधित करने की गति को नाटकीय रूप से बढ़ाता है
- पहले किसी paper को पढ़ने में सहज बनाने में बहुत समय लगता था,
- और reviewers के feedback के बाद revisions अक्सर local changes तक सीमित रह जाते थे
- लेकिन अब AI की text generation और revision क्षमता तथा formal proof tools की verification क्षमता के जुड़ने से
- विभिन्न स्तर की precision और व्याख्या के साथ papers के नए versions तेजी से तैयार किए जा सकते हैं
- एक “official paper” के अलावा, AI द्वारा बनाए गए अनेक supplementary versions भी मौजूद हो सकते हैं
- जो अलग-अलग दृष्टिकोण और अतिरिक्त मूल्य प्रदान कर सकते हैं
कम्युनिटी की प्रतिक्रिया
- कुछ उपयोगकर्ताओं ने AI-जनित दस्तावेज़ों के अतिरिक्त मूल्य को “किसी चीज़ को अलग कोण से देखने की क्षमता” बताया
- अन्य गणितज्ञों ने AI परिणामों की मौलिकता मापने और existing literature से समानता का आकलन करने की जरूरत उठाई
- उदाहरण के लिए, Lean formal proof की लंबाई की तुलना के जरिए मात्रात्मक समानता मापने का सुझाव दिया गया
- एक अन्य टिप्पणी में कहा गया कि AI code refactoring की तरह papers को global स्तर पर rewrite कर सकता है
- इसलिए शोधकर्ताओं को उच्च-स्तरीय document structure design पर अधिक ध्यान देना चाहिए
- कुछ लोगों ने AI द्वारा गणितज्ञों की भूमिका बदल देने की संभावना पर संदेह जताया,
- जबकि अन्य ने इसे सहयोग और सोच के विस्तार का नया अवसर माना
1 टिप्पणियां
Hacker News की राय
मैं Harmonic में काम करता हूँ, और हम जो Aristotle बना रहे हैं उसके बारे में कुछ गलतफ़हमियाँ दूर करना चाहता हूँ
Aristotle नवीनतम AI तकनीकों का सक्रिय रूप से उपयोग करता है, और इसमें language modeling भी शामिल है
अगर किसी अनौपचारिक अंग्रेज़ी proof को इनपुट दिया जाए, तो यदि वह proof सही है, उसके Lean में अनुवाद होने की संभावना काफ़ी अधिक होती है। यानी यह इस बात का मज़बूत संकेत है कि अंग्रेज़ी proof ठोस है
एक बार उसे Lean में formalize कर दिया जाए, तो उस proof के सही होने पर कोई संदेह नहीं रहता। यही हमारा मुख्य approach है — AI-आधारित exploration से उत्तर ढूँढो, और फिर उसकी complexity चाहे जो भी हो, नतीजे की correctness की गारंटी पाओ
Rust memory safety की गारंटी के लिए fixed rules के एक सेट का उपयोग करता है, लेकिन ये rules काफ़ी सरल और सीमित हैं। अगर Aristotle जैसे सिस्टम को compiler में integrate किया जा सके, ताकि code की correctness proof संभव होने पर वह अपने-आप pass हो जाए, तो वह सचमुच कमाल होगा
Harmonic को इंसानों द्वारा लिखी गई अधिकांश mathematics को formalize करने में कितना समय लगेगा, यह जानना दिलचस्प होगा। प्रतिद्वंद्वी Christian Szegedy कह रहे थे कि यह इस साल के भीतर संभव हो सकता है
Terence Tao की व्याख्या पढ़ने पर लगता है कि इंसान दो AI tools के बीच नतीजों का आदान-प्रदान कर रहा था, और AI इंसान द्वारा पाए गए खाली स्थानों को भरने का काम कर रही थी
इसे पूरी तरह autonomous समाधान कहने की बजाय, यह मानव और AI के सहयोग के ज़्यादा क़रीब लगता है। यानी expert नेतृत्व कर रहा था और AI सहायक की भूमिका में थी
मौजूदा proofs को फिर से बनाना या नए तरीक़े से जोड़ना इंसानों के लिए उबाऊ या जटिल प्रक्रिया हो सकता है, लेकिन AI इसे अतिमानवीय गति से कर सकती है
यह approach AGI से पहले के चरण में भी जबरदस्त संभावनाएँ खोल सकती है। लगता है ऐसा समय आएगा जब mathematicians AI को tool की तरह इस्तेमाल करके Millennium Problems जैसी कठिन चुनौतियों पर काम करेंगे
LLM की असली value उन विषयों में नए दृष्टिकोण देने में है जिन्हें भाषा में व्यक्त किया जा सकता है
वास्तव में समस्या हल करने वाले व्यक्ति की व्याख्या पोस्ट में यह बात प्रभावशाली लगी कि बड़े pipeline के बिना, सिर्फ़ कुछ prompts से नतीजा मिला
हाल के models बहुत अधिक computation resources इस्तेमाल करते हैं, इसलिए यह तो उल्टा न्यूनतम स्तर की उपलब्धि जैसा लगता है
Terence Tao ने “AI contributions to Erdős problems” नाम का एक wiki page बनाया है
GitHub page और Mathstodon पोस्ट के अनुसार, इस बार का नतीजा (problem 728) उस page की पहली ‘हरी प्रविष्टि’ है, यानी AI द्वारा वास्तव में हल किया गया पहला मामला
क्या physics या mathematics जैसे जटिल क्षेत्रों के experts भी AI से बातचीत करके मदद लेते हैं, यह जानने की जिज्ञासा है
क्षेत्रों के हिसाब से देखें, तो उपयोगिता programming > applied ML > statistics/applied mathematics > pure mathematics के क्रम में घटती है
आप अभी Aristotle को सीधे इस्तेमाल कर सकते हैं — https://aristotle.harmonic.fun/
और Stanford personal page का link भी ग़लत है (www हटाना होगा)
यह नतीजा integers पर एक theorem से जुड़ा है, जो Mathlib infrastructure अच्छी तरह support करता है
इस्तेमाल की गई definitions भी जटिल नहीं हैं, इसलिए इस तरह के proofs की सफलता की संभावना अधिक होती है। फिर भी, यह सचमुच हैरान करने वाली उपलब्धि है
यह LLM से आगे की specialized AI approach की संभावना दिखाने वाला मामला है
Aristotle का paper arXiv:2510.01346 पर है
सिर्फ़ Transformer architecture इस्तेमाल करने से सब कुछ LLM नहीं बन जाता — अगर उसे language data पर train नहीं किया गया, तो उसे LLM नहीं कहा जा सकता
यानी हर चरण LLM-आधारित है
लगता है 2026 में AI mathematics के unsolved problems पर बढ़ते हुए स्तर पर काम करेगी
यह मामला भी पूरी तरह autonomous नहीं था, लेकिन human feedback के बाद AI ने लगभग ख़ुद ही समाधान तक पहुँचना शुरू कर दिया
अब “LLM सिर्फ़ stochastic parrots हैं” वाली बहस ख़त्म हो जानी चाहिए। आगे असली चर्चा का केंद्र यह होगा कि इसे व्यावहारिक रूप से कैसे इस्तेमाल किया जाए