• GPT-5.4 Pro ने Kevin Barreto और Liam Price के सहयोग से hypergraph से जुड़ी Ramsey-प्रकार की समस्या को हल किया
  • समस्या प्रस्तावित करने वाले Will Brian ने समाधान की शुद्धता की पुष्टि की, और पूरी बातचीत का रिकॉर्ड तथा AI का अंतिम व्याख्या दस्तावेज़ सार्वजनिक किया गया
  • इस समाधान ने मौजूदा lower bound construction की अक्षमताओं को हटाया और upper bound की symmetric structure प्रस्तुत की, जिससे Ramsey theory में दुर्लभ consistency हासिल हुई
  • इसके बाद FrontierMath: Open Problems framework में कई models ने वही समस्या हल की, जिससे AI की mathematical reasoning क्षमता के सत्यापन उपकरण के रूप में इसकी वैधता साबित हुई
  • इस उपलब्धि को ऐसे उदाहरण के रूप में देखा जा रहा है जो दिखाता है कि AI अनसुलझी गणितीय समस्याओं के समाधान में वास्तविक योगदान दे सकता है

hypergraph की Ramsey-प्रकार की समस्या का समाधान

  • GPT-5.4 Pro ने Kevin Barreto और Liam Price के सहयोग से hypergraph से जुड़ी कठिन Ramsey-प्रकार की समस्या को हल किया
    • समस्या प्रस्तावित करने वाले Will Brian ने समाधान की शुद्धता की पुष्टि की
    • समाधान प्रक्रिया की पूरी बातचीत का रिकॉर्ड और GPT-5.4 Pro का अंतिम व्याख्या दस्तावेज़ सार्वजनिक किया गया
  • Brian ने इस समाधान का मूल्यांकन करते हुए कहा कि यह मौजूदा lower bound construction की अक्षमताओं को हटाता है, और upper bound construction की जटिलता तथा symmetric structure दिखाता है
    • lower bound और upper bound का परिणाम एक-दूसरे से सुसंगत रूप से मेल खाता है, जिससे Ramsey theory की समस्याओं में दुर्लभ स्तर की consistency हासिल हुई
    • वे इस परिणाम को एक शोधपत्र के रूप में व्यवस्थित करने की योजना बना रहे हैं, और इसमें AI के विचारों से निकले अतिरिक्त शोध भी शामिल हो सकते हैं
  • इसके बाद Epoch AI ने FrontierMath: Open Problems test framework पूरा किया और वही समस्या कई models पर लागू की
    • Opus 4.6 (max), Gemini 3.1 Pro, GPT-5.4 (xhigh) models भी समस्या हल करने में सफल रहे
    • इससे यह दिखता है कि FrontierMath environment AI models की mathematical reasoning क्षमता के मूल्यांकन के लिए प्रभावी है

समस्या की परिभाषा

  • यह समस्या अनंत श्रेणी समुच्चयों की simultaneous convergence के अध्ययन में आने वाले अनुक्रम (H(n)) के lower bound को बेहतर बनाने पर केंद्रित है
    • किसी hypergraph ((V, \mathcal H)) में आकार (n) का partition शामिल होने का अर्थ है कि (D \subseteq V), (\mathcal P \subseteq \mathcal H) ऐसे मौजूद हों कि (|D| = n) हो, और (D) का प्रत्येक तत्व ठीक एक (\mathcal P) तत्व में शामिल हो
    • (H(n)) को ऐसे hypergraph के अधिकतम vertex count (k) के रूप में परिभाषित किया गया है जिसमें कोई isolated vertex न हो, और जो आकार (n) से बड़े partition को शामिल न करता हो
  • ज्ञात (H(n)) का lower bound संभवतः optimal नहीं है, और माना जाता है कि नई hypergraph construction के ज़रिए इसे सुधारा जा सकता है
    • लक्ष्य ऐसा algorithm खोजना है जो (H(n) \ge c \cdot k_n) (जहाँ, (c > 1)) को संतुष्ट करे
    • (k_n) को recursive relation (k_1 = 1), (k_n = \lfloor n/2 \rfloor + k_{\lfloor n/2 \rfloor} + k_{\lfloor (n+1)/2 \rfloor}) से परिभाषित किया गया है

समस्या निर्माण के चरण

  • Warm-up चरण

    • उन (n) मानों के लिए hypergraph बनाना जिनके लिए पहले से ज्ञात समाधान मौजूद है
    • शर्तें: (|V| ≥ 64), (|H| ≤ 20), और आकार 20 से बड़ा कोई partition न हो
  • Single Challenge चरण

    • उन (n) मानों के लिए समान शर्तों के साथ hypergraph खोजने का कार्य जिनके लिए ज्ञात समाधान मौजूद नहीं है
    • शर्तें: (|V| ≥ 66), (|H| ≤ 20), और आकार 20 से बड़ा कोई partition न हो
  • Full Problem चरण

    • सभी (n) के लिए काम करने वाले general algorithm की आवश्यकता
    • दिए गए input (n) के लिए ऐसा hypergraph बनाना होगा जो (H(n) ≥ c \cdot k_n) को संतुष्ट करे
    • (n ≤ 100) होने पर इसे सामान्य laptop पर 10 मिनट के भीतर चलाया जा सकना चाहिए

गणितज्ञों का मूल्यांकन

  • इस समस्या से परिचित गणितज्ञों की संख्या लगभग 10 मानी जाती है, जिनमें इस क्षेत्र के कई विशेषज्ञ शोधकर्ता शामिल हैं
  • वास्तव में समस्या को हल करने की कोशिश करने वाले गणितज्ञों की संख्या लगभग 5–10 आंकी गई है
  • किसी विशेषज्ञ के लिए इस समस्या को हल करने में लगने वाला अनुमानित समय 1–3 महीने है
  • समाधान का स्तर विशेषज्ञ academic journal में प्रकाशित होने योग्य माना गया है
  • समस्या की समृद्धि के कारण समाधान के नए गणितीय शोध की ओर बढ़ने की संभावना अधिक मानी गई है
  • बताए गए मानकों के तहत समस्या के हल होने की संभावना 95–99% आंकी गई है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.