Donald Knuth ने पेपर में बताया कि Claude Opus 4.6 ने एक अनसुलझी संयोजनात्मक समस्या कैसे हल की
(www-cs-faculty.stanford.edu)मुख्य सारांश
- 'The Art of Computer Programming (TAOCP)' के लेखक कंप्यूटर वैज्ञानिक Donald Knuth ने घोषणा की कि नवीनतम AI मॉडल 'Claude Opus 4.6' ने एक ऐसी अनसुलझी संयोजनात्मक समस्या हल कर दी, जिस पर वे कई हफ्तों से काम कर रहे थे।
- दिशात्मक ग्राफ़ के Hamiltonian cycle decomposition को खोजने की समस्या में Claude ने 31 बार Python स्क्रिप्ट चलाकर और self-feedback loop के जरिए काम करने वाली एक generalized algorithmic structure खोजी।
- पहले generative AI की सीमाओं की ओर इशारा करते हुए संदेहपूर्ण रहे Knuth ने इस नतीजे को "automated deduction और creative problem solving में नाटकीय प्रगति" बताया और संकेत दिया कि वे AI के बारे में अपनी पुरानी राय बदलेंगे।
गहन विश्लेषण
हल की गई समस्या: Hamiltonian Cycle Decomposition
Knuth, TAOCP के अगले वॉल्यूम को लिखते समय, कुछ विशेष दिशात्मक ग्राफ़ों (digraphs) में decomposition की समस्या का अध्ययन कर रहे थे। $0 \le i, j, k < m$ शीर्षों वाले $m^3$ शीर्षों $ijk$ के ग्राफ़ में, हर शीर्ष से $i+jk$, $ij+k$, $ijk+$ की ओर जाने वाले 3 arcs होते हैं (जहाँ $i+ = (i+1) \bmod m$)। लक्ष्य यह था कि $m > 2$ के सभी मामलों के लिए इन arcs को 3 दिशात्मक $m^3$-cycles में विभाजित करने वाला एक सामान्य हल (general decomposition) मिले। Knuth ने $m=3$ का मामला हल कर लिया था, लेकिन उससे आगे के लिए generalization formula निकालने में कठिनाई आ रही थी।
इम्प्लिमेंटेशन सिद्धांत और तकनीकी पृष्ठभूमि: hybrid reasoning और autonomous exploration loop
Knuth के सहयोगी Filip Stappers ने यह समस्या Anthropic के नवीनतम hybrid reasoning मॉडल 'Claude Opus 4.6' को दी। इसमें सिर्फ एक साधारण query नहीं दी गई, बल्कि prompt में ऐसे मजबूत constraints जोड़े गए जो agentic workflow को मजबूर करते थे।
Claude ने तुरंत समस्या को गणितीय रूप से फिर से परिभाषित किया और Python स्क्रिप्ट (exploreXX.py) लिखकर hypothesis-testing loop शुरू किया। लगभग 1 घंटे तक इसने brute force, fiber decompositions, simulated annealing जैसी अलग-अलग algorithms आजमाईं और कुल 31 explorations किए।
समस्या समाधान का अहम turning point
खास तौर पर 25वें exploration में Claude ने खुद विश्लेषण किया कि "simulated annealing algorithm व्यक्तिगत solutions तो ढूंढ सकता है, लेकिन एक सामान्य गणितीय संरचना (general construction) नहीं दे सकता, इसलिए pure math approach चाहिए" और उसने अपनी खोज की दिशा बदल दी। आखिरकार 31वें exploration में उसने पिछली खोजों के structural patterns के आधार पर $m$ के odd होने पर काम करने वाली एक सटीक generalized structure निकाल ली। Knuth ने इसके आधार पर गणितीय proof पूरा किया और इसका नाम 'Claude-like decompositions' रखा।
प्रमुख कोड और डेटा
Filip Stappers द्वारा Claude को दिए गए मुख्य constraints (prompt) और Claude के self-evaluation log का एक हिस्सा नीचे है।
# 1. Claude को दिए गए workflow constraints (loop control और documentation enforcement)
"""
After EVERY exploreXX.py run, IMMEDIATELY update this file [plan.md] before doing anything else.
No exceptions. Do not start the next exploration until the previous one is documented here.
"""
# 2. Claude द्वारा गणितीय समस्या की पुनर्परिभाषा (शुरुआती approach)
"""
Need sigma: Z3 m — S3, assigning a permutation of {0,1,2} at each vertex;
cycle c at vertex v goes in direction sigma(v)[c].
Each resulting functional digraph must be a single Hamiltonian cycle.
"""
# 3. 25वें exploration के बाद Claude का self-evaluation (दिशा परिवर्तन)
"""
SA(Simulated Annealing) can find solutions but cannot give a general construction.
Need pure math.
"""
अभी कोई टिप्पणी नहीं है.