GPT-5 आधारित Aardvark: 92% vulnerability detection के साथ security research के लिए नया benchmark
(aisparkup.com)OpenAI ने GPT-5 का उपयोग करने वाला autonomous security research agent 'Aardvark' पेश किया है। 2024 में ही 40,000 से अधिक नई vulnerabilities रिपोर्ट हुईं, ऐसे में सीमित मानव संसाधनों के साथ उनका सामना करना मुश्किल है। Aardvark मानव security researcher की तरह code का विश्लेषण करता है और test चलाता है, और open source projects में पहले ही 10 नए CVE खोज चुका है。
मुख्य विशेषताएँ
- उच्च detection rate: 'golden' repository benchmark में ज्ञात और synthetic vulnerabilities में से 92% का पता लगाया, जिससे वास्तविक उपयोगिता साबित हुई।
- मानव-केंद्रित approach: fuzzing या static analysis के बजाय LLM-आधारित reasoning से code को समझता है, test लिखता और चलाता है। जटिल conditional bugs तक पकड़ सकता है।
- open source योगदान: non-commercial open source repos के लिए free scanning देने की योजना, और responsible disclosure policy अपनाई गई है।
यह कैसे काम करता है (4-चरण pipeline)
- विश्लेषण (Analysis): पूरे repository का विश्लेषण करके threat model बनाता है (project के उद्देश्य और security design को समझता है)।
- commit scanning: changes की समीक्षा करता है और पुराने history को scan करता है। vulnerability description और code comments भी प्रदान करता है।
- सत्यापन (Validation): sandbox में वास्तविक exploitation की कोशिश करता है और low false-positive insights समझाता है।
- patching: Codex integration के साथ fixes सुझाता है, जिन्हें one-click में apply किया जा सकता है।
यह GitHub और Codex के साथ जुड़कर development workflow में स्वाभाविक रूप से integrate हो जाता है। OpenAI के internal और partner environments में यह पहले ही अर्थपूर्ण vulnerabilities खोज चुका है।
पृष्ठभूमि और प्रभाव
यह पारंपरिक tools की सीमाओं से आगे बढ़ते हुए उन bugs पर भी अपने आप प्रतिक्रिया दे सकता है जो code commits के 1.2% में शामिल होते हैं। यह attacker-defender asymmetry की समस्या को कम करता है और logic flaws तथा privacy issues तक का पता लगा सकता है। open source ecosystem को मजबूत करने और collaborative disclosure के जरिए लंबी अवधि की security resilience बढ़ाने में मदद मिल सकती है।
फिलहाल यह private beta चरण में है, और इच्छुक organizations OpenAI की website पर आवेदन कर सकती हैं।
अभी कोई टिप्पणी नहीं है.