मुंबई, 23 जुलाई, (न्यूज़ हेल्पलाइन) ओपनएआई द्वारा विकसित एक प्रायोगिक वृहद भाषा मॉडल (एलएलएम) ने 2025 अंतर्राष्ट्रीय गणित ओलंपियाड (आईएमओ) में स्वर्ण पदक-स्तर का प्रदर्शन हासिल किया है, जिसने एआई प्रणालियों के लिए गणितीय तर्क में एक नया मानक स्थापित किया है। इस उपलब्धि की घोषणा करते हुए, ओपनएआई के शोधकर्ता अलेक्जेंडर वेई ने एक्स पर पोस्ट किया कि इस मॉडल ने मानव परीक्षा परिस्थितियों में नवीनतम आईएमओ की छह में से पाँच समस्याओं को हल किया। मॉडल ने संभावित 42 में से 35 अंक अर्जित किए, जो वास्तविक प्रतियोगिता में स्वर्ण पदक के लिए योग्य होगा।
वेई ने बताया, "हमने 2025 आईएमओ समस्याओं पर अपने मॉडलों का मूल्यांकन मानव प्रतियोगियों के समान नियमों के तहत किया: दो 4.5 घंटे के परीक्षा सत्र, कोई उपकरण या इंटरनेट नहीं, आधिकारिक समस्या कथनों को पढ़ना और प्राकृतिक भाषा के प्रमाण लिखना।"
आईएमओ को विश्व स्तर पर सबसे प्रतिष्ठित हाई स्कूल गणित प्रतियोगिता माना जाता है, जो अपनी बेहद जटिल समस्याओं के लिए जानी जाती है। वेई ने बताया कि ऐसी समस्याओं के लिए विस्तृत रचनात्मक तर्क की आवश्यकता होती है और स्वर्ण-स्तर का प्रदर्शन प्राप्त करना पहले के मानकों से एक बड़ी छलांग है। उन्होंने कहा, "हम अब GSM8K (शीर्ष मनुष्यों के लिए ~0.1 मिनट) MATH बेंचमार्क (~1 मिनट) AIME (~10 मिनट) IMO (~100 मिनट) से आगे बढ़ चुके हैं।"
प्रस्तुतियों का मूल्यांकन तीन पूर्व IMO पदक विजेताओं द्वारा स्वतंत्र रूप से किया गया, जिन्होंने सर्वसम्मति से मॉडल के समाधानों को मान्य किया। वेई के अनुसार, "मॉडल ने P1 से P5 तक के प्रश्नों को हल किया; इसने P6 के लिए कोई समाधान नहीं दिया।" उन्होंने मॉडल के उत्तरों को सार्वजनिक रूप से साझा किया, और इसकी प्रयोगात्मक प्रकृति के कारण इसकी "विशिष्ट शैली" का उल्लेख किया।
वेई ने कहा कि परिणाम को और भी प्रभावशाली बनाने वाली बात यह है कि IMO प्रमाण लंबे, जटिल और सत्यापित करने में कठिन होते हैं। "स्पष्ट, सत्यापन योग्य पुरस्कारों के सुदृढीकरण अधिगम प्रतिमान से आगे बढ़कर, हमने एक ऐसा मॉडल प्राप्त किया है जो मानव गणितज्ञों के स्तर पर जटिल, अचूक तर्क गढ़ सकता है।"
जिस LLM ने यह परिणाम प्राप्त किया है, उसे निकट भविष्य में सार्वजनिक रूप से जारी नहीं किया जाएगा। वेई ने स्पष्ट किया कि ओपनएआई जीपीटी-5 लॉन्च करने की तैयारी कर रहा है, लेकिन यह आईएमओ-स्तरीय मॉडल एक अलग शोध ट्रैक का हिस्सा है। "हम कई महीनों तक आईएमओ गोल्ड स्तर की क्षमता वाला मॉडल जारी करने की योजना नहीं बना रहे हैं।"
ओपनएआई के सीईओ सैम ऑल्टमैन ने एक अनुवर्ती पोस्ट में इसी बात को दोहराया और इस उपलब्धि को "पिछले एक दशक में एआई की प्रगति का एक महत्वपूर्ण संकेतक" बताया। उन्होंने स्पष्ट किया कि यह मॉडल कोई विशिष्ट गणित प्रणाली नहीं, बल्कि एक सामान्य-उद्देश्यीय तर्क मॉडल है। ऑल्टमैन ने आगे कहा, "हम जल्द ही जीपीटी-5 जारी कर रहे हैं, लेकिन सटीक अपेक्षाएँ निर्धारित करना चाहते हैं: यह एक प्रायोगिक मॉडल है जिसमें नई शोध तकनीकें शामिल हैं। हम कई महीनों तक आईएमओ गोल्ड स्तर की क्षमता वाला मॉडल जारी करने की योजना नहीं बना रहे हैं।"
पीछे मुड़कर देखें तो, वेई ने यह भी सोचा कि एआई की प्रगति अपेक्षाओं से कितनी आगे निकल गई है। "2021 में, मेरे पीएचडी सलाहकार जैकब स्टाइनहार्ट ने मुझे जुलाई 2025 तक एआई गणित की प्रगति का अनुमान लगाने को कहा था। मैंने MATH बेंचमार्क पर 30 प्रतिशत की भविष्यवाणी की थी, लेकिन इसके बजाय, हमारे पास आईएमओ गोल्ड है।" उन्होंने शेरिल ह्सू और नोम ब्राउन सहित सहयोगियों को श्रेय दिया, और सभी 2025 IMO प्रतिभागियों को बधाई देते हुए समापन किया, और कहा कि कई ओपनएआई शोधकर्ता स्वयं पूर्व IMO पदक विजेता हैं।