Openai ने पिछले साल अपने तर्क मॉडल को पहली बार रोल किया था जो अधिक जटिल प्रश्नों के लिए हल करने के लिए मानव स्तर की सोच की नकल करने का दावा करता है। हालांकि, अपने नवीनतम और सबसे शक्तिशाली तर्क मॉडल के साथ, ओपनई का कहना है कि यह ‘सटीक’ और ‘गलत’ दावों को बना सकता है।
O3 और O4 मिनी (पहली बार TechCrunch द्वारा रिपोर्ट की गई) के लिए अपनी तकनीकी रिपोर्ट में, Openai का कहना है कि “O3 समग्र रूप से अधिक दावे करने के लिए जाता है, जिससे अधिक सटीक दावों के साथ -साथ अधिक गलत/मतिभ्रम दावों के लिए अग्रणी होता है। इस परिणाम के कारण को समझने के लिए अधिक शोध की आवश्यकता होती है।”
Openai के अपने व्यक्तित्व बेंचमार्क के अनुसार, कंपनी ने पाया कि O3 के लिए 16% मतिभ्रम दर और O3 मिनी के लिए 14.8% की तुलना में लगभग 33% प्रश्नों का जवाब देते हुए O3 मतिभ्रम करता है।