Презентация GPT-5: графики с ошибками вызвали шквал критики в адрес OpenAI

Выход GPT-5 от OpenAI сопровождался не только смешанными отзывами пользователей, но и скандалом вокруг презентационных материалов. В официальном видео запуска был показан график производительности на тесте SWE-bench, где высоты столбцов для моделей GPT-4o и OpenAI o3 оказались одинаковыми, несмотря на существенную разницу в показателях. Это создало ложное впечатление о подавляющем превосходстве GPT-5, хотя на деле его преимущество над OpenAI o3 было незначительным, что вызвало вопросы о честности компании.

Неудачный график, который впоследствии был исправлен, показал следующие цифры: 74,9% для ChatGPT 5, 69,1% для OpenAI o3 и 30,8% для GPT-4o. Тем не менее, попытка исправить ошибку лишь усилила критику со стороны сообщества. Глава OpenAI Сэм Альтман был вынужден неоднократно приносить извинения в социальной сети X, пытаясь сгладить ситуацию, в то время как многие пользователи выражают сомнения в том, что сам график не был сгенерирован ИИ.

image
image
5
5комментариев