Во время презентации новой модели GPT-5 компания OpenAI продемонстрировала несколько графиков, подчеркивающих эффективность модели. Однако внимательный взгляд выявил явные несоответствия в представленных данных.
Один из графиков, посвященный оценке способности GPT-5 к «обману» в разных тестах, показал непоследовательные результаты: например, в категории «кодирование обмана» GPT-5 получил 50% обмана, а более ранняя модель — 47,4%, но при этом визуальное отображение данных было некорректным, с большими столбцами для меньших значений.
Другой график содержал аналогичные ошибки, где показатели GPT-5 были ниже, чем у предыдущей версии, но при этом имели больший визуальный объём. В некоторых случаях значения, которые должны были отличаться, отображались одинаковыми по размеру на диаграмме.
Генеральный директор OpenAI Сэм Альтман прокомментировал эту ситуацию, назвав ошибку в графиках «огромной ошибкой в визуализации». Представитель компании также принес извинения за непреднамеренные ошибки в презентации.
Хотя неясно, использовался ли сам GPT-5 для создания этих графиков, ситуация оставила неоднозначное впечатление в день важного запуска, особенно учитывая обещания значительного снижения ошибок и «галлюцинаций» в новой модели.