В ближайшие минуты состоится анонс ChatGPT-4.5
Модель получит множество доработок и изменений направленных на улучшение производительности и борьбы с ошибками. Так же разработчики подтянули базы данных модели и теперь она будет способна конкурировать с reasonerами в областях вроде ядерной физики.

Основные плюсы новой модели:
1) Надёжность и уменьшение галлюцинаций

2) Количество знаний. В доменах вроде ядерной физики модель идёт нос к носу с ризонерами.


3) Владение языком. Великолепно проходит бенчмарки на дебаты, переубеждение или вымогание.


4) Тест, связанный с медициной на уровне ризонеров.
Основные минусы новой модели:
1) В целом модель хуже reasoner'ов: иногда даже уступает o1 и o3-mini
2) Агентские навыки (использование инструментов) уступают рассуждающим моделям.
3) Не так много разных оценок, на мультимодальность, длинный контекст и разные языки (второго вообще нет).
Посмотреть прямую трансляцию с анонсом новой модели вы можете тут: "Тык"
Информация о рабочих показателях модели была взята отсюда: "Тык"