В ближайшие минуты состоится анонс ChatGPT-4.5

Модель получит множество доработок и изменений направленных на улучшение производительности и борьбы с ошибками. Так же разработчики подтянули базы данных модели и теперь она будет способна конкурировать с reasonerами в областях вроде ядерной физики. 

image

Основные плюсы новой модели:

1) Надёжность и уменьшение галлюцинаций

image

2) Количество знаний. В доменах вроде ядерной физики модель идёт нос к носу с ризонерами.

image
image

3) Владение языком. Великолепно проходит бенчмарки на дебаты, переубеждение или вымогание.

image
image

4) Тест, связанный с медициной на уровне ризонеров.

Основные минусы новой модели:

1) В целом модель хуже reasoner'ов: иногда даже уступает o1 и o3-mini

2) Агентские навыки (использование инструментов) уступают рассуждающим моделям.

3) Не так много разных оценок, на мультимодальность, длинный контекст и разные языки (второго вообще нет).

Посмотреть прямую трансляцию с анонсом новой модели вы можете тут: "Тык"

Информация о рабочих показателях модели была взята отсюда: "Тык"

13
13комментариев