В ближайшие минуты состоится анонс ChatGPT-4.5

Модель получит множество доработок и изменений направленных на улучшение производительности и борьбы с ошибками. Так же разработчики подтянули базы данных модели и теперь она будет способна конкурировать с reasonerами в областях вроде ядерной физики. 

Основные плюсы новой модели:

1) Надёжность и уменьшение галлюцинаций

2) Количество знаний. В доменах вроде ядерной физики модель идёт нос к носу с ризонерами.

3) Владение языком. Великолепно проходит бенчмарки на дебаты, переубеждение или вымогание.

4) Тест, связанный с медициной на уровне ризонеров.

Основные минусы новой модели:

1) В целом модель хуже reasoner'ов: иногда даже уступает o1 и o3-mini

2) Агентские навыки (использование инструментов) уступают рассуждающим моделям.

3) Не так много разных оценок, на мультимодальность, длинный контекст и разные языки (второго вообще нет).

Посмотреть прямую трансляцию с анонсом новой модели вы можете тут: "Тык"

Информация о рабочих показателях модели была взята отсюда: "Тык"

13
no_fantasy

Редакция: editorial@enthub.it/Техника и коммуникации с брендами: tech@enthub.it Модерация: mod@enthub.it/Сотрудничество: team@enthub.it

13комментариев