Поединок разумов

В недавнем эксперименте ChatGPT, мощная языковая модель, проиграла в шахматной партии консоли Atari 2600, на которой была запущена простая шахматная программа 1977 года. ChatGPT разработан для выполнения задач, связанных с языком и его игра в шахматы оказалась значительно слабее по сравнению со старой, но специализированной программой. 

image

Для контекста стоит привести технические характеристики консоли Atari 2600:

  • MOS Technology 6507, 8-битный
  • Тактовая частота: 1.19 МГц
  • Ограниченная версия популярного процессора MOS 6502

  • Чип: TIA (Television Interface Adapter)
  • Разрешение: примерно 160 x 192 пикселей (в реальности — ниже, из-за чересстрочной развертки и ограничений NTSC)
  • Цветов: 128 возможных оттенков, но на экране может быть показано только 4 цвета на строку без хака
  • Нет видеопамяти — изображение формируется в реальном времени, по строкам, процессором

  • Встроенная RAM: 128 байт
  • Программы (игры) загружались с картриджей (обычно от 2 КБ до 4 КБ, позже — до 32 КБ с банкингом)
  • Ни ПЗУ, ни энергонезависимой памяти внутри самой консоли нет

Инженер Роберт Карузо организовал шахматную партию между ChatGPT и шахматной программой Atari 2600. Целью было проверить, насколько хорошо ChatGPT, известный своей способностью понимать и генерировать человекоподобный текст, справится с шахматной партией.

Модель испытывала сложности с базовыми шахматными понятиями: путала ладьи и слонов, не замечала простейших вилок пешками и постоянно теряла отслеживание своих фигур. Также ей было сложно интерпретировать абстрактное визуальное представление фигур в шахматной игре Atari.

image

Шахматная программа на Atari 2600, несмотря на простоту и возраст, оказалась серьёзным соперником. Она уверенно выполняла базовые ходы и стратегические приёмы, которые ChatGPT не смог воспроизвести.

Эксперимент демонстрирует, что даже мощные ИИ-модели вроде ChatGPT не являются универсальными решателями задач. Они обучаются для выполнения конкретных функций, и при попытке решать задачи вне их обучающего контекста могут проигрывать даже простым, но специализированным системам.

***

Это весьма показательный эксперимент, который разрушает распространённый миф о том, что большие языковые модели являются универсальными «искусственными интеллектами». ChatGPT — это в первую очередь инструмент для работы с языком, и его "понимание" шахмат (и не только шахмат) носит поверхностный, вероятностно-лексический характер, а не стратегический или позиционный.

Программа Atari, пусть и примитивная, была написана для одной-единственной цели — играть в шахматы. Её логика — алгоритмична и эффективна в узком контексте. А ChatGPT не «думает» о шахматах как игрок: он оперирует последовательностями текста, не имея встроенного представления о доске, фигурах или правилах. 

Эксперимент подчёркивает: "общий интеллект" пока что не достигнут. Современные ИИ — это мощные узкоспециализированные инструменты, но далеко не универсальные разумные агенты. И это напоминает нам, как важно не переоценивать сегодняшнее состояние и потенциал LLM — особенно в задачах, требующих чёткого моделирования мира, пространственных или логических рассуждений.

Источники:
https://futurism.com/atari-beats-chatgpt-chess

https://www.techspot.com/news/108248-chatgpt-gets-crushed-chess-1-mhz-atari-2600.html

7
1
7комментариев