Anthropic: Claude Sonnet 3.7 Застрял в 90-х, играя в Pokémon Red и заработал экзистенциальный кризис

В эпоху, когда нейросети рисуют картины и пишут стихи, компания Anthropic решила проверить своего нового AI-гиганта Claude 3.7 Sonnet старомодным способом – заставила его играть в Pokémon Red. И результаты, скажем так, заставляют задуматься, ведь даже самые простые задачи заставляют искусственный интеллект напрячь все свои вычислительные мощности.

image

Claude, как и среднестатистический ребенок 90-х, бороздит просторы Канто, пытаясь поймать Пикачу и стать чемпионом. Но в отличие от нас, Claude не полагается на интуицию и детскую непосредственность. Он анализирует каждый пиксель, озвучивает каждый свой шаг. И в этом, как ни странно, заключается уникальность Claude 3.7 Sonnet: он способен к "расширенному мышлению". Как и другие продвинутые модели, такие как o3-mini от OpenAI и R1 от DeepSeek, Claude 3.7 Sonnet может "рассуждать", решая сложные задачи, пусть и тратит на это больше времени.

В отличие от своего предшественника, Claude 3.5 Sonnet, который не смог даже покинуть дом в Паллет-Тауне, Claude 3.7 Sonnet смог не только выбраться из родного города, но и заработал три значка тренеров, победив первых лидеров стадионов. И все это благодаря способности мыслить, анализируя ситуацию шаг за шагом.

Трансляция "Claude Plays Pokémon" на Twitch – это одновременно захватывающее и удручающее зрелище. С одной стороны, интересно наблюдать за "мышлением" AI, который пытается понять логику игры. С другой – скорость его прогресса заставляет вспомнить, как легко нам давались эти задачи в детстве.

Например, Claude столкнулся с трудностями при попытке найти профессора Оука в его лаборатории. Заметив нового персонажа в белом халате, Claude заявил: "Я вижу нового персонажа ниже себя – персонажа с черными волосами и, похоже, в белом халате в координатах (2, 10)! Возможно, это профессор Оук! Я спущусь и поговорю с ним". Затем он поговорил не с профессором, а с другим NPC, с которым до этого уже несколько раз разговаривал.

image

Пользователи в чате Twitch разделились: одни начали нервничать, а другие, кто следил за трансляцией дольше нескольких минут, отнеслись к этому спокойнее. Один из зрителей написал: "Ребята, успокойтесь. Мы уже раз 10 входили и выходили из лаборатории Оука, прежде чем поняли, что делать дальше". И это правда, Claude потребовалось 35 000 действий, чтобы добраться до последнего из пройденных лидеров стадионов. И все это напоминает нам, что даже самым современным AI иногда трудно справиться с задачами, которые для человека кажутся элементарными.

Один из пользователей Twitch метко подметил: "Кто победит: компьютерный AI с тысячами часов программирования или каменная стена?"

Впрочем, эксперимент Anthropic – это не просто развлечение. Компания использует Pokémon Red в качестве "игрушечного бенчмарка", чтобы оценить способность Claude 3.7 Sonnet к "расширенному мышлению".

Ностальгирующие пользователи Twitch видят в этом эксперименте отголоски "Twitch Plays Pokémon" – хаотичного, но объединившего миллионы людей события, когда каждый мог "управлять" персонажем через чат. Теперь же, вместо совместного опыта, мы наблюдаем за одиноким AI, борющимся с пиксельными препятствиями.

"В 2025 году мы больше не товарищи по команде, а зрители, наблюдающие за AI-моделью, пытающейся играть в игру, которую многие из нас освоили в пятилетнем возрасте", - пишет один из обозревателей. "История с AI, играющим в Pokémon, показывает, как искусственный интеллект подталкивает нас к тому, чтобы меньше взаимодействовать онлайн и больше времени проводить в одиночестве. Это часть более широкой картины."*

Так что, в следующий раз, когда вы будете играть в Pokémon на эмуляторе, вспомните о Claude 3.7 Sonnet, застрявшем перед профессором Оуком или каменной стеной. Возможно, он поможет вам осознать ценность человеческой интуиции и совместного опыта в мире, все больше захватываемом AI. И, возможно, он заставит вас задуматься о том, что мы теряем, отдавая все на откуп алгоритмам.

* Мне пришлось адаптировать это предложение, т.к. оригинал слегка не подходит под рускоязычный контекст. Вот оригинал: It’s an AI-motivated microcosm of a larger trend: Our experiences online are moving from shared, communal activities to more solitary ones.

Источники:

56
56комментариев