Claude AI от Anthropic играет в Pokémon на Twitch — медленно

Во вторник днем Anthropic запустила потоковую передачу Claude Plays Pokémon на Twitch, в которой новейшая модель искусственного интеллекта Anthropic, Claude 3.7 Sonnet, играет в игру Pokémon Red. Это стало своеобразным экспериментом, демонстрирующим возможности современных технологий искусственного интеллекта и реакцию людей на них.

Исследователи искусственного интеллекта использовали различные видеоигры, от Street Fighter до Pictionary, для тестирования новых моделей — чаще всего больше для развлечения, чем для практической пользы. Но в Anthropic заявили, что Pokémon оказался полезным эталоном для Claude 3.7 Sonnet, которая эффективно способна «размышлять» над головоломками, которые содержит игра.

Как и o3-mini от OpenAI и R1 от DeepSeek, Claude 3.7 Sonnet может «мыслить» через сложные вызовы, такие как игра в видеоигру, предназначенную для детей. В то время как предшественник модели без мышления, Claude 3.5 Sonnet, провалил первый этап в Pokémon Red — выход из дома игрока в Паллет-тауне — Claude 3.7 Sonnet смогла получить три знака тренера гима.

Клод борется, чтобы выйти из здания в Pokémon Red.Фотокредиты: Клод играет в Pokémon на Twitch

Новейший Клод все равно сталкивается с проблемами. Часы стрима на Twitch, модель остановилась у каменной стены, через которую она не могла пройти, как бы она не старалась.

Один из пользователей Twitch подвел итог ситуации следующим образом: «кто победит, компьютерный искусственный интеллект с тысячами часов, затраченных на его программирование, или одна каменная стена?»

В конечном итоге Клод понял, что может обойти стену.

С одной стороны, раздражает наблюдать, как Клод проходит по Pokémon Red со скоростью Slowpoke, размышляя через каждый шаг с мучительным размышлением. Но это также странно увлекательно. На левой стороне потока показана «мыслительная деятельность» Клода, а справа — игра в реальном времени.

В какой-то момент Клод пытался найти профессора Оака в его лаборатории, но запутался, потому что на сцене были другие неигровые персонажи.

«Я заметил, что появился новый персонаж подо мной — персонаж с черными волосами и, кажется, белым пальто на координатах (2, 10),» — написал Клод. «Это, вероятно, профессор Оак! Давайте спустимся вниз и поговорим с ним.»

Затем Клод ошибочно начал разговор с другим неигровым персонажем, а не с профессором — персонажем, с которым модель говорила несколько раз ранее. Некоторые из тысяч людей в чате Twitch начали нервничать. Другие, особенно те, кто смотрел поток уже более нескольких минут, были менее обеспокоены.

«Ребята, успокойтесь», — написал один человек в чате. «Мы выходили и входили в лабораторию Оака, как минимум, 10 раз, прежде чем поняли, как двигаться дальше».

Фотокредиты: Anthropic

Для давних пользователей Twitch формат потока Anthropic может показаться ностальгическим. Более десяти лет назад миллионы людей пытались одновременно играть в Pokémon Red в первом такого рода онлайн-социальном эксперименте под названием Twitch Plays Pokémon. Каждый пользователь мог управлять персонажем игрока через чат Twitch, что приводило к предсказуемой хаосной игре.

Некоторые исследователи искусственного интеллекта называют Twitch Plays Pokémon вдохновением для своей работы. В октябре 2023 года программист из Сиэтла Питер Уидден опубликовал видеоролик на YouTube, где он рассказывал, как обучил алгоритм обучения с подкреплением играть в Pokémon. Его искусственный интеллект потратил более 50 000 часов на игру, прежде чем научился успешно в ней навигировать. Одной из проблем было то, что искусственный интеллект предпочитал любоваться пикселированным пейзажем, а не фактически играть в игру.

Искусственные "переигровки" Twitch Plays Pokémon, подобные работам Уиддена и Anthropic, развлекательны, но в то же время немного горьки. Оригинальный поток был столь важным моментом в истории Twitch, потому что он объединил людей неожиданным образом. Все были на одной команде, работая на цель заставить персонажа игрока перестать бегать по кругу и фактически прогрессировать через игру.

В 2025 году кажется, что мы больше не товарищи по команде, а зрители, наблюдающие как модель искусственного интеллекта пытается играть в игру, в которую многие из нас разобрались, когда нам было пять лет. Это микрокосм искусственного интеллекта более крупной тенденции: наши онлайн-опыты переходят от общих, коммунальных мероприятий к более одиночным.