
Во вторник днем Anthropic запустила потоковую передачу Claude Plays Pokémon на Twitch, в которой новейшая модель искусственного интеллекта Anthropic, Claude 3.7 Sonnet, играет в игру Pokémon Red. Это стало своеобразным экспериментом, демонстрирующим возможности современных технологий искусственного интеллекта и реакцию людей на них.
Исследователи искусственного интеллекта использовали различные видеоигры, от Street Fighter до Pictionary, для тестирования новых моделей — чаще всего больше для развлечения, чем для практической пользы. Но в Anthropic заявили, что Pokémon оказался полезным эталоном для Claude 3.7 Sonnet, которая эффективно способна «размышлять» над головоломками, которые содержит игра.
Как и o3-mini от OpenAI и R1 от DeepSeek, Claude 3.7 Sonnet может «мыслить» через сложные вызовы, такие как игра в видеоигру, предназначенную для детей. В то время как предшественник модели без мышления, Claude 3.5 Sonnet, провалил первый этап в Pokémon Red — выход из дома игрока в Паллет-тауне — Claude 3.7 Sonnet смогла получить три знака тренера гима.

Новейший Клод все равно сталкивается с проблемами. Часы стрима на Twitch, модель остановилась у каменной стены, через которую она не могла пройти, как бы она не старалась.
Один из пользователей Twitch подвел итог ситуации следующим образом: «кто победит, компьютерный искусственный интеллект с тысячами часов, затраченных на его программирование, или одна каменная стена?»
В конечном итоге Клод понял, что может обойти стену.
С одной стороны, раздражает наблюдать, как Клод проходит по Pokémon Red со скоростью Slowpoke, размышляя через каждый шаг с мучительным размышлением. Но это также странно увлекательно. На левой стороне потока показана «мыслительная деятельность» Клода, а справа — игра в реальном времени.
В какой-то момент Клод пытался найти профессора Оака в его лаборатории, но запутался, потому что на сцене были другие неигровые персонажи.
«Я заметил, что появился новый персонаж подо мной — персонаж с черными волосами и, кажется, белым пальто на координатах (2, 10),» — написал Клод. «Это, вероятно, профессор Оак! Давайте спустимся вниз и поговорим с ним.»
Затем Клод ошибочно начал разговор с другим неигровым персонажем, а не с профессором — персонажем, с которым модель говорила несколько раз ранее. Некоторые из тысяч людей в чате Twitch начали нервничать. Другие, особенно те, кто смотрел поток уже более нескольких минут, были менее обеспокоены.
«Ребята, успокойтесь», — написал один человек в чате. «Мы выходили и входили в лабораторию Оака, как минимум, 10 раз, прежде чем поняли, как двигаться дальше».

Для давних пользователей Twitch формат потока Anthropic может показаться ностальгическим. Более десяти лет назад миллионы людей пытались одновременно играть в Pokémon Red в первом такого рода онлайн-социальном эксперименте под названием Twitch Plays Pokémon. Каждый пользователь мог управлять персонажем игрока через чат Twitch, что приводило к предсказуемой хаосной игре.
Некоторые исследователи искусственного интеллекта называют Twitch Plays Pokémon вдохновением для своей работы. В октябре 2023 года программист из Сиэтла Питер Уидден опубликовал видеоролик на YouTube, где он рассказывал, как обучил алгоритм обучения с подкреплением играть в Pokémon. Его искусственный интеллект потратил более 50 000 часов на игру, прежде чем научился успешно в ней навигировать. Одной из проблем было то, что искусственный интеллект предпочитал любоваться пикселированным пейзажем, а не фактически играть в игру.
Искусственные "переигровки" Twitch Plays Pokémon, подобные работам Уиддена и Anthropic, развлекательны, но в то же время немного горьки. Оригинальный поток был столь важным моментом в истории Twitch, потому что он объединил людей неожиданным образом. Все были на одной команде, работая на цель заставить персонажа игрока перестать бегать по кругу и фактически прогрессировать через игру.
В 2025 году кажется, что мы больше не товарищи по команде, а зрители, наблюдающие как модель искусственного интеллекта пытается играть в игру, в которую многие из нас разобрались, когда нам было пять лет. Это микрокосм искусственного интеллекта более крупной тенденции: наши онлайн-опыты переходят от общих, коммунальных мероприятий к более одиночным.