Никто не знает, что это за агент ИИ

Силиконовая долина в восторге от агентов ИИ. Генеральный директор OpenAI Сэм Альтман сказал, что агенты в этом году "присоединятся к рабочей силе". Генеральный директор Microsoft Сатья Наделла предсказал, что агенты заменят определенные виды работ. Генеральный директор Salesforce Марк Бениофф заявил, что цель Salesforce - стать "номер один поставщиком цифрового труда в мире" благодаря различным "агентистическим" услугам компании.

Но никто не может согласиться на точное определение, что такое агент ИИ.

За последние несколько лет технологическая индустрия утверждала, что ИИ "агенты" - самое последнее модное слово - изменят все. Так же, как ИИ-чатботы, такие как ChatGPT от OpenAI, дали нам новые способы доступа к информации, агенты кардинально изменят наш подход к работе, утверждают генеральные директоры типа Альтмана и Наделлы.

Это может быть правдой. Но это также зависит от того, как кто-то определяет "агентов", что не является легкой задачей. Подобно другим терминам, связанным с ИИ (например, "мультимодальный", "ИИ общего интеллекта" и сам "ИИ"), термины "агент" и "агентиская" становятся размытыми до степени бессмысленности.

Это угрожает оставить OpenAI, Microsoft, Salesforce, Amazon, Google и бесчисленные другие компании, создающие целые линейки продуктов на основе агентов, в неудобном положении. Агент от Amazon не то же самое, что агент от Google или любого другого поставщика, и это приводит к путанице - и разочарованию клиентов.

Райан Салва, старший директор по продукту в Google и бывший лидер GitHub Copilot, сказал, что он начал "ненавидеть" слово "агенты".

"Я думаю, что наша индустрия злоупотребляет термином 'агенты' до такой степени, что он почти нелеп", - сказал Салва в интервью TechCrunch. "Это один из моих главных брезгливый пунктов".

Дилемма определения агента не нова. В статье прошлого года бывший репортер TechCrunch Рон Миллер спрашивал: Что такое агент ИИ? Проблему, которую он выявил, заключается в том, что практически каждая компания, создающая агентов, подходит к технологии по-разному.

Эта проблема в последнее время усугубилась.

На этой неделе OpenAI опубликовала блог, в котором определила агентов как "автоматизированные системы, способные автономно выполнять задачи от имени пользователей". Тем не менее, в ту же неделю компания выпустила разработчиков документации, определяющие агентов как "LLM, оснащенные инструкциями и инструментами".

Лехер Патак, руководитель маркетинга продукта API в OpenAI, затем заявила в сообщении на X, что она понимает термины "ассистенты" и "агенты" как взаимозаменяемые - дальнейшее затуманивание вод.

Тем временем в блогах Microsoft пытаются разграничить агентов и ИИ-помощников. Первые, которых Microsoft называет "новыми приложениями" для "ИИ-включенного мира", могут быть настроены на определенное направление, в то время как помощники просто помогают с общими задачами, такими как написание электронных писем.

Исследовательская лаборатория Anthropic немного более прямо решает проблему рассогласования определений агентов. В блоге Anthropic говорится, что агентов "можно определить несколькими способами", включая как "полностью автономные системы, которые работают независимо в течение продолжительного времени", так и "поставленные варианты, которые следуют за ранее определенными рабочими процессами".

У Salesforce, пожалуй, самое широкое определение ИИ-"агентов". Согласно этому крупнейшему в мире разработчику программного обеспечения, агенты - это "тип […] системы, которая способна понимать и отвечать на запросы клиентов без человеческого вмешательства". На веб-сайте компании перечислены шесть различных категорий, начиная от "простых рефлексивных агентов" до "агентов на основе полезности".

Так почему такой хаос?

Ну, агенты - как и ИИ - являются нечто неопределенным и неустойчиво. OpenAI, Google и Perplexity только начали отправлять то, что они считают своими первыми агентами - Operator OpenAI, Project Mariner Google и shopping agent Perplexity - и их возможности весьма разнообразны.

Рич Вилларс, вице-президент по всемирным исследованиям в IDC, отметил, что технологические компании "имеют долгую историю" не строгого придерживания технических определений.

"Им важнее то, чего они пытаются достичь" на техническом уровне, сказал Вилларс в интервью TechCrunch, "особенно в быстро развивающихся рынках".

Но маркетинг также во многом виноват, считает Андрю Нг, основатель платформы обучения ИИ DeepLearning.ai.

"Понятия 'ИИ-агенты' и 'агентные' рабочие процессы раньше имели технический смысл", - сказал Нг в недавнем интервью, "но примерно год назад ими начали пользоваться маркетологи и несколько крупных компаний".

Отсутствие общепризнанного определения агентов является как возможностью, так и вызовом, говорит Джим Роуэн, руководитель ИИ в Deloitte. С одной стороны, неопределенность дает гибкость, позволяя компаниям настраивать агентов под свои нужды. С другой стороны, это может - и, пожалуй, уже привело к "несогласованным ожиданиям" и сложностям в измерении ценности и ROI от агентских проектов.

"Без стандартизированного определения, по крайней мере внутри организации, становится сложно оценить производительность и обеспечить систематические результаты", - сказал Роуэн. "Это может привести к разнообразным интерпретациям того, что должны представлять из себя ИИ-агенты, что, вероятно, усложнит цели и результаты проектов. В конечном итоге, хотя гибкость может стимулировать креативные решения, более стандартизированное понимание помогло бы предприятиям лучше ориентироваться в ландшафте ИИ-агентов и максимизировать свои инвестиции."

К сожалению, если распад термина "ИИ" является каким-либо указанием, кажется маловероятным, что отрасль скоро сойдется на одном определении "агента" - вряд ли когда-либо.