OpenAI запускает новые инструменты для помощи бизнесам в создании искусственных интеллект-агентов

\n

Во вторник OpenAI выпустила новые инструменты, разработанные для помощи разработчикам и предприятиям в создании искусственных интеллект-агентов - автоматизированных систем, способных самостоятельно выполнять задачи - с использованием собственных моделей и фреймворков искусственного интеллекта компании.

\n

Инструменты являются частью нового API-интерфейса OpenAI, который позволяет бизнесам разрабатывать настраиваемых искусственных интеллект-агентов, способных проводить поиск в Интернете, просматривать файлы компании и навигироваться по веб-сайтам, подобно продукту Operator от OpenAI. API Responses фактически заменяет API Assistants от OpenAI, который компания планирует закрыть в первой половине 2026 года.

\n
\n\t
\n\t
\n
\n
\n\t
\n\t
\n
\n

Идея о искусственных интеллект-агентах в последние годы резко возросла, несмотря на то, что техническая отрасль борется показать людям, или даже определить, что такое "искусственные интеллект-агенты". В последнем примере того, как хайп вокруг агентов опережает их реальную пользу, китайский стартап Butterfly Effect на прошлой неделе стал вирусным благодаря новой платформе для искусственного интеллекта под названием Manus, которую пользователи быстро обнаружили, что не оправдывает многих обещаний компании.

\n

Другими словами, для OpenAI стоит высокая ставка на создание агентов правильно.

\n

“Довольно легко продемонстрировать своего агента,” - сказал Оливье Годеман, руководитель продукта API OpenAI, в интервью TechCrunch. “Масштабировать агента довольно сложно, и добиться того, чтобы люди его часто использовали, очень сложно”.

\n

Ранее в этом году OpenAI представила двух искусственных интеллект-агентов в ChatGPT: Operator, который навигирует по веб-сайтам от вашего имени, и deep research, который создает исследовательские отчеты для вас. Оба инструмента предоставили возможность увидеть, что может достичь агентная технология, но оставили много желаемого в отделе "автономности".

\n

Теперь с Responses API OpenAI хочет продать доступ к компонентам, которые обеспечивают работу искусственных интеллект-агентов, позволяя разработчикам создавать собственные приложения-агенты в стиле Operator и deep research. OpenAI надеется, что разработчики смогут создать некоторые приложения с помощью своей агентной технологии, которые будут более автономными, чем доступные сегодня.

\n
\n
\n

Используя Responses API, разработчики могут использовать те же модели искусственного интеллекта (на предпросмотре), которые используются внутри инструмента поиска веб-сайтов ChatGPT Search от OpenAI: GPT-4o search и GPT-4o mini search. Модели могут просматривать Интернет в поисках ответов на вопросы, указывая источники в процессе генерации ответов.

\n

OpenAI утверждает, что GPT-4o search и GPT-4o mini search являются высоко фактически точными. По их бенчмарку SimpleQA, который оценивает способность моделей отвечать на короткие факт-запросы, GPT-4o search набирает 90%, в то время как GPT-4o mini search набирает 88% (чем выше, тем лучше). Для сравнения, GPT-4.5 - гораздо более крупная, недавно выпущенная модель OpenAI - набирает всего 63%.

\n

Responses API также включает утилиту поиска файлов, которая может быстро сканировать файлы в базах данных компании для извлечения информации. (OpenAI утверждает, что не будет обучать модели на этих файлах.) Кроме того, разработчики, использующие Responses API, могут использовать модель Computer-Using Agent (CUA) от OpenAI, которая управляет Operator. Модель генерирует действия мыши и клавиатуры, позволяя разработчикам автоматизировать задачи использования компьютера, такие как ввод данных и рабочие процессы приложений.

\n
\n\t
\n\t
\n
\n
\n\t
\n\t
\n
\n

Предприятия могут по желанию запускать модель CUA, которая выходит в исследовательском превью, локально на своих собственных системах, сообщила OpenAI. Потребительская версия CUA, доступная в Operator, может только выполнять действия в Интернете.

\n

Чтобы быть ясным, Responses API не решит все технические проблемы, мучающие сегодня искусственные интеллект-агенты.

\n

Хотя поисковые инструменты на основе искусственного интеллекта более точны, чем традиционные модели искусственного интеллекта - факт, который не удивителен, учитывая, что они просто могут найти правильный ответ - веб-поиск не решает проблему галлюцинаций искусственного интеллекта. Поиск GPT-4o все еще допускает 10% ошибок в фактической информации. Кроме их точности, инструменты поиска на основе искусственного интеллекта также часто сталкиваются с короткими навигационными запросами (например, "Счет Лейкерс сегодня"), и последние отчеты позволяют предположить, что цитаты ChatGPT не всегда надежны.

\n

В блоге, предоставленном TechCrunch, OpenAI заявила, что модель CUA “пока не очень надежно для автоматизации задач на операционных системах”, и что она подвержена совершению “случайных” ошибок.

\n

Тем не менее, OpenAI заявила, что это ранние итерации их инструментов агентов, и они постоянно работают над их улучшением.

\n

В дополнение к Responses API, OpenAI выпускает бесплатный набор инструментов под названием Agents SDK, который предлагает разработчикам инструменты для интеграции моделей с их внутренними системами, внедрения защитных механизмов и отслеживания деятельности искусственного интеллект-агента для целей отладки и оптимизации. Agents SDK является своего рода продолжением Swarm от OpenAI, фреймворка для оркестрации многих агентов, который компания выпустила в конце прошлого года.

\n

Годеман сказал, что он надеется, что OpenAI сможет сократить разрыв между демонстрациями агента и продуктами в этом году, и что, по его мнению, “агенты - это наиболее важное применение искусственного интеллекта, которое произойдет”. Это подтверждает заявление генерального директора OpenAI Сэма Альтмана в январе: что 2025 год станет годом вхождения искусственных интеллект-агентов в рабочую силу.

\n

Будет ли 2025 год действительно “годом искусственного интеллект-агента”, последние релизы OpenAI показывают, что компания хочет сдвинуться от эффектных демонстраций агентов к воздейственным инструментам.