23 января OpenAI представила собственного ИИ-агента: Operator по просьбе пользователя пишет посты, делает заказы и бронирует отели.
Это персональный помощник, который умеет не только находить ответы в интернете, но и выполнять там задачи. Используя встроенный браузер, Operator может переходить на сайты и взаимодействовать с ними: скроллить, кликать, печатать, нажимать на кнопки.
Функцию уже запустили для обладателей Pro-подписки в США. В OpenAI подчеркивают, что это еще не финальная версия, а «исследовательское превью».
ИИ-агенты — новая ступень развития нейросетей, такие сервисы уже представили Google и ByteDance, компания-владелец TikTok. Ключевая особенность ИИ-агентов в автономности и возможности совершать действия без участия человека. Пользователь только дает задачу, а все остальное ИИ берет на себя. Некоторые агенты уже умеют так управлять компьютером. Operator ограничен задачами в браузере: заполнить форму, написать пост в блог и сразу отправить его, заказать нужные продукты с доставкой на дом.
Как отличается выполнение одной и той же задачи в ChatGPT и Operator
Допустим, вы хотите приготовить борщ. Вот как отличается постановка задачи и роль нейросети в ее выполнении. В примере приведена идеальная ситуация — пока у Operator все еще есть ограничения, где промежуточные шаги подтверждает человек.
ChatGPT. Формулируем задачу: «Расскажи, какие ингредиенты нужны, чтобы приготовить борщ, и где их купить». После чего сами заходим в сервис доставки продуктов, выбираем нужные ингредиенты, заказываем, готовим.
Operator. Формулируем задачу: «Закажи на дом продукты для борща к 15:00 на Amazon». Нейросеть ищет, какие ингредиенты нужны для борща, затем складывает их в корзину, заказывает. Человеку остается принять заказ и приготовить.
Operator использует модель Computer-Using Agent на базе GPT-4o, чтобы «разглядывать» сайты через скриншоты и анализировать их. Все свои действия ИИ-агент записывает в логи, которые можно посмотреть в специальной панели сервиса. В любой момент можно перехватить управление и поправить действия нейросети либо вообще отказаться от ее помощи.
Также Operator иногда сам просит пользователя помочь с определенными действиями: подтвердить платеж, авторизоваться на сайте, пройти капчу. В некоторых случаях человек еще нужен для финального подтверждения всей операции: например, на всякий случай вычитать письмо коллеге перед отправкой.
Статья оригинал здесь