КиберпанкДеталиТехнологии

Главный ИИ-тренд: что умеют интеллектуальные агенты и как они меняют рабочие процессы

OpenAI представила ChatGPT Agent — агента на основе искусственного интеллекта, который способен самостоятельно управлять компьютером и выполнять сложные задачи от имени пользователя. Например, покупать одежду в онлайн-магазинах и отвечать на электронные письма. Такие агенты — самый популярный тренд в сфере ИИ на сегодняшний день. По прогнозам, через пару лет они будут принимать не менее 15% рабочих решений вместо людей. 

Новый ИИ-агент от OpenAI: что умеет ChatGPT Agent

OpenAI делает ставку на самый популярный тренд в сфере искусственного интеллекта на данный момент: у ChatGPT появился режим Agent — интеллектуальный агент, который не просто отвечает на вопросы, а выполняет сложные задачи от имени пользователя. Он может, например, запускать приложения, обрабатывать файлы, оформлять онлайн-заказы, планировать встречи и отвечать на письма (ему можно предоставить доступ к Google Calendar, электронной почте и другим сервисам). Инструмент уже работает у подписчиков ChatGPT Plus, Team и Pro (кроме стран Европейской экономической зоны и Швейцарии). Этим летом доступ к Agent откроют также для корпоративных клиентов и образовательных учреждений. 

Команда, которая работала над ChatGPT Agent, много внимания уделила безопасности: прежде чем агент сделает что-то «необратимое» — например, отправит электронное письмо, забронирует билет на самолет или купить продукты к семейному ужину, — он запросит разрешение. Кроме того, пользователь может следить за выполнением задачи в режиме реального времени и в любой момент остановить систему. 

ChatGPT Agent — новый уровень возможностей искусственного интеллекта. Несмотря на пользу, потенциальные риски тоже значительны. Мы не знаем точно, какими будут последствия, но злоумышленники могут попытаться обманом заставить ИИ-агентов предоставлять конфиденциальную информацию. Мы предусмотрели множество мер предосторожности, но я бы пока не стал использовать его для задач с применением большого количества личной информации. Нам нужно изучить возможности Agent в «дикой природе» и усовершенствовать его. 

Сэм Альтман 
глава OpenAI

Сэм Альтман рекомендует пользователям предоставлять ChatGPT Agent минимальный доступ, необходимый для выполнения задачи. Так, ИИ должен видеть календарь, чтобы выбрать подходящее время для встречи. Но если ChatGPT Agent по запросу просто покупает одежду в онлайн-магазине, ему не нужен доступ к расписанию человека. Глава OpenAI также советует корректно составлять промпты. Например, формулировка «просмотри мои электронные письма, которые пришли за ночь, самостоятельно ответь на них и не задавай никаких дополнительных вопросов» — рискованная: в таком случае ИИ может открыть вредоносную рассылку и перейти на фишинговый сайт. 

Что такое ИИ-агенты и как они работают

ИИ-агенты — это автономные системы на основе искусственного интеллекта, которые могут самостоятельно принимать решения, взаимодействовать с внешней средой и совершать действия без вмешательства человека. Термин начали активно употреблять в 2023-м, а в середине 2024-го все крупнейшие технологические компании — OpenAI, Google, Microsoft и другие — объявили о работе над такими инструментами. Один из первых релизов — обновленная версия модели Claude 3.5 Sonnet от Antropic, которую американский стартап показал в октябре 2024 года. Этот инструмент способен видеть экран компьютера, самостоятельно управлять им и решать различные задачи. 

Интерфейс Claude 3.5 Sonnet
Интерфейс Claude 3.5 Sonnet
Фото: Anthropic

В декабре 2024-го корпорация Google провела большую презентацию, где презентовала своего первого ИИ-агента Project Mariner, которого назвали прорывом в индустрии. Инструмент выполняет действия в браузере Chrome за человека: перемещает курсор на экране, кликает на ссылки и заполняет формы. Project Mariner можно поручить разные задачи, например создать корзину покупок в магазине на основе заданного списка. А в мае 2025-го Google представила автономного ИИ-агента Jules для написания кода и «универсального» Project Astra, способного взаимодействовать с окружающим миром через камеру и другие сенсоры. Например, Astra может наблюдать за тем, как пользователь выполняет домашнее задание, и указывать на ошибки. У Microsoft тоже есть свое семейство агентов для разных задач. 

Все они работают по одной схеме: получают задачу, оценивают ее и планируют работу (с учетом контекста и предыдущих действий пользователя), запрашивают дополнительные данные (при необходимости) и выполняют действие. От генеративных ИИ-моделей они как раз отличаются тем, что не ждут команду, а сами инициируют последовательные действия и могут в том числе управлять календарями и бронированиями, анализировать документы и затем самостоятельно заполнять таблицы, общаться с клиентами и заказчиками. The Verge отмечает, что, по сути, ИТ-гиганты стремятся создать аналог Джарвиса — ИИ-помощника Тони Старка в «Железном человеке».

На данный момент ИИ-агенты далеко не идеальны: они в основном работают на базе больших языковых моделей (LLM), которые все еще могут галлюцинировать (выдумывать несуществующие факты) и путаться в многоэтапных задачах. Кроме того, агенты разных компаний не склонны к сотрудничеству. Журнал MIT Technology Review приводит простой пример: ИИ-агент по планированию путешествий запрашивает цены на туры у агента по бронированию авиабилетов. Второй отдает предпочтение определенным перевозчикам, в таком случае первый не сможет предложить пользователю наиболее выгодный маршрут по стоимости и времени в пути. 

Как ИИ-агенты изменят бизнес-процессы и работу

По прогнозам, объем мирового рынка ИИ-агентов будет расти в среднем на 45% ежегодно и к 2030-му достигнет $50,3 млрд. Такие инструменты не только позволяют обычным пользователям делегировать рутинные задачи, но и меняют бизнес-процессы. Опрос американской корпорации International Business Machines (IBM) показал, что 86% топ-менеджеров уверены: к 2027 году компании станут эффективнее именно за счет использования агентов на базе искусственного интеллекта. 

В Goldman Sachs ожидают, что в ближайшее время появится гибридная рабочая сила: наравне с обычными сотрудниками конкретные задачи будут выполнять агенты — им могут делегировать техническую поддержку, клиентские коммуникации, маркетинг. Менеджеры будут проходить переподготовку для управления такими командами. Уже к 2028 году автономные ИИ-системы будут принимать не менее 15% повседневных рабочих решений вместо людей, считают эксперты AI Business.

В некоторых компаниях уже внедряют ИИ-агентов, в первую очередь для обслуживания клиентов. По данным McKinsey, организации, использующие такие инструменты, увеличили скорость решения проблем в среднем на 14%. Например, китайская технологическая компания Lenovo «наняла» искусственный интеллект на работу в двух областях — разработке ПО и поддержке клиентов. Представители корпорации утверждают, что в сфере обслуживания клиентов наблюдается двузначный рост производительности за счет сокращения времени обработки звонков.

Пока что ИИ-агенты могут выполнять небольшие и хорошо описанные задачи, но сложность задач, которые они могут выполнять, будет постепенно расти. Со временем они смогут стать полноценной рабочей силой. 

Виктор Тарнавский 
директор по искусственному интеллекту в Т-Банке

Прогнозы главы OpenAI Сэма Альтмана еще более глобальные — в своем эссе The Intelligence Age, опубликованном еще в сентябре 2024-го, он написал, что в скором времени у каждого человека «появится личная команда ИИ». 

У каждого из нас появится личная команда ИИ из виртуальных экспертов в разных областях, которые будут работать вместе, чтобы создать практически всё, что мы можем себе представить. У наших детей будут виртуальные наставники, которые предоставят персонализированные уроки по любому предмету, на любом языке и в любом темпе. Можно представить аналогичные инструменты для улучшения здравоохранения, создания любого ПО, которое только можно вообразить, и многого другого. 

Сэм Альтман
генеральный директор OpenAI

Фото обложки: Zulfugar Karimov / Unsplash

Копировать ссылкуСкопировано