Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
OpenAI делает ставку на самый обсуждаемый тренд в сфере искусственного интеллекта – AI-агенты, или инструменты, которые идут на шаг дальше чат-ботов, выполняя сложные многоступенчатые задачи от имени пользователя. Компания в четверг представила ChatGPT Agent, который позиционируется как инструмент, способный выполнять работу за пользователя, используя свой собственный «виртуальный компьютер». В ходе брифинга и демонстрации Яш Кумар (Yash Kumar) и Иса Фулфорд (Isa Fulford) – руководитель продукта и исследовательский руководитель ChatGPT Agent соответственно – заявили, что инструмент работает на новой модели, разработанной OpenAI специально для этого продукта.
Компания сообщила, что новый инструмент может выполнять такие задачи, как просмотр календаря пользователя для информирования о предстоящих встречах с клиентами, планирование и покупка ингредиентов для приготовления завтрака для семьи, а также создание презентации на основе анализа конкурирующих компаний. Модель, лежащая в основе ChatGPT Agent, не имеет конкретного названия и была обучена на сложных задачах, требующих использования нескольких инструментов – например, веб-браузера, визуального браузера и терминала, где пользователи могут импортировать свои данные, – с использованием обучения с подкреплением, той же техники, которая используется для всех моделей рассуждений OpenAI.
OpenAI заявила, что ChatGPT Agent объединяет возможности как Operator, так и Deep Research, двух существующих инструментов искусственного интеллекта. Для разработки нового инструмента компания объединила команды, стоящие за Operator и Deep Research, в единую команду. Кумар и Фулфорд сообщили, что новая команда состоит из 20-35 человек, работающих в отделах продукта и исследований.
В ходе демонстрации Кумар и Фулфорд продемонстрировали потенциальные варианты использования ChatGPT Agent, например, попросили его запланировать свидание, подключившись к Google Calendar, чтобы узнать, когда у пользователя есть свободный вечер, а затем сопоставив данные с OpenTable, чтобы найти свободные столики в определенных типах ресторанов. Они также показали, как пользователь может прервать процесс, добавив, например, другую категорию ресторанов для поиска.
Другая демонстрация показала, как ChatGPT Agent может сгенерировать исследовательский отчет о росте популярности Labubus по сравнению с Beanie Babies. Фулфорд сказала, что ей нравится использовать его для онлайн-покупок, потому что комбинация технологий, лежащих в основе Deep Research и Operator, работает лучше и более тщательно, чем попытка выполнить тот же процесс, используя только Operator. А Кумар сказал, что он начал использовать ChatGPT Agent для автоматизации небольших частей своей жизни, например, запрашивать новое парковочное место в офисе OpenAI каждое четверг вместо того, чтобы приходить в понедельник и обнаруживать, что забыл запросить место и негде парковаться.
Кумар сказал, что поскольку ChatGPT Agent имеет доступ к «целому компьютеру», а не только к браузеру, они «значительно расширили набор инструментов». Однако, согласно демонстрации, инструмент может работать довольно медленно. На вопрос о задержке Кумар сказал, что их команда больше сосредоточена на «оптимизации сложных задач» и что пользователям не предполагается сидеть и наблюдать за работой ChatGPT Agent. «Даже если это занимает 15 минут, полчаса, это значительное ускорение по сравнению с тем, сколько времени это заняло бы у вас», – сказала Фулфорд, добавив, что команда поиска OpenAI больше сосредоточена на сценариях использования с низкой задержкой. «Это одна из тех вещей, которые можно запустить в фоновом режиме, а затем вернуться к ним».
Прежде чем ChatGPT Agent выполнит что-либо «необратимое», например, отправит электронное письмо или сделает бронирование, он запросит разрешение, сказала Фулфорд. Поскольку модель, лежащая в основе инструмента, имеет расширенные возможности, OpenAI активировала меры безопасности, которые она создала для «высоких биологических и химических возможностей», хотя компания заявила, что не имеет «прямых доказательств того, что модель может осмысленно помочь новичку создать серьезный биологический или химический вред» в форме оружия. Anthropic в мае активировала аналогичные меры безопасности для запуска одной из своих моделей Claude, Opus 4.
На вопрос о том, разрешено ли инструменту выполнять финансовые транзакции, Кумар сказал, что эти действия были ограничены «пока», и что существует дополнительная защита под названием Watch Mode, при которой, если пользователь переходит на определенные категории веб-страниц, например, финансовые сайты, он должен не покидать вкладку, в которой работает ChatGPT Agent, иначе инструмент перестанет работать.
OpenAI начнет развертывание инструмента сегодня для пользователей Pro, Plus и Team – выберите «режим агента» в меню инструментов или введите «/agent», чтобы получить к нему доступ – и компания заявила, что сделает его доступным для пользователей ChatGPT Enterprise и Education позже этим летом. Пока нет графика развертывания для Европейской экономической зоны и Швейцарии.
Концепция AI-агентов уже несколько лет является обсуждаемым трендом в отрасли. Идеальные разработчики стремятся к созданию чего-то вроде J.A.R.V.I.S. из «Железного человека», инструмента, который может выполнять определенные служебные функции, проверять календари людей, чтобы найти лучшее время для планирования мероприятия, покупать подарок по предпочтениям друга и многое другое, но в настоящее время они в некоторой степени ограничены помощью в кодировании и составлении исследовательских отчетов.
Термин «AI-агент» стал более распространен среди инвесторов и руководителей технологических компаний в 2023 году и быстро набрал обороты, особенно после того, как финтех-компания Klarna объявила в феврале 2024 года, что за один месяц работы ее собственный AI-агент обработал две трети чатов службы поддержки клиентов – что эквивалентно 700 штатным сотрудникам. С тех пор руководители Amazon, Meta, Google и других компаний начали упоминать свои цели в области AI-агентов на конференц-звонках после публикации финансовых отчетов. И с тех пор AI-компании стратегически нанимают сотрудников для достижения этих целей: например, Google на прошлой неделе наняла генерального директора, соучредителя и некоторых сотрудников отдела исследований и разработок компании Windsurf, чтобы помочь в дальнейшем развитии своих проектов, связанных с агентурным искусственным интеллектом.
Премьера ChatGPT Agent от OpenAI последовала за выпуском в январе Operator, который компания представила как «агента, способного работать в Интернете для выполнения задач для вас», поскольку он был обучен умению управлять кнопками, текстовыми полями и другими элементами Интернета. Это также является частью более широкой тенденции в сфере искусственного интеллекта, поскольку крупные и мелкие компании стремятся к созданию AI-агентов, которые привлекут внимание потребителей и, в идеале, станут привычкой. В октябре прошлого года Anthropic, стартап в сфере искусственного интеллекта, поддерживаемый Amazon, выпустила аналогичный инструмент под названием «Computer Use», который она представила как инструмент, способный использовать компьютер так же, как это может сделать человек, для выполнения задач от имени пользователя. Несколько AI-компаний, включая OpenAI, Google и Perplexity, также предлагают AI-инструмент, который все трое назвали Deep Research, обозначая AI-агента, который может писать большие аналитические отчеты и исследовательские работы по любому запросу пользователя.
``` **Описание разметки:** * **``**: Объявление типа документа как HTML5. * **``**: Корневой элемент HTML-документа. * **``**: Содержит метаданные о документе, такие как кодировка и заголовок. * **``**: Указывает кодировку символов как UTF-8 для поддержки всех символов. * **``**: Абзац текста. Используется для разделения текста на смысловые блоки. Разметка выполнена максимально просто и чисто, чтобы обеспечить читаемость и доступность текста. Использование только необходимых тегов делает ее легкой для понимания и модификации.
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...