OpenAI представляет Deep Research: ИИ-агент, который проводит комплексные исследования за минуты

OpenAI анонсировала Deep Research — мощную новую функцию в ChatGPT, способную автономно проводить многоступенчатые исследования в интернете. Эта функция выполняет за 5–30 минут задачи, на которые у человека ушли бы часы, а то и дни. На данный момент Deep Research доступен подписчикам ChatGPT Pro (с лимитом до 100 запросов в месяц), пользователям Plus и Team будет предоставлен ограниченный доступ позднее, расширение доступа до Enterprise пользователей и других регионов планируется в будущем.

image

Deep Research — это агент на основе новой модели OpenAI o3 (ещё не выпущенной публично), оптимизированной для работы с веб-данными и использования Python-скриптов. Он обрабатывает информацию из различных онлайн-источников: текст, изображения и PDF-файлы. Уникальность Deep Research заключается в его способности самостоятельно планировать и выполнять многошаговые поисковые запросы, корректируя свою стратегию по мере получения новых данных. Это не просто поиск информации – это настоящий аналитический процесс.

Посмотрим, как это работает на практике: заказчик описывает необходимую информацию модели, Deep Research задает уточняющие вопросы, чтобы сузить область поиска, затем начинается автономный поиск. В боковой панели отображается ход исследования с указанием источников и этапов работы. Результатом становится детальный отчет, готовый к использованию – фактически, полноценное исследование на уровне профессионального аналитика.

image

Deep Research ориентирован на профессионалов – аналитиков финансовых рынков, ученых, политических стратегов и инженеров — которым необходим быстрый доступ к точной и достоверной информации из множества источников. Однако функция полезна не только специалистам: Deep Research незаменим при планировании крупных покупок (автомобиль, недвижимость), когда необходимо провести тщательный анализ рынка перед принятием решения. Полная прозрачность процесса – цитирование всех источников данных и подробное описание логики поиска — гарантируют высокую степень доверия к полученным результатам.

Использование Deep Research интуитивно понятно: вы выбираете опцию «Deep research», вводите свой запрос и можете прикрепить необходимые файлы (например для добавления контекста). После запуска запроса модель начинает работу. О завершении вы получите уведомление. В ближайшем будущем OpenAI планирует добавить в отчеты визуальные элементы: изображения, графики и таблицы для более удобного восприятия информации.

Внутренние испытания показали впечатляющие результаты: на бенчмарке Humanity's Last Exam модель достигла 26,6% точности при использовании веб-браузера и Python-скриптов.

image

Это ощутимо выше показателей других моделей (например GPT-4o показал всего 3.3%). Стоит отметить также методологию тестирования "Humanity's last exam", где модель имела доступ к внешним инструментам (веб поиск + python). На GAIA – публичном бенчмарке для оценки ИИ по реальным задачам — Deep Research установил новый рекорд точности (72%), превзойдя по результатам предыдущего лидера более чем на 8%.

image

Глубокий анализ результатов задачи третьего уровня сложности продемонстрировал поразительные 58% успешных ответов против 42% у предыдущего рекордсмена. Графики корреляции между экономической ценностью задачи/временем работы/обращением к инструментам указывают на неожиданную тенденцию – чем быстрее исследование выполняется, тем выше его качество, но это связано с корреляцией между сложностью задачи и её экономической значимостью: чем сложнее задача, тем больше время требуется для исследования, а следовательно, и вероятность ошибки выше.

image

Интересно отметить, что аналогичная функция под названием Deep Research появилась в Gemini Advanced от Google еще в декабре 2024 года. Однако релиз от Google прошел значительно тише, чем громкий анонс OpenAI. Google использует модель Gemini 1.5 Pro, что теоретически должно давать менее качественные результаты по сравнению с моделью o3 от OpenAI .

image

Deep Research – это технология на стадии развития, модель может иногда допускать неточности или ошибочные выводы . Однако по сравнению с существующими моделями ChatGPT, уровень ошибок существенно снижен (согласно внутренним оценкам). На данный момент существуют ограничения по количеству запросов для различных платных опций ChatGPT(сначала Pro) + план постепенного расширения доступа к функции для пользователей Plus/Team и Enterprise

OpenAI планирует дальнейшее развитие функции: расширение доступа к специализированным источникам данных, интеграцию с другими агентами, например Operator (для выполнения действий в реальном мире), и расширение функционала до мобильных приложений.

Deep Research демонстрирует значительный прогресс в развитии ИИ-агентов – это мощный инструмент для решения комплексных исследовательских задач. Хотя функция все еще находится на этапе активной разработки, её потенциал уже сейчас впечатляет, открывая новые возможности как для профессионалов, так и для рядовых пользователей.

Источники:

18
18комментариев