Deep Research: ИИ, сдавший "Последний экзамен человечества"

06.02.2025

Компания OpenAI совершила новый прорыв в области искусственного интеллекта, представив Deep Research – систему, способную решать невероятно сложные задачи, требующие многоступенчатого исследования. В недавнем тестировании на бенчмарке "Последний экзамен человечества" (Humanity’s Last Exam), одном из самых жестких испытаний для ИИ, Deep Research продемонстрировал поразительную точность – 26,6%. Это значительно превосходит результаты предыдущих моделей, таких как o3-mini (13%) и DeepSeek-R1 (9,4%), и подтверждает революционный характер нового инструмента.

"Последний экзамен человечества" – это не просто тест на знание фактов. Он включает более 3000 вопросов с вариантами ответов по 100 различным предметам – от высокоспециализированных областей, таких как ракетостроение и лингвистика, до гуманитарных наук, литературы и экологии. Успех Deep Research говорит о его способности не только накапливать и обрабатывать информацию, но и действительно понимать и анализировать разнообразные области знаний.

Deep Research работает поэтапно, планируя свои действия и корректируя подход на основе полученных данных. Пользователь может загружать различные типы файлов, от изображений до PDF-документов и электронных таблиц, для более точного анализа. Процесс может занять от 5 до 30 минут, а результаты представляются в формате чата с подробным описанием использованной методологии.

Появление Deep Research – это значительное событие в мире ИИ. Он открывает новые возможности для исследователей и решения сложных задач в самых различных областях. Остается только подождать, какие еще прорывы принесет нам эта удивительная система.

Источник