ИИ провалил сертификацию Яндекс.Директ с результатом 48%. Где границы ИИ в 2025 году?

Как ИИ сдал сертификацию Яндекс.Директ вместо меня

129

29.11.2025

Время чтения: ~2 мин.

Распечатать

У меня нет цели становиться директологом. Но мне стало интересно: насколько уже можно доверять искусственному интеллекту в сложных профессиональных задачах? Сертификация Яндекс.Директ показалась идеальным полигоном.

Суть эксперимента: не готовиться, не проверять, не вмешиваться. Я просто брал вопросы из теста, закидывал их в одну из продвинутых языковых моделей и бездумно вносил её ответы в систему. Пусть ИИ сдает экзамен сам за себя. Результат оказался показательным - 29 правильных ответов из 60. Всего 48%. Это даже не «троечка», а честная «два с плюсом». И этот провал - не неудача, а ценнейшие данные. Если современный ИИ, способный писать код и эссе, не может сдать профессиональный тест даже на 50%, о чем это нам говорит?

Почему ИИ не справился? Разбор полетов

Проанализировав ошибки, я увидел четкую картину слабых мест:

Устаревшая информация.

Яндекс.Директ - живая платформа, где интерфейс, правила и функции меняются регулярно. ИИ часто давал ответы, которые были актуальны год или два назад, но сейчас уже не работали.

Иллюзия компетентности.

Некоторые ответы были сформулированы настолько уверенно и гладко, что вызывали полное доверие. Но по сути они были пустыми или общими, не отвечающими на конкретный вопрос с его нюансами.

Фундаментальные ошибки.

В ряде случаев ИИ демонстрировал неверное понимание ключевых механизмов рекламной системы. Он комбинировал данные из своей базы так, что получалась убедительная, но совершенно неправильная картина.

Главный вывод: 50% - это потолок доверия к ИИ без человека. Мой эксперимент наглядно показывает: примерно половина информации, которую генерирует ИИ в профессиональных областях, требует обязательной перепроверки экспертом. ИИ - это не замена специалисту, а мощный, но глупый инструмент.

Он гениален как:

Ассистент для черновой работы.
Генератор идей и гипотез.
Помощник в структурировании данных.

Но он неспособен нести ответственность и не обладает актуальным практическим опытом. Он не видит разницы между статьей в блоге за 2022 год и последним обновлением в интерфейсе за прошлый месяц.

Финал истории: победил человек!!!

Этот эксперимент лишний раз доказывает - наша ценность в эпоху ИИ - не в том, чтобы бездумно копировать его результаты, а в том, чтобы уметь их анализировать, проверять, критически осмыслять и применять с учетом реального контекста. ИИ отлично справляется с задачками «на троечку». Но всё, что должно работать на отлично, требует человеческого глаза, экспертизы и здравого смысла.

Как ИИ сдал сертификацию Яндекс.Директ вместо меня

Почему ИИ не справился? Разбор полетов

Читать еще