Вчера в 11:08

ИИ вытесняет квалифицированные задачи, оставляя человеку рутину — неожиданные итоги исследования Anthropic

Изображение: recraft

Компания Anthropic представила 4-ю часть своего экономического индекса, основанную на анализе 2 млн сессий взаимодействия с моделью Claude. В этот раз исследователи предложили пять новых параметров для оценки того, как генеративный ИИ влияет на экономику. Один из выводов оказался особенно неожиданным: интеллектуальная система берет на себя сложные, квалифицированные задачи, в то время как менее интересная и однообразная работа остаётся людям.

Команда проанализировала уровень сложности запросов и ответов, используя два критерия — число лет формального образования, необходимого для понимания запроса, и аналогичный показатель для восприятия ответа.

Эти значения оказались практически идентичны по корреляции (r выше 0,92), что указывает на прямую зависимость между качеством формулировки задания и глубиной ответа модели. Исследователи пояснили, что чем выше когнитивный уровень запроса, тем точнее и содержательнее результат.

На этом фоне становится яснее ещё одно наблюдение. Время выполнения сложных задач с участием Claude сокращается гораздо заметнее, чем у задач базового уровня.

Те, что требуют университетской подготовки, ускоряются примерно в 12 раз, тогда как задачи, соответствующие школьной программе, лишь в 9 раз. Среднестатистическая работа в экономике требует 13 лет учёбы, а те задачи, с которыми пользователи обращаются к Claude, соответствуют 14 годам. То есть на практике ИИ активнее осваивает именно квалифицированные задачи, оставляя рутину исполнителю.

В попытке смоделировать последствия такого перераспределения, специалисты исключили из разных профессий всё, что уже умеет выполнять Claude. Картина получилась неоднозначной. Так, сотрудники турсферы могут потерять аналитическую часть своей работы — составление маршрутов, подбор условий и расчёт стоимости поездок.

Их участие сведётся к действиям, требующим меньшей вовлечённости: оформлению документов, приёму оплаты, подтверждению заявок. Аналогичная ситуация наблюдается у технических писателей: уходит необходимость в отраслевом анализе и оценке документации, остаётся шаблонное оформление инструкций.

Авторы отчёта делают важное уточнение. Наиболее интеллектуально насыщенные запросы сопровождаются более высокой вероятностью ошибки со стороны Claude. Если в случае простых задач успешность достигает 70%, то на уровне, требующем университетской подготовки, показатель падает до 66%. А для сценариев, на выполнение которых у человека ушло бы порядка 3,5 часов, модель показывает уверенный результат лишь в половине случаев. Это означает, что без человеческой проверки надёжность снижается, а значит, эксперты по-прежнему остаются необходимыми участниками процесса.

Автор: Артем

Представитель редакции CISOCLUB. Пишу новости, дайджесты, добавляю мероприятия и отчеты.

Комментарии: