ИИ ускоряет задачи, но не рост компаний

Генеративный ИИ действительно ускоряет выполнение многих задач, и это подтверждают многочисленные исследования. Однако разрыв между более быстрым выполнением отдельных задач и заметным экономическим эффектом для компаний и экономики в целом пока сохраняется.

Как пишет THE DECODER в выпуске Frontier Radar о влиянии ИИ на производительность, проблема часто заключается не в отсутствии локального эффекта, а в том, что этот эффект слабо переносится на уровень всей организации. Этому мешают затраты на проверку результатов, слабые системы измерения производительности в интеллектуальном труде и медленные изменения внутри компаний.

На уровне отдельных задач данные выглядят убедительно. В клиентской поддержке исследование в Quarterly Journal of Economics показало, что после внедрения генеративного ИИ число решённых обращений в час выросло примерно на 14–15%. Наибольшую выгоду получили менее опытные сотрудники.

В 2023 году Ной и Чжан также показали, что ChatGPT заметно сокращает время выполнения профессиональных письменных задач и в среднем повышает качество результата.

В разработке ПО картина похожая. Раннее исследование GitHub Copilot зафиксировало ускорение на 55,8% при выполнении чётко заданной задачи по программированию. В трёх полевых экспериментах в Microsoft, Accenture и одной компании из списка Fortune 100 число завершённых задач с ИИ выросло в среднем примерно на 26%. В рандомизированном эксперименте Google разработчики работали до 20% быстрее.

Автор материала отмечает, что часть этих исследований проводилась на более слабых моделях. С тех пор появились специализированные инструменты для программирования, включая Claude Code, а также более сильные модели вроде Claude Opus 4.6 и GPT-5.4-Thinking. По оценке Андрея Карпати, к концу 2025 года кодирующие модели вышли на новый уровень возможностей.

При этом методическая сила таких исследований одновременно показывает и их пределы. Обычно они измеряют то, что проще всего посчитать: время выполнения, объём работы в час или качество стандартизированного результата. Чем уже задача, тем яснее итог. Но если сотрудник стал быстрее закрывать обращение, это ещё не значит, что вся команда или компания стала настолько же продуктивнее.

Работа редко состоит из одного действия. Обычно это цепочка подзадач, согласований, ожиданий, уточнений и технических пауз. Поэтому впечатляющий результат на одной узкой операции может дать лишь ограниченный суммарный эффект, если узкое место находится в другом месте процесса.

Эту проблему показывает эксперимент Microsoft и NBER. Исследователи изучали 66 компаний и 7137 сотрудников умственного труда в рандомизированной постановке. Во второй половине шестимесячного исследования активные пользователи ИИ сократили примерно два часа в неделю на работу с электронной почтой и реже работали вне основного времени. Но авторы не нашли явных признаков того, что освобождённое время перешло в другие полезные задачи или что структура работы заметно изменилась.

В разработке ПО разрыв между возможностями модели и реальным процессом виден особенно хорошо. В 2025 году METR сообщила, что опытные разработчики open source при использовании ИИ на знакомых задачах в среднем работали на 19% медленнее.

Позднее, в феврале 2026 года, METR пересмотрела часть результатов. Новые сырые данные уже указывали скорее на ускорение, поскольку сами инструменты стали лучше. Но и этот вывод сопровождался оговорками: чем полезнее ИИ, тем глубже разработчики встраивают его в повседневную работу, а значит, подобрать корректную контрольную группу становится труднее.

Похожие выводы дают и бенчмарки для ИИ-агентов. В тесте APEX-Agents, который включает длинные задачи с активным использованием инструментов в инвестбанкинге, консалтинге и праве, лучшая система решает с первой попытки только 24% задач. В FeatureBench сильная модель успешно завершает 11% задач по реализации функций в реальных кодовых базах. В ResearchGym лучший протестированный агент улучшает базовые результаты лишь в 1 из 15 запусков и в среднем выполняет 26,5% подзадач.

Такие тесты показывают, как система ведёт себя в специально собранной среде. Но перенос этих результатов в обычную рабочую практику остаётся открытым вопросом, потому что реальные задачи менее стандартизированы, контекст меняется, а цена ошибок выше.

Отдельная проблема — измерение производительности в интеллектуальном труде. В производстве её относительно просто считать по выпуску, браку или времени цикла. У аналитиков, продукт-менеджеров и юристов нет единых стандартных единиц выпуска: их вклад часто выражается в решениях, согласовании действий и снижении рисков.

Как отмечается в широко цитируемом обзоре по измерению производительности работников умственного труда, универсальной метрики здесь нет. Для разных типов работы нужны разные сочетания количества, качества, уместности и итогового эффекта.

При этом компании обычно собирают много данных об активности: число писем, протоколы встреч, обработанные тикеты, время ответа. По данным Deloitte, 60% опрошенных руководителей используют именно такие показатели как меру производительности. Но сотрудники в среднем тратят 32% времени на демонстративную занятость, которая делает работу заметной, но не обязательно повышает полезный результат.

Если компания раньше не отслеживала, как меняются длительность процессов, частота ошибок и экономический вклад целых рабочих цепочек, то и влияние ИИ она надёжно измерить не сможет. В таком случае остаются отдельные примеры или качественные описания.

Есть и проблема стимулов. Генеративный ИИ сначала часто повышает видимый объём работы: больше черновиков, писем, закрытых тикетов, предложений кода. Эти числа легко вывести на дашборд, поэтому они быстро попадают в отчёты и презентации по окупаемости.

Как пишет исследователь рынка труда Ян Зауэрман, когда конкретные наблюдаемые метрики начинают влиять на оценку сотрудников и стимулы, люди начинают оптимизировать именно эти показатели. В случае ИИ это значит, что компании лучше считают ускорившийся выпуск, но не обязательно лучше понимают его экономическую ценность.

Из-за этого часто путают output и outcome, то есть объём произведённого и реальный результат. Если команда с ИИ делает вдвое больше черновиков, писем или подсказок к коду, это больше продукции. Но ценность появляется только тогда, когда эти дополнительные результаты ведут к лучшим решениям, сохраняют качество или повышают прибыль.

Опрос Федерального резервного банка Сент-Луиса показывает масштаб разрыва. Среди тех, кто реально использует генеративный ИИ, экономия времени составляет в среднем около 5,4% рабочего времени. Если распределить это на всю рабочую силу, показатель снижается до 1,4% всех часов.

Авторы выводят из этого потенциальный прирост производительности примерно на 1,1%, но подчёркивают: неясно, когда и появится ли этот эффект в официальных данных. Если не менять процессы, цели и распределение обязанностей, сэкономленное время может просто раствориться в буферах, паузах и дополнительной коммуникации.

Самую жёсткую проверку, по версии THE DECODER, даёт датское исследование на данных реестров Андерса Хумлума и Эмили Вестергор. Авторы сопоставили опросы об использовании ИИ с административными данными рынка труда и не нашли эффекта на доходы и учтённые рабочие часы через два года после появления чат-ботов. При этом они зафиксировали изменения в составе задач и профессиональной мобильности.

Более позитивную картину показывает европейское исследование компаний под руководством Альдасоро. Оно указывает, что внедрение ИИ повышает производительность труда в среднем на 4% и не вызывает краткосрочного снижения занятости. Но эффект сильнее в средних и крупных компаниях, а также там, где уже были вложения в ПО, данные и обучение сотрудников.

Оценки Penn Wharton, OECD и Anthropic также не обещают резкого скачка. Они ожидают вклад в производительность от нескольких десятых долей процента до примерно одного процентного пункта в год в зависимости от страны и сценария. Причина проста: ИИ затрагивает лишь часть работы, глубоко встроен пока лишь в часть компаний, а в ценность превращается лишь часть сэкономленного времени.

Есть и скрытые издержки. Центральная слабость многих обсуждений производительности — внимание к валовому выигрышу без учёта чистого результата. Инструмент может сэкономить пять минут на написании текста, но затем потребовать десять минут на проверку, редактирование и контроль качества.

Поскольку генеративный ИИ работает вероятностно, часть нагрузки возникает уже после ответа модели. Речь идёт о верификации, постредактировании и проверке качества.

BCG в исследовании AI Brain Fry описывает когнитивное истощение, которое возникает из-за постоянного контроля и оценки нескольких ИИ-систем. По опросу 1488 работников в США, около 14% пользователей ИИ сообщили о таких симптомах.

BetterUp и Stanford Social Media Lab описывают другой эффект — Workslop. Так называют контент, созданный ИИ, который выглядит правдоподобно по форме, но остаётся слабым по сути и требует дальнейшей доработки. В их опросе 40% работников сообщили, что получали такой результат за последний месяц. На разбор одного такого случая в среднем уходит почти два часа.

Долгосрочные издержки затрагивают и обучение. Исследование Anthropic с участием 52 разработчиков показало: активное использование ИИ при освоении новой библиотеки слегка ускоряло работу, но приводило к результатам на тесте знаний хуже на 17%. При этом разработчики, которые использовали ИИ для объяснений, учились заметно лучше, чем те, кто в основном передавал модели выполнение задач.

Ещё один риск связан с самооценкой. Исследование в Computers in Human Behavior показало, что ChatGPT повышает результаты в задачах на рассуждение, но одновременно искажает оценку собственных навыков. Пользователи работали лучше, но систематически переоценивали свою компетентность.

К этому добавляются расходы на внедрение, совместимость, управление рисками и юридическую защиту процессов. Встраивание модели в инфраструктуру компании в безопасной и проверяемой форме требует значительных ресурсов, но эти затраты редко учитывают в публичных обсуждениях производительности.

THE DECODER предлагает ставить вопрос иначе: важна не только скорость выполнения отдельной задачи, а то, как меняется весь процесс и какие из этих изменений создают экономическую ценность. Освобождённое время становится продуктивным только тогда, когда его направляют на полезную работу, а не теряют в повседневной рутине.

Издание считает базовым сценарием постепенное распространение ИИ в рабочих процессах в ближайшие два-три года без глубокого пересмотра процессов, систем измерения и стимулов. В таком случае локальная экономия времени сохранится, но значительная её часть будет уходить в буферы, дополнительную коммуникацию и занятость ради видимости.

В более быстром сценарии, по оценке авторов, нужны более стабильные модели, системный пересмотр процессов внутри компаний и общие стандарты оценки ИИ-помощи в работе. Тогда в наиболее цифровых секторах прирост производительности на уровне компании мог бы составить 3–5% в год.

Пока же общий вывод остаётся таким: генеративный ИИ приносит измеримую выгоду на уровне отдельных задач, но путь от этой локальной эффективности к заметному эффекту в отчётности компаний и макроэкономике остаётся длинным. Главным ограничением выступают не только возможности моделей, но и то, как медленно организации перестраивают процессы, метрики и систему ответственности.

Источник: THE DECODER, выпуск Frontier Radar #2.

Оцените статью
Gimal-Ai