Растущие расходы на ИИ-агентов: почему бизнес не может предсказать итоговый чек

Растущие расходы на ИИ-агентов: почему бизнес не может предсказать итоговый чек

Внедрение автономных агентов на базе искусственного интеллекта сопряжено с серьезным вызовом — непредсказуемостью затрат. Новое исследование экспертов из Мичиганского и Стэндфордского университетов, а также специалистов из Google DeepMind и Microsoft показало, что использование таких систем может обходиться в тысячи раз дороже, чем обычное общение с чат-ботами.

Ключевые выводы исследования

В отчете под названием «Как ИИ-агенты тратят ваши деньги?» впервые системно анализируется потребление токенов — базовых единиц информации (частей слов или знаков препинания), за которые разработчики моделей взимают плату. В обзоре выделяются следующие основные проблемы:

  • Расход токенов при использовании агентов в 3500 раз превышает затраты на простые запросы в ChatGPT.
  • Поведение агентов нестабильно: выполнение одной и той же задачи дважды может привести к двукратному изменению стоимости.
  • ИИ-модели систематически недооценивают объем ресурсов, необходимых для решения поставленной проблемы.
  • Увеличение вычислительных затрат не всегда гарантирует успешный результат.

Проблема прозрачности ценообразования

Такие компании, как OpenAI, Google и Anthropic, предоставляют прайс-листы за количество токенов, однако они не дают представления о финальной стоимости решения конкретной бизнес-задачи. По словам исследователей, агенты часто попадают в цикл бесконечных попыток решения проблемы, продолжая потреблять ресурсы даже в тех случаях, когда задача невыполнима. У моделей отсутствует надежный механизм ранней остановки, что ведет к накоплению расходов без прогресса в работе.

Для анализа использовалась платформа OpenHands и бенчмарк SWE-Bench, имитирующий реальные задачи по программированию из репозиториев GitHub. В ходе тестирования выяснилось, что модель Claude 3.5 Sonnet от Anthropic показала высочайшую точность, но при этом потребовала значительно больше токенов. Модели от OpenAI продемонстрировали хороший баланс между ценой и качеством, в то время как разработки других компаний, например китайской Moonshot, показали низкую эффективность при высоких затратах.

Почему входные данные стоят дороже выходных

В отчете отмечается, что в агентских рабочих процессах доминируют затраты на входящие токены (информацию, которую ИИ считывает), а не на исходящие (ответы ИИ). Это происходит из-за того, что агенты постоянно перечитывают контекст задачи, обращаются к базам данных и используют память для координации своих действий.

Особую роль играет чтение кешированных данных. Повторное использование накопленного контекста на каждом этапе работы агента становится основной статьей расходов. В результате соотношение входящих и исходящих данных у агентов гораздо выше, чем у обычных чат-ботов.

Рекомендации по управлению бюджетом

Эксперты отмечают, что текущая ситуация на рынке ИИ-услуг перекладывает все риски на конечного пользователя. Для минимизации финансовых потерь компаниям рекомендуется:

  • Устанавливать жесткие лимиты на использование вычислительных ресурсов для каждого конкретного агента.
  • Тщательно контролировать объем контекстного окна и количество инструментов, к которым агент имеет доступ.
  • Требовать от поставщиков ИИ более прозрачных механизмов оценки стоимости и гарантий выполнения задач.

В обзоре подчеркивается, что отсутствие предсказуемости мешает корпоративному сектору планировать инвестиции в программное обеспечение. Без внедрения механизмов точного прогнозирования затрат и контроля эффективности, массовое внедрение ИИ-агентов может столкнуться с волной отказов со стороны бизнеса из-за неконтролируемого роста расходов.