Растущие расходы на ИИ-агентов: почему бизнес не может предсказать итоговый чек
Внедрение автономных агентов на базе искусственного интеллекта сопряжено с серьезным вызовом — непредсказуемостью затрат. Новое исследование экспертов из Мичиганского и Стэндфордского университетов, а также специалистов из Google DeepMind и Microsoft показало, что использование таких систем может обходиться в тысячи раз дороже, чем обычное общение с чат-ботами.
Ключевые выводы исследования
В отчете под названием «Как ИИ-агенты тратят ваши деньги?» впервые системно анализируется потребление токенов — базовых единиц информации (частей слов или знаков препинания), за которые разработчики моделей взимают плату. В обзоре выделяются следующие основные проблемы:
- Расход токенов при использовании агентов в 3500 раз превышает затраты на простые запросы в ChatGPT.
- Поведение агентов нестабильно: выполнение одной и той же задачи дважды может привести к двукратному изменению стоимости.
- ИИ-модели систематически недооценивают объем ресурсов, необходимых для решения поставленной проблемы.
- Увеличение вычислительных затрат не всегда гарантирует успешный результат.
Проблема прозрачности ценообразования
Такие компании, как OpenAI, Google и Anthropic, предоставляют прайс-листы за количество токенов, однако они не дают представления о финальной стоимости решения конкретной бизнес-задачи. По словам исследователей, агенты часто попадают в цикл бесконечных попыток решения проблемы, продолжая потреблять ресурсы даже в тех случаях, когда задача невыполнима. У моделей отсутствует надежный механизм ранней остановки, что ведет к накоплению расходов без прогресса в работе.
Для анализа использовалась платформа OpenHands и бенчмарк SWE-Bench, имитирующий реальные задачи по программированию из репозиториев GitHub. В ходе тестирования выяснилось, что модель Claude 3.5 Sonnet от Anthropic показала высочайшую точность, но при этом потребовала значительно больше токенов. Модели от OpenAI продемонстрировали хороший баланс между ценой и качеством, в то время как разработки других компаний, например китайской Moonshot, показали низкую эффективность при высоких затратах.
Почему входные данные стоят дороже выходных
В отчете отмечается, что в агентских рабочих процессах доминируют затраты на входящие токены (информацию, которую ИИ считывает), а не на исходящие (ответы ИИ). Это происходит из-за того, что агенты постоянно перечитывают контекст задачи, обращаются к базам данных и используют память для координации своих действий.
Особую роль играет чтение кешированных данных. Повторное использование накопленного контекста на каждом этапе работы агента становится основной статьей расходов. В результате соотношение входящих и исходящих данных у агентов гораздо выше, чем у обычных чат-ботов.
Рекомендации по управлению бюджетом
Эксперты отмечают, что текущая ситуация на рынке ИИ-услуг перекладывает все риски на конечного пользователя. Для минимизации финансовых потерь компаниям рекомендуется:
- Устанавливать жесткие лимиты на использование вычислительных ресурсов для каждого конкретного агента.
- Тщательно контролировать объем контекстного окна и количество инструментов, к которым агент имеет доступ.
- Требовать от поставщиков ИИ более прозрачных механизмов оценки стоимости и гарантий выполнения задач.
В обзоре подчеркивается, что отсутствие предсказуемости мешает корпоративному сектору планировать инвестиции в программное обеспечение. Без внедрения механизмов точного прогнозирования затрат и контроля эффективности, массовое внедрение ИИ-агентов может столкнуться с волной отказов со стороны бизнеса из-за неконтролируемого роста расходов.
