Стартап Perceptron представил модель Mk1 для глубокого анализа видео
Компания Perceptron анонсировала выпуск своей флагманской мультимодальной модели Mk1, способной в режиме реального времени понимать происходящее на видеопотоке. Разработка ориентирована на промышленный сектор и крупные организации, которым требуется автоматизированный контроль объектов, анализ действий персонала или обработка контента.
Преимущества и ценовая политика
Ключевым преимуществом модели стала её экономическая эффективность. Стоимость использования через программный интерфейс (API) составляет 0,15 доллара за миллион входящих токенов и 1,5 доллара за миллион исходящих. Это на 80–90% дешевле, чем у ведущих рыночных конкурентов, таких как GPT-5 от OpenAI, Claude Sonnet 4.5 от Anthropic* и Gemini 3.1 Pro от Google. По оценкам экспертов, модель успешно конкурирует с лидерами отрасли по качеству логических выводов, сохраняя при этом ценовые показатели бюджетных версий ИИ.
Технические возможности и физическое мышление
Модель Mk1 отличается способностью обрабатывать видеопоток с частотой до 2 кадров в секунду в рамках контекстного окна объемом 32 тысячи токенов. В отличие от традиционных систем, которые анализируют видео как набор статичных кадров, Mk1 учитывает временную непрерывность, что позволяет отслеживать объекты даже при их временном перекрытии другими предметами.
Особое внимание разработчики уделили так называемому физическому мышлению. Система способна анализировать динамику объектов и законы физики:
- Точное определение последовательности событий в пространстве и времени.
- Чтение данных с аналоговых датчиков и циферблатов, что ранее было труднодоступно для цифровых систем.
- Высокоточный подсчет объектов в сложных и плотных сценах.
- Распознавание исторических кадров и контекстуальный анализ видеоматериалов начала XX века.
Экосистема для разработчиков
Вместе с моделью компания представила набор инструментов (SDK) на языке Python, включающий специализированные функции для автоматизации:
- Focus: автоматическое кадрирование и приближение на нужных объектах по текстовому запросу.
- Counting: оптимизированный подсчет предметов в сложных условиях.
- In-Context Learning: возможность дообучения модели «на лету» с помощью предоставления нескольких примеров без необходимости полной перенастройки системы.
Стратегия развития
Perceptron придерживается гибридного подхода к распространению технологий. Флагманская модель Mk1 доступна исключительно как закрытое решение через API, обеспечивающее корпоративную безопасность. Параллельно компания развивает открытую линейку моделей Isaac, оптимизированных для работы на периферийных устройствах с минимальной задержкой отклика. Данная стратегия позволяет поддерживать как сообщество разработчиков открытого ПО, так и крупных промышленных заказчиков, нуждающихся в максимальном контроле инфраструктуры.
Основателями стартапа, базирующегося в Белвью, штат Вашингтон, являются Армен Агаджанян и Акшат Шривастава — бывшие исследователи из лаборатории ИИ компании Meta*. Их предыдущие наработки в области создания моделей, способных понимать смешанные потоки текста и изображений, легли в основу архитектуры нового продукта.
* — деятельность компании запрещена на территории РФ
