От бизнес-идеи до работающего домена с SSL, наблюдаемостью, CRM и подтверждённым outcome — без найма команды и погружения в код.
Заказчик не нанимает команду и не разбирается в коде. Он получает продукт с измеримым бизнес-результатом.
AI-агенты не ускорили старый процесс — они его схлопнули. Стадии слились в петлю: намерение → агент → результат → наблюдение → следующее намерение.
Строчка кода больше не стоит часов. Единственное ограничение — качество. Мы не гонимся за 10× velocity, мы строим систему, где каждый этап отточен.
От лендинга для физлица до enterprise-платформы. Драйвер спроса — сокращение ФОТ на IT и радикальное сокращение lead time.
Zero API-затрат на модели. Полный контроль над latency, контекстом и конфиденциальностью данных заказчика. Все модели — open-source, развёрнуты на арендованных GPU.
Единая плоскость управления GPU-флотом с бизнес-метриками на лету: стоимость задачи, маржа, ROI каждого GPU в реальном времени.
Всё сгенерированное — код, тесты, SDD, документация — поступает в Корпус Знаний и используется для снижения стоимости и дообучения моделей.
Каждая стадия процесса отточена, даже если долго и с большим расходом токенов. Скорость — следствие качества, а не цель.
Проверки находятся внутри процесса, а не добавлены постфактум. Review-agent, security gates, evals, outcome check на каждом шаге.
Результат измеряется бизнес-метрикой, а не фактом деплоя. Outcome Hypothesis обязательна для каждой задачи.
| Принцип | Следствие |
|---|---|
| Среда работы агента важнее модели | Конкурентное преимущество — в качестве детерминированного harness'а, не в конкретной LLM. 98.4% кодовой базы — детерминированная логика. |
| Discovery важнее промпта | Качество результата определяется постановкой задачи, а не длиной промпта. PR/FAQ и Outcome Hypothesis обязательны. |
| Валидация важнее скорости | Код без проверки создаёт техдолг со скоростью агента. Review-agent, security gates, evals, outcome check — на каждом шаге. |
| Governance в процессе, не постфактум | Policy Hooks, Codified Guardrails, лестница R0–R5. Человек — только в исключениях. |
| Данные задач — стратегический актив | Всё, что произведено в процессе, переиспользуется. Каждая задача делает следующую дешевле. |
Каждый токен оплачивается вендору. Маржа сжимается линейно с ростом объёма.
Задачи проходят через сторонний API. Compliance-риски, утечка домена.
Модель обновляется вендором, нельзя дообучить под доменную область.
Аренда GPU по годовому контракту. Стоимость токена падает с ростом утилизации.
Данные заказчика не покидают арендованные серверы. Compliance — архитектурно.
Модели дообучаются на успешных задачах. Качество растёт со временем.
Человек формулирует, что изменить в бизнесе и какой результат считать успехом. Всё остальное — зона агентов. Discovery → PR/FAQ → SDD → Outcome Hypothesis.
Агенты превращают SDD в продукт. Паттерн Orchestrator-Workers: Coder, Tester, Reviewer, Security, Docs. Каждый — в изолированной песочнице.
| Шаг | Артефакт | Ответственный |
|---|---|---|
| Формулировка возможности | Что, почему, кто заинтересован | Product Engineer + заказчик |
| PR/FAQ | Желаемое будущее (Amazon Working Backwards) | Discovery-агент + заказчик |
| Outcome Hypothesis | Метрика, target, период, fallback | Product Engineer |
| Адаптация / перепроектирование | Автоматизация vs. переосмысление | Команда |
| Класс применимости агента | deterministic / ai-augmented / ai-native / agentic | Product Engineer |
| Поиск в Корпусе Знаний | Похожие задачи, шаблоны SDD, переиспользуемый код | Retrieval Agent |
| Human-in-the-loop Map | Кто, на каком шаге, по каким критериям валидирует | Product Engineer |
SDD + данные из Корпуса Знаний → машиночитаемый контекст для модели
Безопасный вызов инструментов с соблюдением квот и R-уровня
Фиксация фактического результата (не только намерений модели)
Мандатная проверка через Policy Hooks до применения действий
Только чтение
Генерация без выполнения
Выполнение в dev/staging
Production с авто-проверками
Production + human-on-the-loop
Полная автономия, аудит постфактум
Короткие задачи. Передаём всё как есть.
JSON-форма. До ~30% окна.
Сжатые саммари. До ~60% окна.
progress.md. Длинные сессии.
PDLC Object Model. Multi-session.
Новый ключевой навык: Context Engineering. Не «промпт-инжиниринг», а инженерия памяти агента сквозь сессии и задачи.
| Компонент | Модель | GPU | Примечание |
|---|---|---|---|
| Оркестратор (планирование) | Qwen 3.6 35B A3B (MoE) | 2×A100 | Декомпозиция SDD, multi-agent coordination |
| Coder | Qwen 3.6 27B / DeepSeek R1 Distill 32B | 1×A100 | Генерация кода |
| Coder (лёгкий) | Qwen 3.5 9B / Phi-4 14B | 1×A10/V100 | Простые правки, автокомплит |
| Tester | Qwen 3.6 27B | 1×A100 | Генерация тестов |
| Reviewer | Qwen 3 Coder 480B (MoE) | 4×A100 | Критическое ревью, архитектурный анализ |
| Security | Qwen 3 Coder 480B (MoE) | 4×A100 | SAST-подобный анализ, уязвимости |
| Docs | Qwen 3.5 9B | 1×A10 | Документация |
| Роутинг (классификация) | Qwen 3.6 27B (дообученный) | 1×A100 | Классификация задач |
| Embedding | Qwen 3.6 27B / BGE-M3 | 1×A100 | Векторизация артефактов |
Дообучаемые из петли (§6): Coder · Роутинг · Reviewer — все улучшаются на успешных Outcome Check.
Жёсткое правило: ни одного внешнего SaaS. Софт = open-source. Hardware = наш периметр. Данные = у нас.
immers.cloud, Selectel, Rusonyx — физическое разделение машин. Никаких внешних SaaS.
Покупка серверов + размещение в 2-3 ДЦ. Аренда — резерв на пик.
2 собственных дата-центра. Full-stack суверенитет: GPU, сеть, охлаждение, питание, безопасность.
| Слой | Open-source софт | Где работает |
|---|---|---|
| LLM Runtime | vLLM · Ollama · TGI | Bare-metal GPU |
| Fine-tuning | LLaMA-Factory · axolotl | Bare-metal H100/H200 |
| Оркестрация | Kubernetes (k3s) | Self-hosted кластер |
| База данных | PostgreSQL 17 + Patroni HA | Self-hosted |
| Векторная БД | Qdrant (open-source) | Self-hosted |
| Очереди / шина | RabbitMQ · Apache Kafka | Self-hosted |
| Object Storage | MinIO · Ceph | Self-hosted |
| Observability | Prometheus · Grafana · Loki · Tempo | Self-hosted |
| Git | Gitea · Forgejo | Self-hosted |
| CI/CD | Woodpecker · Drone | Self-hosted |
| Identity / SSO | Keycloak | Self-hosted |
| Secrets | HashiCorp Vault | Self-hosted |
Self-hosted платформа мокирования, тестирования и автоматизации API. mockarty.ru
mock_builder · api_tester · fuzzer · analyzer · db_specialist · crawler · notifier и др. Auto-routing, tool calling, multi-step delegation.
Из OpenAPI · .proto · WSDL · GraphQL · MCP — генерируются standalone-серверы с автономным кэшем.
Инжект failures в K8s. Public API Registry. Drift Detection. Pact Violation Tracking.
| Сценарий | Как работает |
|---|---|
| Генерация моков из SDD | Coder Agent генерирует код → mock_builder из SDD создаёт моки внешних зависимостей (платёжки, CRM, почта, SMS, Kafka, RabbitMQ). |
| API-тестирование | Test Agent прогоняет тесты против продукта + Mockarty. Stateful-моки с Global / Chain / Mock stores для заказов, auth-флоу. |
| Контрактное тестирование | Сверка API продукта с SDD-контрактами. Drift Detection при эволюции продукта. |
| Fuzzing безопасности | Fuzzer Agent — инжект некорректных payloads, проверка на уязвимости, поиск edge-cases. |
| Нагрузочное тестирование | Runner Agent — staged-нагрузка (Ramp VU), APDEX-метрики, поиск bottlenecks. |
| Chaos engineering | Перед production: pod termination, network partitions, service isolation → проверка resilience. |
| Дрифт-мониторинг | После деплоя — непрерывное сравнение API с эталоном. Алерт при дрифте >14%. |
UI, конфигурация, управление моками. Единый источник истины.
Разрешение моков. Горизонтальное масштабирование под нагрузку.
Выполнение тестов, фаззинг, нагрузка. Изолированные песочницы.
Три измерения. Software — open-source. Hardware — наш периметр. Data — всегда у нас.
| Категория | Software | Hardware (H1 → H3) | Данные |
|---|---|---|---|
| GPU inference | vLLM (OSS) | Аренда → колокейшн → свой ДЦ | Наши |
| Agent Runtime | Своя разработка | Наш GPU/CPU | Наши |
| IDP (SDD, R0–R5) | Своя разработка | Self-hosted | Наши |
| Mockarty | Своя разработка | Self-hosted | Наши |
| База данных | PostgreSQL + Patroni | Self-hosted кластер | Наши |
| Векторная БД | Qdrant (OSS) | Self-hosted | Наши |
| Кэш · очереди | Redis · RabbitMQ · Kafka | Self-hosted | Наши |
| CI/CD | Woodpecker · Drone | Self-hosted | Наши |
| Observability | Prometheus · Grafana · Loki | Self-hosted | Наши |
| Object Storage | MinIO · Ceph | Self-hosted | Наши |
| Identity / SSO | Keycloak | Self-hosted | Наши |
| Корпус Знаний | Своя разработка | Self-hosted | Наши |
| Fine-Tuning | LLaMA-Factory + наш Pipeline | Наши H100/H200 | Наши |
Заказ/отмена серверов · Spot vs Reserved pricing · жизненный цикл сервера от Provisioning до Released
Распределение задач по GPU · Affinity rules · Bin-packing · приоритет по R-уровню
GPU temp · power · VRAM · pending queue · ECC errors · throttle events
Предзаказ GPU под прогноз нагрузки · реагирование на пиковые часы
Выбор модели под сложность задачи · routing задач между cold/hot моделями
Spot-арбитраж · выключение неиспользуемых GPU · ночной fine-tuning
Это не «devops-функция» — это первоклассный компонент архитектуры, напрямую влияющий на юнит-экономику каждой задачи.
Заказ у провайдера
Загрузка модели в VRAM
Прогрев кэша (KV, embeddings)
Обработка задач
Завершение текущих
Возврат провайдеру
Метрики Provisioner'а: GPU Procurement Lead Time · GPU Waste Ratio · Spot Eviction Rate.
Для каждой задачи в реальном времени вычисляются полные затраты и маржа.
| Панель | Что показывает |
|---|---|
| Fleet Overview | Общее кол-во GPU, утилизация, стоимость/час, задачи в очереди |
| Per-GPU Drilldown | Сервер: модель, задача, температура, VRAM, стоимость |
| Profitability Heatmap | Какой GPU приносит наибольшую маржу |
| Task Cost Breakdown | GPU + CPU + токены + накладные + маржа в разрезе задачи |
| Model Efficiency | Средняя стоимость токена, throughput, холодные старты |
| Forecast vs Actual | Прогноз затрат на неделю vs факт, алерты при отклонении >15% |
Сервер простаивает >30 мин → модель выгружается из VRAM, сервер переводится в standby (сниженная аренда).
Часы низкой нагрузки (2-6 утра) — освободившиеся GPU автоматически переключаются на fine-tuning задач из очереди.
Простые задачи → Qwen 3.5 9B на A10 (дёшево). Сложные → Qwen 3.6 27B на A100 (дороже, но качественнее).
Если spot-цена падает ниже reserved → Provisioner замещает reserved-серверы на spot, сохраняя контракты на пик.
Векторная база (Qdrant), куда после каждого успешного Outcome Check поступают артефакты задачи.
| Артефакт | Формат | Способ поиска |
|---|---|---|
| SDD (спецификация) | Полный текст | Семантический поиск по описанию задачи |
| Код (реализация) | Файлы с метаданными | Семантический поиск по функциональности |
| Тесты | Property-based + regression | Поиск по тестируемому поведению |
| Документация | Markdown | Семантический поиск |
| Evidence Bundle | Структурированный JSON | Поиск по метрикам качества |
| Outcome Hypothesis (подтверждённые) | Структурированный JSON | Поиск по бизнес-метрике |
| Mockarty артефакты | Моки, тест-сьюты, контракты | Поиск по типу API и протоколу |
similarity > 0.85 → переиспользовать SDD целиком
> 0.70 → архитектурные решения
> 0.50 → похожие тесты / документация
Хэш(SDD + контекст) → поиск в Redis. Если найден — возвращаем закэшированный результат, минуя инференс полностью.
Применимость: Dockerfile, CI/CD pipeline, boilerplate, стандартные формы, CRUD-эндпоинты.
Подтверждённые гипотезы → автопредложение для похожих задач, бенчмаркинг ("медианный uplift для L-задач = 3.2%"), прогноз маржи.
Окно низкой нагрузки (ночь/выходные)
H100/H200 серверы для тренировки
Собирает датасет из Корпуса
Trainer запускает fine-tuning
Held-out тестовый набор
10% флота, сравнение с baseline
Полный rollout или откат
Стоимость задачи: baseline. Начинаем собирать данные.
Стоимость задачи: −12%. Меньше токенов на архитектуру.
Стоимость задачи: −25%. Reuse + fine-tuned модель.
Стоимость задачи: −40%. Накопительный эффект.
Надзор силами ИИ — review-agent, security-agent, guardian-agent. Человек только в исключениях.
Policy Hooks, Codified Guardrails — внутри процесса, а не отдельный шаг постфактум.
R0–R5 динамически подстраивается под класс задачи, зрелость агента и зону риска.
| Точка валидации | Кто | Эскалация |
|---|---|---|
| До запуска агента | Product Engineer | Повтор Discovery |
| Перед merge | Review-Agent + Tech Lead | Отклонение |
| Перед staging | CI/CD gates + Security Agent | Авто-блок |
| Перед production | Release Gate + заказчик | Отложенный релиз |
| +7 дней | Outcome Check | Fallback |
| Угроза | Базовая защита | Mockarty |
|---|---|---|
| Уязвимый код | Security Agent + SAST в CI/CD | Fuzzer Agent — инжект некорректных payloads, поиск уязвимостей |
| Hallucination API | Контракты в SDD + runtime-валидация | Contract Testing + Drift Detection — алерт при расхождении >14% |
| Supply chain | SCA-сканирование, pinned-версии | API Dependencies — мокирование внешних API для изоляции |
| Prompt injection | Input sandboxing + policy hooks | Proxy Mode — инжект задержек, замена заголовков |
| Over-engineering | Review-agent на соответствие классу задачи | APDEX Performance — нагрузочное тестирование выявляет избыточную сложность |
Генерация моков из SDD-контрактов. Регистрация API-контрактов задачи в общем реестре.
Прогон тестов против сгенерированных моков. Сверка с контрактами — нет ли дрифта?
Фаззинг-атака на все эндпоинты. Анализ результатов, классификация уязвимостей.
Pod termination, network partitions. APDEX на целевой нагрузке. Resilience Check — восстанавливается ли система?
Непрерывное сравнение API с контрактами. Алерт при отклонении. Все артефакты → в Корпус Знаний.
Фиксированная аренда распределяется на больше задач — себестоимость единицы падает.
Переиспользование снижает расход токенов на 25-40% к концу года.
Дообученные модели генерируют качественнее и используют меньше токенов.
Tilda Russian = 1.5M пользователей. Это ориентир TAM. При правильной воронке (inbound + agency + perform marketing) массовый сегмент S/M открывается быстро.
Рамп воронки. 700 бесплатных пилотов + 1500 платных по early bird -30%.
Целевая точка. К концу H2 (мес 12) — 22K/мес. Cash-positive на мес 7-8.
Лидер сегмента. 800+ GPU в 2 собственных ДЦ. Запуск Black Box.
| Размер | H1 | H2 | H3 |
|---|---|---|---|
| S · лендинги, боты | 80% | 70% | 60% |
| M · SaaS, админки | 15% | 20% | 22% |
| L · маркетплейсы | 5% | 8% | 12% |
| XL · Enterprise | 0 | 1.5% | 4% |
| 2XL · платформы | 0 | 0.5% | 2% |
| Средневзв. чек | 25.5 тыс ₽ | 44 тыс ₽ | 65 тыс ₽ |
| Категория | H1 | H2 | H3 |
|---|---|---|---|
| Инженерия (Agent, GPU, Data, Platform, QA) | 5 | 27 | 64 |
| Sales (inbound + outbound + Partner) | 1 | 13 | 41 |
| Marketing + Content + Perform | 0 | 6 | 15 |
| Customer Success | 0 | 4 | 12 |
| CEO/CTO + Finance/Ops + Юрист | 2 | 5 | 8 |
| ИТОГО FTE | 8 | 57 | 140 |
| ФОТ gross/мес | 4.4 млн | 27.6 млн | 63.8 млн |
| ФОТ gross/период | 13.2 млн (3 мес) | 331 млн/год | 766 млн/год |
Применяется по умолчанию для не-аккредитованных компаний.
Требует ≥70% ИТ-выручки и средней ЗП ≥ региона. Получается за 1-2 мес.
До 10 лет, лимит выручки 1 млрд ₽/год. Альт.: Иннополис, ИНТЦ МГУ.
| Сценарий | Налог на прибыль | Страховые от ФОТ 331 млн | Чистая прибыль | Маржа |
|---|---|---|---|---|
| A · ОСН | 1 010 млн (25%) | ~99 млн (30%) | ~2.96 млрд ₽ | 60% |
| B · IT-аккредитация | 202 млн (5%) | ~25 млн (7.6%) | ~3.78 млрд ₽ | 77% |
| C · Сколково (лимит 1 млрд исчерпан) | ~1 010 млн | ~46 млн (14%) | ~2.95 млрд ₽ | 60% |
3 месяца · 8 FTE · ~2 200 задач за период (рамп с 100 до 1500/мес). Critical path — построение воронки.
| ФОТ gross (8 чел × 3 мес) | 13.2 млн ₽ |
| GPU аренда (15 серв × 80K × 3) | 3.6 млн ₽ |
| CPU + сеть + бэкапы | 0.9 млн ₽ |
| Маркетинг (агрессивный старт) | 12 млн ₽ |
| Sales (CRM, заказы) | 3 млн ₽ |
| Юр. · ПО · прочее | 3 млн ₽ |
| Итого расходы | 35.7 млн ₽ |
| 700 бесплатных пилотов | 0 ₽ |
| 1 500 платных × 25.5K × 0.7 (early bird) | 26.8 млн ₽ |
| Итого выручка | ~27 млн ₽ |
9 мес · 57 FTE · 105 000 задач за год (рост с 1.5K до 22K/мес) · 250 GPU.
| ФОТ gross (57 чел средн., 9 мес) | 248 млн ₽ |
| GPU инфра (среднее 150 × 80K × 9) | 108 млн ₽ |
| CPU + сеть + хостинг клиентов | 30 млн ₽ |
| Маркетинг агрессивный (CAC ~2K) | 380 млн ₽ |
| Sales + Customer Success | 80 млн ₽ |
| Поддержка + ITSM | 20 млн ₽ |
| Юр. · ПО · офис | 25 млн ₽ |
| Итого расходы | ~891 млн ₽ |
| 105 000 задач × 44K средневзв. | 4 620 млн ₽ |
| Поддержка SLA (~5%) | 230 млн ₽ |
| Enterprise (3-5 шт) | 80 млн ₽ |
| Итого выручка | ~4 930 млн ₽ |
| Сценарий | Чистая прибыль | Маржа |
|---|---|---|
| A · ОСН | ~2.96 млрд | 60% |
| B · IT-аккредитация | ~3.78 млрд | 77% |
| C · Сколково (лимит исчерпан) | ~2.95 млрд | 60% |
12 мес (мес 12-24) · 140 FTE · 540 000 задач/год (рост с 22K до 70K/мес) · 800+ GPU в 2 собственных ДЦ.
| ФОТ gross (140 чел × 12 мес) | 766 млн ₽ |
| GPU инфра (среднее 500 × 100K × 12) | 600 млн ₽ |
| CAPEX свой ДЦ (амортизация 5 лет) | 200 млн ₽ |
| CPU + сеть + хостинг | 150 млн ₽ |
| Маркетинг + perform | 1 500 млн ₽ |
| Sales + Customer Success | 250 млн ₽ |
| Юр. · ПО · офис · прочее | 120 млн ₽ |
| Поддержка + ITSM | 80 млн ₽ |
| Итого | ~3 666 млн ₽ |
| 540K задач × 65K средневзв. | 35 100 млн ₽ |
| Поддержка SLA | 1 800 млн ₽ |
| Enterprise (15-20) | 350 млн ₽ |
| Black Box on-prem | 800 млн ₽ |
| Итого | ~38 050 млн ₽ |
| Сценарий | Чистая прибыль | Маржа |
|---|---|---|
| A · ОСН | ~25.6 млрд | 67% |
| B · IT-аккредитация | ~32.6 млрд | 86% |
| C · Сколково (лимит исчерпан) | ~25.7 млрд | 68% |
С самого начала строим в двух конфигурациях. Одни модели, одни агенты — разные способы доставки.
Облачная платформа в нашем периметре. Заказчик подключается через личный кабинет, присылает идею — получает работающий продукт.
| Клиент | SMB · стартапы · e-commerce · EdTech |
| Размер сделки | 5K – 3M ₽ |
| Time-to-value | 2-14 дней |
| Цикл продажи | 1-14 дней |
| Маржинальность | 70-80% |
| Доля выручки H3 | 65-70% |
Герметичный комплект «под ключ» на инфраструктуре заказчика. Полностью air-gapped — никаких внешних подключений.
| Клиент | Банки · госы · оборонка · телеком · крупный ритейл |
| Размер сделки | 50-500 млн ₽ + 30-100 млн/год |
| Time-to-value | 2-6 месяцев |
| Цикл продажи | 3-12 месяцев |
| Маржинальность | 60-70% (с hardware) |
| Доля выручки H3 | 30-35% |
| Поставка комплекта | от 50 млн ₽ (фикс) |
| Лицензия на ПО | 15-25% от стоимости поставки в год |
| Поддержка 24/7 | от 30 млн ₽/год |
| On-site инженер | от 600 тыс ₽/мес |
| Кастомизация · доработка | 30 тыс ₽/чел-день |
Источники: Tadviser, J'son & Partners, прогноз Минцифры, наша экспертная оценка.
| Сегмент | Объём 2026 | CAGR 2025-2030 |
|---|---|---|
| Заказная разработка ПО (custom dev) | ~550 млрд | 12-15% |
| Цифровизация SMB | ~180 млрд | 18-22% |
| Госзаказ ИТ-разработки | ~320 млрд | 8-10% |
| Enterprise ИТ-разработка | ~400 млрд | 10-12% |
| Итого «прикладная разработка» | ~1 050 млрд | ~12% |
Total Addressable
Cloud: 90-110 млрд
Black Box: 60-70 млрд
Serviceable Available
Cloud: 25 млрд (SaaS-готовые)
Black Box: 15 млрд (регулир.)
Serviceable Obtainable
К году 5 — категорийный лидер РФ + СНГ
| Игрок | Слабость |
|---|---|
| Bolt.new · v0.dev | Только фронтенд, API-модели, нет SLA |
| Replit Agent | Только dev-окружение, нет деплоя |
| Yandex Code Assistant | Подсказки кода, не агент-делатель |
| Cursor · Windsurf | IDE-инструмент, не сервис |
| Игрок | Слабость |
|---|---|
| Cognition (Devin) | Cloud only, API-модели |
| Magic.dev | Cloud only, не для КИИ |
| 1С · Корус · Лига | Классическая разработка людьми |
| Внутренние ИТ-отделы | Нет AI-стека, нет fine-tuning |
| Период | Cloud Platform | Black Box on-prem |
|---|---|---|
| H1 · 0-3 мес | Только Cloud — MVP, пилоты, 5-10 заказчиков | Подготовка documentation, типового SLA, договорной шаблон |
| H2 · 3-12 мес | Активный рост · маркетинг · partner-network · 600+ задач | 1-2 пилот-внедрения у дружественных клиентов |
| H3 · 12-24 мес | Cloud масштаб · 800+ клиентов · cash-positive | 5-10 коммерческих поставок · контракт 50-500 млн каждая |
| H4 · 24+ мес | Cloud — лидер сегмента в РФ | 20+ Black Box в год · 35-40% выручки |
| Роль | Задача | Компетенции |
|---|---|---|
| Product Engineer | Discovery, SDD, валидация | Бизнес-домен, facilitation, Outcome Hypothesis |
| Agent Engineer | Тюнинг агентов, среда исполнения | Context Engineering, Multi-agent, Eval Design |
| Guardian Agent Engineer | Review-agent, Codified Guardrails | Security, SAST/DAST, compliance |
| GPU Fleet Engineer новая | Управление GPU-флотом, Provisioner, Scheduler | K8s, GPU-драйверы, DCGM, Prometheus, автоскейлинг |
| Data & Fine-Tuning Engineer новая | Корпус Знаний, fine-tuning pipeline, датасеты | Vector DB, LoRA/QLoRA, eval design, data quality |
| Quality & Mockarty Engineer новая | API-тестирование, моки, контракты, fuzzing, chaos | Mockarty, контрактное тестирование, APDEX, security testing |
| Platform Engineer | IDP, Agent Runtime, CI/CD, observability | K8s, CI/CD, MCP/A2A |
Discovery + SDD + single-agent. IT-аккредитация с дня 1. Маркетинг под рост.
Multi-agent, Корпус Знаний, 1-й fine-tuning, agency-partners, Black Box-prep.
L4 long-running, Black Box-продажи, региональная экспансия, лидер сегмента.
Аренда первых GPU, развёртывание inference (vLLM), GPU Fleet Control Plane (Provisioner + Scheduler minimal)
PR/FAQ-агент, Outcome Hypothesis-шаблон
Шаблоны SDD, валидация R-уровня, бюджет токенов
Single-agent (code + test + review + docs) · Интеграция Mockarty: моки из SDD, API-тестирование, контрактные проверки
Сохранение артефактов, baseline-поиск
Per-task cost, GPU utilisation dashboard
2-3 заказчика, сбор Outcome Hypothesis
| Антипаттерн | Защита |
|---|---|
| ⚠️ Coding-Only AI | Discovery + Eval начиная с H1 |
| ⚠️ SDD без Discovery | Template enforcement в IDP |
| ⚠️ Ручное управление GPU | GPU Fleet Control Plane с H1 |
| ⚠️ Игнорирование Корпуса Знаний | Сохранение артефактов с первой задачи |
| ⚠️ Никогда не дообучать | Fine-Tuning Pipeline с H2 |
| ⚠️ Vendor Lock-in (API-модели) | Свой inference с нуля |
| Outcome Validation Rate | >70% |
| CSAT | >4.5/5 |
| Repeat Rate | >40% |
| Себестоимость задачи (S) | <2 500 ₽ |
| Маржа (средняя) | >50% |
| GPU Utilisation | >70% |
| GPU Waste Ratio | <10% |
| Task Queue Depth (P95) | <3 |
| Cold Start Latency (P95) | <30с |
| Spot Eviction Rate | <5% |
| Corpus Reuse Rate | >30% |
| Token Cost Reduction | >25% |
| Fine-Tune Quality Gain | >5% |
| Corpus-to-Model Latency | <48ч |
| Model Drift Incidents | 0 |
| Regression Rate / 100 деплоев | <2 |
| Contract Drift Rate | <5% |
| Fuzzing Coverage | 100% |
| Mock Accuracy | >98% |
| APDEX Score (staging) | >0.85 |
Zero API-затрат · полный контроль
Open-source софт · наш периметр · zero внешних
Единая плоскость · бизнес-метрики на лету
Reuse · −25-40% затрат · fine-tuning
10 протоколов · 11 AI-агентов · уже готово
Cloud (65%) + Black Box (35%) · одна база
Налог 5% · страховые 7.6% · НДС 0%
При воронке 10K задач/мес @ мес 6 + IT-аккредитация
Не очередной AI-помощник для разработчиков.
Производственная линия, превращающая идею в подтверждённый бизнес-результат.
Спасибо. ESC для оглавления