◆ Архитектурный документ · v2.1 · май 2026

Dark Factory. Фабрика IT-продуктов под ключ.

От бизнес-идеи до работающего домена с SSL, наблюдаемостью, CRM и подтверждённым outcome — без найма команды и погружения в код.

10K задач/мес @ мес 6 Self-hosted всё Cloud + Black Box ROI ~9 мес

Резюме для руководства

Не очередной AI-инструмент. Производственная линия результатов.

Заказчик не нанимает команду и не разбирается в коде. Он получает продукт с измеримым бизнес-результатом.

⚡

SDLC мёртв

AI-агенты не ускорили старый процесс — они его схлопнули. Стадии слились в петлю: намерение → агент → результат → наблюдение → следующее намерение.

🎯

Качество, не скорость

Строчка кода больше не стоит часов. Единственное ограничение — качество. Мы не гонимся за 10× velocity, мы строим систему, где каждый этап отточен.

🏭

Реальный бизнес, не айтишники

От лендинга для физлица до enterprise-платформы. Драйвер спроса — сокращение ФОТ на IT и радикальное сокращение lead time.

Что нового в v2.1

Три отличия, которые меняют экономику и качество

01 · Inference

Свой inference с нуля

Zero API-затрат на модели. Полный контроль над latency, контекстом и конфиденциальностью данных заказчика. Все модели — open-source, развёрнуты на арендованных GPU.

API-стоимость

0 ₽

02 · GPU Fleet

Сотни серверов под контролем

Единая плоскость управления GPU-флотом с бизнес-метриками на лету: стоимость задачи, маржа, ROI каждого GPU в реальном времени.

Управление

200+

GPU к 24 мес

03 · Data Loop

Петля переиспользования

Всё сгенерированное — код, тесты, SDD, документация — поступает в Корпус Знаний и используется для снижения стоимости и дообучения моделей.

Снижение затрат к 12 мес

−40%

Философия

SDLC мёртв — да здравствует непрерывная петля

«AI agents didn't make the SDLC faster. They killed it.» — Boris Tane, 2026

1 · Отточенные стадии

Каждая стадия процесса отточена, даже если долго и с большим расходом токенов. Скорость — следствие качества, а не цель.

2 · Встроенные проверки

Проверки находятся внутри процесса, а не добавлены постфактум. Review-agent, security gates, evals, outcome check на каждом шаге.

3 · Бизнес-метрика

Результат измеряется бизнес-метрикой, а не фактом деплоя. Outcome Hypothesis обязательна для каждой задачи.

1.2

Пять архитектурных принципов

Принцип	Следствие
Среда работы агента важнее модели	Конкурентное преимущество — в качестве детерминированного harness'а, не в конкретной LLM. 98.4% кодовой базы — детерминированная логика.
Discovery важнее промпта	Качество результата определяется постановкой задачи, а не длиной промпта. PR/FAQ и Outcome Hypothesis обязательны.
Валидация важнее скорости	Код без проверки создаёт техдолг со скоростью агента. Review-agent, security gates, evals, outcome check — на каждом шаге.
Governance в процессе, не постфактум	Policy Hooks, Codified Guardrails, лестница R0–R5. Человек — только в исключениях.
Данные задач — стратегический актив	Всё, что произведено в процессе, переиспользуется. Каждая задача делает следующую дешевле.

1.3

Экономика собственного inference

API-модели

Переменные затраты

Каждый токен оплачивается вендору. Маржа сжимается линейно с ростом объёма.

API-модели

Чужие данные

Задачи проходят через сторонний API. Compliance-риски, утечка домена.

API-модели

Чёрный ящик

Модель обновляется вендором, нельзя дообучить под доменную область.

Свой inference

Фиксированные затраты

Аренда GPU по годовому контракту. Стоимость токена падает с ростом утилизации.

Свой inference

Полный контроль

Данные заказчика не покидают арендованные серверы. Compliance — архитектурно.

Свой inference

Fine-tuning

Модели дообучаются на успешных задачах. Качество растёт со временем.

Точка окупаемости. При 1000 задач/мес × 300K токенов: Claude Sonnet ≈ $900/мес только output. Один сервер 2×A100 на immers.cloud — ~32 тыс ₽/мес и обслуживает ~400 задач/мес. Свой inference выгоднее API уже от 500 задач/мес.

2 · Жизненный цикл

Двухпетлевая модель Intent + Implementation

Intent Loop · Цикл намерения

Человек формулирует, что изменить в бизнесе и какой результат считать успехом. Всё остальное — зона агентов. Discovery → PR/FAQ → SDD → Outcome Hypothesis.

Implementation Loop · Цикл реализации

Агенты превращают SDD в продукт. Паттерн Orchestrator-Workers: Coder, Tester, Reviewer, Security, Docs. Каждый — в изолированной песочнице.

2.1.1

Discovery sub-loop — постановка важнее промпта

Шаг	Артефакт	Ответственный
Формулировка возможности	Что, почему, кто заинтересован	Product Engineer + заказчик
PR/FAQ	Желаемое будущее (Amazon Working Backwards)	Discovery-агент + заказчик
Outcome Hypothesis	Метрика, target, период, fallback	Product Engineer
Адаптация / перепроектирование	Автоматизация vs. переосмысление	Команда
Класс применимости агента	deterministic / ai-augmented / ai-native / agentic	Product Engineer
Поиск в Корпусе Знаний	Похожие задачи, шаблоны SDD, переиспользуемый код	Retrieval Agent
Human-in-the-loop Map	Кто, на каком шаге, по каким критериям валидирует	Product Engineer

Ключевое: SDD без Discovery = длинное техзадание без стратегического смысла. Discovery — это не препроцессинг, это половина процесса.

3 · Архитектура платформы

Integrated Development Platform (IDP)

SURFACE LAYER

Web UI · CLI · Chat (Slack) · API (MCP) · Личный кабинет заказчика

INTENT LOOP

Discovery Engine · SDD Builder · Pattern Library + Корпус Знаний

AGENT RUNTIME

Orchestration · Multi-Agent · Session Mgr · Tool Layer · Policy Hooks R0–R5

GPU FLEET CONTROL НОВОЕ

Provisioner · Scheduler · Load Balancer · Metrics Engine · Auto-Scaler

VALIDATION + GOVERNANCE

Review-Agent · Security Gates · Eval Runner · Mockarty (API Tests · Contract · Fuzzing · Chaos) · Audit Trail

DATA REUSE + FINE-TUNING НОВОЕ

Vector DB (Корпус Знаний) · Embedding Service · Fine-Tuning Scheduler · Model Registry · A/B Eval Harness · Mockarty artifacts

OBSERVABILITY + METRICS РАСШИРЕНО

GPU-per-task метрики · Бизнес-метрики на лету · Mockarty (APDEX · Drift · Contract Health)

DEPLOYMENT

CI/CD · Feature Flags · Canary · Domain + SSL · CRM · Docs · Mockarty Chaos · Drift Monitor

3.2

Agent Runtime — четыре функции

📖

Трансляция

SDD + данные из Корпуса Знаний → машиночитаемый контекст для модели

⚙️

Исполнение

Безопасный вызов инструментов с соблюдением квот и R-уровня

👁️

Наблюдение

Фиксация фактического результата (не только намерений модели)

🛡️

Коррекция

Мандатная проверка через Policy Hooks до применения действий

Принцип изоляции: каждый worker-агент работает в Docker-песочнице на своём GPU-сервере. Контекстные окна изолированы — это снижает шум, обеспечивает параллелизм и изолирует failure modes.

3.3

Лестница автономности R0 → R5

R0

Read-only

Только чтение

R1

Suggest

Генерация без выполнения

R2

Non-Prod

Выполнение в dev/staging

R3

Gated Prod

Production с авто-проверками

R4

Monitored Prod

Production + human-on-the-loop

R5

Full Autonomy

Полная автономия, аудит постфактум

Трёхфакторная адаптация: класс задачи × зрелость агента × зона риска.
R-уровень не статичен — он назначается под каждую задачу динамически.

3.4

Context Engineering — 5 уровней сжатия

L1

Raw context

Короткие задачи. Передаём всё как есть.

L2

Structured logs

JSON-форма. До ~30% окна.

L3

Summaries

Сжатые саммари. До ~60% окна.

L4

Persistent notes

progress.md. Длинные сессии.

L5

Schema-typed memory

PDLC Object Model. Multi-session.

Новый ключевой навык: Context Engineering. Не «промпт-инжиниринг», а инженерия памяти агента сквозь сессии и задачи.

4.1

Уровень LLM — только свои модели

Компонент	Модель	GPU	Примечание
Оркестратор (планирование)	Qwen 3.6 35B A3B (MoE)	2×A100	Декомпозиция SDD, multi-agent coordination
Coder	Qwen 3.6 27B / DeepSeek R1 Distill 32B	1×A100	Генерация кода
Coder (лёгкий)	Qwen 3.5 9B / Phi-4 14B	1×A10/V100	Простые правки, автокомплит
Tester	Qwen 3.6 27B	1×A100	Генерация тестов
Reviewer	Qwen 3 Coder 480B (MoE)	4×A100	Критическое ревью, архитектурный анализ
Security	Qwen 3 Coder 480B (MoE)	4×A100	SAST-подобный анализ, уязвимости
Docs	Qwen 3.5 9B	1×A10	Документация
Роутинг (классификация)	Qwen 3.6 27B (дообученный)	1×A100	Классификация задач
Embedding	Qwen 3.6 27B / BGE-M3	1×A100	Векторизация артефактов

Дообучаемые из петли (§6): Coder · Роутинг · Reviewer — все улучшаются на успешных Outcome Check.

4.2 · v2.1

Инфраструктура — open-source, всегда у нас

Жёсткое правило: ни одного внешнего SaaS. Софт = open-source. Hardware = наш периметр. Данные = у нас.

H1 · 0-3 мес

Bare-metal аренда в РФ

immers.cloud, Selectel, Rusonyx — физическое разделение машин. Никаких внешних SaaS.

H2 · 3-12 мес

Колокейшн собственного железа

Покупка серверов + размещение в 2-3 ДЦ. Аренда — резерв на пик.

H3 · 24+ мес

Свои ДЦ под ключ

2 собственных дата-центра. Full-stack суверенитет: GPU, сеть, охлаждение, питание, безопасность.

Слой	Open-source софт	Где работает
LLM Runtime	vLLM · Ollama · TGI	Bare-metal GPU
Fine-tuning	LLaMA-Factory · axolotl	Bare-metal H100/H200
Оркестрация	Kubernetes (k3s)	Self-hosted кластер
База данных	PostgreSQL 17 + Patroni HA	Self-hosted
Векторная БД	Qdrant (open-source)	Self-hosted
Очереди / шина	RabbitMQ · Apache Kafka	Self-hosted
Object Storage	MinIO · Ceph	Self-hosted
Observability	Prometheus · Grafana · Loki · Tempo	Self-hosted
Git	Gitea · Forgejo	Self-hosted
CI/CD	Woodpecker · Drone	Self-hosted
Identity / SSO	Keycloak	Self-hosted
Secrets	HashiCorp Vault	Self-hosted

Air-gap-готовность из коробки: вся платформа работает в полностью изолированной сети без интернета. Любой компонент дублирован между двумя ДЦ. Бэкапы — на собственный MinIO с шифрованием.

4.4 · УЖЕ РЕАЛИЗОВАНО

Mockarty — наш API-тестовый периметр

Self-hosted платформа мокирования, тестирования и автоматизации API. mockarty.ru

10 протоколов на одной платформе

🌐HTTP/REST

⚡gRPC

◆GraphQL

📜SOAP

🔌WebSocket

📡SSE

🤖MCP

📨Kafka

🐰RabbitMQ

✉️SMTP

🤖

11 AI-агентов

mock_builder · api_tester · fuzzer · analyzer · db_specialist · crawler · notifier и др. Auto-routing, tool calling, multi-step delegation.

⚙️

Server Generator

Из OpenAPI · .proto · WSDL · GraphQL · MCP — генерируются standalone-серверы с автономным кэшем.

🧪

Chaos + Contracts (beta)

Инжект failures в K8s. Public API Registry. Drift Detection. Pact Violation Tracking.

4.4.2

Mockarty — тестовый периметр жизненного цикла

4.4.2 · Сценарии

Семь сценариев Mockarty в фабрике

Сценарий	Как работает
Генерация моков из SDD	Coder Agent генерирует код → mock_builder из SDD создаёт моки внешних зависимостей (платёжки, CRM, почта, SMS, Kafka, RabbitMQ).
API-тестирование	Test Agent прогоняет тесты против продукта + Mockarty. Stateful-моки с Global / Chain / Mock stores для заказов, auth-флоу.
Контрактное тестирование	Сверка API продукта с SDD-контрактами. Drift Detection при эволюции продукта.
Fuzzing безопасности	Fuzzer Agent — инжект некорректных payloads, проверка на уязвимости, поиск edge-cases.
Нагрузочное тестирование	Runner Agent — staged-нагрузка (Ramp VU), APDEX-метрики, поиск bottlenecks.
Chaos engineering	Перед production: pod termination, network partitions, service isolation → проверка resilience.
Дрифт-мониторинг	После деплоя — непрерывное сравнение API с эталоном. Алерт при дрифте >14%.

4.4.3

Mockarty — децентрализованная архитектура

Agent Runtime (Coder · Tester · Reviewer · Security) │ │ MCP / REST API / A2A ▼ Mockarty │ ├── Mock Server (HTTP/gRPC/GraphQL/Kafka/...) ├── API Tester + Load Runner ├── Contract Registry + Drift Detector ├── Fuzzer + Chaos Engine └── AI Agents (mock_builder, api_tester, fuzzer, analyzer)

Admin Node

UI, конфигурация, управление моками. Единый источник истины.

Resolver Nodes (N)

Разрешение моков. Горизонтальное масштабирование под нагрузку.

Runner Agents (N)

Выполнение тестов, фаззинг, нагрузка. Изолированные песочницы.

On-premise · air-gapped · zero внешних зависимостей. Разворачивается через Docker Compose или Kubernetes Helm. Полное владение данными.

4.5 · v2.1

Матрица «софт vs железо vs данные»

Три измерения. Software — open-source. Hardware — наш периметр. Data — всегда у нас.

Категория	Software	Hardware (H1 → H3)	Данные
GPU inference	vLLM (OSS)	Аренда → колокейшн → свой ДЦ	Наши
Agent Runtime	Своя разработка	Наш GPU/CPU	Наши
IDP (SDD, R0–R5)	Своя разработка	Self-hosted	Наши
Mockarty	Своя разработка	Self-hosted	Наши
База данных	PostgreSQL + Patroni	Self-hosted кластер	Наши
Векторная БД	Qdrant (OSS)	Self-hosted	Наши
Кэш · очереди	Redis · RabbitMQ · Kafka	Self-hosted	Наши
CI/CD	Woodpecker · Drone	Self-hosted	Наши
Observability	Prometheus · Grafana · Loki	Self-hosted	Наши
Object Storage	MinIO · Ceph	Self-hosted	Наши
Identity / SSO	Keycloak	Self-hosted	Наши
Корпус Знаний	Своя разработка	Self-hosted	Наши
Fine-Tuning	LLaMA-Factory + наш Pipeline	Наши H100/H200	Наши

Принцип zero-внешних-зависимостей: софт — берём open-source (не пишем БД с нуля), но всегда self-hosted. Air-gap deployment возможен из коробки. Ни одного байта в чужом облаке.

5 · НОВАЯ КЛЮЧЕВАЯ ПЛОСКОСТЬ

GPU Fleet Control Plane — сотни серверов под контролем

📦

Provisioner

Заказ/отмена серверов · Spot vs Reserved pricing · жизненный цикл сервера от Provisioning до Released

🎯

Scheduler

Распределение задач по GPU · Affinity rules · Bin-packing · приоритет по R-уровню

📊

Fleet Health Monitor

GPU temp · power · VRAM · pending queue · ECC errors · throttle events

📈

Auto-Scaler

Предзаказ GPU под прогноз нагрузки · реагирование на пиковые часы

🔀

Model Router

Выбор модели под сложность задачи · routing задач между cold/hot моделями

💰

Cost Optimizer

Spot-арбитраж · выключение неиспользуемых GPU · ночной fine-tuning

Это не «devops-функция» — это первоклассный компонент архитектуры, напрямую влияющий на юнит-экономику каждой задачи.

5.2 · Provisioner

Жизненный цикл GPU-сервера

1

Provisioning

Заказ у провайдера

2

Warming

Загрузка модели в VRAM

3

Ready

Прогрев кэша (KV, embeddings)

4

Busy

Обработка задач

5

Draining

Завершение текущих

6

Released

Возврат провайдеру

Стратегия аренды флота

Базовая нагрузка

70%

Reserved · годовые контракты · A100, RTX 4090

Пиковая нагрузка

20%

On-demand · масштабирование под рост

Опортьюнистический

10%

Spot · ночное дообучение, фоновые задачи

Метрики Provisioner'а: GPU Procurement Lead Time · GPU Waste Ratio · Spot Eviction Rate.

5.3 · Scheduler

Bin-packing задач по GPU

Для каждой входящей задачи: 1. Model Router определяет модель (оркестратор / coder / reviewer / ...) 2. Scheduler ищет GPU-сервер с уже загруженной моделью (warm cache) 3. Если нет — ищет свободный GPU, загружает модель 4. Если флот заполнен — задача в очередь с приоритетом по R-уровню 5. Auto-Scaler оценивает: заказать новый сервер или подождать?

Affinity rules

Coder + Tester одной задачи — на одном сервере (общий контекст)
Reviewer — на другом сервере (независимая валидация)
Security Agent — изолирован от Coder (нет доступа к его workspace)

GPU Utilisation

>70%

Цель H2 · % времени полезной работы

Task Queue Depth (P95)

<3

Средняя длина очереди

Cold Start Latency

<30с

От поступления до первого токена

5.4

Business Metrics Engine — расчёт на лету

Для каждой задачи в реальном времени вычисляются полные затраты и маржа.

Стоимость задачи = Σ(GPU_часы × цена_GPU/ч) + Σ(CPU_часы × цена_CPU/ч) + стоимость хостинга результата + накладные расходы Маржа задачи = цена_задачи − стоимость_задачи ROI GPU = (выручка от задач на этом GPU) / (стоимость аренды GPU) за скользящие 24 часа / 7 дней / 30 дней

Дашборд реального времени · Grafana

Панель	Что показывает
Fleet Overview	Общее кол-во GPU, утилизация, стоимость/час, задачи в очереди
Per-GPU Drilldown	Сервер: модель, задача, температура, VRAM, стоимость
Profitability Heatmap	Какой GPU приносит наибольшую маржу
Task Cost Breakdown	GPU + CPU + токены + накладные + маржа в разрезе задачи
Model Efficiency	Средняя стоимость токена, throughput, холодные старты
Forecast vs Actual	Прогноз затрат на неделю vs факт, алерты при отклонении >15%

5.5

Cost Optimizer — автоматические решения

⏸️

Выключение неиспользуемых GPU

Сервер простаивает >30 мин → модель выгружается из VRAM, сервер переводится в standby (сниженная аренда).

🌙

Ночное дообучение

Часы низкой нагрузки (2-6 утра) — освободившиеся GPU автоматически переключаются на fine-tuning задач из очереди.

🎚️

Выбор модели под задачу

Простые задачи → Qwen 3.5 9B на A10 (дёшево). Сложные → Qwen 3.6 27B на A100 (дороже, но качественнее).

💱

Spot-арбитраж

Если spot-цена падает ниже reserved → Provisioner замещает reserved-серверы на spot, сохраняя контракты на пик.

6 · Корпус Знаний

Каждая задача делает следующую дешевле

Векторная база (Qdrant), куда после каждого успешного Outcome Check поступают артефакты задачи.

Артефакт	Формат	Способ поиска
SDD (спецификация)	Полный текст	Семантический поиск по описанию задачи
Код (реализация)	Файлы с метаданными	Семантический поиск по функциональности
Тесты	Property-based + regression	Поиск по тестируемому поведению
Документация	Markdown	Семантический поиск
Evidence Bundle	Структурированный JSON	Поиск по метрикам качества
Outcome Hypothesis (подтверждённые)	Структурированный JSON	Поиск по бизнес-метрике
Mockarty артефакты	Моки, тест-сьюты, контракты	Поиск по типу API и протоколу

6.2

Три сценария переиспользования

Сценарий 1

Поиск похожих задач

similarity > 0.85 → переиспользовать SDD целиком
> 0.70 → архитектурные решения
> 0.50 → похожие тесты / документация

Экономия токенов при 30% reuse

25-40%

Сценарий 2

Кэш инференса

Хэш(SDD + контекст) → поиск в Redis. Если найден — возвращаем закэшированный результат, минуя инференс полностью.

Применимость: Dockerfile, CI/CD pipeline, boilerplate, стандартные формы, CRUD-эндпоинты.

Сценарий 3

Outcome Hypothesis reuse

Подтверждённые гипотезы → автопредложение для похожих задач, бенчмаркинг ("медианный uplift для L-задач = 3.2%"), прогноз маржи.

6.3

Fine-Tuning Pipeline — дообучение моделей

1

Scheduler

Окно низкой нагрузки (ночь/выходные)

2

Reserve GPU

H100/H200 серверы для тренировки

3

Data Pipeline

Собирает датасет из Корпуса

4

LoRA/QLoRA

Trainer запускает fine-tuning

5

Eval Harness

Held-out тестовый набор

6

A/B Deploy

10% флота, сравнение с baseline

7

Promote/Rollback

Полный rollout или откат

Фильтры качества датасета

Только задачи с qualityScore > 0.8
Только код, прошедший review-agent без замечаний
Только задачи без production-регрессий за 30 дней
Только задачи с human-in-the-loop approval на всех контрольных точках

6.4

Экономика петли переиспользования

МЕС 1

Корпус Знаний = 10 задач · similarity reuse = 5%

Стоимость задачи: baseline. Начинаем собирать данные.

МЕС 3

Корпус = 50 задач · similarity reuse = 15%

Стоимость задачи: −12%. Меньше токенов на архитектуру.

МЕС 6

Корпус = 200 задач · similarity reuse = 30% · 1-й цикл fine-tuning Coder'а

Стоимость задачи: −25%. Reuse + fine-tuned модель.

МЕС 12

Корпус = 1000 задач · similarity reuse = 45% · 4 цикла fine-tuning · A/B-тестирование

Стоимость задачи: −40%. Накопительный эффект.

7.1

Governance Mesh — сквозной слой управления

🤖

Автономность

Надзор силами ИИ — review-agent, security-agent, guardian-agent. Человек только в исключениях.

⚓

Встроенность

Policy Hooks, Codified Guardrails — внутри процесса, а не отдельный шаг постфактум.

🌀

Адаптивность

R0–R5 динамически подстраивается под класс задачи, зрелость агента и зону риска.

Human-in-the-loop Decision Map

Точка валидации	Кто	Эскалация
До запуска агента	Product Engineer	Повтор Discovery
Перед merge	Review-Agent + Tech Lead	Отклонение
Перед staging	CI/CD gates + Security Agent	Авто-блок
Перед production	Release Gate + заказчик	Отложенный релиз
+7 дней	Outcome Check	Fallback

7.4

Пять категорий угроз — защита с Mockarty

Угроза	Базовая защита	Mockarty
Уязвимый код	Security Agent + SAST в CI/CD	Fuzzer Agent — инжект некорректных payloads, поиск уязвимостей
Hallucination API	Контракты в SDD + runtime-валидация	Contract Testing + Drift Detection — алерт при расхождении >14%
Supply chain	SCA-сканирование, pinned-версии	API Dependencies — мокирование внешних API для изоляции
Prompt injection	Input sandboxing + policy hooks	Proxy Mode — инжект задержек, замена заголовков
Over-engineering	Review-agent на соответствие классу задачи	APDEX Performance — нагрузочное тестирование выявляет избыточную сложность

7.5

Mockarty-конвейер качества

SDD написан

mock_builder Agent + Contract Registry

Генерация моков из SDD-контрактов. Регистрация API-контрактов задачи в общем реестре.

Код сгенерирован

api_tester Agent

Прогон тестов против сгенерированных моков. Сверка с контрактами — нет ли дрифта?

Тесты пройдены

fuzzer Agent + analyzer Agent

Фаззинг-атака на все эндпоинты. Анализ результатов, классификация уязвимостей.

Staging

Chaos Engine + Load Runner

Pod termination, network partitions. APDEX на целевой нагрузке. Resilience Check — восстанавливается ли система?

Production

Drift Monitor + Contract Health Dashboard

Непрерывное сравнение API с контрактами. Алерт при отклонении. Все артефакты → в Корпус Знаний.

8.2 · Тарифы

Заказчик платит за результат, не за процесс

Корректировка v2.1: токены × 5 — реальный расход многоагентной фабрики (оркестратор + 5 worker'ов, многократные итерации, контексты). Цена × 3 — себестоимость растёт, но reuse loop компенсирует часть.

S

Лендинг / бот

15 000 ₽

125 000 токенов

Деплой
Домен + SSL
Аналитика

M

SaaS / админка

45 000 ₽

400 000 токенов

+ CMS
+ Формы
+ CRM

L

Маркетплейс

135 000 ₽

1 250 000 токенов

+ Платежи
+ Каталог
+ Поиск

XL

Enterprise

360 000 ₽

3 750 000 токенов

+ Роли
+ Аудит
+ Compliance

2XL

Платформа

900 000 ₽

12.5M токенов

+ Мультитенант
+ API · SDK

Дополнительно: поддержка от 30 000 ₽/мес · срочное ×1.5 · enterprise SLA 24/7 от 150 000 ₽/мес · compliance — индивидуально.

8.3

Юнит-экономика — фиксированные затраты

Затраты/мес = GPU-аренда + CPU-аренда + Хостинг результатов + Аутсорс-сервисы (БД, кэш, векторы, CI/CD, DNS) + ФОТ команды (Tiny Teams) Себестоимость задачи = Затраты/мес / Число_задач/мес Выручка/мес = Σ (задач_i × цена_i) Прибыль = Выручка − Затраты Маржа = Прибыль / Выручка × 100%

Эффект масштаба — три рычага

Рычаг 1

Утилизация GPU

Фиксированная аренда распределяется на больше задач — себестоимость единицы падает.

Рычаг 2

Корпус Знаний

Переиспользование снижает расход токенов на 25-40% к концу года.

Рычаг 3

Fine-tuning

Дообученные модели генерируют качественнее и используют меньше токенов.

8.3 · АМБИЦИОЗНАЯ ТРАЕКТОРИЯ

Кривая роста — 10K задач/мес к 6-му месяцу

Tilda Russian = 1.5M пользователей. Это ориентир TAM. При правильной воронке (inbound + agency + perform marketing) массовый сегмент S/M открывается быстро.

H1 · к мес 3

1 500 задач/мес

Рамп воронки. 700 бесплатных пилотов + 1500 платных по early bird -30%.

H2 · к мес 6

10 000 задач/мес

Целевая точка. К концу H2 (мес 12) — 22K/мес. Cash-positive на мес 7-8.

H3 · к мес 24

70 000 задач/мес

Лидер сегмента. 800+ GPU в 2 собственных ДЦ. Запуск Black Box.

8.3 · ФОТ + микс

Микс задач и команда под массовый рост

МИКС ЗАДАЧ (90% мелких в H1, дрейф к L/XL в H3)

Размер	H1	H2	H3
S · лендинги, боты	80%	70%	60%
M · SaaS, админки	15%	20%	22%
L · маркетплейсы	5%	8%	12%
XL · Enterprise	0	1.5%	4%
2XL · платформы	0	0.5%	2%
Средневзв. чек	25.5 тыс ₽	44 тыс ₽	65 тыс ₽

КОМАНДА: ~50% инж · ~30% sales/CX · ~20% упр./опс

Категория	H1	H2	H3
Инженерия (Agent, GPU, Data, Platform, QA)	5	27	64
Sales (inbound + outbound + Partner)	1	13	41
Marketing + Content + Perform	0	6	15
Customer Success	0	4	12
CEO/CTO + Finance/Ops + Юрист	2	5	8
ИТОГО FTE	8	57	140
ФОТ gross/мес	4.4 млн	27.6 млн	63.8 млн
ФОТ gross/период	13.2 млн (3 мес)	331 млн/год	766 млн/год

Ключевой сдвиг: при 10K+ задач/мес нужна сильная sales/CX/marketing-функция. Это не «инженерный стартап с маркетингом» — это массовый product-led growth с агрессивной воронкой и партнёрской сетью.

8.4

Три налоговых сценария — эффект на маржу

A · Базовый

ОСН / УСН

Налог на прибыль 25%
Страховые 30% + 15% сверх МСП
НДС 20% (B2B-услуги)

Применяется по умолчанию для не-аккредитованных компаний.

B · IT-аккредитация

Минцифры (с дня 1)

Налог на прибыль 5%
Страховые 7.6% бессрочно
НДС 0% (реестр ПО)

Требует ≥70% ИТ-выручки и средней ЗП ≥ региона. Получается за 1-2 мес.

C · Сколково

Резидент ИНТЦ / ОЭЗ

Налог на прибыль 0%
Страховые 14%
НДС 0% · Имущество 0%

До 10 лет, лимит выручки 1 млрд ₽/год. Альт.: Иннополис, ИНТЦ МГУ.

Сравнение на примере H2 (выручка ~5 млрд, прибыль до налогов ~4 млрд)

Сценарий	Налог на прибыль	Страховые от ФОТ 331 млн	Чистая прибыль	Маржа
A · ОСН	1 010 млн (25%)	~99 млн (30%)	~2.96 млрд ₽	60%
B · IT-аккредитация	202 млн (5%)	~25 млн (7.6%)	~3.78 млрд ₽	77%
C · Сколково (лимит 1 млрд исчерпан)	~1 010 млн	~46 млн (14%)	~2.95 млрд ₽	60%

Парадокс на масштабе: при выручке >1 млрд ₽/год Сколково теряет свою главную льготу (лимит превышен). IT-аккредитация стабильно лучшая для ФОТ-тяжёлого профиля: +800 млн ₽ чистой прибыли vs ОСН в H2. С дня 1.

8.5 · Окупаемость

Горизонт H1 — рамп воронки + IT-аккредитация

3 месяца · 8 FTE · ~2 200 задач за период (рамп с 100 до 1500/мес). Critical path — построение воронки.

РАСХОДЫ H1

ФОТ gross (8 чел × 3 мес)	13.2 млн ₽
GPU аренда (15 серв × 80K × 3)	3.6 млн ₽
CPU + сеть + бэкапы	0.9 млн ₽
Маркетинг (агрессивный старт)	12 млн ₽
Sales (CRM, заказы)	3 млн ₽
Юр. · ПО · прочее	3 млн ₽
Итого расходы	35.7 млн ₽

ВЫРУЧКА H1

700 бесплатных пилотов	0 ₽
1 500 платных × 25.5K × 0.7 (early bird)	26.8 млн ₽
Итого выручка	~27 млн ₽

ФИНАНСОВЫЙ РЕЗУЛЬТАТ H1

A · ОСН

−12.6 млн ₽

B · IT-аккредитация

−9.7 млн ₽

Минимальный убыток

C · Сколково

−10.5 млн ₽

Требуется seed: 20-30 млн ₽

×2 vs прежняя оценка — потому что нужна агрессивная маркетинговая воронка для достижения 10K задач/мес к мес. 6.

8.5 · Окупаемость

Горизонт H2 — массовый рост, cash-positive с мес 7-8

9 мес · 57 FTE · 105 000 задач за год (рост с 1.5K до 22K/мес) · 250 GPU.

РАСХОДЫ H2 (9 мес)

ФОТ gross (57 чел средн., 9 мес)	248 млн ₽
GPU инфра (среднее 150 × 80K × 9)	108 млн ₽
CPU + сеть + хостинг клиентов	30 млн ₽
Маркетинг агрессивный (CAC ~2K)	380 млн ₽
Sales + Customer Success	80 млн ₽
Поддержка + ITSM	20 млн ₽
Юр. · ПО · офис	25 млн ₽
Итого расходы	~891 млн ₽

ВЫРУЧКА H2 (9 мес)

105 000 задач × 44K средневзв.	4 620 млн ₽
Поддержка SLA (~5%)	230 млн ₽
Enterprise (3-5 шт)	80 млн ₽
Итого выручка	~4 930 млн ₽

ПРИБЫЛЬ ДО НАЛОГОВ: ~4 040 млн ₽ · маржа 82%

Сценарий	Чистая прибыль	Маржа
A · ОСН	~2.96 млрд	60%
B · IT-аккредитация	~3.78 млрд	77%
C · Сколково (лимит исчерпан)	~2.95 млрд	60%

CASH-POSITIVE

мес. 7-8

После выхода на 10K задач/мес

Series A нужна только под маркетинг H1-начало H2: 100-150 млн ₽. После мес 8 — компания себя кормит. Уже к концу H2 чистая прибыль покрывает все инвестиции 20×.

8.5 · Окупаемость

Горизонт H3 — доминирование сегмента

12 мес (мес 12-24) · 140 FTE · 540 000 задач/год (рост с 22K до 70K/мес) · 800+ GPU в 2 собственных ДЦ.

РАСХОДЫ H3 (год)

ФОТ gross (140 чел × 12 мес)	766 млн ₽
GPU инфра (среднее 500 × 100K × 12)	600 млн ₽
CAPEX свой ДЦ (амортизация 5 лет)	200 млн ₽
CPU + сеть + хостинг	150 млн ₽
Маркетинг + perform	1 500 млн ₽
Sales + Customer Success	250 млн ₽
Юр. · ПО · офис · прочее	120 млн ₽
Поддержка + ITSM	80 млн ₽
Итого	~3 666 млн ₽

ВЫРУЧКА H3 (год)

540K задач × 65K средневзв.	35 100 млн ₽
Поддержка SLA	1 800 млн ₽
Enterprise (15-20)	350 млн ₽
Black Box on-prem	800 млн ₽
Итого	~38 050 млн ₽

ПРИБЫЛЬ ДО НАЛОГОВ: ~34 380 млн ₽ · маржа 90%

Сценарий	Чистая прибыль	Маржа
A · ОСН	~25.6 млрд	67%
B · IT-аккредитация	~32.6 млрд	86%
C · Сколково (лимит исчерпан)	~25.7 млрд	68%

ОКУПАЕМОСТЬ ИНВЕСТИЦИЙ

~9 мес

Seed 20-30M + Series A 100-150M = 130-180M ₽ при IT-аккредитации

12 · НОВЫЙ РАЗДЕЛ

Две продуктовые ветки — одна кодовая база

С самого начала строим в двух конфигурациях. Одни модели, одни агенты — разные способы доставки.

☁️

ВЕТКА 1 · ОСНОВНАЯ

Cloud Platform

Облачная платформа в нашем периметре. Заказчик подключается через личный кабинет, присылает идею — получает работающий продукт.

Клиент	SMB · стартапы · e-commerce · EdTech
Размер сделки	5K – 3M ₽
Time-to-value	2-14 дней
Цикл продажи	1-14 дней
Маржинальность	70-80%
Доля выручки H3	65-70%

📦

ВЕТКА 2 · ENTERPRISE

Black Box on-prem

Герметичный комплект «под ключ» на инфраструктуре заказчика. Полностью air-gapped — никаких внешних подключений.

Клиент	Банки · госы · оборонка · телеком · крупный ритейл
Размер сделки	50-500 млн ₽ + 30-100 млн/год
Time-to-value	2-6 месяцев
Цикл продажи	3-12 месяцев
Маржинальность	60-70% (с hardware)
Доля выручки H3	30-35%

Ключевая магия: одна и та же кодовая база, одни и те же fine-tuned модели. Black Box — это просто упакованная версия Cloud Platform, разворачиваемая у заказчика. Data flywheel работает в обе стороны (опционально).

12.2 · Black Box

Что входит в Black Box-поставку

🖥️

Hardware Layer

4-12 GPU-серверов (H100/H200)
2-4 CPU-нод (Postgres, Qdrant, MinIO)
Сетевое оборудование 100GbE
ИБП + ДГУ (опционально)

⚙️

Software Layer

Преднастроенный k3s кластер
IDP (Agent Runtime, Discovery, SDD)
GPU Fleet Control Plane
Mockarty полностью
Корпус Знаний + Business Metrics + Grafana

🧠

Models Layer

Все LLM-модели (Qwen 3.6, DeepSeek, Phi-4)
Базовый fine-tuned набор по сегменту
Возможность дообучать на данных клиента

📞

Support & SLA

Runbook'и операций · документация
SLA-контракт 24/7
Удалённый доступ для поддержки (опц.)
On-site инженер (доп. опция)

Бизнес-модель Black Box

Поставка комплекта	от 50 млн ₽ (фикс)
Лицензия на ПО	15-25% от стоимости поставки в год
Поддержка 24/7	от 30 млн ₽/год
On-site инженер	от 600 тыс ₽/мес
Кастомизация · доработка	30 тыс ₽/чел-день

12.4 · Рынок РФ 2026

TAM · SAM · SOM — оценка рынка

Источники: Tadviser, J'son & Partners, прогноз Минцифры, наша экспертная оценка.

Объём рынка РФ 2026 (млрд ₽)

Сегмент	Объём 2026	CAGR 2025-2030
Заказная разработка ПО (custom dev)	~550 млрд	12-15%
Цифровизация SMB	~180 млрд	18-22%
Госзаказ ИТ-разработки	~320 млрд	8-10%
Enterprise ИТ-разработка	~400 млрд	10-12%
Итого «прикладная разработка»	~1 050 млрд	~12%

TAM

Total Addressable

~165 млрд ₽

Задачи, потенциально автоматизируемые агентной фабрикой

Cloud: 90-110 млрд
Black Box: 60-70 млрд

SAM

Serviceable Available

~40 млрд ₽

Доступная нам часть с учётом компетенций и стека

Cloud: 25 млрд (SaaS-готовые)
Black Box: 15 млрд (регулир.)

SOM (мес 12 → мес 24 → год 5)

Serviceable Obtainable

5 → 38 → 88 млрд ₽

Cloud 4.9 → 37 → 80 · Black Box 0 → 0.8 → 8

К году 5 — категорийный лидер РФ + СНГ

12.5 · Конкуренты

Кто на рынке и в чём наш moat

Cloud-ветка

Конкуренты

Игрок	Слабость
Bolt.new · v0.dev	Только фронтенд, API-модели, нет SLA
Replit Agent	Только dev-окружение, нет деплоя
Yandex Code Assistant	Подсказки кода, не агент-делатель
Cursor · Windsurf	IDE-инструмент, не сервис

Наш moat: полный продукт с доменом, SSL, CRM. Reuse loop. Own inference. Outcome Hypothesis.

Black Box-ветка

Конкуренты

Игрок	Слабость
Cognition (Devin)	Cloud only, API-модели
Magic.dev	Cloud only, не для КИИ
1С · Корус · Лига	Классическая разработка людьми
Внутренние ИТ-отделы	Нет AI-стека, нет fine-tuning

Наш moat: единственная self-hosted air-gapped агентная фабрика со своими fine-tuned моделями для русского compliance.

12.6

Roadmap двух веток параллельно

Период	Cloud Platform	Black Box on-prem
H1 · 0-3 мес	Только Cloud — MVP, пилоты, 5-10 заказчиков	Подготовка documentation, типового SLA, договорной шаблон
H2 · 3-12 мес	Активный рост · маркетинг · partner-network · 600+ задач	1-2 пилот-внедрения у дружественных клиентов
H3 · 12-24 мес	Cloud масштаб · 800+ клиентов · cash-positive	5-10 коммерческих поставок · контракт 50-500 млн каждая
H4 · 24+ мес	Cloud — лидер сегмента в РФ	20+ Black Box в год · 35-40% выручки

Распределение выручки по горизонтам

9 · Команда

Tiny Teams — 3–6 человек, end-to-end владение

Роль	Задача	Компетенции
Product Engineer	Discovery, SDD, валидация	Бизнес-домен, facilitation, Outcome Hypothesis
Agent Engineer	Тюнинг агентов, среда исполнения	Context Engineering, Multi-agent, Eval Design
Guardian Agent Engineer	Review-agent, Codified Guardrails	Security, SAST/DAST, compliance
GPU Fleet Engineer новая	Управление GPU-флотом, Provisioner, Scheduler	K8s, GPU-драйверы, DCGM, Prometheus, автоскейлинг
Data & Fine-Tuning Engineer новая	Корпус Знаний, fine-tuning pipeline, датасеты	Vector DB, LoRA/QLoRA, eval design, data quality
Quality & Mockarty Engineer новая	API-тестирование, моки, контракты, fuzzing, chaos	Mockarty, контрактное тестирование, APDEX, security testing
Platform Engineer	IDP, Agent Runtime, CI/CD, observability	K8s, CI/CD, MCP/A2A

6 ключевых компетенций

Context Engineering Eval Design Agent Debugging Outcome Thinking Governance as Code Multi-Agent Design

10.1 · АМБИЦИОЗНАЯ ТРАЕКТОРИЯ

Три горизонта — от рамп до флота 800+ GPU

H1 · 90 дней

MVP + рамп воронки

Discovery + SDD + single-agent. IT-аккредитация с дня 1. Маркетинг под рост.

Задач/мес (к концу)

1.5K

GPU-флот

15

A100, RTX 4090, A10, H100

Команда

8 FTE

H2 · 12 мес

Массовый рост · cash-positive

Multi-agent, Корпус Знаний, 1-й fine-tuning, agency-partners, Black Box-prep.

Задач/мес (к концу)

22K

10K к мес 6 (целевая точка)

GPU-флот

250+

A100, H100, RTX 4090/5090

Команда

57 FTE

H3 · 24+ мес

Доминирование + свой ДЦ

L4 long-running, Black Box-продажи, региональная экспансия, лидер сегмента.

Задач/мес (к концу)

70K

GPU-флот

800+

В 2 собственных ДЦ + резерв

Команда

140 FTE

10.2

90-дневный MVP-план

НЕД 1–2

GPU Bootstrap

Аренда первых GPU, развёртывание inference (vLLM), GPU Fleet Control Plane (Provisioner + Scheduler minimal)

НЕД 3–4

Discovery Engine

PR/FAQ-агент, Outcome Hypothesis-шаблон

НЕД 5–6

SDD Builder + Codified Guardrails

Шаблоны SDD, валидация R-уровня, бюджет токенов

НЕД 7–8

Цикл реализации + Mockarty (параллельно)

Single-agent (code + test + review + docs) · Интеграция Mockarty: моки из SDD, API-тестирование, контрактные проверки

НЕД 9–10

Деплой-пайплайн + Корпус Знаний v1

Сохранение артефактов, baseline-поиск

НЕД 11–12

Business Metrics Engine

Per-task cost, GPU utilisation dashboard

НЕД 13

Пилот

2-3 заказчика, сбор Outcome Hypothesis

10.3

Шесть антипаттернов

Антипаттерн	Защита
⚠️ Coding-Only AI	Discovery + Eval начиная с H1
⚠️ SDD без Discovery	Template enforcement в IDP
⚠️ Ручное управление GPU	GPU Fleet Control Plane с H1
⚠️ Игнорирование Корпуса Знаний	Сохранение артефактов с первой задачи
⚠️ Никогда не дообучать	Fine-Tuning Pipeline с H2
⚠️ Vendor Lock-in (API-модели)	Свой inference с нуля

11 · Метрики эффективности

Пять категорий — единая система измерений

📊 Бизнес-метрики

Outcome Validation Rate	>70%
CSAT	>4.5/5
Repeat Rate	>40%
Себестоимость задачи (S)	<2 500 ₽
Маржа (средняя)	>50%

🖥️ GPU-флот

GPU Utilisation	>70%
GPU Waste Ratio	<10%
Task Queue Depth (P95)	<3
Cold Start Latency (P95)	<30с
Spot Eviction Rate	<5%

🔄 Петля переиспользования

Corpus Reuse Rate	>30%
Token Cost Reduction	>25%
Fine-Tune Quality Gain	>5%
Corpus-to-Model Latency	<48ч
Model Drift Incidents	0

🛡️ Качество + Mockarty

Regression Rate / 100 деплоев	<2
Contract Drift Rate	<5%
Fuzzing Coverage	100%
Mock Accuracy	>98%
APDEX Score (staging)	>0.85

Заключение

Семь отличий, которые меняют правила

1

Свой inference

Zero API-затрат · полный контроль

2

Self-hosted всё

Open-source софт · наш периметр · zero внешних

3

Сотни GPU

Единая плоскость · бизнес-метрики на лету

4

Корпус Знаний

Reuse · −25-40% затрат · fine-tuning

5

Mockarty

10 протоколов · 11 AI-агентов · уже готово

6

Две ветки

Cloud (65%) + Black Box (35%) · одна база

7

IT-аккредитация

Налог 5% · страховые 7.6% · НДС 0%

ROI

~9 месяцев

При воронке 10K задач/мес @ мес 6 + IT-аккредитация

«The SDLC is dead. The new skill is context engineering. The new safety net is observability.» — Boris Tane, 2026

◆ Dark Factory · v2.1 · май 2026

Мы не строим инструмент.
Мы строим фабрику.

Не очередной AI-помощник для разработчиков.
Производственная линия, превращающая идею в подтверждённый бизнес-результат.

🚀 Свой inference 🔐 Self-hosted всё 🖥️ Свои ДЦ к H3 📊 Метрики на лету 🧠 Корпус Знаний 🎯 Fine-tuning 🧪 Mockarty ☁️ Cloud Platform 📦 Black Box 💼 IT-аккредитация

Спасибо. ESC для оглавления