DARK FACTORY · v2.1
◆ Архитектурный документ · v2.1 · май 2026

Dark Factory. Фабрика IT-продуктов под ключ.

От бизнес-идеи до работающего домена с SSL, наблюдаемостью, CRM и подтверждённым outcome — без найма команды и погружения в код.

10K задач/мес @ мес 6 Self-hosted всё Cloud + Black Box ROI ~9 мес
Резюме для руководства

Не очередной AI-инструмент. Производственная линия результатов.

Заказчик не нанимает команду и не разбирается в коде. Он получает продукт с измеримым бизнес-результатом.

SDLC мёртв

AI-агенты не ускорили старый процесс — они его схлопнули. Стадии слились в петлю: намерение → агент → результат → наблюдение → следующее намерение.

🎯

Качество, не скорость

Строчка кода больше не стоит часов. Единственное ограничение — качество. Мы не гонимся за 10× velocity, мы строим систему, где каждый этап отточен.

🏭

Реальный бизнес, не айтишники

От лендинга для физлица до enterprise-платформы. Драйвер спроса — сокращение ФОТ на IT и радикальное сокращение lead time.

Что нового в v2.1

Три отличия, которые меняют экономику и качество

01 · Inference

Свой inference с нуля

Zero API-затрат на модели. Полный контроль над latency, контекстом и конфиденциальностью данных заказчика. Все модели — open-source, развёрнуты на арендованных GPU.

API-стоимость
0 ₽
02 · GPU Fleet

Сотни серверов под контролем

Единая плоскость управления GPU-флотом с бизнес-метриками на лету: стоимость задачи, маржа, ROI каждого GPU в реальном времени.

Управление
200+
GPU к 24 мес
03 · Data Loop

Петля переиспользования

Всё сгенерированное — код, тесты, SDD, документация — поступает в Корпус Знаний и используется для снижения стоимости и дообучения моделей.

Снижение затрат к 12 мес
−40%
Философия

SDLC мёртв — да здравствует непрерывная петля

«AI agents didn't make the SDLC faster. They killed it.» — Boris Tane, 2026

1 · Отточенные стадии

Каждая стадия процесса отточена, даже если долго и с большим расходом токенов. Скорость — следствие качества, а не цель.

2 · Встроенные проверки

Проверки находятся внутри процесса, а не добавлены постфактум. Review-agent, security gates, evals, outcome check на каждом шаге.

3 · Бизнес-метрика

Результат измеряется бизнес-метрикой, а не фактом деплоя. Outcome Hypothesis обязательна для каждой задачи.

1.2

Пять архитектурных принципов

ПринципСледствие
Среда работы агента важнее моделиКонкурентное преимущество — в качестве детерминированного harness'а, не в конкретной LLM. 98.4% кодовой базы — детерминированная логика.
Discovery важнее промптаКачество результата определяется постановкой задачи, а не длиной промпта. PR/FAQ и Outcome Hypothesis обязательны.
Валидация важнее скоростиКод без проверки создаёт техдолг со скоростью агента. Review-agent, security gates, evals, outcome check — на каждом шаге.
Governance в процессе, не постфактумPolicy Hooks, Codified Guardrails, лестница R0–R5. Человек — только в исключениях.
Данные задач — стратегический активВсё, что произведено в процессе, переиспользуется. Каждая задача делает следующую дешевле.
1.3

Экономика собственного inference

API-модели

Переменные затраты

Каждый токен оплачивается вендору. Маржа сжимается линейно с ростом объёма.

API-модели

Чужие данные

Задачи проходят через сторонний API. Compliance-риски, утечка домена.

API-модели

Чёрный ящик

Модель обновляется вендором, нельзя дообучить под доменную область.

Свой inference

Фиксированные затраты

Аренда GPU по годовому контракту. Стоимость токена падает с ростом утилизации.

Свой inference

Полный контроль

Данные заказчика не покидают арендованные серверы. Compliance — архитектурно.

Свой inference

Fine-tuning

Модели дообучаются на успешных задачах. Качество растёт со временем.

Точка окупаемости. При 1000 задач/мес × 300K токенов: Claude Sonnet ≈ $900/мес только output. Один сервер 2×A100 на immers.cloud — ~32 тыс ₽/мес и обслуживает ~400 задач/мес. Свой inference выгоднее API уже от 500 задач/мес.
2 · Жизненный цикл

Двухпетлевая модель Intent + Implementation

INTENT LOOP Discovery PR/FAQ SDD Outcome IMPLEMENTATION LOOP Coder Tester Reviewer Docs SDD-контракт Evidence Bundle

Intent Loop · Цикл намерения

Человек формулирует, что изменить в бизнесе и какой результат считать успехом. Всё остальное — зона агентов. Discovery → PR/FAQ → SDD → Outcome Hypothesis.

Implementation Loop · Цикл реализации

Агенты превращают SDD в продукт. Паттерн Orchestrator-Workers: Coder, Tester, Reviewer, Security, Docs. Каждый — в изолированной песочнице.

2.1.1

Discovery sub-loop — постановка важнее промпта

ШагАртефактОтветственный
Формулировка возможностиЧто, почему, кто заинтересованProduct Engineer + заказчик
PR/FAQЖелаемое будущее (Amazon Working Backwards)Discovery-агент + заказчик
Outcome HypothesisМетрика, target, период, fallbackProduct Engineer
Адаптация / перепроектированиеАвтоматизация vs. переосмыслениеКоманда
Класс применимости агентаdeterministic / ai-augmented / ai-native / agenticProduct Engineer
Поиск в Корпусе ЗнанийПохожие задачи, шаблоны SDD, переиспользуемый кодRetrieval Agent
Human-in-the-loop MapКто, на каком шаге, по каким критериям валидируетProduct Engineer
Ключевое: SDD без Discovery = длинное техзадание без стратегического смысла. Discovery — это не препроцессинг, это половина процесса.
3 · Архитектура платформы

Integrated Development Platform (IDP)

SURFACE LAYER
Web UI · CLI · Chat (Slack) · API (MCP) · Личный кабинет заказчика
INTENT LOOP
Discovery Engine · SDD Builder · Pattern Library + Корпус Знаний
AGENT RUNTIME
Orchestration · Multi-Agent · Session Mgr · Tool Layer · Policy Hooks R0–R5
GPU FLEET CONTROL НОВОЕ
Provisioner · Scheduler · Load Balancer · Metrics Engine · Auto-Scaler
VALIDATION + GOVERNANCE
Review-Agent · Security Gates · Eval Runner · Mockarty (API Tests · Contract · Fuzzing · Chaos) · Audit Trail
DATA REUSE + FINE-TUNING НОВОЕ
Vector DB (Корпус Знаний) · Embedding Service · Fine-Tuning Scheduler · Model Registry · A/B Eval Harness · Mockarty artifacts
OBSERVABILITY + METRICS РАСШИРЕНО
GPU-per-task метрики · Бизнес-метрики на лету · Mockarty (APDEX · Drift · Contract Health)
DEPLOYMENT
CI/CD · Feature Flags · Canary · Domain + SSL · CRM · Docs · Mockarty Chaos · Drift Monitor
3.2

Agent Runtime — четыре функции

📖

Трансляция

SDD + данные из Корпуса Знаний → машиночитаемый контекст для модели

⚙️

Исполнение

Безопасный вызов инструментов с соблюдением квот и R-уровня

👁️

Наблюдение

Фиксация фактического результата (не только намерений модели)

🛡️

Коррекция

Мандатная проверка через Policy Hooks до применения действий

Принцип изоляции: каждый worker-агент работает в Docker-песочнице на своём GPU-сервере. Контекстные окна изолированы — это снижает шум, обеспечивает параллелизм и изолирует failure modes.
3.3

Лестница автономности R0 → R5

R0

Read-only

Только чтение

R1

Suggest

Генерация без выполнения

R2

Non-Prod

Выполнение в dev/staging

R3

Gated Prod

Production с авто-проверками

R4

Monitored Prod

Production + human-on-the-loop

R5

Full Autonomy

Полная автономия, аудит постфактум

Трёхфакторная адаптация: класс задачи × зрелость агента × зона риска.
R-уровень не статичен — он назначается под каждую задачу динамически.
3.4

Context Engineering — 5 уровней сжатия

L1

Raw context

Короткие задачи. Передаём всё как есть.

L2

Structured logs

JSON-форма. До ~30% окна.

L3

Summaries

Сжатые саммари. До ~60% окна.

L4

Persistent notes

progress.md. Длинные сессии.

L5

Schema-typed memory

PDLC Object Model. Multi-session.

Новый ключевой навык: Context Engineering. Не «промпт-инжиниринг», а инженерия памяти агента сквозь сессии и задачи.

4.1

Уровень LLM — только свои модели

КомпонентМодельGPUПримечание
Оркестратор (планирование)Qwen 3.6 35B A3B (MoE)2×A100Декомпозиция SDD, multi-agent coordination
CoderQwen 3.6 27B / DeepSeek R1 Distill 32B1×A100Генерация кода
Coder (лёгкий)Qwen 3.5 9B / Phi-4 14B1×A10/V100Простые правки, автокомплит
TesterQwen 3.6 27B1×A100Генерация тестов
ReviewerQwen 3 Coder 480B (MoE)4×A100Критическое ревью, архитектурный анализ
SecurityQwen 3 Coder 480B (MoE)4×A100SAST-подобный анализ, уязвимости
DocsQwen 3.5 9B1×A10Документация
Роутинг (классификация)Qwen 3.6 27B (дообученный)1×A100Классификация задач
EmbeddingQwen 3.6 27B / BGE-M31×A100Векторизация артефактов

Дообучаемые из петли (§6): Coder · Роутинг · Reviewer — все улучшаются на успешных Outcome Check.

4.2 · v2.1

Инфраструктура — open-source, всегда у нас

Жёсткое правило: ни одного внешнего SaaS. Софт = open-source. Hardware = наш периметр. Данные = у нас.

H1 · 0-3 мес

Bare-metal аренда в РФ

immers.cloud, Selectel, Rusonyx — физическое разделение машин. Никаких внешних SaaS.

H2 · 3-12 мес

Колокейшн собственного железа

Покупка серверов + размещение в 2-3 ДЦ. Аренда — резерв на пик.

H3 · 24+ мес

Свои ДЦ под ключ

2 собственных дата-центра. Full-stack суверенитет: GPU, сеть, охлаждение, питание, безопасность.

СлойOpen-source софтГде работает
LLM RuntimevLLM · Ollama · TGIBare-metal GPU
Fine-tuningLLaMA-Factory · axolotlBare-metal H100/H200
ОркестрацияKubernetes (k3s)Self-hosted кластер
База данныхPostgreSQL 17 + Patroni HASelf-hosted
Векторная БДQdrant (open-source)Self-hosted
Очереди / шинаRabbitMQ · Apache KafkaSelf-hosted
Object StorageMinIO · CephSelf-hosted
ObservabilityPrometheus · Grafana · Loki · TempoSelf-hosted
GitGitea · ForgejoSelf-hosted
CI/CDWoodpecker · DroneSelf-hosted
Identity / SSOKeycloakSelf-hosted
SecretsHashiCorp VaultSelf-hosted
Air-gap-готовность из коробки: вся платформа работает в полностью изолированной сети без интернета. Любой компонент дублирован между двумя ДЦ. Бэкапы — на собственный MinIO с шифрованием.
4.4 · УЖЕ РЕАЛИЗОВАНО

Mockarty — наш API-тестовый периметр

Self-hosted платформа мокирования, тестирования и автоматизации API. mockarty.ru

10 протоколов на одной платформе

🌐HTTP/REST
gRPC
GraphQL
📜SOAP
🔌WebSocket
📡SSE
🤖MCP
📨Kafka
🐰RabbitMQ
✉️SMTP
🤖

11 AI-агентов

mock_builder · api_tester · fuzzer · analyzer · db_specialist · crawler · notifier и др. Auto-routing, tool calling, multi-step delegation.

⚙️

Server Generator

Из OpenAPI · .proto · WSDL · GraphQL · MCP — генерируются standalone-серверы с автономным кэшем.

🧪

Chaos + Contracts (beta)

Инжект failures в K8s. Public API Registry. Drift Detection. Pact Violation Tracking.

4.4.2

Mockarty — тестовый периметр жизненного цикла

1 · SDD написан 2 · Код сгенерирован 3 · Тесты пройдены 4 · Staging развёрнут 5 · Production Mockarty тестовый периметр mock_builder генерация моков из SDD-контрактов api_tester + Contract Tests прогон тестов против моков, drift check fuzzer + analyzer фаззинг эндпоинтов, классификация уязвимостей Chaos Engine + Load Runner pod kill, partitions, APDEX-нагрузка Drift Monitor непрерывная сверка API с контрактами
4.4.2 · Сценарии

Семь сценариев Mockarty в фабрике

СценарийКак работает
Генерация моков из SDDCoder Agent генерирует код → mock_builder из SDD создаёт моки внешних зависимостей (платёжки, CRM, почта, SMS, Kafka, RabbitMQ).
API-тестированиеTest Agent прогоняет тесты против продукта + Mockarty. Stateful-моки с Global / Chain / Mock stores для заказов, auth-флоу.
Контрактное тестированиеСверка API продукта с SDD-контрактами. Drift Detection при эволюции продукта.
Fuzzing безопасностиFuzzer Agent — инжект некорректных payloads, проверка на уязвимости, поиск edge-cases.
Нагрузочное тестированиеRunner Agent — staged-нагрузка (Ramp VU), APDEX-метрики, поиск bottlenecks.
Chaos engineeringПеред production: pod termination, network partitions, service isolation → проверка resilience.
Дрифт-мониторингПосле деплоя — непрерывное сравнение API с эталоном. Алерт при дрифте >14%.
4.4.3

Mockarty — децентрализованная архитектура

Agent Runtime (Coder · Tester · Reviewer · Security) │ │ MCP / REST API / A2A ▼ Mockarty │ ├── Mock Server (HTTP/gRPC/GraphQL/Kafka/...) ├── API Tester + Load Runner ├── Contract Registry + Drift Detector ├── Fuzzer + Chaos Engine └── AI Agents (mock_builder, api_tester, fuzzer, analyzer)

Admin Node

UI, конфигурация, управление моками. Единый источник истины.

Resolver Nodes (N)

Разрешение моков. Горизонтальное масштабирование под нагрузку.

Runner Agents (N)

Выполнение тестов, фаззинг, нагрузка. Изолированные песочницы.

On-premise · air-gapped · zero внешних зависимостей. Разворачивается через Docker Compose или Kubernetes Helm. Полное владение данными.
4.5 · v2.1

Матрица «софт vs железо vs данные»

Три измерения. Software — open-source. Hardware — наш периметр. Data — всегда у нас.

КатегорияSoftwareHardware (H1 → H3)Данные
GPU inferencevLLM (OSS)Аренда → колокейшн → свой ДЦНаши
Agent RuntimeСвоя разработкаНаш GPU/CPUНаши
IDP (SDD, R0–R5)Своя разработкаSelf-hostedНаши
MockartyСвоя разработкаSelf-hostedНаши
База данныхPostgreSQL + PatroniSelf-hosted кластерНаши
Векторная БДQdrant (OSS)Self-hostedНаши
Кэш · очередиRedis · RabbitMQ · KafkaSelf-hostedНаши
CI/CDWoodpecker · DroneSelf-hostedНаши
ObservabilityPrometheus · Grafana · LokiSelf-hostedНаши
Object StorageMinIO · CephSelf-hostedНаши
Identity / SSOKeycloakSelf-hostedНаши
Корпус ЗнанийСвоя разработкаSelf-hostedНаши
Fine-TuningLLaMA-Factory + наш PipelineНаши H100/H200Наши
Принцип zero-внешних-зависимостей: софт — берём open-source (не пишем БД с нуля), но всегда self-hosted. Air-gap deployment возможен из коробки. Ни одного байта в чужом облаке.
5 · НОВАЯ КЛЮЧЕВАЯ ПЛОСКОСТЬ

GPU Fleet Control Plane — сотни серверов под контролем

📦

Provisioner

Заказ/отмена серверов · Spot vs Reserved pricing · жизненный цикл сервера от Provisioning до Released

🎯

Scheduler

Распределение задач по GPU · Affinity rules · Bin-packing · приоритет по R-уровню

📊

Fleet Health Monitor

GPU temp · power · VRAM · pending queue · ECC errors · throttle events

📈

Auto-Scaler

Предзаказ GPU под прогноз нагрузки · реагирование на пиковые часы

🔀

Model Router

Выбор модели под сложность задачи · routing задач между cold/hot моделями

💰

Cost Optimizer

Spot-арбитраж · выключение неиспользуемых GPU · ночной fine-tuning

Это не «devops-функция» — это первоклассный компонент архитектуры, напрямую влияющий на юнит-экономику каждой задачи.

5.2 · Provisioner

Жизненный цикл GPU-сервера

1

Provisioning

Заказ у провайдера

2

Warming

Загрузка модели в VRAM

3

Ready

Прогрев кэша (KV, embeddings)

4

Busy

Обработка задач

5

Draining

Завершение текущих

6

Released

Возврат провайдеру

Стратегия аренды флота

Базовая нагрузка
70%
Reserved · годовые контракты · A100, RTX 4090
Пиковая нагрузка
20%
On-demand · масштабирование под рост
Опортьюнистический
10%
Spot · ночное дообучение, фоновые задачи

Метрики Provisioner'а: GPU Procurement Lead Time · GPU Waste Ratio · Spot Eviction Rate.

5.3 · Scheduler

Bin-packing задач по GPU

Для каждой входящей задачи: 1. Model Router определяет модель (оркестратор / coder / reviewer / ...) 2. Scheduler ищет GPU-сервер с уже загруженной моделью (warm cache) 3. Если нет — ищет свободный GPU, загружает модель 4. Если флот заполнен — задача в очередь с приоритетом по R-уровню 5. Auto-Scaler оценивает: заказать новый сервер или подождать?

Affinity rules

GPU Utilisation
>70%
Цель H2 · % времени полезной работы
Task Queue Depth (P95)
<3
Средняя длина очереди
Cold Start Latency
<30с
От поступления до первого токена
5.4

Business Metrics Engine — расчёт на лету

Для каждой задачи в реальном времени вычисляются полные затраты и маржа.

Стоимость задачи = Σ(GPU_часы × цена_GPU/ч) + Σ(CPU_часы × цена_CPU/ч) + стоимость хостинга результата + накладные расходы Маржа задачи = цена_задачи − стоимость_задачи ROI GPU = (выручка от задач на этом GPU) / (стоимость аренды GPU) за скользящие 24 часа / 7 дней / 30 дней

Дашборд реального времени · Grafana

ПанельЧто показывает
Fleet OverviewОбщее кол-во GPU, утилизация, стоимость/час, задачи в очереди
Per-GPU DrilldownСервер: модель, задача, температура, VRAM, стоимость
Profitability HeatmapКакой GPU приносит наибольшую маржу
Task Cost BreakdownGPU + CPU + токены + накладные + маржа в разрезе задачи
Model EfficiencyСредняя стоимость токена, throughput, холодные старты
Forecast vs ActualПрогноз затрат на неделю vs факт, алерты при отклонении >15%
5.5

Cost Optimizer — автоматические решения

⏸️

Выключение неиспользуемых GPU

Сервер простаивает >30 мин → модель выгружается из VRAM, сервер переводится в standby (сниженная аренда).

🌙

Ночное дообучение

Часы низкой нагрузки (2-6 утра) — освободившиеся GPU автоматически переключаются на fine-tuning задач из очереди.

🎚️

Выбор модели под задачу

Простые задачи → Qwen 3.5 9B на A10 (дёшево). Сложные → Qwen 3.6 27B на A100 (дороже, но качественнее).

💱

Spot-арбитраж

Если spot-цена падает ниже reserved → Provisioner замещает reserved-серверы на spot, сохраняя контракты на пик.

6 · Корпус Знаний

Каждая задача делает следующую дешевле

Векторная база (Qdrant), куда после каждого успешного Outcome Check поступают артефакты задачи.

АртефактФорматСпособ поиска
SDD (спецификация)Полный текстСемантический поиск по описанию задачи
Код (реализация)Файлы с метаданнымиСемантический поиск по функциональности
ТестыProperty-based + regressionПоиск по тестируемому поведению
ДокументацияMarkdownСемантический поиск
Evidence BundleСтруктурированный JSONПоиск по метрикам качества
Outcome Hypothesis (подтверждённые)Структурированный JSONПоиск по бизнес-метрике
Mockarty артефактыМоки, тест-сьюты, контрактыПоиск по типу API и протоколу
6.2

Три сценария переиспользования

Сценарий 1

Поиск похожих задач

similarity > 0.85 → переиспользовать SDD целиком
> 0.70 → архитектурные решения
> 0.50 → похожие тесты / документация

Экономия токенов при 30% reuse
25-40%
Сценарий 2

Кэш инференса

Хэш(SDD + контекст) → поиск в Redis. Если найден — возвращаем закэшированный результат, минуя инференс полностью.

Применимость: Dockerfile, CI/CD pipeline, boilerplate, стандартные формы, CRUD-эндпоинты.

Сценарий 3

Outcome Hypothesis reuse

Подтверждённые гипотезы → автопредложение для похожих задач, бенчмаркинг ("медианный uplift для L-задач = 3.2%"), прогноз маржи.

6.3

Fine-Tuning Pipeline — дообучение моделей

1

Scheduler

Окно низкой нагрузки (ночь/выходные)

2

Reserve GPU

H100/H200 серверы для тренировки

3

Data Pipeline

Собирает датасет из Корпуса

4

LoRA/QLoRA

Trainer запускает fine-tuning

5

Eval Harness

Held-out тестовый набор

6

A/B Deploy

10% флота, сравнение с baseline

7

Promote/Rollback

Полный rollout или откат

Фильтры качества датасета

6.4

Экономика петли переиспользования

МЕС 1

Корпус Знаний = 10 задач · similarity reuse = 5%

Стоимость задачи: baseline. Начинаем собирать данные.

МЕС 3

Корпус = 50 задач · similarity reuse = 15%

Стоимость задачи: −12%. Меньше токенов на архитектуру.

МЕС 6

Корпус = 200 задач · similarity reuse = 30% · 1-й цикл fine-tuning Coder'а

Стоимость задачи: −25%. Reuse + fine-tuned модель.

МЕС 12

Корпус = 1000 задач · similarity reuse = 45% · 4 цикла fine-tuning · A/B-тестирование

Стоимость задачи: −40%. Накопительный эффект.

7.1

Governance Mesh — сквозной слой управления

🤖

Автономность

Надзор силами ИИ — review-agent, security-agent, guardian-agent. Человек только в исключениях.

Встроенность

Policy Hooks, Codified Guardrails — внутри процесса, а не отдельный шаг постфактум.

🌀

Адаптивность

R0–R5 динамически подстраивается под класс задачи, зрелость агента и зону риска.

Human-in-the-loop Decision Map

Точка валидацииКтоЭскалация
До запуска агентаProduct EngineerПовтор Discovery
Перед mergeReview-Agent + Tech LeadОтклонение
Перед stagingCI/CD gates + Security AgentАвто-блок
Перед productionRelease Gate + заказчикОтложенный релиз
+7 днейOutcome CheckFallback
7.4

Пять категорий угроз — защита с Mockarty

УгрозаБазовая защитаMockarty
Уязвимый кодSecurity Agent + SAST в CI/CDFuzzer Agent — инжект некорректных payloads, поиск уязвимостей
Hallucination APIКонтракты в SDD + runtime-валидацияContract Testing + Drift Detection — алерт при расхождении >14%
Supply chainSCA-сканирование, pinned-версииAPI Dependencies — мокирование внешних API для изоляции
Prompt injectionInput sandboxing + policy hooksProxy Mode — инжект задержек, замена заголовков
Over-engineeringReview-agent на соответствие классу задачиAPDEX Performance — нагрузочное тестирование выявляет избыточную сложность
7.5

Mockarty-конвейер качества

SDD написан

mock_builder Agent + Contract Registry

Генерация моков из SDD-контрактов. Регистрация API-контрактов задачи в общем реестре.

Код сгенерирован

api_tester Agent

Прогон тестов против сгенерированных моков. Сверка с контрактами — нет ли дрифта?

Тесты пройдены

fuzzer Agent + analyzer Agent

Фаззинг-атака на все эндпоинты. Анализ результатов, классификация уязвимостей.

Staging

Chaos Engine + Load Runner

Pod termination, network partitions. APDEX на целевой нагрузке. Resilience Check — восстанавливается ли система?

Production

Drift Monitor + Contract Health Dashboard

Непрерывное сравнение API с контрактами. Алерт при отклонении. Все артефакты → в Корпус Знаний.

8.2 · Тарифы

Заказчик платит за результат, не за процесс

Корректировка v2.1: токены × 5 — реальный расход многоагентной фабрики (оркестратор + 5 worker'ов, многократные итерации, контексты). Цена × 3 — себестоимость растёт, но reuse loop компенсирует часть.
S
Лендинг / бот
15 000 ₽
125 000 токенов
Деплой
Домен + SSL
Аналитика
M
SaaS / админка
45 000 ₽
400 000 токенов
+ CMS
+ Формы
+ CRM
L
Маркетплейс
135 000 ₽
1 250 000 токенов
+ Платежи
+ Каталог
+ Поиск
XL
Enterprise
360 000 ₽
3 750 000 токенов
+ Роли
+ Аудит
+ Compliance
2XL
Платформа
900 000 ₽
12.5M токенов
+ Мультитенант
+ API · SDK
Дополнительно: поддержка от 30 000 ₽/мес · срочное ×1.5 · enterprise SLA 24/7 от 150 000 ₽/мес · compliance — индивидуально.
8.3

Юнит-экономика — фиксированные затраты

Затраты/мес = GPU-аренда + CPU-аренда + Хостинг результатов + Аутсорс-сервисы (БД, кэш, векторы, CI/CD, DNS) + ФОТ команды (Tiny Teams) Себестоимость задачи = Затраты/мес / Число_задач/мес Выручка/мес = Σ (задач_i × цена_i) Прибыль = Выручка − Затраты Маржа = Прибыль / Выручка × 100%

Эффект масштаба — три рычага

Рычаг 1

Утилизация GPU

Фиксированная аренда распределяется на больше задач — себестоимость единицы падает.

Рычаг 2

Корпус Знаний

Переиспользование снижает расход токенов на 25-40% к концу года.

Рычаг 3

Fine-tuning

Дообученные модели генерируют качественнее и используют меньше токенов.

8.3 · АМБИЦИОЗНАЯ ТРАЕКТОРИЯ

Кривая роста — 10K задач/мес к 6-му месяцу

Tilda Russian = 1.5M пользователей. Это ориентир TAM. При правильной воронке (inbound + agency + perform marketing) массовый сегмент S/M открывается быстро.

H1 · к мес 3

1 500 задач/мес

Рамп воронки. 700 бесплатных пилотов + 1500 платных по early bird -30%.

H2 · к мес 6

10 000 задач/мес

Целевая точка. К концу H2 (мес 12) — 22K/мес. Cash-positive на мес 7-8.

H3 · к мес 24

70 000 задач/мес

Лидер сегмента. 800+ GPU в 2 собственных ДЦ. Запуск Black Box.

8.3 · ФОТ + микс

Микс задач и команда под массовый рост

МИКС ЗАДАЧ (90% мелких в H1, дрейф к L/XL в H3)

РазмерH1H2H3
S · лендинги, боты80%70%60%
M · SaaS, админки15%20%22%
L · маркетплейсы5%8%12%
XL · Enterprise01.5%4%
2XL · платформы00.5%2%
Средневзв. чек25.5 тыс ₽44 тыс ₽65 тыс ₽

КОМАНДА: ~50% инж · ~30% sales/CX · ~20% упр./опс

КатегорияH1H2H3
Инженерия (Agent, GPU, Data, Platform, QA)52764
Sales (inbound + outbound + Partner)11341
Marketing + Content + Perform0615
Customer Success0412
CEO/CTO + Finance/Ops + Юрист258
ИТОГО FTE857140
ФОТ gross/мес4.4 млн27.6 млн63.8 млн
ФОТ gross/период13.2 млн (3 мес)331 млн/год766 млн/год
Ключевой сдвиг: при 10K+ задач/мес нужна сильная sales/CX/marketing-функция. Это не «инженерный стартап с маркетингом» — это массовый product-led growth с агрессивной воронкой и партнёрской сетью.
8.4

Три налоговых сценария — эффект на маржу

A · Базовый

ОСН / УСН

  • Налог на прибыль 25%
  • Страховые 30% + 15% сверх МСП
  • НДС 20% (B2B-услуги)

Применяется по умолчанию для не-аккредитованных компаний.

B · IT-аккредитация

Минцифры (с дня 1)

  • Налог на прибыль 5%
  • Страховые 7.6% бессрочно
  • НДС 0% (реестр ПО)

Требует ≥70% ИТ-выручки и средней ЗП ≥ региона. Получается за 1-2 мес.

C · Сколково

Резидент ИНТЦ / ОЭЗ

  • Налог на прибыль 0%
  • Страховые 14%
  • НДС 0% · Имущество 0%

До 10 лет, лимит выручки 1 млрд ₽/год. Альт.: Иннополис, ИНТЦ МГУ.

Сравнение на примере H2 (выручка ~5 млрд, прибыль до налогов ~4 млрд)

СценарийНалог на прибыльСтраховые от ФОТ 331 млнЧистая прибыльМаржа
A · ОСН1 010 млн (25%)~99 млн (30%)~2.96 млрд ₽60%
B · IT-аккредитация202 млн (5%)~25 млн (7.6%)~3.78 млрд ₽77%
C · Сколково (лимит 1 млрд исчерпан)~1 010 млн~46 млн (14%)~2.95 млрд ₽60%
Парадокс на масштабе: при выручке >1 млрд ₽/год Сколково теряет свою главную льготу (лимит превышен). IT-аккредитация стабильно лучшая для ФОТ-тяжёлого профиля: +800 млн ₽ чистой прибыли vs ОСН в H2. С дня 1.
8.5 · Окупаемость

Горизонт H1 — рамп воронки + IT-аккредитация

3 месяца · 8 FTE · ~2 200 задач за период (рамп с 100 до 1500/мес). Critical path — построение воронки.

РАСХОДЫ H1

ФОТ gross (8 чел × 3 мес)13.2 млн ₽
GPU аренда (15 серв × 80K × 3)3.6 млн ₽
CPU + сеть + бэкапы0.9 млн ₽
Маркетинг (агрессивный старт)12 млн ₽
Sales (CRM, заказы)3 млн ₽
Юр. · ПО · прочее3 млн ₽
Итого расходы35.7 млн ₽

ВЫРУЧКА H1

700 бесплатных пилотов0 ₽
1 500 платных × 25.5K × 0.7 (early bird)26.8 млн ₽
Итого выручка~27 млн ₽

ФИНАНСОВЫЙ РЕЗУЛЬТАТ H1

A · ОСН
−12.6 млн ₽
B · IT-аккредитация
−9.7 млн ₽
Минимальный убыток
C · Сколково
−10.5 млн ₽
Требуется seed: 20-30 млн ₽

×2 vs прежняя оценка — потому что нужна агрессивная маркетинговая воронка для достижения 10K задач/мес к мес. 6.
8.5 · Окупаемость

Горизонт H2 — массовый рост, cash-positive с мес 7-8

9 мес · 57 FTE · 105 000 задач за год (рост с 1.5K до 22K/мес) · 250 GPU.

РАСХОДЫ H2 (9 мес)

ФОТ gross (57 чел средн., 9 мес)248 млн ₽
GPU инфра (среднее 150 × 80K × 9)108 млн ₽
CPU + сеть + хостинг клиентов30 млн ₽
Маркетинг агрессивный (CAC ~2K)380 млн ₽
Sales + Customer Success80 млн ₽
Поддержка + ITSM20 млн ₽
Юр. · ПО · офис25 млн ₽
Итого расходы~891 млн ₽

ВЫРУЧКА H2 (9 мес)

105 000 задач × 44K средневзв.4 620 млн ₽
Поддержка SLA (~5%)230 млн ₽
Enterprise (3-5 шт)80 млн ₽
Итого выручка~4 930 млн ₽

ПРИБЫЛЬ ДО НАЛОГОВ: ~4 040 млн ₽ · маржа 82%

СценарийЧистая прибыльМаржа
A · ОСН~2.96 млрд60%
B · IT-аккредитация~3.78 млрд77%
C · Сколково (лимит исчерпан)~2.95 млрд60%
CASH-POSITIVE
мес. 7-8
После выхода на 10K задач/мес
Series A нужна только под маркетинг H1-начало H2: 100-150 млн ₽. После мес 8 — компания себя кормит. Уже к концу H2 чистая прибыль покрывает все инвестиции 20×.
8.5 · Окупаемость

Горизонт H3 — доминирование сегмента

12 мес (мес 12-24) · 140 FTE · 540 000 задач/год (рост с 22K до 70K/мес) · 800+ GPU в 2 собственных ДЦ.

РАСХОДЫ H3 (год)

ФОТ gross (140 чел × 12 мес)766 млн ₽
GPU инфра (среднее 500 × 100K × 12)600 млн ₽
CAPEX свой ДЦ (амортизация 5 лет)200 млн ₽
CPU + сеть + хостинг150 млн ₽
Маркетинг + perform1 500 млн ₽
Sales + Customer Success250 млн ₽
Юр. · ПО · офис · прочее120 млн ₽
Поддержка + ITSM80 млн ₽
Итого~3 666 млн ₽

ВЫРУЧКА H3 (год)

540K задач × 65K средневзв.35 100 млн ₽
Поддержка SLA1 800 млн ₽
Enterprise (15-20)350 млн ₽
Black Box on-prem800 млн ₽
Итого~38 050 млн ₽

ПРИБЫЛЬ ДО НАЛОГОВ: ~34 380 млн ₽ · маржа 90%

СценарийЧистая прибыльМаржа
A · ОСН~25.6 млрд67%
B · IT-аккредитация~32.6 млрд86%
C · Сколково (лимит исчерпан)~25.7 млрд68%
ОКУПАЕМОСТЬ ИНВЕСТИЦИЙ
~9 мес
Seed 20-30M + Series A 100-150M = 130-180M ₽ при IT-аккредитации
12 · НОВЫЙ РАЗДЕЛ

Две продуктовые ветки — одна кодовая база

С самого начала строим в двух конфигурациях. Одни модели, одни агенты — разные способы доставки.

☁️
ВЕТКА 1 · ОСНОВНАЯ

Cloud Platform

Облачная платформа в нашем периметре. Заказчик подключается через личный кабинет, присылает идею — получает работающий продукт.

КлиентSMB · стартапы · e-commerce · EdTech
Размер сделки5K – 3M ₽
Time-to-value2-14 дней
Цикл продажи1-14 дней
Маржинальность70-80%
Доля выручки H365-70%
📦
ВЕТКА 2 · ENTERPRISE

Black Box on-prem

Герметичный комплект «под ключ» на инфраструктуре заказчика. Полностью air-gapped — никаких внешних подключений.

КлиентБанки · госы · оборонка · телеком · крупный ритейл
Размер сделки50-500 млн ₽ + 30-100 млн/год
Time-to-value2-6 месяцев
Цикл продажи3-12 месяцев
Маржинальность60-70% (с hardware)
Доля выручки H330-35%
Ключевая магия: одна и та же кодовая база, одни и те же fine-tuned модели. Black Box — это просто упакованная версия Cloud Platform, разворачиваемая у заказчика. Data flywheel работает в обе стороны (опционально).
12.2 · Black Box

Что входит в Black Box-поставку

🖥️

Hardware Layer

  • 4-12 GPU-серверов (H100/H200)
  • 2-4 CPU-нод (Postgres, Qdrant, MinIO)
  • Сетевое оборудование 100GbE
  • ИБП + ДГУ (опционально)
⚙️

Software Layer

  • Преднастроенный k3s кластер
  • IDP (Agent Runtime, Discovery, SDD)
  • GPU Fleet Control Plane
  • Mockarty полностью
  • Корпус Знаний + Business Metrics + Grafana
🧠

Models Layer

  • Все LLM-модели (Qwen 3.6, DeepSeek, Phi-4)
  • Базовый fine-tuned набор по сегменту
  • Возможность дообучать на данных клиента
📞

Support & SLA

  • Runbook'и операций · документация
  • SLA-контракт 24/7
  • Удалённый доступ для поддержки (опц.)
  • On-site инженер (доп. опция)

Бизнес-модель Black Box

Поставка комплектаот 50 млн ₽ (фикс)
Лицензия на ПО15-25% от стоимости поставки в год
Поддержка 24/7от 30 млн ₽/год
On-site инженерот 600 тыс ₽/мес
Кастомизация · доработка30 тыс ₽/чел-день
12.4 · Рынок РФ 2026

TAM · SAM · SOM — оценка рынка

Источники: Tadviser, J'son & Partners, прогноз Минцифры, наша экспертная оценка.

Объём рынка РФ 2026 (млрд ₽)

СегментОбъём 2026CAGR 2025-2030
Заказная разработка ПО (custom dev)~550 млрд12-15%
Цифровизация SMB~180 млрд18-22%
Госзаказ ИТ-разработки~320 млрд8-10%
Enterprise ИТ-разработка~400 млрд10-12%
Итого «прикладная разработка»~1 050 млрд~12%

TAM

Total Addressable

~165 млрд ₽
Задачи, потенциально автоматизируемые агентной фабрикой

Cloud: 90-110 млрд
Black Box: 60-70 млрд

SAM

Serviceable Available

~40 млрд ₽
Доступная нам часть с учётом компетенций и стека

Cloud: 25 млрд (SaaS-готовые)
Black Box: 15 млрд (регулир.)

SOM (мес 12 → мес 24 → год 5)

Serviceable Obtainable

5 → 38 → 88 млрд ₽
Cloud 4.9 → 37 → 80 · Black Box 0 → 0.8 → 8

К году 5 — категорийный лидер РФ + СНГ

12.5 · Конкуренты

Кто на рынке и в чём наш moat

Cloud-ветка

Конкуренты

ИгрокСлабость
Bolt.new · v0.devТолько фронтенд, API-модели, нет SLA
Replit AgentТолько dev-окружение, нет деплоя
Yandex Code AssistantПодсказки кода, не агент-делатель
Cursor · WindsurfIDE-инструмент, не сервис
Наш moat: полный продукт с доменом, SSL, CRM. Reuse loop. Own inference. Outcome Hypothesis.
Black Box-ветка

Конкуренты

ИгрокСлабость
Cognition (Devin)Cloud only, API-модели
Magic.devCloud only, не для КИИ
1С · Корус · ЛигаКлассическая разработка людьми
Внутренние ИТ-отделыНет AI-стека, нет fine-tuning
Наш moat: единственная self-hosted air-gapped агентная фабрика со своими fine-tuned моделями для русского compliance.
12.6

Roadmap двух веток параллельно

ПериодCloud PlatformBlack Box on-prem
H1 · 0-3 мес Только Cloud — MVP, пилоты, 5-10 заказчиков Подготовка documentation, типового SLA, договорной шаблон
H2 · 3-12 мес Активный рост · маркетинг · partner-network · 600+ задач 1-2 пилот-внедрения у дружественных клиентов
H3 · 12-24 мес Cloud масштаб · 800+ клиентов · cash-positive 5-10 коммерческих поставок · контракт 50-500 млн каждая
H4 · 24+ мес Cloud — лидер сегмента в РФ 20+ Black Box в год · 35-40% выручки

Распределение выручки по горизонтам

9 · Команда

Tiny Teams — 3–6 человек, end-to-end владение

РольЗадачаКомпетенции
Product EngineerDiscovery, SDD, валидацияБизнес-домен, facilitation, Outcome Hypothesis
Agent EngineerТюнинг агентов, среда исполненияContext Engineering, Multi-agent, Eval Design
Guardian Agent EngineerReview-agent, Codified GuardrailsSecurity, SAST/DAST, compliance
GPU Fleet Engineer новаяУправление GPU-флотом, Provisioner, SchedulerK8s, GPU-драйверы, DCGM, Prometheus, автоскейлинг
Data & Fine-Tuning Engineer новаяКорпус Знаний, fine-tuning pipeline, датасетыVector DB, LoRA/QLoRA, eval design, data quality
Quality & Mockarty Engineer новаяAPI-тестирование, моки, контракты, fuzzing, chaosMockarty, контрактное тестирование, APDEX, security testing
Platform EngineerIDP, Agent Runtime, CI/CD, observabilityK8s, CI/CD, MCP/A2A

6 ключевых компетенций

Context Engineering Eval Design Agent Debugging Outcome Thinking Governance as Code Multi-Agent Design
10.1 · АМБИЦИОЗНАЯ ТРАЕКТОРИЯ

Три горизонта — от рамп до флота 800+ GPU

H1 · 90 дней

MVP + рамп воронки

Discovery + SDD + single-agent. IT-аккредитация с дня 1. Маркетинг под рост.

Задач/мес (к концу)
1.5K
GPU-флот
15
A100, RTX 4090, A10, H100
Команда
8 FTE
H2 · 12 мес

Массовый рост · cash-positive

Multi-agent, Корпус Знаний, 1-й fine-tuning, agency-partners, Black Box-prep.

Задач/мес (к концу)
22K
10K к мес 6 (целевая точка)
GPU-флот
250+
A100, H100, RTX 4090/5090
Команда
57 FTE
H3 · 24+ мес

Доминирование + свой ДЦ

L4 long-running, Black Box-продажи, региональная экспансия, лидер сегмента.

Задач/мес (к концу)
70K
GPU-флот
800+
В 2 собственных ДЦ + резерв
Команда
140 FTE
10.2

90-дневный MVP-план

НЕД 1–2

GPU Bootstrap

Аренда первых GPU, развёртывание inference (vLLM), GPU Fleet Control Plane (Provisioner + Scheduler minimal)

НЕД 3–4

Discovery Engine

PR/FAQ-агент, Outcome Hypothesis-шаблон

НЕД 5–6

SDD Builder + Codified Guardrails

Шаблоны SDD, валидация R-уровня, бюджет токенов

НЕД 7–8

Цикл реализации + Mockarty (параллельно)

Single-agent (code + test + review + docs) · Интеграция Mockarty: моки из SDD, API-тестирование, контрактные проверки

НЕД 9–10

Деплой-пайплайн + Корпус Знаний v1

Сохранение артефактов, baseline-поиск

НЕД 11–12

Business Metrics Engine

Per-task cost, GPU utilisation dashboard

НЕД 13

Пилот

2-3 заказчика, сбор Outcome Hypothesis

10.3

Шесть антипаттернов

АнтипаттернЗащита
⚠️ Coding-Only AIDiscovery + Eval начиная с H1
⚠️ SDD без DiscoveryTemplate enforcement в IDP
⚠️ Ручное управление GPUGPU Fleet Control Plane с H1
⚠️ Игнорирование Корпуса ЗнанийСохранение артефактов с первой задачи
⚠️ Никогда не дообучатьFine-Tuning Pipeline с H2
⚠️ Vendor Lock-in (API-модели)Свой inference с нуля
11 · Метрики эффективности

Пять категорий — единая система измерений

📊 Бизнес-метрики

Outcome Validation Rate>70%
CSAT>4.5/5
Repeat Rate>40%
Себестоимость задачи (S)<2 500 ₽
Маржа (средняя)>50%

🖥️ GPU-флот

GPU Utilisation>70%
GPU Waste Ratio<10%
Task Queue Depth (P95)<3
Cold Start Latency (P95)<30с
Spot Eviction Rate<5%

🔄 Петля переиспользования

Corpus Reuse Rate>30%
Token Cost Reduction>25%
Fine-Tune Quality Gain>5%
Corpus-to-Model Latency<48ч
Model Drift Incidents0

🛡️ Качество + Mockarty

Regression Rate / 100 деплоев<2
Contract Drift Rate<5%
Fuzzing Coverage100%
Mock Accuracy>98%
APDEX Score (staging)>0.85
Заключение

Семь отличий, которые меняют правила

1

Свой inference

Zero API-затрат · полный контроль

2

Self-hosted всё

Open-source софт · наш периметр · zero внешних

3

Сотни GPU

Единая плоскость · бизнес-метрики на лету

4

Корпус Знаний

Reuse · −25-40% затрат · fine-tuning

5

Mockarty

10 протоколов · 11 AI-агентов · уже готово

6

Две ветки

Cloud (65%) + Black Box (35%) · одна база

7

IT-аккредитация

Налог 5% · страховые 7.6% · НДС 0%

ROI

~9 месяцев

При воронке 10K задач/мес @ мес 6 + IT-аккредитация

«The SDLC is dead. The new skill is context engineering. The new safety net is observability.» — Boris Tane, 2026
◆ Dark Factory · v2.1 · май 2026

Мы не строим инструмент.
Мы строим фабрику.

Не очередной AI-помощник для разработчиков.
Производственная линия, превращающая идею в подтверждённый бизнес-результат.

🚀 Свой inference 🔐 Self-hosted всё 🖥️ Свои ДЦ к H3 📊 Метрики на лету 🧠 Корпус Знаний 🎯 Fine-tuning 🧪 Mockarty ☁️ Cloud Platform 📦 Black Box 💼 IT-аккредитация

Спасибо. ESC для оглавления

навигация · ESC оглавление · F полный экран

Оглавление