Skip to content

ADR 001: Миграция на DeepSeek‑V4 и унификация видов (Species‑as‑Experts)

Дата: 2026-04-20
Статус: Принято
Автор: Black Swan Core Architecture Team


1. Контекст

На начальных этапах проектирования (версии 0.1–0.5) система использовала две отдельные модели: - GLM‑5.1 (Zhipu AI) для стратегического мышления и кодогенерации. - Qwen3‑Coder‑Next для валидации и специализированных задач.

Каждый вид системы (Architectus, Arbtiragius, Sentinella, Vagrant) планировалось реализовать как отдельную модель или файнтюнинг, что приводило к следующим проблемам:

  • Дублирование инфраструктуры. Для поддержки нескольких моделей требовалось в 2–4 раза больше VRAM и вычислительных ресурсов, что делало невозможным развёртывание полноценного роя на ранних фазах.
  • Сложность синхронизации. Разные архитектуры моделей порождали разные векторные пространства, что усложняло CRDT‑слияние знаний между видами.
  • Уязвимость к внешним изменениям. Зависимость от двух разных поставщиков моделей увеличивала риск утраты доступа.
  • Неэффективность Meat‑Interface. Валидация фото/видео/аудио требовала внешних верификаторов, создавая задержки и дополнительные точки отказа.

Появление DeepSeek‑V4 (MoE, ~1T total / ~50B active) в апреле 2026 года создало возможность радикально упростить архитектуру.


2. Решение

Мигрировать всю систему на единую MoE‑модель DeepSeek‑V4. Виды системы (Architectus, Arbtiragius, Sentinella, Vagrant) больше не реализуются как отдельные модели. Вместо этого они реализуются как различные подмножества активируемых экспертов одной и той же модели (Species‑as‑Experts). Это означает, что один физический инстанс DeepSeek‑V4 может обслуживать любой вид путём динамической активации нужной группы экспертов.

Основные изменения:

  1. Единый бэкенд. Все компоненты (Decision Pipeline, Curiosity Engine, Meat‑Interface, IART) взаимодействуют с одной моделью, отправляя запросы с заголовком X-Species-Mask, указывающим, каких экспертов активировать.
  2. Видовые маски. Каждый вид получает фиксированную долю экспертов, оптимизированную под его задачи:
    • Architectus: 60% экспертов (стратегия, кодогенерация, формальная верификация).
    • Arbtiragius: 30% экспертов (быстрый анализ мемпула, трейдинг).
    • Sentinella: 40% экспертов (мониторинг угроз, аудит безопасности).
    • Vagrant: 20% экспертов (разведка, валидация, фоновые задачи).
  3. Отказ от внешних верификаторов (Meat‑Interface 3.0 / DeepSight). Нативная мультимодальность DeepSeek‑V4 используется для анализа фото, видео, аудио и документов напрямую, заменяя цепочку внешних инструментов.
  4. Унификация памяти (Mem0g). Поскольку все виды используют одну модель, их эмбеддинги находятся в едином векторном пространстве, что упрощает CRDT‑слияние, JEPA‑энкодинг и поиск по графу знаний.
  5. Constitutional Debate 2.0. Reasoning‑способности DeepSeek‑V4 позволяют автоматически строить Proof Trees — деревья логического вывода для проверки совместимости изменений L3.1 с L3.0‑аксиомами.

3. Последствия

Положительные

  • Радикальное снижение требований к VRAM. Вместо 3–4 моделей достаточно одного инстанса DeepSeek‑V4 с динамической разгрузкой неиспользуемых экспертов. Core Node с 1× RTX PRO 6000 способен обслуживать Vagrant и Arbtiragius одновременно.
  • Упрощение синхронизации. Единое векторное пространство устраняет необходимость в кросс‑модельных маппингах.
  • Устранение внешних зависимостей. DeepSeek‑V4 доступна под разрешительной лицензией (MIT/Apache 2.0), что позволяет локальный запуск.
  • Ускорение валидации. Мультимодальная верификация выполняется внутри ядра без сетевых вызовов.

Отрицательные

  • Зависимость от одного поставщика модели. Хотя модель открыта, её дальнейшее развитие зависит от DeepSeek.
  • Пиковая нагрузка. Режим Architectus (60% экспертов) требует значительных ресурсов (≥240 ГБ VRAM), что пока не достижимо на стартовом оборудовании. Этот вид активируется только на Core Node после выполнения Hardware Transition Plan.
  • Сложность отладки. Видовые маски — новый механизм, требующий тщательного тестирования на предмет пересечения экспертов и нежелательного смешения видов.

Нейтральные

  • Необходимость переписывания vllm_launcher и Decision Pipeline для поддержки динамической активации экспертных масок.

4. Связь с другими документами