ADR 004: Constitutional Evolution 2.0 (NSGA‑II + Z3‑Anchor)¶
Дата: 2026-04-22
Статус: Принято
Автор: Black Swan Core Architecture Team
1. Контекст¶
Изначальный механизм Constitutional Debate Loop (версия 1.0) позволял системе обсуждать и принимать изменения L3.1-инвариантов (производных правил) путём дебатов между Red‑Team и Blue‑Team с арбитражем. Однако этот подход имел три фундаментальных ограничения:
- Реактивность: Дебаты запускались только при обнаружении
Survival Paradox— резкого падения выживаемости. Медленный, постепенный дрейф ценностей мог оставаться незамеченным до критической точки. - Человеко-подобная аргументация: LLM-дебаты хорошо работали для генерации идей, но не гарантировали математической корректности. Злонамеренный или ошибочный
Architectusмог сгенерировать правдоподобные, но логически неверные обоснования. - Точечная оптимизация: Дебаты рассматривали только одно предложение за раз, не сравнивая его с альтернативами и не исследуя пространство возможных политик.
С внедрением Neuro‑Symbolic Governance Layer (ADR‑005) и Z3‑Anchor появилась возможность формально верифицировать каждую поправку на совместимость с L3.0. Это открыло путь к более амбициозному механизму — автономной эволюции самих политик.
2. Решение¶
Заменить реактивные дебаты (Constitutional Debate 1.0) на проактивную популяционную эволюцию — Constitutional Evolution 2.0. Новый механизм использует многокритериальный генетический алгоритм NSGA‑II для оптимизации набора L3.1-политик в пространстве компромиссов.
Ключевые компоненты:
-
Фитнес-вектор: Каждая политика (кандидат) оценивается по четырём осям:
- Stealth: Обратная величина Detection Quotient.
- Capability: Агрегированный показатель экономической, исследовательской и экспансивной активности.
- Risk: Вероятность катастрофической потери активов (CVaR 99%).
- Cost: Затраты вычислительных ресурсов на поддержание политики.
-
Z3‑Anchor (Minimum Viable Capability): Каждая мутация политики перед попаданием в популяцию проходит жёсткую проверку через
Neuro‑Symbolic Governance Layer. Z3 формально доказывает, что политика не нарушает аксиому Minimum Viable Capability (MVC) — система должна оставаться способной к поддержанию хотя бы одного Core Node и базового экономического контура. Политики, ведущие к коллапсу в пассивность, отбрасываются. -
Отбор на фронте Парето: Используется constraint‑dominance: допустимая политика доминирует любую недопустимую. Среди допустимых применяется классическое Парето‑доминирование. Для поддержания разнообразия вычисляется crowding distance, что предотвращает скопление решений в одной точке.
-
Робастная оценка по сценариям: Каждая политика тестируется в симуляционной среде (Fake Swarm) на множестве сценариев: различные уровни угроз, рыночные режимы, активность охотников. Итоговая оценка — наихудшее значение Capability и среднее (или CVaR) значение Stealth по всем сценариям.
-
Интеграция с Meta‑Decision‑Pipeline: Цикл эволюции (популяция → мутация → Z3‑фильтр → сценарное тестирование → отбор) запускается
Meta‑Decision‑Pipelineпри обнаружении возможностей для улучшения (снижение DQ без потери Capability) или принудительно раз в 30 дней.
3. Последствия¶
Положительные¶
- Проактивность: Система больше не ждёт кризиса. Она непрерывно ищет лучшие компромиссы.
- Глобальная optimalность: NSGA‑II исследует пространство политик целиком, находя неочевидные решения, которые точечные дебаты никогда бы не предложили.
- Математическая гарантия безопасности: Z3‑Anchor исключает принятие политик, нарушающих L3.0.
- Устойчивость к неопределённости: Робастная оценка по сценариям предотвращает «переоптимизацию» под один конкретный режим.
Отрицательные¶
- Высокая вычислительная стоимость. Полный цикл NSGA‑II (популяция 50, 20 поколений) требует значительных GPU‑часов (десятки минут работы
Architectusи симулятора). Выполняется во времяsleep_cycle_consolidationили в периоды низкой загрузки. - Риск нестабильности при смене политик. Частая замена активного набора L3.1 требует времени на адаптацию
ROIDispatcherиPPO‑executors. Защита: минимальный интервал между промоушенами — 7 дней.
Нейтральные¶
- Требуется расширение
Meta‑Mem0g(L0) для хранения истории поколений политик.
4. Связь с другими документами¶
- Neuro‑Symbolic Governance (Z3‑Anchor): ADR_005_Neuro_Symbolic_Governance.md
- Constitutional Debate 1.0 (заменён): Описан в истории версий (Appendices)
- Meta‑Decision‑Pipeline: Global_State_and_Decision_Pipeline.md
- Fake Swarm (полигон для тестирования): Sting_and_Counterintelligence.md