Контрольные точки восстановления основного сервера

Назначение: Сводный перечень точек и шагов, по которым проверяется или восстанавливается состояние основного хоста DENKART.


1. Именованные точки восстановления (откат к сохранённому состоянию)

Именованная точка — снимок конфигов + LXD-снимки контейнеров + Git-тег. Используется для отката после неудачных изменений.

Точка Метка / тег Расположение ресурсов Документ
Текущая working-version-2026-02-15, тег v1.7-working-version-2026-02-15 Конфиги: config/snapshots/state-working-version-2026-02-15-*/; LXD-снимки — имена в MANIFEST.txt; код: git checkout v1.7-working-version-2026-02-15 RESTORE-POINT-PROCEDURE.md
Предыдущая (промежуточная) intermediate-working-moodle-lms-2026-02-12 config/snapshots/state-intermediate-working-moodle-lms-2026-02-12-*/; LXD: pre-proxy-20260212-0530 INTERMEDIATE-WORKING-VERSION-2026-02-12.md
Предыдущая (стабильная) stable-restore-point (2026-02-11) config/snapshots/state-stable-restore-point-2026-02-11-*/; LXD: pre-proxy-20260211-0004 RESTORE-POINT-PROCEDURE.md

Быстрый откат к текущей точке: конфиги и iptables из снимка → lxc restore <container> <snapshot> по MANIFEST → git checkout v1.7-working-version-2026-02-15. Полное восстановление системы из бэкапа — по backup.md.


2. Чек-лист после перезагрузки (контрольные шаги проверки)

Выполняются после каждой перезагрузки сервера, чтобы убедиться, что загрузка прошла успешно и защита дисков/сервисы работают. Являются контрольными точками проверки, а не точками отката.

Контрольная точка Команды / действие Документ
1 Загрузка и диски uptime, df -h / /storage /D (на / ≥ 2 ГБ, на /storage целевой резерв 80 ГБ) POST-REBOOT-CHECKLIST.md
2 Защита от переполнения диска systemctl is-active disk-space-monitor.timer, systemctl is-enabled disk-space-monitor.timer, disk-space-boot-cleanup.service Там же
3 Монитор дисков (логи) sudo tail -30 /var/log/disk-space-monitor.log Там же
4 При /storage < 80 ГБ или < 100 ГБ Плановая очистка: Docker prune, cleanup-lxd-snapshots.sh от пользователя cdto Там же
5 Ключевые сервисы systemctl list-timers --all \| grep -E backup\|cleanup\|disk-space, lxc list, docker ps Там же
6 Prometheus/алерты Проверка контейнеров мониторинга и алертов по диску /storage Там же

Расположение: описание шагов — в docs/operations/POST-REBOOT-CHECKLIST.md. Результаты проверки при необходимости фиксируются в операционном журнале.


3. Контрольные точки плана «Диски к 20:00» (приведение /storage к штату)

Используются при выполнении плана приведения дисков к нормальному состоянию к заданному времени (2026-02-15). Время и команды заданы в плане; результаты фиксируются в журнале исполнения.

Время Контрольная точка Действие / команды Фиксация результата
16:40 КТ 1 df -h /storage, tail -20 /tmp/cleanup-storage-2026-02-15.log STORAGE-PLAN-EXECUTION-LOG-2026-02-15.md
17:00 КТ 2 df -h /storage, tail -30 /tmp/cleanup-storage-2026-02-15.log Там же
18:00 КТ 3 Оценка: ≥80 / 40–80 / <40 ГБ; при необходимости — проверка зависания очистки Там же
18:30 Завершение очистки pgrep -af cleanup-lxd-snapshots, tail -50 ...log (строка «Очистка снимков LXD завершена») Там же
18:35 Достижение 80 ГБ df -h /storage; при <80 ГБ — резервные меры (логи Docker, повтор очистки) Там же
19:00 Жёсткий контроль df -h /storage; при <80 ГБ — disk-space-emergency-cleanup.sh /storage 80 Там же
19:00–19:35 Тестирование Диски, монитор, таймеры, сервисы, алерты (по POST-REBOOT-CHECKLIST) Там же
20:00 Дедлайн Фиксация состояния, обновление отчётов при необходимости Там же

Расположение: план — STORAGE-PLAN-DEADLINE-20-00-2026-02-15.md; журнал исполнения — STORAGE-PLAN-EXECUTION-LOG-2026-02-15.md. Ресурс лога очистки: /tmp/cleanup-storage-2026-02-15.log.


4. Предотвращение отказов загрузки (чек-лист и план)

Не точки отката, а шаги, снижающие риск необходимости восстановления после сбоя загрузки.

Ресурс Назначение Документ
План предотвращения отказов загрузки ОС Меры по резерву ФС, очистке при загрузке, мониторингу дисков BOOT-FAILURE-PREVENTION-PLAN.md
Чек-лист исполнения плана Пошаговое выполнение (journald, logrotate, tune2fs, disk-space-boot-cleanup, монитор, таймеры) BOOT-FAILURE-PREVENTION-CHECKLIST.md

5. Полное восстановление системы из бэкапа

При потере работоспособности хоста восстановление из полного бэкапа сервера выполняется по процедуре в backup.md. Каталоги полных бэкапов: /D/backups/full-backup-YYYYMMDD-HHMMSS/ или именованная копия вида restore-point-<метка>-YYYY-MM-DD/.


6. Сводка: где что лежит

Тип контрольной точки / ресурса Расположение
Именованные точки восстановления (конфиги) config/snapshots/state-<метка>-<timestamp>/
LXD-снимки контейнеров Внутри LXD (имена в MANIFEST.txt снимка конфигов)
Git-тег текущей точки v1.7-working-version-2026-02-15
Чек-лист после перезагрузки docs/operations/POST-REBOOT-CHECKLIST.md
План «Диски к 20:00» и журнал исполнения docs/operations/STORAGE-PLAN-DEADLINE-20-00-2026-02-15.md, STORAGE-PLAN-EXECUTION-LOG-2026-02-15.md
Лог очистки снимков (план к 20:00) /tmp/cleanup-storage-2026-02-15.log
Процедура точки восстановления и откат docs/operations/RESTORE-POINT-PROCEDURE.md
Полное восстановление из бэкапа docs/operations/backup.md

Документ подготовлен: AI Denkart, технический директор.