Контрольные точки восстановления основного сервера

Назначение: Сводный перечень точек и шагов, по которым проверяется или восстанавливается состояние основного хоста DENKART.

1. Именованные точки восстановления (откат к сохранённому состоянию)

Именованная точка — снимок конфигов + LXD-снимки контейнеров + Git-тег. Используется для отката после неудачных изменений.

Точка	Метка / тег	Расположение ресурсов	Документ
Текущая	`working-version-2026-02-15`, тег `v1.7-working-version-2026-02-15`	Конфиги: `config/snapshots/state-working-version-2026-02-15-*/`; LXD-снимки — имена в `MANIFEST.txt`; код: `git checkout v1.7-working-version-2026-02-15`	RESTORE-POINT-PROCEDURE.md
Предыдущая (промежуточная)	`intermediate-working-moodle-lms-2026-02-12`	`config/snapshots/state-intermediate-working-moodle-lms-2026-02-12-*/`; LXD: `pre-proxy-20260212-0530`	INTERMEDIATE-WORKING-VERSION-2026-02-12.md
Предыдущая (стабильная)	`stable-restore-point` (2026-02-11)	`config/snapshots/state-stable-restore-point-2026-02-11-*/`; LXD: `pre-proxy-20260211-0004`	RESTORE-POINT-PROCEDURE.md

Быстрый откат к текущей точке: конфиги и iptables из снимка → lxc restore <container> <snapshot> по MANIFEST → git checkout v1.7-working-version-2026-02-15. Полное восстановление системы из бэкапа — по backup.md.

2. Чек-лист после перезагрузки (контрольные шаги проверки)

Выполняются после каждой перезагрузки сервера, чтобы убедиться, что загрузка прошла успешно и защита дисков/сервисы работают. Являются контрольными точками проверки, а не точками отката.

№	Контрольная точка	Команды / действие	Документ
1	Загрузка и диски	`uptime`, `df -h / /storage /D` (на `/` ≥ 2 ГБ, на `/storage` целевой резерв 80 ГБ)	POST-REBOOT-CHECKLIST.md
2	Защита от переполнения диска	`systemctl is-active disk-space-monitor.timer`, `systemctl is-enabled disk-space-monitor.timer`, `disk-space-boot-cleanup.service`	Там же
3	Монитор дисков (логи)	`sudo tail -30 /var/log/disk-space-monitor.log`	Там же
4	При /storage < 80 ГБ или < 100 ГБ	Плановая очистка: Docker prune, `cleanup-lxd-snapshots.sh` от пользователя cdto	Там же
5	Ключевые сервисы	`systemctl list-timers --all \\| grep -E backup\\|cleanup\\|disk-space`, `lxc list`, `docker ps`	Там же
6	Prometheus/алерты	Проверка контейнеров мониторинга и алертов по диску /storage	Там же

Расположение: описание шагов — в docs/operations/POST-REBOOT-CHECKLIST.md. Результаты проверки при необходимости фиксируются в операционном журнале.

3. Контрольные точки плана «Диски к 20:00» (приведение /storage к штату)

Используются при выполнении плана приведения дисков к нормальному состоянию к заданному времени (2026-02-15). Время и команды заданы в плане; результаты фиксируются в журнале исполнения.

Время	Контрольная точка	Действие / команды	Фиксация результата
16:40	КТ 1	`df -h /storage`, `tail -20 /tmp/cleanup-storage-2026-02-15.log`	STORAGE-PLAN-EXECUTION-LOG-2026-02-15.md
17:00	КТ 2	`df -h /storage`, `tail -30 /tmp/cleanup-storage-2026-02-15.log`	Там же
18:00	КТ 3	Оценка: ≥80 / 40–80 / <40 ГБ; при необходимости — проверка зависания очистки	Там же
18:30	Завершение очистки	`pgrep -af cleanup-lxd-snapshots`, `tail -50 ...log` (строка «Очистка снимков LXD завершена»)	Там же
18:35	Достижение 80 ГБ	`df -h /storage`; при <80 ГБ — резервные меры (логи Docker, повтор очистки)	Там же
19:00	Жёсткий контроль	`df -h /storage`; при <80 ГБ — `disk-space-emergency-cleanup.sh /storage 80`	Там же
19:00–19:35	Тестирование	Диски, монитор, таймеры, сервисы, алерты (по POST-REBOOT-CHECKLIST)	Там же
20:00	Дедлайн	Фиксация состояния, обновление отчётов при необходимости	Там же

Расположение: план — STORAGE-PLAN-DEADLINE-20-00-2026-02-15.md; журнал исполнения — STORAGE-PLAN-EXECUTION-LOG-2026-02-15.md. Ресурс лога очистки: /tmp/cleanup-storage-2026-02-15.log.

4. Предотвращение отказов загрузки (чек-лист и план)

Не точки отката, а шаги, снижающие риск необходимости восстановления после сбоя загрузки.

Ресурс	Назначение	Документ
План предотвращения отказов загрузки ОС	Меры по резерву ФС, очистке при загрузке, мониторингу дисков	BOOT-FAILURE-PREVENTION-PLAN.md
Чек-лист исполнения плана	Пошаговое выполнение (journald, logrotate, tune2fs, disk-space-boot-cleanup, монитор, таймеры)	BOOT-FAILURE-PREVENTION-CHECKLIST.md

5. Полное восстановление системы из бэкапа

При потере работоспособности хоста восстановление из полного бэкапа сервера выполняется по процедуре в backup.md. Каталоги полных бэкапов: /D/backups/full-backup-YYYYMMDD-HHMMSS/ или именованная копия вида restore-point-<метка>-YYYY-MM-DD/.

6. Сводка: где что лежит

Тип контрольной точки / ресурса	Расположение
Именованные точки восстановления (конфиги)	`config/snapshots/state-<метка>-<timestamp>/`
LXD-снимки контейнеров	Внутри LXD (имена в `MANIFEST.txt` снимка конфигов)
Git-тег текущей точки	`v1.7-working-version-2026-02-15`
Чек-лист после перезагрузки	`docs/operations/POST-REBOOT-CHECKLIST.md`
План «Диски к 20:00» и журнал исполнения	`docs/operations/STORAGE-PLAN-DEADLINE-20-00-2026-02-15.md`, `STORAGE-PLAN-EXECUTION-LOG-2026-02-15.md`
Лог очистки снимков (план к 20:00)	`/tmp/cleanup-storage-2026-02-15.log`
Процедура точки восстановления и откат	`docs/operations/RESTORE-POINT-PROCEDURE.md`
Полное восстановление из бэкапа	`docs/operations/backup.md`

Документ подготовлен: AI Denkart, технический директор.

operations/CONTROL-POINTS-MAIN-SERVER-RECOVERY.md

📖 Навигация

📄 Паспорт сервера

⚙️ Настройка

🔧 Операции

🐛 Проблемы