Контрольные точки восстановления основного сервера
Назначение: Сводный перечень точек и шагов, по которым проверяется или восстанавливается состояние основного хоста DENKART.
1. Именованные точки восстановления (откат к сохранённому состоянию)
Именованная точка — снимок конфигов + LXD-снимки контейнеров + Git-тег. Используется для отката после неудачных изменений.
| Точка | Метка / тег | Расположение ресурсов | Документ |
|---|---|---|---|
| Текущая | working-version-2026-02-15, тег v1.7-working-version-2026-02-15 |
Конфиги: config/snapshots/state-working-version-2026-02-15-*/; LXD-снимки — имена в MANIFEST.txt; код: git checkout v1.7-working-version-2026-02-15 |
RESTORE-POINT-PROCEDURE.md |
| Предыдущая (промежуточная) | intermediate-working-moodle-lms-2026-02-12 |
config/snapshots/state-intermediate-working-moodle-lms-2026-02-12-*/; LXD: pre-proxy-20260212-0530 |
INTERMEDIATE-WORKING-VERSION-2026-02-12.md |
| Предыдущая (стабильная) | stable-restore-point (2026-02-11) |
config/snapshots/state-stable-restore-point-2026-02-11-*/; LXD: pre-proxy-20260211-0004 |
RESTORE-POINT-PROCEDURE.md |
Быстрый откат к текущей точке: конфиги и iptables из снимка → lxc restore <container> <snapshot> по MANIFEST → git checkout v1.7-working-version-2026-02-15. Полное восстановление системы из бэкапа — по backup.md.
2. Чек-лист после перезагрузки (контрольные шаги проверки)
Выполняются после каждой перезагрузки сервера, чтобы убедиться, что загрузка прошла успешно и защита дисков/сервисы работают. Являются контрольными точками проверки, а не точками отката.
| № | Контрольная точка | Команды / действие | Документ |
|---|---|---|---|
| 1 | Загрузка и диски | uptime, df -h / /storage /D (на / ≥ 2 ГБ, на /storage целевой резерв 80 ГБ) |
POST-REBOOT-CHECKLIST.md |
| 2 | Защита от переполнения диска | systemctl is-active disk-space-monitor.timer, systemctl is-enabled disk-space-monitor.timer, disk-space-boot-cleanup.service |
Там же |
| 3 | Монитор дисков (логи) | sudo tail -30 /var/log/disk-space-monitor.log |
Там же |
| 4 | При /storage < 80 ГБ или < 100 ГБ | Плановая очистка: Docker prune, cleanup-lxd-snapshots.sh от пользователя cdto |
Там же |
| 5 | Ключевые сервисы | systemctl list-timers --all \| grep -E backup\|cleanup\|disk-space, lxc list, docker ps |
Там же |
| 6 | Prometheus/алерты | Проверка контейнеров мониторинга и алертов по диску /storage | Там же |
Расположение: описание шагов — в docs/operations/POST-REBOOT-CHECKLIST.md. Результаты проверки при необходимости фиксируются в операционном журнале.
3. Контрольные точки плана «Диски к 20:00» (приведение /storage к штату)
Используются при выполнении плана приведения дисков к нормальному состоянию к заданному времени (2026-02-15). Время и команды заданы в плане; результаты фиксируются в журнале исполнения.
| Время | Контрольная точка | Действие / команды | Фиксация результата |
|---|---|---|---|
| 16:40 | КТ 1 | df -h /storage, tail -20 /tmp/cleanup-storage-2026-02-15.log |
STORAGE-PLAN-EXECUTION-LOG-2026-02-15.md |
| 17:00 | КТ 2 | df -h /storage, tail -30 /tmp/cleanup-storage-2026-02-15.log |
Там же |
| 18:00 | КТ 3 | Оценка: ≥80 / 40–80 / <40 ГБ; при необходимости — проверка зависания очистки | Там же |
| 18:30 | Завершение очистки | pgrep -af cleanup-lxd-snapshots, tail -50 ...log (строка «Очистка снимков LXD завершена») |
Там же |
| 18:35 | Достижение 80 ГБ | df -h /storage; при <80 ГБ — резервные меры (логи Docker, повтор очистки) |
Там же |
| 19:00 | Жёсткий контроль | df -h /storage; при <80 ГБ — disk-space-emergency-cleanup.sh /storage 80 |
Там же |
| 19:00–19:35 | Тестирование | Диски, монитор, таймеры, сервисы, алерты (по POST-REBOOT-CHECKLIST) | Там же |
| 20:00 | Дедлайн | Фиксация состояния, обновление отчётов при необходимости | Там же |
Расположение: план — STORAGE-PLAN-DEADLINE-20-00-2026-02-15.md; журнал исполнения — STORAGE-PLAN-EXECUTION-LOG-2026-02-15.md. Ресурс лога очистки: /tmp/cleanup-storage-2026-02-15.log.
4. Предотвращение отказов загрузки (чек-лист и план)
Не точки отката, а шаги, снижающие риск необходимости восстановления после сбоя загрузки.
| Ресурс | Назначение | Документ |
|---|---|---|
| План предотвращения отказов загрузки ОС | Меры по резерву ФС, очистке при загрузке, мониторингу дисков | BOOT-FAILURE-PREVENTION-PLAN.md |
| Чек-лист исполнения плана | Пошаговое выполнение (journald, logrotate, tune2fs, disk-space-boot-cleanup, монитор, таймеры) | BOOT-FAILURE-PREVENTION-CHECKLIST.md |
5. Полное восстановление системы из бэкапа
При потере работоспособности хоста восстановление из полного бэкапа сервера выполняется по процедуре в backup.md. Каталоги полных бэкапов: /D/backups/full-backup-YYYYMMDD-HHMMSS/ или именованная копия вида restore-point-<метка>-YYYY-MM-DD/.
6. Сводка: где что лежит
| Тип контрольной точки / ресурса | Расположение |
|---|---|
| Именованные точки восстановления (конфиги) | config/snapshots/state-<метка>-<timestamp>/ |
| LXD-снимки контейнеров | Внутри LXD (имена в MANIFEST.txt снимка конфигов) |
| Git-тег текущей точки | v1.7-working-version-2026-02-15 |
| Чек-лист после перезагрузки | docs/operations/POST-REBOOT-CHECKLIST.md |
| План «Диски к 20:00» и журнал исполнения | docs/operations/STORAGE-PLAN-DEADLINE-20-00-2026-02-15.md, STORAGE-PLAN-EXECUTION-LOG-2026-02-15.md |
| Лог очистки снимков (план к 20:00) | /tmp/cleanup-storage-2026-02-15.log |
| Процедура точки восстановления и откат | docs/operations/RESTORE-POINT-PROCEDURE.md |
| Полное восстановление из бэкапа | docs/operations/backup.md |
Документ подготовлен: AI Denkart, технический директор.