lavr писал(а):
осознанно, смысл понятен?
Смысла здесь нет: нормально написанное ПО, и прежде всего серверное, обязано спокойно переживать холодную перезагрузку - подсистемы хранения непосредственно под это и проектируются, несмотря на чудовищные накладные расходы. И есть мнение что прод периодически
нужно выключать из розетки как минимум чтобы убедиться что он нормально переключается на fallback и потом корректно поднимается, потому что завтра это случится незапланированно. При всём при этом в первом сообщении даже намёка не было на выключение питания - кнопка, если вы не в курсе, в наше время шлёт ACPI событие, которое обязано обрабатываться системой именно как
==shutdown с корректным остановом служб, так что вы совершенно зря начали оффтопик на эту тему.
По теме, я бы предположил сразу две проблемы в настройках или поведении гипервизора и хоста: во-первых, очевидно что они не дожидаются пока виртуалка завершится - возможно она не успевает за отведённый таймаут и нужно его увеличить. Во-вторых, скорее всего неправильно настроена система хранения, потому что независимо от того успела виртуалка завершиться или нет, ФС не должна разваливаться. Гипервизор и хост добавляют два дополнительных storage слоя, и если любой из них игнорирует запросы на немедленную запись в энергонезависимое хранилище от виртуалки, то эта система хранения сломана. Нужно смотреть настройки про write caching и всё с этим связанное.