Dela via


Förstå en systemomstart för Azure virtuell dator

Gäller för: ✔️ virtuella Linux-datorer ✔️ virtuella Windows-datorer

Sammanfattning

Azure virtuella datorer kan ibland startas om utan uppenbar anledning, utan bevis på att du har initierat omstartsåtgärden. Den här artikeln innehåller en lista över åtgärder och händelser som kan orsaka att virtuella datorer startas om och ger insikter om hur du undviker oväntade omstartsproblem eller minskar effekten av sådana problem.

Konfigurera de virtuella datorerna för hög tillgänglighet

Det bästa sättet att skydda ett program som körs på Azure mot omstarter av virtuella datorer och driftstopp är att konfigurera de virtuella datorerna för hög tillgänglighet.

För att tillhandahålla den här redundansnivån till ditt program rekommenderar vi att du grupperar två eller flera virtuella datorer i en tillgänglighetsuppsättning. Den här konfigurationen säkerställer att minst en virtuell dator är tillgänglig under antingen en planerad eller oplanerad underhållshändelse och uppfyller 99,95 procent Azure serviceavtal.

Mer information om tillgänglighetsuppsättningar finns i Hantera tillgängligheten för virtuella datorer

Resurshälsainformation

Azure Resource Health är en tjänst som exponerar hälsotillståndet för enskilda Azure resurser och ger användbar vägledning för felsökning av problem. I en molnmiljö där det inte går att komma åt servrar eller infrastrukturelement direkt är målet med Resource Health att minska den tid som du lägger på felsökning. I synnerhet är syftet att minska den tid som du ägnar åt att avgöra om roten till problemet ligger i programmet eller i en händelse i Azure-plattformen. Mer information finns i Understand och använd Resource Health.

Om Azure har ytterligare information om rotorsaken till en plattformsinitierad otillgänglighet för en virtuell dator kan den informationen publiceras i resurshälsa upp till 72 timmar efter den inledande otillgängligheten.

Saknade driftstopp för virtuella datorer i aktivitetsloggen

Resource Health aviseringar skickas baserat på informationen activity Log. I vissa fall kan det hända att driftstopp för virtuella datorer inte visas i aktivitetsloggen. Om stilleståndstiden inte visas i aktivitetsloggen skickas inte Resource Health aviseringar för stilleståndstiden. Stilleståndstiden visas fortfarande i Resource Health.

Här är de fall där driftstopp för virtuella datorer inte visas i aktivitetsloggen:

  • När en virtuell dator skapas eller migreras till en ny värd visas inte den virtuella datorns tillstånd korrekt Azure plattform och tillståndet ändras till Okänt. Först när alla nätverksanslutnings- och nodprocesser har upprättats ändras den virtuella datorns tillstånd till Tillgänglig. Den långa perioden för tillståndet Okänt filtreras bort från aktivitetsloggen.
  • När den virtuella datorns tillgänglighetstillstånd ändras från Tillgänglig till otillgänglig och sedan återgår till Tillgänglig inom 35 sekunder visas inte stilleståndstiden i aktivitetsloggen. Det här fallet inträffar inte om en korrelerad stilleståndstid skickas inom 15 minuter innan den första övergången inträffar.
  • Om den virtuella datorns hälsotillstånd ändras från ett tillstånd till Okänt och sedan återgår till det ursprungliga tillståndet filtreras det tillfälliga okända tillståndet och relaterade övergångar bort från aktivitetsloggen.

De virtuella datoravbrott som inte visas i aktivitetsloggen filtreras på Azure plattformssidan för att förhindra att tillfälliga fel visar felaktiga driftstopp för kunderna. Med pågående investeringar i hälsokvalitet för virtuella datorer är filtren kanske inte längre nödvändiga och kan leda till att snabba ändringar i den virtuella datorns hälsa förblir orapporterade. Microsoft arbetar med en utfasningsplan för att leverera den bästa kundupplevelsen.

Åtgärder och händelser som kan göra att den virtuella datorn startas om

Planerat underhåll

Microsoft Azure utför regelbundet uppdateringar över hela världen för att förbättra tillförlitligheten, prestandan och säkerheten för värdinfrastrukturen som ligger till grund för virtuella datorer. Många av dessa uppdateringar, inklusive minnesbevarande uppdateringar, utförs utan någon inverkan på dina virtuella datorer eller molntjänster.

Vissa uppdateringar kräver dock en omstart. I sådana fall stängs de virtuella datorerna av medan vi korrigerar infrastrukturen och sedan startas de virtuella datorerna om.

Information om vad Azure planerat underhåll är och hur det kan påverka tillgängligheten för dina virtuella Linux-datorer finns i artiklarna här. Artiklarna innehåller bakgrund om Azure planerade underhållsprocessen och hur du schemalägger planerat underhåll för att ytterligare minska påverkan.

Minnesbevarande uppdateringar

För den här klassen med uppdateringar i Microsoft Azure påverkas inte de virtuella datorer som körs. Många av de här uppdateringarna är till komponenter eller tjänster som kan uppdateras utan att störa den instans som körs. Vissa är uppdateringar av plattformsinfrastrukturen på värdoperativsystemet som kan tillämpas utan omstart av de virtuella datorerna.

De här minnesbevarande uppdateringarna möjliggörs med teknik som aktiverar livemigrering på plats. När den uppdateras placeras den virtuella datorn i ett pausat tillstånd. Det här tillståndet bevarar minnet i RAM medan det underliggande värdoperativsystemet får nödvändiga uppdateringar och korrigeringar. Den virtuella datorn återupptas vanligtvis inom 30 sekunder efter att den har pausats. När det virtuella datorn har återupptagits synkroniseras klockan automatiskt.

På grund av den korta pausperioden minskar distributionen av uppdateringar via den här mekanismen avsevärt effekten på de virtuella datorerna. Alla uppdateringar kan dock inte distribueras på det här sättet.

Uppdateringar med flera instanser (för virtuella datorer i en tillgänglighetsuppsättning) tillämpas med en uppdateringsdomän i taget.

Obs!

Linux-datorer som har gamla kernelversioner påverkas av en kernel-panik under den här uppdateringsmetoden. Undvik det här problemet genom att uppdatera till kernelversion 3.10.0-327.10.1 eller senare. Mer information finns i En Azure virtuell Linux-dator på en 3,10-baserad kernel får panik efter en uppgradering av värdnoden.

Användarinitierade åtgärder för omstart eller avstängning

Om du startar om från Azure-portalen, Azure PowerShell, kommandoradsgränssnittet eller REST-API:et hittar du händelsen i Azure aktivitetslogg.

Om du utför åtgärden från den virtuella datorns operativsystem kan du hitta händelsen i systemloggarna.

Andra scenarier som vanligtvis gör att den virtuella datorn startas om inkluderar flera åtgärder för konfigurationsändring. Normalt visas ett varningsmeddelande som anger att körning av en viss åtgärd resulterar i en omstart av den virtuella datorn. Exempel är eventuella åtgärder för storleksändring av virtuella datorer, ändring av lösenordet för det administrativa kontot och inställning av en statisk IP-adress.

Microsoft Defender för molnet och Windows Update

Microsoft Defender för molnet övervakar dagliga Windows och virtuella Linux-datorer för saknade operativsystemuppdateringar. Defender för molnet hämtar en lista över tillgängliga säkerhetsuppdateringar och kritiska uppdateringar från Windows Update eller Windows Server Update Services (WSUS), beroende på vilken tjänst som har konfigurerats på en Windows virtuell dator. Defender för molnet söker också efter de senaste uppdateringarna för Linux-system. Om den virtuella datorn saknar en systemuppdatering rekommenderar Defender för molnet att du tillämpar systemuppdateringar. Tillämpningen av dessa systemuppdateringar styrs via Defender för molnet i Azure-portalen. När du har tillämpat vissa uppdateringar kan omstarter av virtuella datorer krävas. För mer information, se Tillämpa systemuppdateringar i Microsoft Defender för molnet.

Precis som lokala servrar skickar Azure inte uppdateringar från Windows Update till Windows virtuella datorer, eftersom dessa datorer är avsedda att hanteras av användarna. Du uppmanas dock att lämna inställningen automatisk Windows Update aktiverad. Automatisk installation av uppdateringar från Windows Update kan också orsaka omstarter när uppdateringarna har tillämpats. Mer information finns i vanliga frågor och svar om Windows Update.

Andra situationer som påverkar tillgängligheten för den virtuella datorn

Det finns andra fall där Azure aktivt kan pausa användningen av en virtuell dator. Du får e-postaviseringar innan den här åtgärden vidtas, så du kan lösa de underliggande problemen. Exempel på problem som påverkar tillgängligheten för virtuella datorer är säkerhetsöverträdelser och upphörande av betalningsmetoder.

Värdserverfel

Den virtuella datorn finns på en fysisk server som körs i ett Azure datacenter. Den fysiska servern kör en agent som kallas värdagenten utöver några andra Azure komponenter. När dessa Azure programvarukomponenter på den fysiska servern inte svarar utlöser övervakningssystemet en omstart av värdservern för att försöka återställa. I många fall är den virtuella datorn tillgänglig igen inom 10–15 minuter och fortsätter att finnas på samma värd som tidigare.

Serverfel orsakas vanligtvis av maskinvarufel, till exempel fel på en hårddisk eller solid state-enhet. Azure övervakar dessa förekomster kontinuerligt, identifierar underliggande buggar och distribuerar uppdateringar efter att åtgärden har implementerats och testats.

Eftersom vissa värdserverfel kan vara specifika för den servern kan en upprepad omstart av virtuell dator förbättras genom att den virtuella datorn distribueras manuellt till en annan värdserver. Den här åtgärden kan utlösas med hjälp av alternativet redeploy på informationssidan för den virtuella datorn eller genom att stoppa och starta om den virtuella datorn i Azure-portalen.

Automatisk återställning

Azure-plattformen är utformad för att hantera problem med värdnoder med minimal påverkan på den virtuella datorns prestanda. När en värdnod stöter på ett problem försöker Azure först med den minst störande återställningsmetoden, som är att starta om värdnoden. Om det inte går att starta om värden eller om problemet är maskinvarurelaterat initierar Azure en automatisk återställningsåtgärd för att ta bort den felaktiga värden ur drift för vidare undersökning. Som en del av den här automatiska återställningen kommer en process som kallas tjänståterställning automatiskt att flytta alla virtuella datorer på den felaktiga värden till en annan felfri. Den här processen slutförs vanligtvis inom 15 minuter, även om återställningstiden kan variera beroende på faktorer som systemets minnesstorlek och återställningsmetoder som används. Tjänståterställning används vanligtvis som en sista utväg för maskinvarufel för att säkerställa att virtuella datorer fortsätter att fungera utan betydande stilleståndstid.

Mer information om hur Azure hanterar dessa scenarier finns i Service Healing – Automatisk återställning av Virtual Machines.

Oplanerat underhåll

I sällsynta fall kan Azure driftsteamet behöva utföra underhållsaktiviteter för att säkerställa den övergripande hälsan för Azure-plattformen. Det här beteendet kan påverka tillgängligheten för virtuella datorer och resulterar vanligtvis i samma åtgärd för automatisk återställning som beskrevs tidigare.

Oplanerat underhåll omfattar följande:

  • Brådskande noddefragmentering
  • Brådskande uppdateringar av nätverksväxel

VM-krascher

Virtuella datorer kan startas om på grund av interna problem med virtuella datorer eller maskinvaruproblem, till exempel ett operativsystemdiskproblem, enligt beskrivningen tidigare. Arbetsbelastningen eller rollen som körs på den virtuella datorn kan utlösa en buggkontroll i gästoperativsystemet. Om du vill hitta orsaken till kraschen kontrollerar du system- och programloggarna efter Windows virtuella datorer och serieloggarna för virtuella Linux-datorer. Att samla in en minnesdump är vanligtvis det bästa sättet att identifiera grundorsaken.

Mer information finns i följande artiklar:

Virtuella datorer i Azure förlitar sig på virtuella diskar för operativsystem och datalagring som finns på den Azure Storage infrastrukturen. När tillgängligheten eller anslutningen mellan den virtuella datorn och de associerade virtuella diskarna påverkas i mer än 180 sekunder, utför Azure-plattformen en tvingad avstängning av de virtuella datorerna för att undvika skadade data. De virtuella datorerna aktiveras automatiskt när lagringsanslutningen har återställts. Avstängningen kan vara så kort som fem minuter men kan vara betydligt längre.

Andra incidenter

I sällsynta fall kan ett utbrett problem påverka flera servrar i ett Azure datacenter. Om det här problemet uppstår skickar Azure-teamet e-postaviseringar till de berörda prenumerationerna. Du kan kontrollera Azure Service Health instrumentpanelen och Azure-portalen för status för pågående avbrott och tidigare incidenter.

Diagnostisera omstarter av virtuella datorer

Du kan använda bladet Diagnostisera och lösa på bladet för den virtuella datorn för att köra ytterligare diagnostik. Det kan bero på mer specifika orsaker till den senaste omstarten av den virtuella datorn. Om det finns problem med gästoperativsystemet samlar du in en minnesdump och kontaktar supporten.