Procesul de întârziere al proiectului protejează vms-ul dvs. împotriva erorilor gazdei

Cuprins:

Video: Познакомьтесь с тихоходкой, самым стойким созданием на Земле — Томас Бутби 2024

Video: Познакомьтесь с тихоходкой, самым стойким созданием на Земле — Томас Бутби 2024
Anonim

După mai multe schimbări Azure și îmbunătățiri de securitate în ultimele câteva luni, Microsoft introduce Project Tardigrade ca cea mai nouă încercare de a face Azure mai fiabil.

Project Tardigrade previne eșecurile platformei

Project Tardigrade este un nou serviciu care își propune să îmbunătățească rezistența Azure. Include strategii de atenuare care protejează VM-urile Azure împotriva eșecurilor platformei.

Iată cum descrie Mark Russinovich, Chief Technology Officer la Microsoft Azure:

Obiectivul nostru este să abilităm organizațiile să își gestioneze încărcăturile în mod sigur pe Azure. Cu acest principiu de ghidare, investim continuu în evoluția platformei Azure pentru a deveni rezistent la erori, nu numai pentru a stimula productivitatea afacerilor, ci și pentru a oferi o experiență perfectă clienților.

Pentru a preveni impactul asupra sarcinilor dvs. de muncă, serviciul permite componentelor să se vindece și să se recupereze rapid din eventualele defecțiuni, chiar și în defecțiuni critice ale gazdei.

Cum funcționează Project Tardigrade?

Iată un exemplu despre modul în care funcționează fluxul de recuperare Tardigrade:

  • Faza 1: Această etapă nu are impact asupra rulării VM-urilor clientului. Pur și simplu reciclează toate serviciile care rulează pe gazdă. În rarele cazuri în care serviciul defectat nu repornește cu succes, trecem la Faza 2.
  • Faza 2: Serviciul nostru de diagnosticare rulează pe gazdă pentru a colecta toate jurnalele / depozitele relevante în mod sistematic, pentru a ne asigura că putem diagnostica amănunțit motivul eșecului în faza 1. Această analiză cuprinzătoare ne permite să „cauzăm rădăcină” problema și astfel să prevenim reaparițiile. in viitor.
  • Faza 3: La un nivel ridicat, resetăm sistemul de operare într-o stare sănătoasă, cu impact minim asupra clienților pentru a atenua problema gazdă. În această fază păstrăm stările fiecărei VM la RAM, după care începem să resetăm sistemul de operare într-o stare sănătoasă. În timp ce sistemul de operare se resetează rapid, rularea aplicațiilor pe toate VM-urile găzduite pe server scurt „înghețează”, deoarece CPU este temporar suspendat. Această experiență este similară cu o conexiune de rețea pierdută temporar, dar reluată rapid din cauza logicii din nou. După ce sistemul de operare este resetat cu succes, VM-urile își consumă starea stocată și își reiau activitatea normală, eludând astfel orice potențial de repornire a VM.

Având în vedere acest lucru, Project Tardigrade se va asigura că eșecul oricărei componente din gazdă nu are impact asupra întregului sistem. Ca atare, VM-urile clienților nu vor fi afectate de defecțiunile gazdei.

Microsoft lucrează din greu pentru îmbunătățirea și extinderea diferitelor scenarii de eșec al gazdei, pentru a se asigura că platforma lor de cloud computing este mai fiabilă ca niciodată.

Așteptați-vă la noi evoluții și la alte implementări de fiabilitate în viitorul apropiat.

Procesul de întârziere al proiectului protejează vms-ul dvs. împotriva erorilor gazdei