מדריך לאבטחת חסינות מערכות - שכבות ההגנה בפני כשל  - 3. התמודדות עם איומים - תקלות חומרה - התאוששות

התאוששות

כללי

מתקלת חומרה

מנפילת מתח רגעית

מהפרעת תקשורת

מיציאה מסינכרון

דוגמאות ממאגר האירועים

 

כללי

תהליך ההתאוששות מהמצב החריג כולל גלגול לאחור לנקודה בה המערכת פעלה פעילות נורמאלית, שחזור נתונים וסינכרון המערכת למצב זה.

הנחיה - הכנה לתהליך ההתאוששות. לצורך הכנת המערכת לתהליך ההתאוששות מהמצב החריג מפרט הדרישות צריך לכלול:

  • הגדרת נקודות בטוחות בתהליכי תפעול, וישום תהליכי גלגול לאחור, לעבר הנקודות הבטוחות

  • הגדרה של נקודות איתחול\המשך (rollback)

  • הנחית המפעיל בבחירת האופציות להמשך התפעול.

  • תכן פקדים ספציפי לשלב בתהליך ההתאוששות, במתכונת של אשף התקנות.

התאוששות אוטומטית

הנחיה - עדיפות להתאוששות אוטומטית. לאחר שהמכונה זיהתה מצב של אירוע חריג, הדרך המועדפת לטיפול בו היא על ידי תגובה אוטומטית. ההתאוששות האוטומטית מתייחסת לאירועים כגון:

  • הפסקת מתח רגעית
  • תקלת תקשורת רגעית
  • בעיית סינכרון

דוגמאות

תהליך ההתאוששות

הנחיה - הנחית המפעיל בתהליך ההתאוששות. התכן צריך להניח שהמפעיל מעולם לא התנסה בתהליך ההתאוששות מתקלה מסוג זה בעבר, ושצריך להנחות אותו לגבי כל צעד בתהליך זה.

גלגול לאחור

תהליך הגלגול לאחור כולל שני שלבים:

  • לפני אירוע ההפרעה, במהלך התפעול השוטף, המערכת שומרת מדי פעם את ערכי נתוני התפעול, למשל, בכל עדכון של נתונים מסויימים, או כל פרק זמן קבוע מראש.
  • בתהליך ההתאוששות מהתקלה, המערכת משחזרת את ערכי נתוני התפעול שנשמרו לפני אירוע ההפרעה.

 


באתר  במודל  במדריך  בתיקוף  במאגר      אתר זה נערך ומתחוזק על ידי אבי הראל - ארגולייט.    למידע נוסף, נא לשלוח אימייל לכתובת  ergolight@gmail.com .    דף זה עודכן בתאריך 05 Jan 2015.