המשכיות עסקית BCP

המשכיות עסקית BCP

תכנית להמשכיות עסקית BCP - Business Continuity Plan נועדה להבטיח רציפות תפעולית של התהליכים העסקיים הקריטיים של הארגון בשעת חירום בפרק זמן מוגדר וברמת שירות מוגדרת.

התכנית מתייחסת לאירועי חירום שונים ומגדירה תכניות פעולה לפונקציות הקריטיות בארגון לצורך התאוששות באופן מלא או חלקי בהתאם למדיניות הארגון.

מבוא כללי

מערכות המידע והתשתיות הפכו לקריטיות בניהול התהליכים העסקיים. הסביבה הארגונית מאופיינת בתהליכים עסקיים מורכבים, עבודה גלובלית מסביב לשעון, שינויים עסקיים תכופים, שימוש רב בטכנולוגיה ותחרות הולכת וגוברת.

להבטחת רציפות תפקודית ותפעולית של התהליכים העסקיים הקריטיים של הארגון בשעת חירום (אסונות) בפרק זמן מוגדר וברמת שירות מוגדרת נדרש לבנות תכנית להמשכיות עסקית BCP - Business Continuity Plan. התכנית תתייחס לאירועי חירום שונים ותגדיר תכניות פעולה לפונקציות הקריטיות בארגון לצורך התאוששות באופן מלא או חלקי בהתאם למדיניות הארגון.

התכנית תכלול מענה לתהליכי העבודה הנדרשים בעת הכרזת שעת חירום, כולל היערכות לוגיסטית - פריסה והיערכות באתר החירום, משאבי אנוש, תשתית מערכות מידע, טיפול במערך המידע, תיק הפעלת מערכות המידע באתר החירום וכן תכנית חזרה לפעילות בשגרה עם סיומו של מצב החירום.

חלק אינטגראלי של מערך הערכות לשעת חירום הנו מסמך מדיניות ונוהל תרגולים תקופתיים, אשר מבוצעים במחזוריות ומהם מפיקים לקחים לגבי מוכנות הארגון לעבודה בשעת חירום. תוצר חשוב של תרגולים אלו הנו טיוב הנהלים, הוראות העבודה והגלופות הקיימות (שיפור מתמיד). 

איור 1 : מחזור חיים של המשכיות עסקית בארגון

מצבי יסוד

הארגון נמצא  בכל נקודת זמן שהיא באחד ממצבי היסוד הבסיסיים הבאים:

 

 ·         שיגרה - מצב בו מתקיימת פעילות שגרתית והארגון מספק שירותים שוטפים ללקוחותיו. בתקופה זו מבצע הארגון באופן שוטף פעולות הכנה שונות לשעת חירום, שמטרתן להבטיח מוכנות ומיומנות גבוהה של כלל הגורמים בארגון בניהולו והפעלתו במצבי החירום, שמאפייניהם מוצגים בתרחישי הייחוס שלו.

 ·         מעבר משגרה לחירום - פרק הזמן בין מצב שגרה לבין מצב חירום בארגון, המתחיל עם ההחלטה על מעבר למצב חירום. במשך פרק הזמן הזה מתבצעות בארגון פעולות שמטרתן להבטיח את מוכנותו לביצוע משימותיו כפי שנדרש במצב חירום.

 ·         חירום  מצב שבו הארגון ערוך במתכונת מיוחדת בכדי להתמודד עם השיבושים בשגרת העבודה וזאת עקב התרחשות אחד מסוגי האירועים המשבריים המקומיים או הלאומיים.

 ·         חזרה לשגרה - פרק זמן שתחילתו תוך כדי ניהול המשבר, שבמהלכו תתבצענה פעולות שיקום בעוצמות שונות כנובע מהנזק הפיזי שנגרם לתשתיות בארגון.  במהלך תקופת השיקום מתחיל הארגון לחזור בהדרגה לפעול כבשגרה.

איור 2 : דוגמא למצבי יסוד של הארגון

 

מסמך המדיניות מתבסס על הגורמים הבאים:

 

 ·         BCP גמיש תוך ציות לדרישות הרגולטוריות (במידה וקיימות) ובהתחשב במגבלות ובאילוצים הארגוניים

 ·         התאמה לצרכים עסקיים - קביעה מהם התהליכים הקריטיים של הארגון

 ·         מידת הקריטיות של השירות (מערכות ליבה, מנהלתיות, מעטפת ודיווח)

 ·         משך הזמן שהארגון יכול להתנהל ללא השירות

 ·         קיבולת נדרשת בזמן חירום

 ·         משך הזמן המותר לאבדן נתונים

 ·         משך הקמת פתרון חלופי לשירות

 ·         עלות הקמת המערכת מחדש

 ·         כיצד נערכים המתחרים ?

 

כחלק מתכנית ההמשכיות נבנית גם תכנית התאוששות של המערך הטכנולוגי בארגון בעקבות אירוע אסון (DRP - Disaster Recovery Planning)

איור 3 : מרכיבי תהליך ההתאוששות של המערך הטכנולוגי

פרויקט המשכיות עסקית

מחזור חיים של פרויקט BCP

 ·         קביעת מדיניות ותיחום

 ·         ניתוח מצב קיים - מיפוי תהליכים

 ·         בניית תכנית המשכיות עסקית מפורטת

 ·         קבלת התכנית בארגון

 ·         הטמעה ויישום

 ·         תחקור והפקת לקחים

 

קביעת מדיניות ותיחום

קביעת מדיניות להמשכיות עסקית ורמות שירות בעת תרחיש אסון הכוללת בין השאר:

 

 ·         אופן התארגנות ניהולית/מבנה ארגוני בעת חירום

 ·         הגדרת בעלי תפקידים, תחומי אחריות וסמכויות - דירקטוריון, מנכ"ל, הנהלה, יחידות עסקיות

 ·         אתרי גיבוי (להנהלה, למערכות המידע, לעובדי הארגון)

 ·         עקרונות מנחים לעבודה בעת מעבר והימצאות במצב חירום (ממוכן/ידני, ניהול שינויים, טיפול בתקלות, תחזוקה מונעת ותחזוקת שבר, עבודה מאתרים אחרים, משאבי אנוש, שיווק,  דוברות, תמיכה לוגיסטית)

 ·         רמות שירות מופחת/מינימאלי ללקוחות הארגון ויעדים לחזרה לתפקוד מלא

 ·         אישור המדיניות שתאפשר לארגון לקיים פעילות עסקית בחירום - בהיקפים, ברמות השירות ובתכולה שהוגדרה ע"י ההנהלה

 

ניתוח מצב קיים - תרחישי ייחוס ומיפוי תהליכים

 ·         הגדרת תרחישי הייחוס אליהם ייערך הארגון (הגדרת סוגי ומתארי האיום בפניהם עלול ונדרש להתמודד הארגון).

 ·         מיפוי התהליכים והשירותים החשובים/הקריטיים ברמת-על Top - Down, בין היתר באמצעות תהליך המציג את משמעויות העדר היישום לארגון (BIA - Business impact analysis) ובהתייחס לתרחישי הייחוס שהוגדרו בסעיף הקודם.

 ·         מיפוי המשאבים התומכים בפעילויות הקריטיות הנ"ל (לכל תהליך ותהליך בנפרד) והבנת הקשר ביניהם: מבנים, מערכות מידע, ממשקים (הן ברמת מערכות המידע והן ברמה הפונקציונאלית בין גורמי העסק השונים בארגון), תלויות בין תהליכים, כ"א קריטי, ספקים וגופי תפעול.

 ·         בחינת הסיכונים המתייחסים לתהליכים ולפעילויות שהוגדרו לעיל והגדרת רמת הקריטיות שלהם.

 ·         עבור כל אחד מהתהליכים והשירותים שנבחרו: למשך כמה זמן יכול הארגון להמשיך ולהתקיים כעסק פעיל - ללא התהליך העסקי הנדון.

 ·         דיון הנהלה לתעדוף כל תהליך ותהליך שנבחר והוגדר כקריטי ברמת הארגון כולו.

בניית תכנית המשכיות עסקית מפורטת

·         על בסיס ניתוח מצב קיים, מתארי הייחוס והגדרת התהליכים העסקיים הקריטיים (מידע עסקי) מבוצעת הגדרה של מערכות המידע התומכות בתהליכים הקריטיים והתפעוליים, מיפוי התשתיות החיוניות (כולל מחשוב, חשמל, תקשורת, מים) לרבות הגדרת כמות וסוג כ"א הקריטי, משאבים, ספקים, נותני שירות חיצוניים ואפיון הפעולות הנדרשות להבטחת רציפות תפקודם.

 ·         הגדרת תפקידים ואחריות, מחזור חיים, שלבים.

 ·         מיפוי יכולות סיוע הדדי בין גורמים השייכים לתחום העיסוק של הארגון וקביעת כללים לקבלת סיוע מגורמים ממלכתיים בעת חירום

 ·         הגדרת הפעולות הנדרשות להבטחת זמינות כ"א שהוגדר כקריטי

 ·         גיבוש מנגנון דיווח ובקרה של כל רמות התפעול והניהול בארגון בעת חירום.

 ·         גיבוש מנגנון לבניית תמונת מצב לגורמי הניהול של הארגון בחירום על כל היבטיה (כוח אדם, מערכות תשתית, מיכון/מחשוב, ספקים, תפעול, גורמים עסקיים וכו')

 ·         קיום ראיונות לצורך קבלת מידע ומסמכים עם מספר מצומצם של מנהלים ואנשי מפתח בארגון, גורמי ניהול, גורמים מקצועיים ואנשים שייבחרו אד-הוק. במהלך ראיונות אלה, משלבים לפי העניין סימולציות של תרחישי אסון ובחינה משותפת של מידת השפעתם על התהליכים הקריטיים, כפי שהוגדרו ע"י הארגון.

 ·         עיון במסמכים קשורים והפניית שאלות, תחקור נוסף ושימוש במשוב לצורך קבלת מידע ממוקד או מקצועי מגורמים שונים רלוונטיים.

 

קבלת התכנית בארגון

·         הכנת מסמך טיוטה, אישור ועדה, אישור הנהלת הארגון.

 ·         מעקב אחר התקדמות העבודה, ותיאום ציפיות - באמצעות ועדה משותפת.

 

הטמעה ויישום

·         מיפוי הפערים בין מצב קיים לבין יעדי השירות והתכנית המאושרת (סעיף קודם).

 ·         הגדרה וגיבוש תכנית פעולה לצמצום וסגירת הפערים וניהול סיכונים - כתיבת סט נהלים והוראות עבודה קצרים, ממוקדים ומעשיים בהתאם למדיניות ולתכנית השלדית שנבנתה. נדרשים נהלים והוראות עבודה הן ברמת התהליכים העסקיים הקריטיים והן ברמת התהליכים התומכים כגון: מערכות מידע, תשתיות מחשוב, תשתיות פיזיות, תפעול, לוגיסטיקה וכו'.

 ·         הטמעה:

 ·         - הצגת התכנית ברמת הארגון - כנסים ייעודיים

 ·         - כתיבת הנהלים והוראות העבודה ואישורם ולאחר מכן תרגולם הלכה למעשה

 ·         - תרגול רשת קריאה טלפונית ובחינת זמינות כוח אדם בכל רמות הארגון

 ·         - תרגול כניסה לחדרים/מרחבים ממוגנים

 ·         - הדרכות וריענון עיתי

 ·         - ביצוע תרגילי סימולציה מתודיים

 ·         - תרגול כולל/בפועל מול אחד ממתארי הייחוס שהוגדרו

 ·         עדכון שוטף של מרכיבי התכנית ובקרת יישומה (יישומים קריטיים, הערכות חירום, כוח אדם וכו')

 

תחקור והפקת לקחים

תהליך התחקור והפקת הלקחים נועד לבדוק את התוצאה בפועל של ההיערכות לשעות חירום ואת פרטי ביצועה מול התוצאה המתוכננת, כלומר הבנת הגורמים לפער והפקת לקחים לשם מניעת פערים דומים בעתיד או ללמוד מן הלקחים החיוביים שהופקו.

ועדת היגוי BCP

תחומי אחריות

הועדה אחראית להחלטות הנוגעות להמשכיות העסקית:

 

 ·         אישור תקופתי למדיניות ה - BCP

 ·         הסמכת מנהל אחראי (חבר הנהלה) להפעלת המדיניות

 ·         בחינת פעילויות שבוצעו ופעילויות עתידיות להגברת המודעות לנושא המשכיות עסקית בארגון

 ·         ניתוח השפעה עסקית והערכת סיכונים

 ·         איתור תקציבים נדרשים לתכנית ה - BCP

 ·         הגדרת מסגרת לתרגילים (מתודיים ומעשיים) ובצוע ביקורות לתהליך

 ·         הכרזה על מצבי חירום ומשבר

 ·         הפעלת תהליכים במצבי משבר

 ·         עדכוני המדיניות לאור צרכי הארגון

 

איוש הועדה לפי Best Practices מקובלים

 

יו"ר - מנכ"ל הארגון

מנהל אחראי - סמנכ"ל תפעול ותשתיות

איוש הועדה - נציג אגף כספים, מנהל המשכיות IT, נציג לוגיסטיקה ורכש, נציג אגף שירות/תפעול, נציגים נוספים לפי אופי הארגון והתחומים העסקיים

 

התאוששות המערך הטכנולוגי DRP

איור 4 DRP - Disaster Recovery Planning

תהליך הפעלת מצב חירום

 ·         מתקבל מידע המעיד על משבר

 ·         נוצר חוסר יכולת לתמוך בלקוחות ובפעילות העסקית

 ·         ביצוע הערכת מצב - ניתוח פגיעות וסיבות למשבר

 ·         יידוע מנהלי IT ותשתיות על פוטנציאל למשבר

 ·         הקצאת צוות משבר

 ·         הכרזת מצב חירום בארגון

 ·         החלטה על הפעלת אתר DRP

 ·         העברת תשתיות ומערכות מידע לאתר וחידוש פעילות

 ·         ניהול פעילות ותיעוד

חזרה ממצב חירום

 ·         סיום משבר

 ·         ניתוח משמעויות חזרה לשגרה

 ·         הכנת סביבת הייצור לחזרה לשגרה

 ·         הכרזה על סיום מצב החירום בארגון

 ·         הערכה מצב בטרם מעבר לשגרה

 ·         החלטה על מעבר לסביבת ייצור

 ·         בדיקת תקינות המערכות, התשתיות והמידע שהועבר לסביבת הייצור

 ·         חזרה לשגרה

תרגיל חירום

תרגיל חירום יתקיים אחת לשנה ויכלול:

 

 ·         ביצוע "תרגיל יבש"

 ·         הערכת תוצאות צפויות

 ·         החלטה על הרצת תרגיל אמת - קביעת לו"ז ומהי תקופת הפעילות שתארך מאתר ה: DR

 ·         העברה וקיום DRP אמת

 ·         הערכת תרגיל ותיעוד

 ·         חזרה לסביבת ייצור

 ·         תחקור ומימוש המלצות לשיפור

מדדים ערכיים להתאוששות

מדד

הסבר

דוגמא לערכי התאוששות

RPO - Return Point Objective

כמות המידע שאבד (במונחי זמן פעילות) במקרה של אסון

·         מחשב מרכזי: ללא אובדן מידע.

·         מערכות פתוחות קריטיות: ללא אובדן מידע.

·         שאר המערכות הפתוחות: עד 48 שעות של אובדן מידע.

RTO-   Return Time Objective

משך הזמן המקסימלי עד להפעלת אתר החירום (מרגע קבלת ההחלטה)

·         מחשב מרכזי: תוך 6 שעות.

·         מערכות פתוחות קריטיות: תוך 12 שעות.

·         שאר המערכות הפתוחות: הציוד יירכש בשעת הצורך , לו"ז להפעלה מדורגת

·          3 חודשים.

LOAD

היקף משאבי המחשוב המתוכנן באתר הגיבוי יחסית לאתר היצור

·         מחשב מרכזי:  100%

·         מערכות פתוחות קריטיות:  80%

·         שאר המערכות הפתוחות: הציוד יירכש בשעת הצורך, על פי מגבלות מקום וחשמל באתר החירום.

 

 

מדדים כמותיים להתאוששות

תיאור המדד

יעד

שיטת חישוב

מדידת כיסוי וקיום נהלי חירום והוראות עבודה לכלל מערכות היצור

100% מנהלי והוראות העבודה לחירום קיימים למערכות היצור

 X= (סה"כ מערכות ביצור/כמות מערכות ללא נוהל או הוראת עבודה לחירום)

מדידת כמות התקלות ביצור כתוצאה מהדילוג

0 תקלות יצור כתוצאה מהדילוג

X = (סה"כ התקלות/כמות התקלות במערכות האחראי)-1

ציון למוכנות וכשירות אחראי המערכת לדילוג בין מתקני

100% מנהלי והוראות העבודה לחירום קיימים ומעודכנים ו - 0 תקלות יצור לאחר הדילוג

ציון משוקלל של שני המדדים הקודמים (50,50)

 

 

סוגי כשלים ויעדי התאוששות

רמת איום

נזק פוטנציאלי

מטרת התאוששות

דוגמא ליעדי התאוששות

נזק מקומי / אסון בארגון

פוטנציאל גבוה לנזק עסקי ישיר לארגון

הפעילות העסקית חייבת לחזור לתפקוד במהירות האפשרית

4-24 שעות

50% תפוקה

אסון כללי/לאומי (לדוגמא: מצב מלחמה) - מערכות ארגון עובדות ברמת ייצור נמוכה

פוטנציאל נזק עסקי בהתאם לכלל השוק

קיום תהליכים עסקיים באופן חלקי ולזמן מוגבל

24-72 שעות

50% תפוקה

אסון כללי - מערכת משותקת לאור פגיעה פיזית בארגון (לדוגמא רעידת אדמה והתמוטטות מבנה)

פוטנציאל גבוה לנזק עסקי ישיר לארגון, מעבר לכלל השוק

קיום תהליכים עסקיים קריטיים ובאופן חלקי לתקופה ממושכת

72 שעות עד שבוע

50% תפוקה

 

 

תוצרים

מפת"חון לפרויקט BCP

מפת"חון זה נועד לסייע לארגון בהתנעת הפרויקט ומהווה מסגרת כללית לאפיון הדרישות וביצוע המיפויים הנדרשים כחלק מההערכות הארגונית לביצוע הפרויקט.

תכנית עבודה לשלב המדיניות

טבלת עזר לתכנון בניית מדיניות BCP. המסמך כולל את השדות שלב בתכנית, התוצר המצופה, אומדן שעות לביצוע, משך הזמן בשבועות לביצוע השלב ומשך מצטבר של בניית התכנית

דיווח תוצאות תרגיל DRP

טופס לדיווח על תוצאות התרגיל ברמת מערכת בדידה כולל רישום תקלות, הערות והמלצות לשיפור

דו"ח סיכום תרגיל דילוג בין אתרי

גלופה לסיכום כולל לתרגיל דילוג מעשי בין אתרי - תובנות, לקחים, המלצות לשימור ולשיפור ודיווח תקלות שנגרמו כתוצאה מתהליך הדילוג