מערכות ארכיב

מערכות ארכיב

מדריך זה דן במערכות ארכיב ממוחשב (Archiving Systems) ומטרתו לשמש כלי עבודה בשלבי הייזום, אפיון, בקשה להצעות, עיצוב ובנייה וכו' של מערכות מסוג זה. המדריך סוקר היבטים מיוחדים של מערכות ארכיב ואת השלכותיהם על מחזור החיים ועל עץ המערכת. מערכת ממוחשבת לניהול ארכיב היא מערכת מידע לכל דבר וחלים עליה כל הכללים של מערכות מידע. במדריך זה מתוארות רק התוספות הייחודיות למערכות ארכיב, בלי הגבלת הכלליות של מחזור החיים, עץ המערכת ושאר הנחיות מפת"ח.

מבוא - הסבר כללי

ארכיב (ארכיון) ממוחשב הוא מערכת לניהול ממוחשב של מסמכים ובא כתחליף לתיקיות הידניות הקיימות במרבית הארגונים. ארכיב ממוחשב מדמה את הארכיב הפיסי ומקטלג את המסמכים ב"ארונות", "מגירות", תיקים וחוצצים ממוחשבים, במקום תיקים ידניים/פיסיים.

ארכיב ממוחשב הוא מערכת לקליטה, אחסון, אחזור ותצוגה של מסמכים וטפסים המנוהלים כנתוני מידע בבסיס נתונים מיוחד. ארכיב ממוחשב אינו מנהל רק את התמונה (Image) של המסמכים אלא גם נתונים אלפאנומריים (המכונים "שדות מפתח") המתארים את המסמכים בצורה המאפשרת שליפה מהירה ונקודתית במהלך העבודה השוטפת.

רוב מערכות הארכיב הממוחשב מתבססות על ארכיב אופטי, היינו, על דימות המסמך (Imaging) ועל דיסקים אופטיים כאמצעי אחסנה ולפיכך, בהמשך מדריך זה, הביטוי "ארכיב ממוחשב" ו"ארכיב אופטי" הם זהים.

במקרים רבים הקמת הארכיב הממוחשב אינה פעילות בודדת באירגון אלא היא פעולה משולבת הכוללת גם הקמת מערכת ארגונית לטיפול בכל פעילויות ה"צוארון הלבן" בארגון - מערכת "משרד ממוחשב". לכן מומלץ לעוסק בנושא לפנות גם לקיט משרד ממוחשב בכרך התמחויות/מערכות מידע וללמוד את הנושא בצורה משולבת.

היבט ניהולי/עסקי

המגמה בארגונים להיפטר מניירת - אשר הולכת ונערמת בתיקים, סובלת מבלאי גבוה, תופסת מקום רב ומנוהלת ידנית - ולהמירה באמצעים ממוכנים ונוחים יותר, היא ברורה ומובנת. עם זאת, יש לשקול אותה היטב כמוסבר בפיסקה זו ובפסקאות הבאות.

השיקולים הניהוליים עסקיים להכנסת מערכת ארכיב אופטי לארגון הם:

 ·         העלאת רמת האמינות - הקטנת הסיכויים לאבדן מסמכים/תיקים, גיבוי מלא לתיקים, שמירת מידע מקורי ללא שינויים ופתרון לבעיית הבלאי.

 ·         העלאת רמת אבטחת המידע - אפשרות למידור בין מסמכים ומשתמשים.

 ·         הפחתת עלויות - צמצום שטחי אחסון, הקטנת משאבי כ"א בתיוק ואיתור, חיסכון בנייר, צילומים וכו'.

 ·         העלאת רמת השירות - זמינות התיק והמסמכים, גישה בו זמנית למסמכים ממספר מוקדים, איתור מהיר של מסמך לפי מפתחות.

 

הקמת מערכת ארכיב אופטי היא פעילות יקרה אשר מחייבת מעורבות ארגונית עמוקה ושילוב המערכת באסטרטגיה הכוללת של הארגון. תועלות הארגון מהכנסת מערכת כזו הן רבות אך יש לבחון היטב את המצב הקיים: זמן השירות, זמן אחזור, זמן תיוק, כמות נייר צילום והדפסות, כ"א לניהול הארכיב, שטחי אחסון וכו', על מנת להעריך נכונה את יחס העלות/תועלת של המערכת.

כאשר עומדים בפני החלטה האם להקים מערכת ארכיבאות אופטית יש לשקול בנוסף לתועלות גם את אופן שילוב מערכת כזו במערכות הקיימות כבר בארגון. יש לבחון את הקשר של הארכיב עם שאר המאגרים בארגון ועם קשרי הארגון עם העולם החיצון.

בהיבט הניהולי יש גם להתחשב בשינויי או"ש עקב הכנסת מערכת ארכיב אופטי. מעבר מעבודה עם נייר לעבודה עם מסמכים אופטיים דורש הכנה ארגונית לקראת השינויים הצפויים בשיטות העבודה ובהרכב כוח העבודה בארגון. ככל שהארגון ותהליכיו עתירי נייר כך הכנסת מערכת אופטית תשחרר יותר משאבי כוח אדם ותפחית עלויות, אך גם תגרור השלכות או"ש נרחבות יותר.

ארכיב קיים, מחשוב המצאי

נקודה חשובה ביותר היא בחינה מדוקדקת של הארכיב הקיים. האם יש שיטת קיטלוג מסודרת והבעיה היא רק מיחשוב? האם הארכיב הידני מאורגן היטב או שהוא "מבולגן" פיסית בארונות? האם יש רישום מסודר היכן נמצא כל תיק, מעקב כניסות ויציאות, גם אם הוא ידני?

יש כאן "מילכוד" פשוט. ארכיב שמנוהל ידנית באי-סדר, יקשה מאד למחשב אותו. ארכיב שמאורגן היטב, יש לבחון אם ניתן לפתור, ולו זמנית, חלק ניכר מהבעיות ע"י הכנסת תוכנה לניהול המצאי בדומה לניהול ספרייה. תוכנה כזו איננה פותרת את בעיות היסוד של הארכיב (בלאי הנייר, זמני איתור מסמכים, חיפוש במסמכים עצמם וכו') וגם איננה כה פשוטה כפי שנראה ממבט ראשון (דורשת למשל סימון כל התיקים בבר-קוד או אמצעי דומה). אך יש לשקול חלופה זו ברצינות, בפרט בארגונים שתדירות הגישה לארכיב היא נמוכה ויש "תנופת" מיחשוב כללית שעשויה להציג את כל מיחשוב הארכיב באור אחר במשך הזמן.

היסטוריה

המסמכים האגורים בארכיב הארגון הקיים טרם מחשובו מכונים היסטוריה. מסמכים אלה יוסבו וייקלטו בארכיב הממוחשב במאמץ הסבה לא קטן, אם ע"י חברות חיצוניות המתמחות בהסבה לפי דרישה, או ע"י הקמת אתר הסבה זמני בארגון. בכל מקרה, מחיר הסבת ההיסטוריה הוא גבוה ועל הארגון לשקול היטב את היקף ההיסטוריה הדרושה לו בארכיב הממוחשב. תיתכן בהחלט פשרה לפיה רק חלק מההיסטוריה יוסב למערכת החדשה, למשל, שבע שנים אחורה בלבד. אחזור תיקים מעבר לשבע שנים ימשיך להיות ידני (ראה הסעיף לעיל הדן בארכיב קיים ומחשוב המצאי). "7 שנים" או כל תקופה פשרה אחרת, תיקבע לפי שילוב של אילוצי תקציב, התפלגות תדירות הגישה לארכיב ושיקולים משפטיים ניהוליים (מידת אחריות הארגון לשמירת המידע). גם קצב המיחשוב הכללי בארגון, היינו העמקת השימוש במערכות המידע הייעודיות ומערכות EDI, עשוי להשפיע, בשל ההרגשה הכללית שככל שחולף הזמן, תהיה פחות היסטוריה לא-ממוחשבת ומסמכי המקור יהיו ממוחשבים מעצם בריאתם.

סוגי מקורות לארכיון

מערכת ארכיב היא מערכת לניהול מסמכים. מסמכי הארגון מתקבלים/נוצרים ממספר רב של מקורות: דואר נכנס, מערכות מיחשוב ייעודיות, פקס, תוכנות מדף: קבצי מעבד תמלילים, גיליון אלקטרוני,CAM/CAD וכו'. תוכנת הארכיב האופטי יודעת לנהל את המסמכים יהיה מקורם אשר יהיה. דרך קליטת המסמכים השונים למערכת הארכיבאות האופטית משתנה ע"פ מקורם:

דואר נכנס

מסמכים המגיעים בדואר הנכנס, או כל מקור אחר שהוא בנייר, ייקלטו למערכת האופטית בסריקה ויישמרו במערכת כקבצי image עם אפשרות לפענוח OCR  (ראה להלן).

מערכות מחשב ייעודיות

פלטי מערכות מחשוב ייעודיות (תפעוליות) ייקלטו במערכת הארכיב באמצעות תוכנת COLD היודעת לקלוט פלט מחשב עוד בטרם הדפסתו, להפכו לקבצי ASCII ולהעבירו לניהול הארכיב האופטי.

תוכנות מדף

תוצרים של תוכנות מדף כגון מסמכי מעבדי תמלילים, קבצי עבודה של גיליונות אלקטרוניים וכו', ייקלטו בעזרת מודול תכנותי אשר יביאם ישירות לארכיב האופטי.

פקס

פקסים נכנסים ייקלטו לארכיב ישירות, בעזרת שרת פקס.  

תוכנת הארכיב תנהל את מכלול המסמכים באופן זהה מנקודת ראות המשתמש ותאפשר את מפתוחם, אחסונם ואחזורם. מקור המסמך יהיה שקוף למשתמש, במהלך הטיפול במסמכים, ולא יובחנו הבדלים באחזור ובהצגת תיקים/מסמכים ממקורות שונים.

מידע מקודד ומידע רציף

בעולם עיבוד הנתונים המודרני המכיל גם גרפיקה ודימות (Imaging) מקובל להבחין בין שני סוגי נתונים:

מידע מקודד

סוג זה של נתונים מקובל במערכות ענ"א הותיקות והוא מכיל נתונים אלפאנומריים מובנים בחלוקה ברורה לתווים, שדות, סגמנטים, רשומות וכו' ומאורגן בבסיסי נתונים מידע "קלאסיים" מהסוג המקובל בעולם עיבוד הנתונים מזה שנים רבות. סוג מידע זה נקרא גם מידע מפוענח או ממופתח והוא מאפשר מיונים, חיתוכים, שאילתות וכל גישה אחרת למידע על סמך פריטי מידע מוגדרים: שם, מס' זיהוי, תאריך, ערך מספרי וכו'. מידע מסוג זה מגיע מהקלדה של טפסים או ממערכות ממוחשבות (מערכות ייעודיות או תוכנות מדף) שמנהלות כבר מידע כזה.

מידע רציף (בלתי מקודד)

סוג זה של נתונים הוא למעשה רצף של ביטים המייצג דיגיטציה של מסמך או תמונה (Image) שלו. המחשב יכול להציג את המסמך (או את התמונה), או קטעים ממנו, באופנים שונים: לשנות את ממדיו(Zoom), לסובבו ולהדפיסו וכו', אך מתן משמעות לתוכן שבמסמך היא בידי הקורא (המשתמש), כאשר הוא מתבונן במסמך (או בתמונה), ואיננה "מובנת" למחשב. יש קושי בביצוע שאילתות על מידע זה. מידע מסוג זה נקרא גם בלתי מפוענח או בלתי מקודד (Non-Coded Information). מידע מסוג זה נוצר ע"י פעולת סריקה המתוארת להלן או מתקבל מתוכנות גרפיות. חשוב לוודא שהפורמט (התקן) של הקובץ הגרפי הוא ידוע ומקובל כגון: tiff, jpeg ועוד.

מערכות ארכיב ממוחשבות צריכות לנהל את שני סוגי המידע האלה גם יחד. המידע הרציף ופעולת הסריקה הנלווית לו (ראה בהמשך) מוצגים בד"כ כמאפיין העיקרי של מערכות ארכיב לעומת מערכות מידע רגילות, אך אין לשכוח גם את המידע המקודד שהוא אשר נותן משמעות למידע הרציף. למידע הרציף יתרון בכך שהוא משמר את צורת מסמך המקור, מציגו AS-IS ואינו מושפע מפונטים ופורמטים שונים. החסרון הוא בצורך בשטחי אחסון גדולים (דבר הנפתר ע"י שימוש בדיסקים אופטיים) ובכך שמידע זה הוא חסר פענוח ואינו מאפשר את עיבוד המסמך ו"הבנתו". המידע המקודד מאפשר זאת ובכך תרומתו הגדולה, אך כמובן שמידע מקודד בלבד אינו "ארכיב ממוחשב", אלא רק אינדקס ומילון (ראה הסעיף ארכיב קיים, מחשוב המצאי לעיל) ואיננו חוסך את הצורך בהצגת תמונת מסמך המקור. צריך אפוא את שניהם.

יש קשר בין שני סוגי מידע אלה: רציף ומקודד ומקורות המידע שנזכרו בפיסקה הקודמת, אך אין זה בהכרח קשר של אחד לאחד. פקס הוא בד"כ מידע רציף בעוד שפלט ממערכות ממוחשבות הוא בד"כ מידע מקודד. דואר נכנס הופך בד"כ למידע רציף, אך גם למקודד (בעזרת טכנולוגיית ICR/OCR המוסברת להלן) וגם תוכנות מדף יכולות לתמוך בשני סוגי המידע, תלוי בסוג התוכנה ומהותה.

טיפול במידע משולב, רציף ומקודד אינו נחלתן הבלעדית של מערכות ארכיב. מערכות עיבוד נתונים רבות אחרות מנהלות מידע משולב כזה. ראה למשל קיט מערכות מידע גיאוגרפיות GIS - בכרך זה של מפת"ח. הטכנולוגיות עליהן נשענות מערכות אלה, בסיס נתונים למשל, הן משותפות. ראה הסעיף היבטי טכנולוגיה להלן.

פעולת הסריקה

חלק גדול מהמידע נקלט למערכת הממוחשבת באמצעות פעולת סריקה. המסמך עובר תהליך של "דיגיטציה" ע"י סורק אופטי (Scanner). הנעזר בתוכנה מיוחדת.  פעולה זו היא אחד ממקורות הקלט המרכזיים למידע הרציף, אך בעקיפין גם למקודד אם מוסיפים לתהליך שימוש בטכנולוגיית ICR/OCR. סריקת מסמך דומה לצילום המסמך במכונת צילום וניתן להגדיר את גודל הדף, את דרגות הבהירות והחדות, רגישות לצבע וכו' על מנת לקבל תוצאה מיטבית. בשונה מצילום, הפלט המתקבל הוא קובץ image במחשב. האיור הבא מציג את תהליך הסריקה:

 

תהליך הסריקה בשילוב בטכנולוגיית ICR/OCR

מפתוח - פענוח

כאמור לעיל, לצד המידע הרציף המחזיק את "תמונת" המסמך כרצף של ביטים שאין להם פענוח, נדרשות מערכות ארכיב לנהל גם מידע מקודד המאפשר איתור מסמכים, ביצוע שאילתות ואחזור מידע. פעולת הקידוד נקראת מפתוח או פענוח (Indexing). בפעולה זו נשמרים מספר שדות מובילים הלקוחים מתוך התיק/המסמך וכן שדות חיצוניים כגון: מס' תיק, מס' מסמך, תאריך/שעה, נושא, סוג, יחידה ארגונית, מילות מפתח וכו'. מפתוח (פענוח) מסמכים, היינו, הוספת מידע מקודד לצד המידע הרציף, יכול להיעשות במספר שיטות:

מפתוח ידני

הקלדה ישירה של "פרטי המסמך" למסך מפתוח עבור כל תיק/מסמך. שיטה זו דורשת משאבים רבים.

מפתוח משולב

קבלת המידע המקודד ממערכת ייעודית חיצונית. בשיטה זו יוקלד בד"כ רק מפתח ראשי או מספר מצומצם של מפתחות על מנת ליצור את הקשר עם המערכת החיצונית. לשיטה זו יתרונות רבים בפרט אם המערכת הייעודית מכילה את כל הנתונים הדרושים ומושתתת על שיטות אחזור מידע גמישות. לעתים יש צורך לקלוט את המפתוח ממספר מערכות בארגון. אם מערכות אלה אינן מתואמות ביניהן עשויות להיווצר בעיות קשות.

מפתוח אוטומטי

הפעלת טכנולוגיית ICR/OCR, כמוצג בתרשים לעיל, לזיהוי אוטומטי של תוכן המסמך: כותרות ותכנים בתווים מודפסים ואף בכתב יד. שיטה זו מתאימה במיוחד לטפסים בעלי מבנה קבוע בהם מוגדר מראש מיקום השדות ושמותיהם ולעתים גם גודל התווים ולא למסמכים בפורמט חופשי. המערכת תפענח את סוג הטופס ואת שדות המפתוח ותאחסן את הנתונים כמידע מקודד על התיק/מסמך. בשיטה זו נחסך מאמץ גדול וההשקעה היא באימות הזיהוי בלבד. חסרונה הוא בכך שהיא מושפעת מאד מפורמט המסמך, מהפונטים השונים של התווים שבו ומאיכותו הכללית. טכנולוגיית ה- ICR/OCR היא עדיין בחיתוליה ומתקשה בעיבוד מסמכים עם גרפיקה מורכבת ופונטים רבים, שלא לדבר על כתב יד. בארגונים מסוימים נעשה חלק מהמפתוח על סמך חלקים יחודיים בטופס כגון שורת הקוד המגנטי על המחאות בבנקים, או בר-קוד המצורף לטופס בזמן יצירתו כמו בבדיקות רפואיות וכד'.

שיטות המפתוח השונות מחדדות את האבחנה בין מסמכים לטפסים. מסמכים, היינו תיעוד במבנה חופשי, מתאימים יותר לסריקה רגילה ומפתוח ידני או משולב. טפסים, היינו תיעוד מובנה עם שדות במבנה ומיקום קבועים, יכולים להיעזר הרבה יותר טוב במפתוח אוטומטי בטכנולוגיית ה-ICR/OCR ונילוותיה.

היבט יישומי

מורכבות המידע וההיקפים שמערכת הארכיב נדרשת לנהל גורם למורכבות היישום במספר היבטים מרכזיים:

 ·         ארגון פנימי של מודל הנתונים

 ·         ארגון בסיס הנתונים

 ·         נפחי אחסון ו"עומס" כללי

 ·         ממשקים ומקורות מידע

 

זאת מלבד ההיבטים הרגילים של הגדרת המשתמשים, אבטחת מידע, הנדסת גורמי אנוש וכו'.

ניהול שני סוגי המידע, הרציף והמקודד, נשען על שני סוגי בסיסי נתונים, או על בסיס נתונים משולב. המידע הרציף דורש בסיס נתונים גרפי בעוד שהמידע המקודד (הממופתח) יכול להיעזר בבסיס נתונים אלפאנומרי "רגיל". בכל מקרה, חייב להיווצר קשר ביניהם. אפשרות אחת היא הוספת שדה מפתח "מס' תיק/מסמך" ברשומת תיק/מסמך בבסיס הנתונים  האלפאנומרי המאפשר גישה למידע הרציף והצגתו כחלק משאילתא המופנית למידע המקודד. המידע המקודד יכול ליצור גם קשר עם מאגרי המידע האחרים בארגון ולאפשר עדכונים אוטומטיים בין מאגרים, חיסכון בהקלדה והסבות ואחזור נתונים המשויכים לנושא אחד מהארכיב והמאגרים הייעודיים במשולב.

מערכת ארכיב ממוחשב יכולה להקיף מספר תיקיות בארגון. עבור כל תיקיה יש להגדיר מחלקת מסמכים המגדירה את אוסף המפתחות המתארות אותה. בהקמת ארכיב אופטי יש לקבוע את סדר הכנסת המיחשוב לתיקיות השונות על מנת לא לזעזע את המערכת וליצור התנגדות של המשתמשים לקבלתה. בקביעת סדר הכנסת המערכת יש לקחת בחשבון את הנושאים הבאים :

 ·         מבנה ארגוני - סוגי המשתמשים הפועלים מול התיקייה, כמות המשתמשים ורמת עומס העבודה בה הם נתונים.

 ·         שיטות העבודה - מורכבות תהליכי העבודה, היקף העבודה מול מסמכים, קצב הוצאת תיקים מהתיקייה .

 

הקמת מערכת ארכיון ממוחשב דורשת ליווי צמוד של אנשי ארגון ושיטות החל משלב הייזום וההקמה ועד שלב ההתקנה וההטמעה, בליווי והכנת הארגון לקליטה וקבלת המערכת החדשה.  

היבט טכנולוגי

הנתונים הרציפים (Images) הנשמרים במערכת הארכיב תופסים נפח אחסון רב. כל פריט מידע (מסמך) רציף יכול להגיע ל- 40-50KB בממוצע, תלוי בגודל הדפים המקוריים ובכמות המידע הכלולה בהם. תמיכה בתיקיות המכילות מאות וגם אלפי מסמכים (מקרה שכיח למדי), עשויה לדרוש נפחי אחסון גדולים מאד הדורשים התייחסות טכנולוגית מיוחדת. כניסת הדיסקים האופטיים לשוק אמצעי האחסנה מהווה פתרון טוב לבעיית האחסון של נתוני הארכיב. גם באמצעי האחסנה האלקטרומגנטיים חל כל הזמן גידול וירידה במחיר האחסנה ליחידת נפח. חשוב להדגיש שתוכנות הארכיבאות האופטית יודעות לנהל את ה- Images הן בזיכרון אלקטרומגנטי (Magnetic Disk) והן ארכיב אופטי (Jukebox).

מבנה הטפסים

על טפסים בעלי מבנה קבוע ניתן להפעיל טכנולוגיית Form Drop Out שפירושה, קילוף "כותרות" הטופס ושמירת הנתונים (התכנים) בלבד. המערכת שומרת את תבנית (גלופת) הטופס פעם אחת בלבד. בקליטה, "מקלפת" המערכת מהמסמך הנסרק את התבנית ומאחסנת את התכנים בלבד. בתצוגה, "מלבישה" המערכת את התבנית חזרה על המסמך המוצג. התהליך כולו שקוף לחלוטין למשתמש. שימוש בטכנולוגיה זו מקטין באופן משמעותי את נפחי האחסון הנדרשים והוא מתאים במיוחד למקרים של מספר טפסים רב ומספר סוגי טפסים מועט. קיימות שתי דרכים לביצוע Form Drop Out: אחת בעזרת תוכנה והשנייה בעזרת הדפסת מסמך המקור בצבע שאינו נקלט בסריקה. החסרון של הדרך השנייה הוא שהיא דורשת מעבר לטפסים חדשים ואינה מאפשרת קליטת מסמכים קיימים ושימוש בטופסולוגיה קיימת.

תוכנות ניהול ארכיב

בשוק תוכנות המדף קיימות מספר רב של תוכנות לניהול ארכיב ממוחשב. תוכנות אלו מהוות בסיס לבניית יישומי ארכיבאות אופטית ומבצעות את הפונקציות הבאות:

 ·         הגדרת מחלקות המסמכים - הגדרת מפתחות של מחלקות המסמכים אשר בתיקיות המערכת.

 ·         קליטת מסמכים - קליטת המסמכים לארכיון ע"י סריקה או יבוא ומפתוחם.

 ·         העברות והסבות - ניהול העברת נתונים מדיסקים מגנטיים לדיסקים אופטיים והסבת נתונים ממערכות קיימות.

 ·         ניהול הנתונים - ניהול בסיס נתונים לכל דבר, כולל ניהול משאבי האחסון וביצוע פעולות הקריאה/כתיבה לפי המפתחות שהוגדרו. רוב התוכנות למערכות ארכיב תומכות בבסיסי הנתונים הסטנדרטיים בשוק.

 ·         אחזור מסמכים - אחזור המסמכים ממקומם הפיסי בזיכרון האופטי או המגנטי.

 ·         מידור והרשאות - ניהול הרשאות גישה לפעילויות השונות ביישום והגדרת הרשאות גישה של המשתמשים השונים לנתונים בארכיב.

 

תוכנות המדף יכולות לשמש את הארגון במתכונתן המקורית כיישום ארכיון ממוחשב כאשר המודולים השונים והמסכים יוגדרו אד-הוק באמצעות הכלי. פתרון זה ישים למערכות קטנות ופשוטות. במערכות גדולות ומורכבות יותר יש לבנות יישום מורכב וחכם יותר. במערכות כאלה תהווה תכנת המדף בסיס לבניית המערכת. המערכת תיבנה על בסיס תוכנת המדף ובעזרת ספרית API’s המסופקת עם התכנה.

תוכנות הארכיב הממוחשב הקיימות בשוק תומכות ברוב הפלטפורמות הסטנדרטיות ובמספר רב של סוגי ציוד היקפי (סורקים, מדפסות וכו'). שילוב התוכנות בארגון אינו דורש הקמת סביבה מיוחדת ונפרדת, אלא הרחבת הסביבה הקיימת ותגבורה.

תחנות קצה

היבט טכנולוגי חשוב נוסף הוא גודל מסכי תחנות הקצה. הצגת ה- Images של המסמכים בסביבה חלונאית והרצת יישומים נוספים באותה תחנה לביצוע העבודה השוטפת, דורשים שטח מסך גדול ורזולוציה גבוהה או מסכים כפולים. תחנות העבודה בעמדת המשתמש בארכיון אופטי הן גדולות מן המקובל.

ארכיב אופטי (Jukebox)

אמצעי טכנולוגי מרכזי עליו נשען ארכיב מוחשב הוא מערכת דיסקים אופטיים. מערכת זו מתאפיינת ביכולת ניהול של כמות גדולה מאד של נתונים. מערכת ה-  Jukebox מורכבת ממספר פלטות של דיסקים אופטיים וכן זרוע מיכנית היודעת לבחור בפלטה מסוימת ולהעביר אותה לראש הקריאה והכתיבה. התוכנה מנהלת, כמובן, את כל הפלטות ויודעת לאחזר/לבקש את הפלטה בה נמצאים הנתונים הדרושים. בדומה לניהול זיכרונות מטמון (cache) גם כאן כאשר המשתמש מבקש דף ממסמך (או מסמך מתיק), התוכנה תאחזר את המסמך (התיק) כולו ע"מ שגישה לדף (מסמך) אחר תהיה מיידית.

זמן האחזור מ- Jukebox הוא ארוך יחסית, זאת, בשל סיבות מכניות של תזוזת הזרוע המכנית שאינן תלויות בתוכנה. פתרון לבעיה זו יכול להיות באמצעות שילוב נכון של עבודה עם מדיה מגנטית (שהיא מהירה יותר). הסתייעות במדיה מגנטית יכולה להיות במספר אופנים:

 ·         מסמכים בעלי נגישות גבוהה יאוחסנו דרך קבע במדיה המגנטית.

 ·         העברות Batch ברקע של תיקים ומסמכים עליהם מתכוונים לעבוד מהמדיה האופטית למגנטית.

 

מרבית תוכנות הארכיב מכילות אלגוריתם שתפקידו לייעל את העברת המידע בין המדיה האופטית למגנטית ולנצל ביעילות את היתרונות היחסיים של כל אחד מהם.

היבטי מימוש ועלות

מערכת ארכיבאות מתאפיינת בהיבט המימוש והעלות במספר נושאים ייחודיים:

 ·         מערכת ארכיב ממוחשב דורשת נפחי אחסון רבים מעבר למקובל במערכות מידע אלפאנומריות.

 ·         איסוף וקליטת הנתונים, הקלדתם ואימותם, הוא תהליך משמעותי וחיוני אך גם עתיר משאבים ועלות.

 ·         מחיר הסבת ההיסטוריה ומאמץ ההסבה הם גבוהים ועל הארגון לשקול את היקף ההיסטוריה הדרושה לו בארכיב הממוחשב. ככל שימעיט בדרישותיו ויסתפק בהסבת היסטוריה קטנה יותר, כך יקטנו עלויותיו.

 ·         מסכי תחנות הקצה גדולים במיוחד ומהווים הוצאה כספית גבוהה במערכות מרובות משתמשים.

 ·         נדרשים מחשבים בעלי עוצמת עיבוד וזיכרון גדולים על מנת לאחזר ולהציג מסמכים בזמן סביר. המשתמשים שוכחים מהר מאד את השירות שקיבלו בארכיב הישן (ימים) וזמני תגובה של למעלה מ- 20 שניות נראים כעת "נצח".

סיכום

שימוש במערכות ממוחשבות לניהול ארכיב איננו רעיון חדש. אמצעי האחסנה החדישים כגון דיסקים אופטיים (CDROM, Videodisk) וכו', רק מחזקים רעיון זה והמגמה להיפטר מניירת ולהמירה באמצעים ממוכנים ונוחים יותר, היא ברורה. מכל נקודת מבט, עסקית, יישומית וטכנולוגית, יש הרבה "בעד" ארכיבאות ממוחשבת. אך יש גם שיקולים מרכזיים שיש לקחתם בחשבון. שיקולים אלה הם:

טכנולוגיות משתנות

הגורמים הטכנולוגיים והכלכליים המשפיעים על מערכות ארכיב ממוחשב מורכבים ומשתנים כל הזמן.

לצד הגידול המרשים באמצעים בעלי קיבולת אחסנה עצומה הטבעיים לארכיב ממוחשב, חל גידול מרשים לא פחות באמצעי אחסנה מקוונים המכילים את מאגרי המידע הפעילים של המערכות הייעודיות והגבול הטכנולוגי והכלכלי המפריד בין אחסנה On-line לאחסנה ארכיבאית זז כל הזמן.

אין ספק שלנפוצות טכנולוגיות המחשוב בכלל, העברות מידע אלקטרוניות (EDI) בפרט, יש השפעה רבה על ארכיבאות ממוחשבת משום ש"מסמך המקור" הוא בהרבה מקרים אלקטרוני ולא בהכרח נייר (כולל מסמכים המגיעים מארגונים חיצוניים). יש לבחון בקפדנות את מכלול הטכנולוגיות הקיימות (והעתידיות) בתחום, ועם זאת לזכור שבסופו של דבר לב הבעיה אינו בטכנולוגיה, אלא בהגדרה ברורה של היעדים, ביישום, במימוש ובעלות/תועלת.

תכנון כולל

תכנון ארכיב ממוחשב חייב להיעשות כחלק מתכנון מכלול מאגרי המידע בארגון והקשר שלהם עם מאגרים חיצוניים.

גישה של "בוא נעלה את כל התיקים על מדיה ממוחשבת ונפתור את בעיית הארכיב", היינו, החלפה אחד לאחד של ארכיב נייר (ידני) בארכיב ממוחשב עם שינויי או"ש מקומיים, נכונה במקרים נדירים. למשל בארגונים שייעודם המרכזי הוא ניהול ארכיב וקשריהם החיצוניים הם מועטים ואינם ממוכנים.

ארכיב הוא חלק ממערך המידע הכולל של הארגון ואי אפשר לפותרו בגישה נקודתית. יש להגדיר היטב את הממשקים של מערכת הארכיב עם מאגרי המערכות הייעודיות: סוגי המסמכים, קצב העברתם, שיטות קליטה, מפתוח (ראה השיקול הבא) וכו'.

מפתוח מירבי ומשותף

דגש טבעי במערכות ארכיב הוא על הדימות (Imaging) של המסמכים, היינו, על המידע הרציף. זה ללא ספק מאפיין מרכזי של מערכות ארכיב המייחד אותן ממערכות המידע הקלאסיות בארגון (ומקרב אותה למערכות ייחודיות אחרות כגון GIS).

עם זאת, אין לשכוח את המידע המקודד, היינו את מפתוח המסמכים, שהוא המאפשר את שליפת המידע, הן ברמת התיק והן ברמת המסמך הבודד. תיאום מפתוח המסמכים בין מערכת הארכיב ומערכות אחרות, בעיקר אלה המזינות את הארכיב, יכול לחסוך משאבים יקרים ולמנוע שגיאות בהקלדת המידע המקודד בארכיב ולהביא לאיתור פשוט ונוח של המסמך, ללא תלות היכן הוא נמצא ברגע מסוים (במערכת הייעודית, עבר לארכיב, חזר לייעודית וכו').

איתור כזה יהיה לא רק לפי מס' אדמיניסטרטיבי (מס' עובד, מס' תיק וכו'), אלא גם לפי מילות מפתח, טבלאות נושאים, קטעי טקסט, תאריכי יצירה וארכוב וכו'. הקשר הפיסי של מערכת הארכיב עם המאגרים השונים יהיה כמובן שונה וימומש עם כל מאגר באופן אחר. במקרים מסוימים, עשוי מפתוח כזה לגרום לדרישה לשינויים במערכות הייעודיות ולהקמת קטלוג מרכזי בארגון. בניית קטלוג כזה המקיף למעשה את כל המסמכים והרשומות בארגון, איננה בהכרח חלק מפרויקט הארכיב. היא יכולה להיות חלק ממנו (ואז יש לתמחר את פרויקט הארכיב בהתאם), היא יכולה להיות פרויקט עצמאי, או חלק מפרויקט רחב יותר כגון Workflow או Business Intelligence  (ראה קיט משרד ממוחשב לפרוט נוסף).

מסמכי מקור והיסטוריה

מערכת הארכיב הממוחשב חייבת לתת תשובות הולמות לשאלות:

 ·         מה יקרה עם הארכיב הידני?

 ·         האם הוא ייעלם?

 ·         האם הוא באמת ייחסך?

 ·         כמה היסטוריה תעבור לארכיב הממוחשב?

 ·         איך ינוהל הארכיב הידני שיישאר?

 ·         מה על בעיות משפטיות של צורך בשמירת "מסמכי המקור"?

 ·         האם החיסכון הוא רק בהפרשי מחיר לשטחי אחסנה?

 ·         איך ובאיזה קצב יתבצע שינוע מסמכי המקור (הנייר) בשעת הצורך?

בשורה תחתונה

מערכת ארכיב אופטי מהווה מהפיכה בארגון ויש לה השלכות או"ש רבות על תהליכי עבודה, חלוקת אחריות, תפקידי העובדים וכו'.

תכנון ארכיב ממוחשב חייב להיעשות כחלק מתכנון כולל של מכלול מאגרי המידע ומערכות המידע בארגון והקשר שלהם למאגרים חיצוניים.

המערכת דורשת משאבי מיחשוב רבים, מימוש קפדני, עלויות גבוהות והכנה וליווי מתמשכים, אך בתכנון נכון יכולות להיות לה תועלות רבות בהפחתת עלויות, העלאת רמת האמינות של הטיפול במסמכים ובתיקים וחשוב מכל - העלאת רמת השירות.

מחזור חיים – ניהול הפרויקט

מערכות לניהול ארכיב הן מערכות מידע לכל דבר ויש לנהל אותן לפי מחזור חיים אוניברסלי של מפת"ח. עם זאת יש למערכות אלה ייחודיות מסוימת הבאה לידי ביטוי בהיבטים והשלכות על מחזור החיים כמוסבר להלן.

אפיון

במקרים של בנית מערכת מ"סל" של תוכנות מדף ותיאומים מינימליים אין טעם בהקמת אבטיפוס שכן האבטיפוס יהיה כבר זהה או כמעט זהה לתוצר הסופי. לעומת זאת בארגון שבו אפיון המערכת מעלה צורך בשינויים או"שיים בעקבות הכנסת המערכת יש מקום להביא בחשבון התנסות בתהליך התפעולי והאו"שי החדש בארגון. התנסות כזו יכולה להתבצע בעזרת פרויקט חלוץ (Pilot) בחלק מהאירגון.

בקשה להצעות

אין הבדלים עקרוניים בשלב זה בהשוואה למערכות מידע אחרות. ההחלטה על סעיפי סף, משקלות ויחס עלות/תועלת תידון לגופה. אין צידוק להכריז על "מכרז סגור" בטענה שיש מעט חברות המתמחות בנושא. יש מספיק ספקים וכלים. אפשר, כמובן, לדרוש ניסיון וידע מוקדם.

עיצוב ובנייה

שלב העיצוב והבניה תלוי בהחלטות מן השלבים הקודמים. אם הוחלט בארגון על מערכת המבוססת על מערכות מדף קיימות, יהיה שלב זה קצר מאד. כל החלטה אחרת, גם החלטה על ביצוע של מערכת מעטפת פשוטה המפעילה ישומי מדף בממשק אחיד מחייבת ביצוע שלב זה כמקובל. יש לזכור שהארגון עשוי להרויח מהקמת בסיס נתונים מרכזי המנוהל בצורה אחידה. הקמת בסיס נתונים משותף למסמכים בארגון מחייבת עיצוב ובניה לא פחות מכל מערכת ממוחשבת אחרת, ואין להסתמך על מוצר מדף שיעשה את העבודה ללא השקעה וחשיבה.

בדיקות

בדיקות ומבחני קבלה של חבילות ישומים מוכנות נראים לעיתים מיותרים, אך לא כל חבילת תוכנה שעבדה כהלכה אצל היצרן או בהדגמות אכן תעבוד בצורה המצופה על חומרה הקיימת באירגון או על התשתית הקיימת באירגון. במיוחד הדבר נכון אם בחבילות בוצעו שינויים כדי להתאימן לדרישות הלקוח ואפילו שינויים אלו היו פרמטריים בלבד.

יש להשקיע כמובן זמן רב יותר בבדיקות אינטגרציה של חבילות תוכנה שונות, האחת לשניה, וגם של כל חבילות התוכנה לתשתית הארגונית הקיימת או זו שהוקמה במיוחד לצרכי המערכת.

יש להשקיע גם זמן בבדיקות או"ש ארגוני - האם המערכת פועלת בהתאם להחלטות ולנהלים האו"שיים שעליהם הוחלט והאם החלטות אלה אכן היו נכונות ולא גרמו לבעיות וחריקות בארגון. ביצוע פרויקט פיילוט על חלק מהאירגון עשוי לעזור בבדיקות אלה לפני שהשינויים הנדרשים יהיו יקרים במידה שתפגע בפרויקט כולו.

התקנה והרצה

אין שינוי בשלב זה לעומת המוגדר במחזור חיים אוניברסלי של מפת"ח.

תפעול ותחזוקה

 יש לתת דגש לנושאים הבאים:

 ·         צורך בהקמת מרכז פנים או חוץ ארגוני לטיפול במסמכים כולל מרכז להסבת "היטוריה".

 ·         בעיות או"ש בשינוע מסמכי המקור לנקודת הסריקה ומניעת צוארי בקבוק בנקודות סריקה/מפתוח

 ·         שמירת מסמכי המקור ויכולת להגיע אליהם בעת שמתעורר צורך (למשל משפטי).

ניהול הפרויקט

ניהול הפרויקט תלוי בסוג המערכת שנבחרה לביצוע וסוג האירגון שבו היא מבוצעת.

באירגון שבו יש אלפי משתמשים במערכת יש מקום לנהל את הפרויקט כמו כל פרויקט גדול, בחלוקה לתת פרויקטים או כפרויקט של יחידות מסירה מרובות שבו כל יחידה בארגון מנוהלת כיחידת מסירה נפרדת, כולל שלבי ההדרכה וההטמעה.

בארגונים בינוניים וקטנים יתכן שאפשר להסתפק בפרויקט סדרתי המתחיל ונגמר ברצף אחד.

תוצרים – תיק מערכת

עץ המערכת למערכות ארכיב שייך לקבוצת עצי המערכת המיוחדים למערכות מידע, המבוססת, מצידה, על עץ מערכת אוניברסלי של מפת"ח. לפני העיון בעץ המערכת המיוחד למערכות ארכיב, יש לעיין היטב בקיטים הבאים:

 ·         קיט עץ מערכת אוניברסלי בכרך יסודות/עץ המערכת

 ·         קיט תיעוד בכרך נושאים תומכים

 

עץ המערכת איננו מלא ומכיל רק תוספות ודגשים מיוחדים למערכות ארכיב על גבי עץ מערכת אוניברסלי.

לגלופות לימוד ועבודה ראה לשונית תוצרים בקיט זה.

אבטחת איכות ומדדים

באבטחת איכות לפרויקטי ארכיב (ממוחשב) מומלץ להתמקד בשאלות ובמדדים הבאים:

 ·         מעורבות הייעוץ המשפטי של הארגון בפרויקט

 ·         האם נלמדו \ נסקרו מערכות ופרויקטים דומים בארגון ומחוצה לו?

 ·         האם נלמדו \ נסקרו הטכנולוגיות הזמינות בתחום בארץ ובחו"ל?

 ·         האם הוערכו הנפחים כיאות?

 ·         האם מתוכנן \ קיים אתר פיסי נפרד למערכת? כיצד יתקיים הקשר עם משרדי הארגון ופונקציות אחרות הנזקקות לארכיב?

 ·          כיצד הוערך ההחזר של המערכת? על פני איזו תקופה?

 ·         מה השלכות על ציוד הקצה (מחשבי המשתמשים)?