הלנצח נאכל חרב? (ספוילר: לפי המגמה הנוכחית לפחות נאכל פחות)

כמדי יום זכרון, גם השנה פקדנו את הקבר של יעקב'לה שנפל במלחמת ההתשה. אחרי הטקס דיברנו על תחושה שהייתה לכולם לפיה הרבה יותר אנשים הגיעו לבית הקברות השנה מאשר בשנים עברו; ועל הסברים אפשריים שונים לכך.

עלו כמה הסברים מעניינים, ואחד מהם נגע לזמן הממוצע שעבר מאז הנפילה של רוב החללים.

כששבתי הביתה החלטתי לחזור לטקסט "גיבורים נולדים במותם" של אישתון כדי להסתכל על הנתונים. ואז נזכרתי שבעצם אין שם כאלו (דווקא בגלל הרצון של אישתון לאמת את הנתונים הרשמיים של משרד הביטחון). למעשה, במענה לשאלה של מגיב "האם לדעתך יש מספיק נתונים כיום כדי לבנות גרף סביר של "יהודים הרוגים בשנות קיום המדינה פר שנה"?” אישתון ענה "ךא יודע לגבי "יהודים". אין ספק אבל שיש פחות חללים היום משהיה בעבר. ללא העמקה ניתן אני מניח למצוא את הנתונים הללו ברשת או לשלוף אותם מאתר משרד הביטחון.

אז החלטתי לשלוף.

סייג חשוב לפני הנתונים עצמם (הרחבה בנוגע לפן המתודולוגי/טכני תבוא אחר כך, יחד עם בקשה לסיוע) – בסופו של התהליך הצלחתי לשלוף נתונים בנוגע ל-21,513. לפי הודעת משרד הביטחון, מספר חללי מערכות ישראל עומד על 23,320ככה שעבור ניתוח מקיף חסרים כאן נתונים בנוגע ל1807 חללים.

הממצאים עצמם

באופן עקרוני השאלה שהכי עניינה אותי הייתה מניין החללים ונפגעי פעולות האיבה בחתך שנתי (למרות שבהחלט אפשר לשאול שאלות נוספות על הנתונים – גם בנוגע לדברים כמו הפרדה בין כמות הנופלים לכמות החללים שנפטרו לאחר שירותם; וגם בנוגע לשאלות כמו הכרה ביהודים מהישוב ששירתו בצבא הבריטי במלחמת העולם השנייה או ביהודי שנהרג על ידי פורצים ערבים כשהרצל עוד חגג ברמצווה).

מעבר לשאלה המקורית, זה נשמע כמו מדד "נאיבי" רלוונטי בנוגע לביטחון במדינה; שיכול להיות טוב לראות אותו בהשוואה לעשורים, אירועים ביטחוניים מכוננים, ממשלות שונות, וכו'. אז הנה הנתונים בנוגע לכלל החללים (מזכיר את הסייג) מאתר "יזכור":

allhalal

במבט ראשון בעיקר מושכות את העין מלחמת העצמאות ומלחמת יום כיפור, שחריגות בהיקף ההרוגים שהן גבו. אפשר גם להבחין בששת הימים, לבנון הראשונה, ובמבצע קדש.

נקודה נוספת היא ה"המשכיות" שנדמה שקיימת במניין ההרוגים (למעט החריגה ב-1948) בין תקופת היישוב לבין השנים הראשונות למדינה.

התמקדות בנתונים מאז מלחמת לבנון הראשונה, מבליטה את מגמת הירידה במניין ההרוגים בעשורים האחרונים:

since82halal

בהקשר הזה, מעניין לבחון האם ליציאה מלבנון (שנת 2000) ולהתנתקות (2005) הייתה השפעה על מניין ההרוגים, שכן בשני המקרים מספר ההרוגים היה אחד הטיעונים הבולטים על סדר היום הציבורי בנוגע לצעדי המדיניות הנ"ל.

למרות שעל פניו נראה שבאופן מיידי לא ניתן לראות שינוי לאחר הנסיגה מלבנון (ולאחר ההתנתקות דווקא כן) – נראה לי שהיושרה מחייבת המשך העמקה בנתונים, בדגש על נסיון להפריד בין נפגעי הפיגועים של ראשית שנות האלפיים לבין נפגעי לבנון/עזה.

בחינת ממוצע הרוגים שנתי לפי עשורי המדינה עד כה (כשכמובן צריך לקחת בחשבון שהעשור הנוכחי, והשנה הנוכחית, עדיין בעיצומים) מראה על מגמת ירידה חדה וברורה:

bydecade

בנוגע לעשור הראשון והשלישי צריך לקחת בחשבון שהשונות בהם כנראה מאוד גדולה (בגלל מלחמת העצמאות ומלחמת יום כיפור) ולכן יכול להיות שממוצע הוא דווקא לא המדד הכי רלוונטי.

הערות טכניות/מתודולוגיות

האופן בו הנתונים מונגשים כיום באתר "יזכור" בעייתיים לסוג כזה של שאלות, משני טעמים עיקריים:

א. האתר עובד עם asp

ב. ה-id שמוצמד לכל חלל לא עוקב (לא סדר כרונולוגי ולא אלף ביתי) ולא צמוד (לכ-23000 חללים יש idים שמתחילים איפשהו באזור ה-1000 ומסתיימים באזור החצי מליון).

בעוד שבמקור רציתי לבנות crawler שיוריד את כל הנתונים על פי לינקים (בעיקר האפשרות שכן קיימת באתר לבחינה כרונולוגית של השמות), בגלל שהאתר עובד עם asp (ואין לי מושג איך להתמודד עם זה + לא מצאתי אף כלי חינמי רלוונטי) לא יכלתי ליישם את הרעיון הזה.

מה שעשיתי במקום היה להשתמש בimport.io בתור scraper בלבד. באמצעות R רצתי על כל המספרים מ-1 ועד 518300 – המספר של החלל האחרון נכון לכתיבת שורות אלו, עופר קנריק.

אבל השליפה הזו הייתה כבדה מדי. ולכן זיהיתי "רצפים" של idים, ורצתי במקום על כל המספרים בין 1 ל-20,000; 40,000-60,000; 90,000-100,000; 500000-518,300. יכול מאוד להיות שזו הסיבה לאלפיים השמות ש"לא מצאתי".

מה צריך כדי להמשיך בבדיקת הנתונים הזו?

בעקרון אני חושב שמדובר בנתונים מעניינים ובעל ערך להבנת המצב הביטחוני בישראל, ובעיקר להבנת מגמות ארוכות ובינוניות בהקשר הזה (וכמובן שאפשר לחלץ מהנתונים גם מידע בנוגע ל"פוליטיקה" של הכרה בחללים, שזה ממשיך יותר את הכיוון של אישתון בזמנו).

כמה דברים אחרונים:

1. אם מישהו יודע לבנות crawler שעובד עם asp אז זה יהיה טוב לחילוץ הנתונים החסרים (ולהשלמת הנתונים שודאי עוד יתווספו, לצערנו).

2. אם מישהו מבין לאן "נעלמו" עוד 2000 חללים זה יהיה טוב. קונקרטית – אם אתם מזהים חלל שה-id שלו (אפשר להסתכל בכתובת ה-url) לא נופלת בטווחי המספרים שציינתי לעיל – אנא צרפו את הלינק הרלוונטי בתגובות.

3. את הנתונים עצמם אני מתכוון להעלות בקרוב לשרת כלשהו (צריכים עוד קצת טיפול) להמשך שימוש מצד מי שמעוניין בכך.

מודעות פרסומת
פוסט זה פורסם בקטגוריה Uncategorized. אפשר להגיע ישירות לפוסט זה עם קישור ישיר.

3 תגובות על הלנצח נאכל חרב? (ספוילר: לפי המגמה הנוכחית לפחות נאכל פחות)

  1. Eishton הגיב:

    גם אני ניסיתי לבנות סקרייפר או קרולר לאתר וכשלתי (גם עם Import.io). כשמסתכלים על האתרים האמריקאים והאירופאים מבינים את הביזיון. שם לא רק שהמידע הגולמי נגיש, אלא שהממשק עצמו מאפשר פילוחים שפה צריך לבנות איזה בוט בכדי להוציא אותם.

    נ.ב.
    אין הכרח שמספר החללים המוצהר יקביל למספר החללים הידוע באמת. לא יפתיע אותי אם איש לא בדק במשך עשורים את השמות הללו (עובדה שאיש לא בדק בעיתונות את המספרים השנתיים עד שעשיתי זאת ב-2012). בהחלט אפשר שיש שם טעויות. נוסף על כך יש לזכור שאמורים להיות מעט חללים שמוסתרים מן הרישום מטעמי ביטחון (לא אלפיים כמובן) ואני מניח שיתווספו כאשר יחלוף מספיק זמן וזה יתאפשר. בזמנו ביקשתי ממשהב"ט שיוסיפו קטגוריה ל"חלל חסוי" או משהו בסגנון, בכדי שלפחות הרישום השנתי והכללי יסתדר מבחינת ספירת החללים. לא הגיבו.

    זרוק לי לינק למידע כשתנגיש אותו וגם אם תמצא תוכנה שמצליחה לעשות קרולינג לאתר.

  2. עודד ספקטור הגיב:

    מר אישתןם.
    מדוע פסקו הדיווחים? הרי רק אתה מוציא את האמת.האם כוחות השלטון גברו עליך?

להשאיר תגובה

הזינו את פרטיכם בטופס, או לחצו על אחד מהאייקונים כדי להשתמש בחשבון קיים:

הלוגו של WordPress.com

אתה מגיב באמצעות חשבון WordPress.com שלך. לצאת מהמערכת / לשנות )

תמונת Twitter

אתה מגיב באמצעות חשבון Twitter שלך. לצאת מהמערכת / לשנות )

תמונת Facebook

אתה מגיב באמצעות חשבון Facebook שלך. לצאת מהמערכת / לשנות )

תמונת גוגל פלוס

אתה מגיב באמצעות חשבון Google+ שלך. לצאת מהמערכת / לשנות )

מתחבר ל-%s