תנינים הימורים וימי הולדת / חיים שפירא

כותרת משנה: על סטטיסטיקה והסתברות בחיי היום-יום

הסטטיסטיקה וההסתברות נוכחות בחיינו בכל תחום, וחיים שפירא פותח את הספר ברשימה ארוכה של דוגמאות אקראיות שממחישות זאת. קל מאוד לשחק במספרים כדי להציג על בסיסם מסקנות שגויות: לפעמים המחקר שמאחורי המספרים לוקה בתכנון, בהשמטת גורמים משמעותיים, בבלבול בין מתאם וסיבתיות. לפעמים די בקביעת נקודת התחלה ומרווח על גרף כדי להגיע לכמה תובנות שונות לחלוטין מאותם המספרים בדיוק. במקרים רבים מציגי המספרים וקוראיהם פשוט אינם מבינים אותם. שפירא מנסה לעשות סדר בים הסטטיסטיקה.

בשונה מספרים אחרים שלו שקראתי, כאן הצד המקצועי והמעשי של התחום בא לידי ביטוי נרחב, מעין מבוא לסטטיסטיקה כולל הסברת מונחים מקצועיים, שימוש בנוסחאות, תרגילים ועוד. אודה (ולא באמת אבוש) שלמרות שאני דוברת בשפת המספרים רפרפתי מעליהם, לא משום שאינם מועילים או מעניינים, אלא משום שעניין אותי יותר הפלט מאשר הקלט. תוך כדי התקדמות בהסברים שפירא מרבה לומר, "את זה אנחנו כבר יודעים" או "זה כבר קל לנו". כדי להרגיש כמוהו כדאי להתאים ציפיות לפני הקריאה. מי שמספרים עוברים לו מעל הראש, יתכן שהספר הזה אינו בשבילו. החלקים התיאורטיים, לעומת זאת, חשובים מאוד, אם כי יש להודות שהוא אינו מחדש הרבה, אם בכלל. יחודו בבהירות הדוגמאות התיאורטיות, בהומור ובחן הכתיבה.

הנה כמה נקודות שליקטתי מן הספר.

דוגמא למסקנה שגויה על בסיס נתון לכאורה נכון: מהירות מופרזת אינה גורמת לתאונות, שהרי רק אחוז קטן מן התאונות נגרם כתוצאה ממהירות מעל מאה ועשרים קמ"ש. הליקוי הלוגי: התעלמות מן העבודה שאחוז קטן מן הנסיעות מתרחש במהירות זו. המספר היחסי הקטן של התאונות קשור מן הסתם למספר הקטן יחסית של הנסיעות. על פי אותה לוגיקה ניתן להמליץ על נהיגה במהירות מעל שלוש מאות קמ"ש. על פי ה"סטטיסטיקה", לא נרשמו כלל תאונות במהירות זו.

אפקט דאנינג-קרוגר הוא התופעה שבה בני אדם נוטים להפגין בטחון מופרז בתחומים שבהם אין להם ידע, ולעומת זאת המומחים, שיודעים כמה הם לא יודעים, נוטים להערכת חסר של מומחיותם. תופעה קשורה היא האולטרקרפידריאניזם, הנטיה של אנשים להביע דעות ולתת עצות בעניינים שבהם אין להם הבנה מספקת. שתי אלה יחד חוברות לקביעות בלתי מבוססות, ולהאחזות במסקנות שגויות על סמך נתונים בלתי מספקים ובלתי ברורים.

שפירא מצטט מאמר הטוען, שהחברה נסוגה אחורה בזמן לעידן שבו תחושתם של אנשים רבים לגבי מה נכון ומה לא נכון נשלטת על ידי האמונות שלהם ושל האנשים סביבם יותר מאשר על ידי ראיות מדעיות. יתכן שהדבר נובע מתופעה ששפינוזה אבחן מזמן: ההגיון אינו יכול לנצח את הרגש. נראה לי שבעולם שבו הידע כל כך נגיש בהיקפים נרחבים ובלי סינון, ושבו הולך ונעשה קשה להבחין בין אמת לכזב, יש מי שפשוט מרימים ידים. אם כל כך קשה לברור את העובדות מתוך השפע, קל יותר (וגם מייאש יותר) לעקוב אחרי הרגש והאמונה. וחבל.

הנה כמה שגיאות שנעשות בעת איסוף נתונים והצגתם. "קטיף דובדבנים" הוא מונח המציין בחירה סלקטיבית, שבתורה מובילה, כמובן, למסקנות בלתי מדויקות. קטיף הדובדבנים הוא מסימני ההיכר של פסאודו-מדע, ושל כל מידע אנקדוטלי. שגיאה נפוצה אחרת היא לחשוב שאם יש שתי אפשרויות אז הסיכויים לכל אחת מהן זהים לזו של השניה ושווים לחצי. הטית השרידות, או עקרון החורים/הנתונים החסרים, משמעותה שלא בכל מקרה אנחנו רואים את כל הנתונים החשובים למחקר ויתכן שדווקא הנתונים החשובים ביותר חמקו מאתנו (שפירא מביא כדוגמא את הקביעה שפעם השירים היו טובים לעין ערוך מאשר בזמננו. עיון במצעדי הפזמונים הישנים מגלה בראשם שירים גרועים רבים שנשכחו. הקביעה הנ"ל נובעת מן הטובים הבודדים ששרדו). ועוד שגיאה נפוצה מאוד היא חוסר האבחנה בין מתאם לסיבתיות. דוגמאות משעשעות רבות ניתן למצוא באתר spurious correlations (ראו לדוגמא את המתאם בין צריכת מרגרינה לשיעור הגירושין במיין בשנים 2000 עד 2009. ממש מתאם אחד לאחד. אבל סיבתיות? לא).

משפע הסיפורים והאנקדוטות בספר חביב עלי במיוחד סיפורו של דיאגורס, הפילוסוף בן המאה החמישית לפני הספירה, הממחיש פעמיים את חשיבות ההתיחסות לנתונים החסרים. כשטענו באוזניו כי תפילות לאלים סייעו לאנשים להנצל מסערות בים, הזכיר למספרים את כל אלה שטבעו למרות שנשאו תפילות, ומכיוון שלא שרדו כדי לספר הם אינם נכנסים לסיפור הסטטיסטי. כשנקלע בעצמו לסערה, ושותפיו למסע התלוננו שזו ארעה באשמתו ובאשמת האתאיזם שלו, הזכיר להם את כל הסערות שהתרחשו בעת שהוא עצמו לא היה על סיפונה של סירה כלשהי. קל לקפוץ למסקנות מבוססות אמונה. מסקנות מבוססות עובדות דורשות עבודה קפדנית יותר.

אפרופו עובדות, שפירא מזכיר בהערכה רבה את הנס רוסלינג, וזו הזדמנות לשוב ולהמליץ על ספרו "עובדתיות".

"תנינים הימורים וימי הולדת" הוא ספר מעניין, נוטה מדי לטכני, לטעמי (אך אני בטוחה שיהיו מי שייהנו גם מן הפן הזה), מושך לקריאה בקטעים התיאורטיים, ומנגיש בחן מונחי יסוד לחשיבה לוגית וביקורתית.

כנרת זמורה

2023