דף הבית של Shvoong > מדע > סטטיסטיקה > 'שקרים, שקרים מלוכלכים, וסטטיסטיקה' נקודות לביקורת הסטטיסטיקה

.

פתרו את החידה של Shvoong וזכו ב-$500!

'שקרים, שקרים מלוכלכים, וסטטיסטיקה' נקודות לביקורת הסטטיסטיקה

Summary rating: 4 stars 4 דירוגים
מחבר : שי כהן
תקציר מאת : shayc
ביקורים : 429  מילים: 900   פורסם ב-: יוני 20, 2006
ברוח האמירה המפורסמת "יש שלושה סוגים של שקרים- שקרים, שקרים מלוכלכים וסטטיסטיקה" , אנו חשים לעיתים שחסרים לנו הכלים לבחון מידע סטטיסטי בצורה ביקורתית, בואו ונבחן את הבעיות בניתוח סטטיסטי:

היקש סטטיסטי הוא מצרפי, לרוב יחסי ולא תמיד אמין בערכי הקיצון.
כלומר- כשאנו מבינים משהו מבחינה סטטיסטית, אין בידינו כלל מוחלט של נכון ולא נכון, אלא היקש לגבי קבוצה של נתונים- המקרה הפרטי, ובעיקר בערכים קיצוניים למדגם כולו או לקבוצת מדגם מסוימת יכול להתנהג בדרכים לחלוטין לא צפויות מבחינת התמונה הסטטיסטית. דוגמה- אם סוציולוג בודק יחס בין הכנסה והשכלה על תיכונית, הוא ייקח את כל האנשים (כלומר מצרפי- צירוף הנתונים של כל הקבוצה) שלא השלימו השכלה על תיכונית, ויבדוק את היחס (לכן ההיקש הוא יחסי) בין ההכנסה הממוצעת שלהם להכנסה הממוצעת של האוכלוסייה הכללית או של קבוצת האנשים בעלי תואר ראשון. יכול להיות שאדם מסוים בקבוצה הזו כמעט והשלים את לימודיו ולמד גם בתוכניות הכשרה רבות- הוא קרוב לגבול שהוגדר לקבוצה והסוציולוג שלנו ימנע מלנבא את הכנסתו. ייתכן גם שהאדם עם ההכנסה הגבוהה ביותר בכל האוכלוסייה, היה דווקא מהקבוצה הזו, ועדיין נגלה שבאופן סטטיסטי ההכנסה של קבוצה זו נמוכה מהממוצע של בעלי ההשכלה.

היקש סטטיסטי כשלעצמו יעיד רק על קשר בין תופעות ולא על סיבתיות.
העובדה שיש קשר "מובהק" (כלומר עומד במבחן הסטטיסטי המקובל מדעית) בין שני נתונים לא מספיקה בכלל להוכחת קשר סיבתי ביניהם- קשר סיבתי יחייב גם קשר בזמן (סיבה לפני תוצאה) והבנת ואישוש מנגנון ההשפעה בין שני הנתונים (מודל סיבתי תיאורטי, שניתן יהיה להפריך אותו בניסוי) לגבי עובדות חברתיות-כלכליות רבות אין בכלל אפשרות להוכיח סיבתיות אלא רק לשער לגביה. כדי להבין זאת בואו נחזור אל הדוגמה שלנו, אם נמצא שחסרי השכלה על תיכונית אכן מרוויחים פחות מבעלי השכלה, האם אנו יכולים לטעון שההשכלה היא הסיבה להכנסה? וודאי שניתן להעלות השערות אחרות- שתי התופעות יכולות להיות קשורות דווקא כי שתיהן תוצאות של גורם שלישי, כמו מעמד חברתי של ההורים וחינוך בגיל צעיר. וייתכן אף שהקשר הסיבתי הוא הפוך, ואנשים בעלי הכנסה גבוהה "הרשו לעצמם" ללמוד.

התוצאה של ניתוח סטטיסטי מושפעת מניסוח השאלה
לסעיף זה שני היבטים, קודם כל היבט טכני מתמטי: במבחן סטטיסטי אנחנו לוקחים "טווח ביטחון" כדי להגדיר שהתוצאה שקיבלנו מובהקת- כלומר שהסיכוי שקיבלנו תוצאה זו במקרה הוא קטן מערך מקובל (חצי אחוז ברוב הניתוחים) את טווח הביטחון ניקח תמיד "נגד הכיוון" כלומר נקטין את הסיכוי לאושש את שאלת המחקר שלנו בטעות. המשמעות היא שבהרבה הליכים סטטיסטיים המקובלים במדעי החברה נמצא תוצאה שונה אם נשאל שאלה שונה על אותו נושא. ייתכן ולא נמצא קשר מובהק בין הכנסה והשכלה על תיכונית, אבל גם נמצא קשר מובהק בין חוסר השכלה והכנסה נמוכה (שזו בעצם אותה שאלה מנוסחת הפוך)

ההיבט השני של ניסוח השאלות (אין קשר בין שני ההיבטים ואין להתבלבל ביניהם) נוגע בעיקר לסקרים המבוססים על מענה של נבדקים לשאלות (המקור להרבה מאד נתונים סטטיסטיים חברתיים-כלכליים) וזו בפשטות השאלה מי שואל, איך הוא שואל ואת מי שואלים- הבחירה בנוסח, מדגם מסוים של אנשים שאותם שואלים, ואף הזהות והתפיסות של מי ששואל את השאלות, משפיעם במודע ושלא במודע על התוצאה.

עד כאן הבעיות ה"מתודולוגיות" בסטטיסטיקה, אולם אני בוחר להדגיש גם בעיות מסוג קצת שונה, הנמצאות במקום בו הסטטיסטיקה יוצאת מתחום המחקר המדעי אל התחום התקשורתי הציבורי והפוליטי.

הסטטיסטיקה כרטוריקה:

אם לדוגמה אנו רואים ידיעה כי הצמיחה בשנה האחרונה הייתה למעשה צמיחה של שני העשירונים העליונים, וכל השאר דשדשו במקום, נתרשם מהנתון הזה הרבה יותר חזק אם הוא ילווה במספרים מדויקים, ועוד יותר אם יצורף גרף מרשים (רצוי צבעוני). אנו נוטים לקבל טיעונים בעלי ניחוח מדעי כחזקים יותר ואמינים יותר, יש גם נטייה לייחס יותר מומחיות למי שמשתמש בטיעונים ואמצעי המחשה מסוג זה.
הכוח הרטורי של הסטטיסטיקה הוא אם כן פתח למניפולציות אין סופיות- כאשר עיתונאים, פרשנים פוליטיקאים ופקידים עושים שימוש מכוון בכל הבעיות אותן סקרנו קודם לכן, ומטים את דעת הקהל לכיוון הרצוי להם. יש גם דוגמאות של גנבת דעת ממש- לדוגמה כאשר מציגים גרף או דיאגרמה שנקודת ההתחלה שלה אינה נקודת האפס כדי להציג שינוי בנתון כמשמעותי הרבה מאשר הוא באמת:

הגידול בהשקעות זרות בישראל (נתונים מפוברקים במיליארדי דולרים):

178............................................
176.................|..........................
174.................|..........................
172.................|..........................
170 _________|_________|_____
....................2004.........2003......

הדיאגרמה עם העלייה הדרמטית הזו הייתה נראית די עלובה אם נקודת ההתחלה הייתה כפי שמקובל מדעית, נקודת האפס, השיקול הוא רטורי בלבד- וזו רטוריקה אפקטיבית

דוגמה חריפה עוד יותר היא השימוש בדיאגראמות "עוגה" שבהן מראים את החלוקה בין קבוצות או קטגוריות בתחום מסוים- לעיתים קרובות יש קטגוריות חסרות ועדיין- עוגה היא תמיד של 100% . לדוגמה, אם נשרטט עוגה של הוצאות הממשלה בישראל, כאשר נציין רק חלק מהסעיפים- בטחון, חינוך וכו' ואילו אחרים, כמו הוצאות משרד רה"מ והאוצר לדוגמה, לא יופיעו- ברור שזה לא משקף את המציאות שכן חלקם היחסי של הסעיפים שמוצגים נראה גדול בהרבה מהמציאות, בדיוק את זה עשה בדוגמה שלפנינו פקיד בכיר באוצר, כשהסביר את ההכרח בקיצוץ תשלומי העברה (קצבאות). במצב כזה ניתן לצפות שלכל הפחות תופיע קטגוריה "הוצאות אחרות" או לחילופין בכלל לא להשתמש בעוגה, אבל במקרה זה מישהו רצה לאכול את העוגה ולהשאיר אותה שלמה...

הניכור בסטטיסטיקה- את הנקודה שבעיני היא חשובה ביותר שמרתי לסוף, היות והסטטיסטיקה היא מצרפית, ולפחות מתחזה למדעית ורציונאלית, הרי שהיא מגדירה סביבת דיון המנוכרת לפרט הבודד, ומנוכרת לאדם. אבחנה זו איננה טריביאלית, משום שסטטיסטיקה משמשת תפקיד מרכזי גם בידי חוקרים היוצאים, כביכול, מנקודת מבט הומניסטית ורגישה לקשיים ועוולות חברתיות. לניכור מהמקרה הפרטי ומכאן גם לנסיון האישי של כל אחד מאיתנו יש גם תפקיד חשוב בדרך בה אנו נרתעים מלערער, ומייחסים סמכות לטיעונים והמחשות סטטיסטיות מורכבות, לעיתים קרובות אנחנו משאירים את ההבנה מה באמת מסתתר בין המספרים והדיאגרמות לאחרים, בדומה לדרך בה הניכור והגועל מפוליטיקה גורמים לנו להשאיר את השלטון בידי פוליטיקאים מנוגרים ומגעילים.

תקצירים נוספים אודות 'שקרים, שקרים מלוכלכים, וסטטיסטיקה' נקודות לביקורת הסטטיסטיקה

תגובות ל'שקרים, שקרים מלוכלכים, וסטטיסטיקה' נקודות לביקורת הסטטיסטיקה

קראו סיכומים בחינם - כתבו ותרויחו!

תקצרו את הידע האנושי בShvoong. הצטרפו אלינו!

------