מעניין לנסות לצייר מפה פוליטית מבוססת על מידע אובייקטיבי ככל האפשר. לא כזאת שעיתונאים מגדירים או אפילו המפלגות עצמן. מי ימין ומי שמאל, איזה מפלגות קרובות ומי בקצוות שונים.
ההצבעות בסקר הפתוח נתנו תוצר לוואי מעניין. המפה הפוליטית לפי שתי שאלות בלבד וכ-1500 אנשים שענו עליהן. השאלות אובייקטיביות ואינן מנסות לאפיין את המפלגות או המשיבים על קשת פוליטית:
- מה תצביע/י בבחירות הקורובות (2022)?
- מה הצבעת בבחירות הקודמות (2021)?
עכשיו קצת טכני (אפשר לדלג) איך בונים ״מפה״ מתוך שתי שאלות:
את התשובות של אנשים לשאלות בסקר הפתוח, הזנתי לתוך רשת נוירונים שמטרתה - לחזות מה כל בן אדם יצביע לפי הצבעתו הקודמת. הקלט של הרשת הוא - מה הצבעת בבחירות הקודמות והפלט - תחזית של מה תצביע (ואת ההסתברות להצבעה לכל מפלגה).
הסקר הפתוח היה לא רע בחיזוי מה אנשים מצביעים. בשקלול הכללי (זה כבר יותר מדי טכני, לא אכנס להכל) הוא חזה את תוצאות הבחירות עם טעות ממוצעת של 2 מנדטים בערך, מעט פחות טוב מהסקרים של המכונים המובילים.
מתוך הרשת שביצעה את התחזית עבור מצביע בודד, אפשר לחלץ embedding (לא מצאתי תירגום טוב) של הפלט במרחב וקטורי. זו טכניקה נפוצה במודלים של שפה. אלגוריתם ידוע הוא word2vec והשיטה פה משתמשת בעיקרון דומה.
מה שאמבדינג כזה נותן זה יחסים בין מילים (ובמקרה פה מפלגות) במרחב וקטורי. מי קרוב למי ובאיזה מובן. מודלים של שפה מגיעים גם למצב שאפשר לעשות אריתמטיקה בסיסית במרחב המילים שנוצר. למשל פריז פחות צרפת ועוד יפן שווה טוקיו. זה בא להראות ש- embedding כזה מכיל אינפורמציה מעניינת על מילים והקשרים בינהם.
כשלב אחרון, מורידים את המימד של המרחב שנוצר ל-2 מימדים (למשל תוך שימוש באלגוריתם PCA) כדי לאפשר הדמייה.
אז מה יצא ב-embedding של המפלגות במודל הזה. ככה זה נראה:
מה משמעות הצירים? עכשיו זה כבר פרשנות ולא מתמטיקה. לצירים פה באופן בסיסי כנראה אין בדיוק משמעות קונקרטית אלא אבסטרקטית. כלומר זה לא ימין-שמאל כמו שאנשים רגילים להבין (ובכל מקרה מתווכחים על מה המשמעות של ימין-שמאל, בטח בישראל). אולי אולי אפשר להגיד שציר ה-x נראה קצת כמו איזה ציר ליברליות. עוד יותר פרשנות מרחיקת לכת זה שציר ה-y בערכיו הנמוכים זה המיינסטרים הישראלי סוג של וככל שעולים למעל מתרחקים מזה בצורות כאלה ואחרות. אבל זה באמת פרשנות מאוד חפשית ולא באמת מגובה במידע וזה גם רק ניסוי קטן.
רואים קצת קבוצות של מפלגות מאוד קרובות:
העבודה-מרצ
יש עתיד-ישראל-ביתנו-המחנה הממלכתי
שס-הציונות הדתית-יהדות התורה במובן מסויים
וכו וכו אפשר גם לראות מי הכי קרוב למי ומי הכי רחוק ממי.
אולי אפילו קצת אריתמטיקה, למרות שזה קצת לונג-שוט קצת חובבני:
ההופכי של יהדות התורה זה בערך הממוצע בין יש עתית למפלגת העבודה.
שס והציונות הדתית זה ההיפך ממפלגת העבודה ומרצ.
הליכוד פלוס יהדות התורה יוצא בערך הציונות הדתית.
סהכ נחמד וניסוי מעניין עם מודל פשוט יחסית של רשת ולא עם המון מידע. רק כ-1500 הצבעות בסקר הפתוח יוצרים ״מפה פוליטית אלגוריתמית״ ולא כזאת שמוגדרת בדרכים סובייקטיביות.
טלח.