אסף שפירא

11 באפר׳ 2020זמן קריאה 25 דקות

הרחבות לפרק 9: מרמיטה, רשתות דינאמיות והגביע הקדוש של עולם הנתונים (וקצת קורונה)

עודכן: 14 בספט׳ 2022

(ר' קישורים בטקסט)

מה מתרחש (:

אני אסף שפירא וזה נטפריקס – הפודקאסט העברי הראשון למדע הרשתות.

עד היום, רוב התכנים עליהם דיברנו עסקו ברשתות סטאטיות, כלומר, הסתכלנו על רשת בחלון זמן נתון, מה שנקרא snapshot של הרשת. אבל ברור לכולנו שרשתות הן ברובן המכריע – דינאמיות. אז למה אנחנו מתעסקים ברשתות סטאטיות, אם הן דינאמיות? שאלה מצוינת. במיוחד שאם חושבים על זה, הפוטנציאל מאחורי פיצוח הדינאמיות ברשת הוא אדיר ומהווה אולי את "הגביע הקדוש" של עולם ה-data science. למה הכוונה?

כשאנחנו מדמיינים עולם מוכוון דאטה, אנו מצפים שהדאטה יוכל לחשוף לנו את הדפוסים שמרכיבים את עולמנו כאמצעי להבנה טובה יותר של העולם ולחיזוי העתיד. ואם נוכל לזהות את הדפוסים נוכל הרי לזהות גם חריגה מהדפוסים וכך לחזות שינויים.

פתרון של רשת דינאמית הוא למעשה פתרון של העולם, היקום וכל השאר.

למה?

כבר אמרנו בעבר שעולמנו הוא עולם רשתי והרבה מהדאטה שלנו הוא רשת או שניתן להבנות אותו כרשת. הרשת מייצרת לנו מפה של המציאות וכמו שהמציאות היא דינאמית, כך גם הרשת. מכיוון שלרשת יש חוקים, פיצוח החוקים יאפשר לנו את פיצוח המפה כלומר נוכל לפצח את המציאות.

בעולמנו שטוף הקורונה, פיצוח דינאמיות הרשת יכול להראות לנו איך המגפה תופץ וכך להדביר אותה מוקדם יותר, ובחלק האחרון של הפרק נרחיב בנושא.

בעולם הפרסום, נוכל לעקוב אחר הרשתות החברתיות ולזהות את הטרנד הבא.

בעולם הסייבר למשל, פיצוח שינויים ברשת הדינאמית יכול לעזור לנו לזהות כל איום על הרשת.

בעולם הנוירולוגיה, אם נזהה את הדפוסים ברשת הנוירונים של המוח, זה יאפשר לנו לא רק לזהות מחלות אלא גם "לקרוא" את המוח. תחשבו על זה, תרתי משמע (: , אם נוכל לאתר את הדפוס של המחשבות שלנו, קריאת הרשת תאפשר קריאת מחשבות.

אם נבנה את עולם המניות כרשת, וכבר היו מחקרים שעשו זאת, ונפצח את החוקים הדינאמיים שלה, אז השמיים הם הגבול.

לא פלא שמחקר הרשתות הדינאמיות הוא נושא חם. אז למה התעסקנו בכלל ברשתות סטאטיות?

שוב, שאלה מצוינת, אבל חייב פה מילת אזהרה:

למי שלא שמע את הפרקים 2 עד 5, אני ממליץ בחום לחזור אליהם. בכלל, אני ממליץ גם לבוא לפרק הזה בראש פתוח. לא פעם הזהרתי שרשתות הן לא אינטואיטיביות. אז הפרק הזה ייקח אותנו לאקסטרים. אני יכול לספר מניסיון אישי שכל אינטואיציה שהייתה לי על הרשת (ומכאן על העולם) היתה שגויה, עד שהבנתי כמה אני לא מבין.

אני לא חושב שההסברים פה יהיו מורכבים, אני חושב פשוט שהם יאתגרו המון דברים שאנחנו לוקחים כמובן מאליו. . אז למי שהמשיך, כבוד. טוב, אז כדי לענות על השאלה המצוינת ששאלנו קודם, צריך להתחיל בלהגדיר שניה מה זה רשת דינאמית.

מה שהופך את הרשת לדינאמית הוא כמובן מימד הזמן שיכול לבוא לידי ביטוי בצמתים חדשים שמופיעים או נעלמים ברשת, קשתות חדשות שנוצרות או ישנות שנעלמות וכמובן שגם המשקלים של הקשתות יכולים להשתנות לאורך זמן.

שינויים אלו ברכיבי היסוד מהם בנויה הרשת משנים כמובן את הרשת כולה: היווצרות של צמתים חדשים יכולה להוליד קהילות חדשות והיעלמות של קשתות יכולה לפרק קהילות קיימות. כך הרשת כולה יכולה להתרחב או להצטופף לאורך זמן. הזכרנו כבר בפרק 2 את השינויים בטופולוגיית הרשת כשדיברנו למשל על תופעת ה"עולם הקטן" שמתארת איך ככל שנוספים קשרים ברשת, הקוטר שלה קטן.

זמן הוא מימד שלא הרחבנו עליו קודם אז נעצור שניה ונפריד בין שני מושגים של זמן ברשת:

המושג הראשון הוא הזמן כעוד תכונה או לייבל של קשת או צומת. כלומר, עוד מטא דאטה שיש לנו לגבי הרכיב ברשת.

בתכונה זו אנו עושים שימוש כל הזמן בניתוח רשתות, לדוגמא, כשאנחנו מנתחים את רשת החשמל של ישראל ב-2020 אנחנו מגבילים את עצמנו רק לצמתים וקשתות שיש להם לייבל של זמן ב-2020. כלומר, תכונת הזמן של הקשתות והצמתים משמשת אותנו לתיחום הרשת כשאנחנו בוחרים דאטהסט ולרוב, מחקרי רשת נעשים על רשת סטאטית בתקופת זמן מוגדרת (חלון זמן או "snapshot").

בנוסף, אנחנו יכולים לעשות שימוש בתכונת הזמן בשביל להבנות את הדאטהסט שלנו כרשת. יש מקרים שאין בזה צורך למשל ברשתות בהן הקשרים בין הצמתים מובהקים, נגיד, ברשת מייל. כתובת מייל אחת שולחת מייל לכתובת מייל אחר. יש לנו 2 צמתים וקשת ביניהם.

האותות מהמוח מתורגמים לקורולוציות מהן נבנית הרשת (Changwon Jang et al. 2016)

אבל מה לגבי רשת הנוירונים במוח? כיום, אין ברשות המחקר יכולת לזהות את היעד של מסר שנשלח מנוירון X. למעשה, אנחנו אפילו לא יכולים להגיד שמדובר במסר. מה שאנחנו יודעים להגיד הוא זה שבשעה מסויימת נוירון X היה פעיל. אנחנו קוראים לזה מסר, כי שמנו לב שמייד אחרי שנוירון X היה פעיל, נוירון Y החל להיות פעיל גם.

כלומר, מצאנו קורולוציה של פעילות בזמן שנובעת מהנחה של סיבתיות: אם Y פעיל אחרי ובסמוך ל-X, אז יש בינהם קשר.

שיטה זו נקראת השוואה בין סדרות זמן או time-series correlation. אנחנו משרטטים על גרף את הפעילות של הצמתים השונים, ובמידה ומוצאים תאימות או קורולציה בין הפעילויות אנחנו מחברים בינהם בקו. ניתן להגדיר שכעוצמת הקורולציה, כך עוצמת הקשר.

כך למשל אפשר לייצר רשת בין גורמים שאנו מניחים שיש בינהם קשרים אבל הם לא חשופים לנו. כך גם אפשר לייצר רשת ממעקב אחרי מניות. כשמניות עולות ביחד או יורדות ביחד, אנחנו יכולים לחבר בינהן בקשת. אבל זהירות! שימו לב שקורולציה אינה קוזאציה או תאימות אינה סיבתיות.

זה ששני דברים קורים בסמוך זה לזה, לא אומר שיש לכך סיבה. זה שגרף מכירות של רחפנים תואם בצורה מפתיעה לכמות הלוטרות בארה"ב, לא אומר שיש סיבתיות בין השניים. לאלה שמתענינים בנושא אני שמח להפנות לספרו של יהודה פרל The Book of Why שחסרונו היחיד הוא שהסוף שלו די רחוק מההתחלה. לכן ממצאים מסוג זה צריך לבדוק פרטנית ולצד הספקנות, יכול להיות שיעלו נקודות למחשבה שלא היו עולות בדעתנו קודם. מה שיכול לעזור לנו פה זו החלוקה לקהילות: כיוון שקהילות הן הומופיליות, חריגה מההומופיליה תצביע על נקודה שדורשת בדיקה, למשל,

קהילה של מניות נפט שכוללת בתוכה מניות של חברה לייצור מזון מעלה אנומליה חשודה. בירור עומק יכול לגלות שמדובר בקורולציה מקרית בין המניות או שאולי חברת המזון נזקקת לנפט בשביל המפעלים שלה ולכן היא מושפעת או שצריך לבדוק טוב טוב ממה היא מכינה את האוזני המן עם השחור בפנים. המושג השני והמאתגר יותר, ובו נעסוק בהמשך הפרק, הוא הזמן כמימד של הרשת, כלומר, הדינאמיקה ברשת.

כדי להימנע מפירוט טכני מדי, את השיטות לניתוח דינאמי של רשת נפרוט בפרק best practices לחוקר הדאטה. כאן רק נציין בכותרות שלוש שיטות נפוצות ואחרי זה... אחרי זה יבואו הזיקוקים.

אז בחלוקה גסה, יש כיום כמה גישות שונות למחקר דינאמי:

לנגן את הרשת: קשה לעקוב בעין אחרי הרבה שינויים (Nick Locascio, 2017)

שיטת המחקר הרציף, שהיא אולי הכי אינטואיטיבית, והיא פשוט מאפשרת מעקב ויזואלי אחרי שינוי הרשת, מה שנקרא "לנגן את הרשת".

t=time window (Why start with zero? Tradition!)

השיטה השניה, היא שיטת חלונות הזמן, שבה נחלק את הרשת הדינאמית למקטעים סטאטיים (או חלונות) של שעות, ימים או שבועות לפי הצורך, ונשווה בינהם.

והשיטה השלישית היא שיטת הניטור, שפחות מסתכלת על הרשת כרשת אלא כאוסף של מדדים שלכל אחד מהם יש רצף בזמן, כלומר, התוצר שלה הוא גרפים, בדומה לפוליגרף, שהמחט שלהם נעה בכל שינוי במדד, למשל, מעקב אחרי מדד כמות הצמתים, צפיפות הרשת וכד'. גישה זו גם דורשת חלוקה של הרשת למקטעים או לחלונות זמן, אבל יתרונה שהם יכולים להיות קטנים מאד, מבלי להקשות על הויזואליזציה. השימוש הנפוץ בשיטה זו היא בכדי לאתר חריגות או נקודות שינוי ברשת, בהסתמך על גרף המדדים.

המטרה של כל השיטות האלה היא לתאר באופן מדוייק יותר את המציאות, שהיא דינאמית.

וחלקן, ובמיוחד גישת הניטור, מנסות לאפשר את הבסיס לזהות דפוסים, חריגות ושינויים.

יש רק בעיה אחת בגישה הזו, ולמעשה בהרבה מהשיטות לזיהוי דפוסים ופרדיקציות:

הן לא כ"כ עובדות.

(הבטחתי זיקוקים)

הופה, רגע, רגע, זו אמירה קצת קיצונית.

מה זאת אומרת לא עובדות? אנחנו לא יכולים לזהות דפוסים בדאטה? אז בשביל מה משלמים לכל האנשים האלה שמתעסקים כל היום בדאטה? ומה לגבי כל ההבטחות בנושא machine learning ו-AI שיזהו דפוסים בדאטה וייתנו פרדיקציות? עזבו הבטחות – הצלחות מוכחות!

אז זו באמת אמירה קצת קיצונית, וננסה למתן אותה ולהבהיר בהמשך מתי היא נכונה ומתי לא, אבל בינתיים, אנצל את המומנטום כל עוד אתם מוכנים להמשיך לשמוע ואגיד שהבעיה היא לא בזיהוי דפוסים בשיגרה. הבעיה היא בשיגרה.

אין שיגרה.

וכאן, נכנסת המרמיטה.

הסרט "לקום אתמול בבוקר", או "Groundhog's day" (יום המרמיטה), נבחר לאחת מעשרת הקומדיות הגדולות בכל הזמנים. הסרט מתאר את הדמות הראשית, בכיכובו של ביל מוריי (המלך) כאיש די מגעיל שהוטלה עליו קללה: הוא נידון לקום כל יום באותו תאריך ושעה ולחוות שוב ושוב את אותן 24 שעות, לנצח. הסרט, אגב, הרבה יותר מעניין ממה שנשמע.

אז קודם כל, ממליץ מאד לראות, אבל חוצמזה, למה זה נשמע לנו תרחיש כזה הזוי? לכאורה כולנו קוללנו באותה קללה. אנחנו קמים באותה שעה, עושים אותם דברים, נפגשים או מדברים עם אותם אנשים, חוזרים הביתה והולכים לישון. אז זהו, שזה לא בדיוק המצב.

אני מניח שלחלקנו יש לוז קבוע, למשל, כל יום שישי הייתי עומד באותה פינת רחוב לחכות להסעה של הילד בחזרה מבית ספר. אותו מקום, אותה שעה. כל שבוע.

יום אחד עבר חבר שלי ברחוב שהופתעתי לראות. דיברנו קצת, ואחרי שהוא הלך התחלתי לחשוב. למה אני לא פוגש אותו כל פעם באותו מקום? בעצם, למה אני לא מכיר את כל האנשים שעוברים כאן ברחוב? הרי אני שם באותו מקום, באותה שעה. אני מכיר חלק מהאנשים (למשל את המוכר הקבוע בקיוסק, או הקבצן הידוע בכינוי שלו "בשורות טובות" מקינג ג'ורג'), אבל את הרוב המכריע אני לא מזהה מהפעמים הקודמות שהייתי שם.

כדי להבין למה זה קורה, נצטרך להבין מערכות מורכבות. ואין שקר בפרסום. זה מורכב. אבל אנחנו נתגבר על זה (:

רשתות דינאמיות הן מערכות מורכבות (complex system) ולפיכך גם האתגר המחקרי מורכב. אז ממה נובעת המורכבות של הרשתות? כמו ש"אף אדם אינו אי", כך גם הצמתים ברשת קשורות/משפיעות זו על זו. ניסיון למפות שיגרת קשרים של צומת ברשת דומה לניסיון לעקוב אחר שיגרת תנועה של טיפת מים באדוות הנהר. כמו טיפת המים, כך גם הצומת מושפעת מסביבתה שמושפעת אף היא מהסביבה הרחוקה יותר וכן הלאה. מארג זה משפיע הדדית ויוצר "אדוות" ברשת. אם "אדוות הרשת" מזכירות את המושג הפופולרי "אפקט הפרפר" מתורת הכאוס, הדבר אינו מקרי. אפקט הפרפר הוא משל מעולם חיזוי מזג האוויר ובו תנודות כנפיים של פרפר בצד אחד של העולם יכולות לייצר סופה בצד השני, הכוונה לשרשרת של אירועים במיקרו שמייצרות תופעת מאקרו, באופן לא ליניארי. אפקט זה הוא אשר מייצר כאוס ברשת.

בשיח הפופולרי, כשאומרים על משהו שהוא כאוטי, הכוונה היא בדרך כלל להתנהגות שנראית אקראית ומבולגנת, ולא מצייתת לאף חוק, או בז'רגון המקצועי: שכונה. אגב, הסיפור מאחורי ההיסטוריה של המילה כאוס וההקבלות שלה ל"תוהו ובוהו" התנכי, מרתק גם, אבל זה נושא שנשאיר לצערי בצד כרגע. בכל מקרה, בשיח המדעי, זה לא המצב. מערכת כאוטית יכולה להיות מאד מסודרת, פשוט לא צפויה.

אולי זה לא אינטואיטיבי, אבל מערכת כאוטית יכולה להיראות מאד מסודרת (Geek3, Wikipedia)

בשיח זה, כאוס היא מילה טעונה. כשקוראים למשהו כאוטי, זה מגיע עם שובל ארוך של משמעויות, והן כבדות. אולי זו הסיבה שבעולם הרשת לא נוטים להשתמש במילה הזו אלא במושג "מערכת מורכבת" שזו הגדרה שכוללת בתוכה את ההיבטים הכאוטיים של המערכת אבל נשמעת פחות מיסטית. למי שלא מפחד מקצת כאוס, אני ממליץ על האזנה לפרק 9 בנושא בפודקאסט המשחק הגדול של ניצן פוקס.

אז בואו נשחק את משחק ההגדרות. מהי "מערכת מורכבת"?

מערכת מורכבת היא "מערכת דינאמית, לא-ליניארית וכאוטית". מה זה אומר? אז בואו נפרק את המשפט הזה:

מערכת: מערכת היא אוסף רכיבים המגיבים זה לזה ויוצרים שלם הגדול מסך חלקיו.
מערכת לא ליניארית: היא מערכת בה הקשרים וההיזונים בין הרכיבים מגדילים משמעותית את השלם.
דינאמית: כלומר המערכת משתנה לאורך זמן.

אז למה אם הרשת היא מערכת מורכבת היא גם כאוטית? אז נסביר קצת על מהי מערכת כאוטית, ונשתמש בדוגמאות מעולם מזג האוויר שכולנו מכירים ונקביל את זה בסוף לעולם הרשת אבל נתחיל בזה שנגיד שלמערכת כאוטית יש מספר מאפיינים או תנאים שצריכים להתקיים בה כדי להיחשב ככזו והם:

רגישות לתנאי פתיחה
דטרמיניסטיות
לא אקראית
לרוב פרקטלית
ויש בה מושכים מוזרים

ואחרי התפריט הסיני הזה, בואו נפרוט את התנאים: מערכת כאוטית היא מערכת דינאמית לא-ליניארית שרגישה לתנאי פתיחה, כלומר, שינוי ולו הקל ביותר במערכת יביא לתוצאות שונות מאד. התערבות במערכת, ולו המזערית, יכולה להוביל לתוצאות לא צפויות אף יותר ("אפקט הפרפר"). בנוסף, המערכת היא דטרמיניסטית, כלומר, בהינתן אותם תנאי פתיחה, נקבל 2 מערכות זהות. הכוונה לאותם תנאי פתיחה בדיוק מוחלט. גם אם תנאי הפתיחה יהיו מאד מאד מאד דומים, זה לא מספיק ותתקבלנה 2 מערכות שונות מאד.

למערכת כאוטית יש גם קשר חזק לפרקטליות (fractals): התמקדות בחלק מהמערכת תחשוף את אותו מבנה וחוקים של המערכת בכל רזולוציה (מה שנקרא, scale-free, מושג שנתקלנו בו בעבר). ולבסוף, למערכת כאוטית ישנם גבולות הנקבעים ע"י "מושכים מוזרים" ועל כך נפרט בהמשך.

אז מערכת מורכבת היא מערכת דינאמית, שרגישה לתנאי פתיחה, ששינויים בה הם לא ליניאריים. היא לא אקראית אלא יש בה חוקים דטרמיניסטים שבאים לידי ביטוי בכל רזולוציה של המערכת, כלומר, המערכת היא פרקטלית. ויש לה גבולות.

למה הגדרה זו חשובה? שכן המשמעות של הגדרת מערכת כ"מערכת כאוטית" היא שקיימת "תקרת זכוכית" ליכולת לחזות אותה.

מערכת מזג האוויר היא מהמערכות הכאוטיות המפורסמות והנחקרות ביותר ובעיית החיזוי שבה היא מהמוכרות. נשתמש במערכת זו כדי להדגים את עקרונות הכאוס ונקשר בסוף את הכל לעולם הרשת:

מערכת מזג האוויר מגלה רגישות לתנאי פתיחה. ההשפעות על המערכת מצטברות באופן לא-ליניארי ("אפקט הפרפר") כך שחיזוי אפשרי לזמן קצר בלבד.

השפעות אלו אינן מחזוריות ולפיכך במערכת כאוטית, ידיעת ה"עבר" אינה מסייעת לחיזוי ה"עתיד". מזג האוויר אינו אקראי ופועל לפי חוקים פיסיקליים (למשל, אוויר חם עולה, אוויר קר יורד), וחוקים אלו קיימים בכל רזולוציה של המערכת (פרקטלית). אך ידיעת החוקים עדיין לא מאפשרת חיזוי וזאת למרות שמזג האוויר הוא דטרמיניסטי. לכאורה, דטרמיניזם של מערכת מאפשר חיזוי, בהינתן היכרות עם תנאי הפתיחה שלה, אך הקושי נובע בעיקר מהיעדר היכולת לשחזר את תנאי הפתיחה של המערכת במדויק לטובת מודלי החיזוי. חיזוי מזג האוויר הוא בעיה עתיקה שבני האדם השקיעו בה רבות לאורך השנים. למרות כל המשאבים הרבים שהושקעו ומושקעים בכך, הסנסורים המשתכללים והמתרבים, כמויות הנתונים העצומות, היכרות עמוקה עם החוקים הפיסיקליים של המערכת והידע הרב שנרכש, לא ניתן לתת חיזוי טוב למזג האוויר של יותר מימים בודדים וגם בתקופה קצרה זו לא פעם מתקבלות תחזיות שגויות. בנוסף, מכיוון שהמערכת נתונה להשפעות תמידיות ואפילו המזעריות שבהן יכולות לשנות אותה משמעותית, נדרש כיול מתמיד של הפרמטרים במודלים בהם משתמשים החזאים. חזאים אף העריכו שאפילו אם היינו יכולים לנטר כל מולקולה לצרכי המודלים, בגלל הרגישות הגבוה לתנאי פתיחה, עדיין תהיה קיימת "תקרת זכוכית" לתחזיות לטווח של כשבועיים. זהו.

המציג אינו חזאי, ולכן אני מסתמך על אדוארד לורנץ, שהוא אבי הכאוס של מזג האוויר, והסיפור בענינו הוא מדהים והתוצרים שלו מדהימים לא פחות, אבל מכיוון שאנו עוסקים ברשתות, אני נאלץ להפנות לספר "כאוס- מדע חדש נוצר" של ג'יימס גליק. במאמר מוסגר אני אגיד שהספר של גליק הוא אחד מהספרים הכי פחות ערוכים שקראתי, עד שגיליתי שכך נראים כל הספרים של ג'יימס גליק. מי שיצליח להתגבר על זה, צפוי לחוויה מטלטלת.

אבל לורנץ הוא עתיק, אז נצטרך לשכנע אם משהו קצת יותר עדכני. אז הנה זה גם מה שחושבים בארגון ה-EMCWF, שזה European Centre for Medium-Range Weather Forecasts יש כמה סיבות למה אני תופס מהם. קודם כל יש להם שם ארוך. חוצמזה, יש להם דאטה. הרבה דאטה. כל יום נאספים שם כ-233 טראבייט (TB) של נתונים, והארגון עושה במודלים שלו שימוש בכביליון (billion) משתנים. אני לא עושה שימוש בביליון משתנים. אתם כן?

וחוצמזה, המודל שלהם להוריקנים הוכח כטוב יותר מהמודל האמריקאי. שזה קצת מוזר כשחושבים על זה, כי אין הוריקנים באירופה. אנחנו עוד נחזור לארגון זה בהמשך בהקשר של למידת מכונה/machine learning אבל בינתיים, בואו נסכים שלא צריך ביליוני משתנים כדי לתת תחזית אמינה-יחסית שבחורף הטמפרטורות יהיו נמוכות מאשר בקיץ. אז למה דווקא זו פרדיקציה לגיטימית? הסיבה לכך היא שלמערכות כאוטיות ישנם גבולות המוגדרים ע"י "מושכים מוזרים" (strange attractors). ה"מושך" הוא אותו הפרמטר שסביבו סובבת המערכת. המערכת מסתובבת סביבו, אבל בצורה כאוטית, כלומר, ללא דפוסים, אך גם לא בצורה אקראית. אקראיות אומרת שישנה בחירה רנדומלית בין תוצאות ידועות מראש.

למשל, זריקת קוביה היא אקראית. עם זאת, ניתן להגיד שממוצע הזריקות יהיה 3.5 למרות שזו תוצאה שאף פעם לא נקבל בקוביה. במובן מסוים אפשר להגיד ש- 3.5 הוא המושך המוזר של הטלת הקוביה, כי הוא מאפשר לנו להגיד שהתוצאות יהיו סביב ה-3.5, כך שנוכל להעריך את גבולות המערכת בכ-1-6.

הבעיה היא שבמערכת כאוטית, יכולים להיות כמה מושכים מוזרים והמערכת עוברת בינהם בצורה לא צפויה.

בחנ/י את עצמך: חנונ/ית או קול/ית? איזה קוביה יטיל קוסם דרגה1 עם חץ קסם?

עכשיו בואו נפריד את הגברים מהילדים ונדמיין שיש לנו סט של קוביות משחק של מבוכים ודרקונים, שכמו שכל גבר יודע, מכיל 6 קוביות: קוביה של 1-4, קוביה רגילה של 1-6, קוביה של 1-8, קוביה של 1-10, קוביה של 1-12 (שמשום מה, אף פעם לא משתמשים בה), וקוביה של 1-20.

במהלך המשחק, מדי פעם נזרוק קוביות שונות לפי הצורך.

במקרה כזה, אנחנו ננוע בין כמה מושכים מוזרים ולכן הממוצע של כלל הקוביות לא יספר לנו באיזה קוביה אנחנו משתמשים כי הממוצע שנקבל לא יתאר אף אחת מהקוביות. יכול להיות שנקבל ממוצע שיהיה גדול יותר ממה שחלק מהקוביות בכלל יכול לתת.

עד כאן, תיארנו מערכת שהיא אקראית, כי אנחנו יודעים כמה קוביות יש לנו, וכמה פאות לכל קוביה, כלומר, יש לנו מגוון של תוצאות ידועות מראש, אבל התזמון שלהם לא ידוע.

עכשיו דמיינו אותו דבר רק בלי שאנחנו יודעים כמה קוביות יש לנו וכמה פאות יש להן.

לא נעים.

מזג האוויר הוא לא אקראי. יש אינסוף טמפרטורות שניתן לבחור מבינהן, והמעבר בינהן הוא לא אקראי. הוא תוצאה של תהליכים שנבעו מתנאי הפתיחה של המערכת. כך גם למערכת מזג האוויר ישנם גבולות הנקבעים ע"י "מושכים מוזרים" וזו הסיבה למשל שבסהרה נוכל להניח שלא צפוי שלג שנה הבאה (בגלל גבולות המערכת) אך לא נדע להגיד מה בדיוק תהיה הטמפרטורה בתוך מסגרת גבולות המערכת. כלומר, קיימות מערכות כאוטיות בהן ניתן לזהות מצבי מאקרו יחסית-יציבים אך כאוס ברכיבי המיקרו. אני אומר יחסית יציבים, כי למשל ההתחממות הגלובאלית יכולה לייצר רצף של אירועים שתמשוך את המערכת בסהרה למושך מוזר אחר שתייצר שם יציבות מסוג אחר.

מערכת כאוטית שנעה סביב שני מושכים מוזרים

ולסקרנים להבין איך נראה מושך מוזר, מצורפת תמונה של אחד משרטוטיו המפורסמים של לורנץ, המבוססים על מערכות כאוטיות. מה שמהפנט בשרטוטים האלו, שלמרבה האירוניה, נראים כמו כנפי פרפר, זה שהמערכת נעה סביב אותם מושכים מוזרים או עוגנים, אך לא חוזרת על עצמה, כלומר, ללא שיגרה או דפוס.

אז עכשיו אנחנו בשלים ליישם את עקרונות המערכת הכאוטית על רשתות אמיתיות ובדגש על רשתות טמפורליות (Temporal Real-World Networks). רשת טמפורלית היא רשת בה לקשתות יש מועד פקיעה, למשל, ברשת טלפוניה, משך הקשת הוא כמשך השיחה, ולכן הן מייצרות דינאמיות רבה.

נזכיר שמה שאנחנו מחפשים, זה שהרשת תענה לקריטריונים הבאים של מערכת כאוטית:

רגישות לתנאי פתיחה
דטרמיניסטיות
לא אקראית
לרוב פרקטלית
ויש בה מושכים מוזרים

בהקשר לדטרמיניזם ורגישות לתנאי פתיחה, נראה שיהיה בלתי אפשרי להוכיח שרשת אמיתית היא דטרמיניסטית. כדי לבדוק את זה, נצטרך לשחזר רשת מתחילתה עד סופה בדיוק באותם תנאי פתיחה וזה לא כלכך ריאלי. אם היינו יכולים לשחזר רשת בצורה כזו, אז אני מניח שהיו קמות הרבה מתחרות לפייסבוק. זה כנראה בלתי אפשרי לשחזר את אותם תנאי פתיחה שהיו למארק צוקרברג בכדי להדגים שבאותו מצב תיווצר בדיוק אותה רשת...

לפיכך, תשובה סופית לשאלה זו היא עניין לפילוסופים וחוקרי תורת הקוואנטים וגם זה, רק אם הם אוהבים את הסרט "Groundhog's Day" ("לקום אתמול בבוקר") שמתאר בדיוק כזה תרחיש. דמות שקמה כל בוקר באותה שעה בדיוק, לאותם תנאי פתיחה.

ברשותכם, ארחיב מעט על הסוגיה הדטרמיניסטית ואצטט את רוברט סאפולסקי, שהוא פרופסור לביולוגיה התנהגותית בסטנפורד, ויש לו אגב הרצאות מרתקות, כולל על תופעת ה-Power Law בטבע ותודה לדור ליטאי שהפנה אותי אליו.

סאפולסקי, בשיעור המבוא שלו לתחום, שאל את תלמידיו מספר שאלות וביניהן "האם אתה מאמין שלאדם יש בחירה חופשית?" אחרי שרובן המכריע של הידיים התרוממו בשיעור הוא אמר: "טוב, זה הולך להשתנות במהלך הקורס". דטרמיניזם הוא בעצם היעדר חופש בחירה. סאפולסקי מאתגר אותנו להרהר בקיומו של חופש כזה לאור התלות הברורה של ההתנהגות שלנו בגנטיקה וסביבה.

אבל היעדר חופש בחירה זה משהו שרובנו לא אוהבים לשמוע, אז נשים כוכבית על הנושא ונמשיך.

הדגמת קשר שמשנה טופולוגיה ("עולם קטן") במודל רשת (J. (Saramaki, 2005

לגבי הרגישות לתנאי פתיחה, אני מוכן להסתכן ולהגיד שאמפירית, נראה שרשת אמיתית לא גדלה באופן סימטרי ואין שתי רשתות זהות (יכולות להיות דומות, אבל לא זהות), כיוון שאפילו ההשפעה הקטנה ביותר יכולה לשנות משמעותית את הרשת. למשל, אפילו קשת אחת שנוצרת בין צמתים רחוקים ברשת תשנה משמעותית את מבנה הרשת, כמו שלמדנו מחוק העולם הקטן.

אז אם נסכים שרשתות רגישות לתנאי פתיחה, ונשאיר את הדטרמיניזם בצד לרגע, אז בואו נתקדם לנושא האקראיות.

כמו שכבר דיברנו בפרקים 2 ו-3, רשתות אינן אקראיות (כפי שחשבו בעבר) אלא פועלות לפי חוקים: חוק ה-Power Law, כמובן בראש, אבל גם חוק ההתקהלות של הרשת, חוק העולם הקטן, חוק דנבאר ועוד.

ואמרנו גם שלמערכת כאוטית יש קשר לפרקטליות. אז אם אתם זוכרים מהפרק על קהילות ברשת, המשלנו את מבנה הרשת לכרובית. כמו שהמבנה של הכרובית הוא פרקטלי, כלומר, כרובית בנויה מהרבה כרוביות קטנות (והקוראים הנאמנים כבר בטח בדקו במקרר) כך גם הרשת מורכבת מהרבה רשתות קטנות שהן למעשה הקהילות.

ועכשיו כל הפרקים מתחברים לנו: בפרק בנושא Power Law דיברנו על כך שברבאשי, חוקר הרשתות המפורסם, גילה שהרשת היא scale-free כלומר, משוחררת מרזולוציה. בכל מימד של הרשת, נראה את אותן תופעות. אז הנה, הפרקטליות היא-היא תופעת ה- scale-free: הרשת מחולקת לקהילות שבתורן מחולקות לקהילות קטנות יותר וכן הלאה. גם הרשת וגם הקהילות וגם תת הקהילות שומרות על ה-Power Law. בכל חלק ברשת יהיו מעט צמתים מרכזיים וזנב ארוך של צמתים עם קשרים בודדים. או כמו שאני אוהב להגיד בחיבה: בכל קהילה, יש Power Law קטן. אז נשארנו עם המאפיין הכאוטי האחרון והוא המושך המוזר.

אז בפרק 2, בנושא העולם הקטן, דיברנו על כך שהרשת בנויה מרכיבי קשירות, כלומר, "איים ברשת" שלא מחוברים זה לזה, ושבכל רשת יש רכיב קשירות מרכזי אחד שהוא הגדול מכולם ועומד בראש הדינוזאור, או בראש הזנב הארוך, שכן גם רכיבי קשירות ברשת הם Power Law.

רכיב הקשירות המרכזי ברשת יכול להיחשב כ"מושך המוזר" של המערכת. בתהליך היווצרותה של רשת, מהר מאד נוצר רכיב קשירות מרכזי שאליו מתחברים רוב הצמתים. הם יכולים להינתק ממנו ולחזור אליו, אבל הוא יישאר שם. ההרכב שלו יכול להשתנות (ובטוח משתנה) אבל הוא שם. מכיוון שהרשת היא פרקטלית, התופעה הזו תופיע גם בתת-רכיבי הרשת שהן הקהילות. המושכים המוזרים יופיעו בקהילות כהומופיליה של הקהילה ויבואו לידי ביטוי בגורמים המובילים ב-Power Law. הם יישתנו וייתחלפו, אבל עדיין ימשכו את המערכת סביבם. [1]

אז בואו נעשה סיכום ביניים:

רשתות, הן למעשה מערכות כאוטיות. למערכת כאוטית יש הגדרה מדעית והרשת עונה עליהן. אירועים שמתחילים כקטנים ברשת, כמו מישהו שאוכל מרק עטלפים, יכולים להכות בה גלים כמו במשל "אפקט הפרפר" ולשנות אותה מאד. כמו כן, מערכות כאוטיות הן לא אקראיות ויש בהן חוקים, וכבר הראינו שהדבר נכון גם לגבי רשתות. הן פועלות לפי חוקים. כמו בהרבה מערכות כאוטיות, גם הרשתות הן פרקטליות, כלומר מורכבות מתת-רכיבים שאותם חוקים חלים עליהם ולכן משמרים את הצורה של הרשת (כמו מבנה הכרובית). וכמו במערכות כאוטיות, גם ברשתות יש מושכים מוזרים ששומרים על גבולות המערכת, והם מרכזי הכובד של הרשת.

אז עכשיו לשורה התחתונה, מה זה אומר שרשת אמיתית היא כאוטית? אז המשמעות היא שמעצם הגדרת הרשת ככאוטית, אז בדומה לתחזיות מזג אוויר, גם כאן קיימת תקרת זכוכית ליכולת לבצע תחזית/פרדיקציה על הרשת או לאתר בה שיגרה/דפוסים.

(מייק דרופ)

רגע,

בוא נחזור על זה שוב: מה זה אומר שאין שיגרה ברשת? איך זה יכול להיות?

עכשיו אנחנו כבר בטח לא מופתעים שכמו תובנות רבות נוספות על רשתות, גם התובנה הזו היא לא אינטואיטיבית בעליל, אבל לא בטוח שמישהו נשאר לקרוא (:

אז בואו נחזור שוב לחיקה החם של האינטואיציה:

שיגרה היא הרי מושג אינטואיטיבי: אנשים קמים בבוקר, הולכים לעבודה, נפגשים עם אותם חבר'ה מהמשרד, מדברים עם אותם אנשים, חוזרים הביתה והולכים לישון. מה זה אם לא שיגרה או דפוס?

לפעמים אנחנו מרגישים כל כך קבורים בשיגרה הזו, שפעם בשנה אנחנו מרגישים שאנחנו חייבים לצאת לנופש כדי לשבור את השיגרה. והרי בפועל, נוכל לתת תחזית די טובה שמי שיוצא מהבית בבוקר נוסע למקום עבודתו אם זה מה שעשה ביום לפני וביום לפני. לכאורה, מקרה קלאסי שבו ידיעת העבר כן מסייעת לנו לחזות את העתיד (כלומר, עבר=עתיד). נוסיף לכך שמזג האוויר היא מערכת מורכבת/כאוטית ולמרות זאת, קיים מקצוע שעוסק בחיזוי מזג האוויר וכולנו נהנים ממנו. אז למה להיות שלילי?

בכדי ליישב את הסתירה, נבדיל בין התנהגות המערכת במיקרו למאקרו ונקביל לתחזיות מזג האוויר שגם בה, חלק מגבולות המערכת נקבעים ע"י מחזוריות: עונות השנה אינן מערכת כאוטית אלא מחזורית (כמו יום ולילה). מזג האוויר עצמו לעומת זאת הוא מערכת כאוטית מורכבת. וכך גם הרשת: גם ברשת יש "עונתיות" (למשל, נצפה לראות יותר פעילות ביום מבלילה) אבל הפרטים שבה הם כאוטיים.

נשתמש ב"משל הנהר" לצורך ההדגמה: יש אימרה מוכרת שאומרת ש"אי אפשר להיכנס לאותו נהר פעמיים", כי המים שונים, הדגים אחרים וכו', אבל מצד שני, ברור לכולנו שעדיין יש שם נהר וזה אותו נהר. ה"דגים" וה"מים" בדוגמא זו הם הצמתים והקשתות ברשת. הם תמונת המיקרו שלה והם כאוטיים. ה"נהר" הוא גבולות המערכת (מאקרו) והוא מתנהג עונתית.

הבעיה עם מסקנות עונתיות זה שהן נוטות להיות טריוויאליות: אנשים לרוב אכן קמים בבוקר לעבודה וחוזרים בערב ובמקרה של ישראל, פחות נוטים ללכת לעבודה בשבת. אבל מה שפחות טריוויאלי הוא שבזמן שהם בעבודה למשל, הקשתות והצמתים שאיתם הם באים באינטראקציה שונים מאד מיום ליום. נשמע מאד לא אינטואיטיבי אבל ניתן לבדוק זאת אמפירית: מבדיקה אמפירית על מגוון רשתות טמפורליות תוך השוואה בין חלונות זמן בכל רשת, נגלה שאחוז החפיפה של הצמתים והקשתות הולך וקטן משמעותית לאורך זמן. למשל, ואל תתפסו אותי על האחוז, השוואה של הרשת, למשל, בין יום א' ליום ב', תגלה חפיפה של כ-40%~ מהצמתים וכ-20%~ מהקשתות. המשמעות המיידית היא שרוב הרשת השתנתה, לא רק בהרכב שלה (הצמתים) אלא גם במבנה שלה (הקשתות) בסדר גודל של כ-80%~ לפחות! כלומר, אפילו שחלק מהצמתים נשארו ברשת, המבנה של הרשת השתנה לגמרי בגלל השינוי בקשתות או בקשרים בין הצמתים.

ולאורך זמן, השינויים ברשת רק יגדלו ויגדלו. אבל אולי השוואה בין חלונות זמן רציפים היא כמו השוואה בין תפוחים לתפוזים? ביום א' כולם חזרו מהשבת והם משלימים פערים, וביום ב' חוזרים לענינים? אז גם אם נשווה את יום א' ליום א' שבוע אחריו (וכך בהתאמה), מתוך ציפייה שמבנה היום בשבוע הוא עונתי, עדיין נקבל תוצאה דומה - אחוז השינוי הוא גדול, ורק הולך וגדל.

נשמע מוזר?

כשמוזר לי, אני פונה למילגרם. מילגרם, נזכיר, היה פסיכולוג חברתי מפורסם, ואחד הניסויים שערך בשנות ה-70 היה ניסוי שנקרא "הזר המוכר" (familiar stranger).

מילגרם הגדיר זר-מוכר כמי שאנחנו פוגשים באופן קבוע ומכירים בפנים אבל מעולם לא דיברנו איתו. מילגרם ערך את הניסוי בתחנת רכבת. הוא צילם את האנשים בתחנה וביקש מהם לסמן את האנשים שהם מכירים מהתחנה, אבל שמעולם לא דיברו עימם, כלומר, זרים-מוכרים.

הוא הצביע על כך שכ-90% מהאנשים זיהו לפחות אדם אחד.

מכיוון שכבר למדנו לחשוד במילגרם, אז בדיקה חוזרת לניסוי, שנערכה ב-2004 העלתה ממצא די דומה, ובו כ-78% מהנסקרים זיהו לפחות אדם אחד. אני מרגיש שמיותר לציין זאת, אבל כמובן שהיה power law בהתפלגות התשובות. היו מעט אנשים שהרבה זיהו, והרוב זיהה רק אדם אחד.

החלק המעניין בסיפור הוא שמחברי הניסויים בחרו לראות את חצי הכוס המלאה. הם נדהמו לגלות שאחוז די גדול זיהה לפחות אדם אחד ואיששו כך את המושג "זר-מוכר". אבל במבט מפוכח על הניסוי אנחנו בעצם מגלים שבניגוד לאינטואיציה, רוב האנשים לא מכירים את האנשים שנמצאים סביבם, למרות שלכאורה מדובר במקומות שמשדרים שיגרה (למשל, תחנות תחבורה ציבורית). וזה מסביר גם מדוע כשחיכיתי להסעה של הילד, לא הכרתי אף אחד ברחוב למרות שהייתי באותו מקום באופן קבוע.

את התופעה הזו ניתן למצוא בכמה וכמה מאמרים שמצביעים על כך שחלק ניכר מהצמתים והקשתות נעלמים ומופיעים בין חלונות זמן. אבל התופעה הזו לדעתי עברה קצת מתחת לראדאר המחקרי וחלק מהחוקרים פשוט ייחסו אותה ל"רעש" או "אי יציבות" של הרשת או של אלגוריתם כזה או אחר. וכמו שכבר למדנו בפרק 2, לא במפתיע, הכאוס נמצא ברעש. כלומר, אם נחזור לדוגמה של "משל הנהר", אז ה"דגים" וה"מים" (הצמתים והקשתות, או במקרה של מילגרם, האנשים בתחנת הרכבת) לא מקיימים שיגרה אלא מערכת כאוטית.

לעומת זאת, ברמת ה"נהר" (או הרשת כולה), אם נעשה בדיקה השוואתית של הפעילות הרשתית בין יום ללילה, למשל, נגלה דפוס מובהק של צניחת פעילות בלילה וחידוש הפעילות ביום למחרת, כלומר, עונתיות, בדיוק כמו שנוכל להגיד שבקיץ יהיה חם יותר מבחורף.

ועל זה יש ה-מ-ו-ן מחקרים.

כלומר, אם נחזור לדוגמא שנתנו לגבי השיגרה החונקת של חיינו, אז כשנשווה יום ליום נגלה שכל יום הוא למעשה ממש לא שגרתי ושונה מקודמו. ודווקא במבט שנתי, החופשה שלנו שנועדה לברוח מהשיגרה, היא-היא הדפוס השגרתי שלנו.

לתזה הזו יש משמעויות כבדות משקל לעולם למידת המכונה (Machine learning): ללמידת מכונה יש פוטנציאל גדול (שבחלקו כבר מומש) על דאטהסט שמהותו סטאטית. מה זאת אומרת? שמה שמאפיין את הנתונים זה שהעבר=עתיד ולא פחות חשוב, שלדאטהסט הזה יהיה groundtruth, כלומר, שיהיו מקרים מובהקים, ומספיק מהם, שנדע להגיד האם המכונה צדקה או לא.

לדוגמא, היכולת לזהות חתולים: חתול הוא חתול בעבר ובעתיד. יש לו הרבה זוויות אפשריות אבל במהותו הוא אותו דבר, ולפיכך למידת מכונה תוכל לזהות חתול בעבר ובעתיד. בכדי לעשות זאת, למידת מכונה דורשת אימון, שמצריך זמן והרבה נתונים (למשל, מיליוני תמונות של חתולים לצורך זיהוי, שזה ה-groundtruth). האימון מתבסס על מה שנצפה ו/או על חוקים ידועים מראש. בנוסף, אנחנו גם נדע למשב את התוצרים ונדע אם המכונה צדקה או לא. [2]

אבל הבעיה בלמידת מכונה על רשת היא שהרשת היא דינאמית/כאוטית (על כל המשתמע מכך) ושבנוסף לכל הצרות, לרוב אין מספיק נתונים לאימון המכונה שיכסה את כל האפשרויות של חריגות/שינויים שהיו ויהיו. אבל בעצם, אם חושבים על זה, האם אי פעם יהיה לנו מאגר כזה של ground-truth של שינויים? הרי עצם המהות של שינוי זה שהוא שונה ממה שהיה בעבר. אז איך נמצא משהו שלא קרה קודם על סמך העבר?

בואו נחזור למכון מחקר מזג אויר החביב עלי והוא ה- EMCWF ולניסוי שהם ערכו בתחום פרדיקציה של למידת מכונה על מערכת כאוטית.

הניסוי כלל מספר שיטות של למידת מכונה במטרה לחזות מערכת כאוטית יחסית-פשוטה בתחום מזג האוויר.

התוצר של הניסוי היה למעשה גרף שרץ מעלה-מטה שכלל את ה-ground truth כלומר, את ההתנהגות האמיתית של המערכת הכאוטית, ובמקביל אליו, עוד גרפים שייצגו את הפרדיקציות של למידת המכונה, כדי להשוותם לגרף המקורי.

ההתחלה נראתה מבטיחה. ביחידת הזמן הראשונה, הגרפים עלו וירדו ביחד. למידת המכונה חזתה יפה את צעד הפתיחה של המערכת. אבל משם והלאה, כל קשר בין הגרפים הלך ונעלם. כשאחד ירד השני עלה וכו'. המערכת הכאוטית "ברחה" למודלים של למידת המכונה, שלבים או אפילו שלב בודד מתחילת התהליך.

"האמת" (הגרף הירוק) "בורחת" לפרדיקציה מבוססת למידת מכונה (Peter D. Dueben and Peter Bauer, 2018)

במאמר המתאר את הניסוי, ישנו דיון שלם לגבי הדאטה עליו אמורים לאמן את המכונה. איך למשל, מכונה תחזה עידן קרח בקיץ, אם הדבר לא קרה מעולם?

אבל לצד הרהורים אלה, למידת המכונה כנראה תאפשר לייעל הרבה מהמודלים בהם משתמשים החזאים, שכמו שכבר הבנו, נהיו מורכבים ואולי מורכבים מדי. אבל אם נכוון נמוך יותר, לרכיבים מאד בסיסיים של המערכת, אז יש פרדיקציות ברשת שיותר מוכיחות את עצמן, אבל גם להן יש מגבלות. הכוונה היא לפרדיקציה על קשרים (link prediction), כלומר, ניסיון לחזות קשתות שיחברו בין צמתים לא-מחוברים. האלגוריתמיקה שעוסקת בכך מיושמת במנועי המלצות, כמו למשל, המלצות למשתמש ברשת חברתית על חברים או על מוצרים.

דוגמא פשוטה לחיזוי קשרים כזה היא רשת ובה שלושה צמתים שרק שניים מהם מחוברים. כך ניתן להניח, בסבירות גבוהה, שהצמתים הלא-מחוברות יתחברו, כלומר, חבר טוב של חבר טוב שלי כנראה יהיה חבר שלי.

מהיכרות עם חוקי הרשת (למשל, חוק הקהילות, שגורס שהקשרים החזקים יהיו בתוך הקהילה) נוכל להסיק שרוב הקשרים של הצומת יהיו לצמתים בקהילה/שכנים ועל כך מתבססת האלגוריתמיקה המובילה בתחום, שמגיעה לפרדיקציות של 80% ויותר.

אבל המגבלה היא כמובן על הקשתות החריגות, אותם קשרים חלשים שמחברים בין קהילות ויוצרות את השינויים הגדולים בטופולוגיית הרשת, כלומר, הקשתות שיוצרות את אפקט "העולם הקטן". למשל, פגישה מקרית של שני אנשים ברחוב, שאינה מנוטרת, יכולה להוביל לחברות ברשת החברתית המנוטרת ולהפתיע. נציין גם באמירת אגב, שהקשר הלא-צפוי הזה גם ישנה מאד את טופולוגיית הרשת שלנו. אז אולי ככל שנגדיל את הניטור, נהיה יותר קרובים לפתרון. למשל, אם נייצר רשת רבת מימדים שכוללת סוגים שונים של קשרים, למשל, איזור מגורים משותף או תחביבים משותפים, נקבל משהו כמו: חברים שלך בפייסבוק, נוטים לקנות את מוצר X ולכן נמליץ לך אותו. כך בעיית הפרדיקציה הופכת לבעיית סיווג (classification) שם ללמידת מכונה יש יתרון. אבל מכיוון שאנחנו לא יכולים לנטר כל פעילות, זה כנראה אף פעם לא יהיה מושלם, אבל אולי זה מספיק טוב, בעיקר כי גם מחיר הטעות הוא לא גבוה. גם בחיזוי מזג האוויר, נוספים המון נתונים מהרבה סנסורים שהולכים ומשתכללים, ואכן נותנים לנו פרדיקציות טובות לטווח הקצר, אבל תקרת הזכוכית שרירה וקיימת.

אז איפה הקסם שישבור אותה? נראה שבניגוד למה שהבטיחו לי בברושור, שום דבר לא מושלם וזו הגישה שעומדת מאחורי מודלים של רשת.

אני אוהב שהדברים מוחלטים וברורים ואילו הגישה הזו של המודלים דנה אותנו למאסר עולם של "בערך", אבל בעולם חקר הביצועים והפיסיקה, "הבערך" הזה שווה ערך למדליית זהב.

כמו שנאמר על מודלים, "כולם שגויים אבל לחלקם יש שימוש". הקירוב של המודל יכול לעזור לנו בפרקטיקה.

הגישה הזו באה לידי ביטוי למשל אצל ברבאשי (חוקר הרשתות המפורסם שדיברנו עליו פעמים רבות) וד"ר ברוך ברזל, מאוניברסיטת בר אילן, שמנסים למדל את התנועה ברשת הדינאמית, תוך התחשבות בטופולוגיית הרשת הסטאטית. שזה כמו לחקור נתונים דינאמיים של waze על מפת הכבישים הסטאטית בארץ.

מודלים של רשת הם גם אבן יסוד בעולם האפידימיולוגיה שעושה את הקאמבק בזכות הקורונה. לא תכננתי לדבר על קורונה, אבל איפה שאנשים רואים מגפה, פודקסטרים מזהים הזדמנות. נראה לי שאת השיא מחזיק פודקסטר אלמוני שהוציא סדרה תחת הכותרת "עושים קורונה".

אז ננצל את ההזדמנות לדבר קצת בעברית קלה ומנוקדת על נושאים קלילים במרכז היום כמו מודלים להתפשטות מגפות, שמנסים לתאר את תנועת הנגיף ברשת האנושית.

במודלים אלו משתמשים אחרי שכבר פרץ אירוע. הם לא יעזרו לנו למצוא את האירוע הבא. בשביל להבין למה, אני ממליץ לחזור לפרק 7 בנושא הקורונה, שמסביר על מבנה הרשת ולמה הוירוס שלנו צריך קצת מזל. סיבה נוספת היא שהמודלים צריכים נתונים, ונתונים נקבל מרגע שיש אירוע.

אז בואו נדבר על שלושת המודלים הבסיסיים להתפשטות מגפה והם:

SIS

SIR

נתחיל במודל הפשוט SI שהוא פשוט משתי סיבות:

הסיבה הראשונה היא השם שלו, Susceptible-Infected, כלומר Susceptible זה מישהו שעלול לחלות ו-infected זה מישהו שחולה. המודל מניח שכל אדם מדביק את כל האנשים הקשורים אליו.

לכן הנחה שכל בן אדם קשור ל-2 אנשים תאפשר קפיצה אקפוננציאלית, כי כבר דיברנו על כך בפרק 6 בנושא פרסום והשפעה שמקדם מעל 1, מייצר ויראליות, במקרה זה, תרתי משמע.

הסיבה השניה שהמודל פשוט היא שכולם מתים בסוף. המודל לא מניח התאוששות או החלמה.

אם אתם לא מבינים למה עדיין מדברים על המודל הזה, אז בלי ספויילרים, אני מציע שתחפשו בגוגל SI MODEL ותגלו בעצמכם למה אנשים עדיין מגגלים אותו.

בקיצור, שונא אותו, לא נחזור אליו – נמשיך הלאה.

המודל השני הוא מודל SIS (או:Susceptible-Infected-Susceptible).

המודל הזה מעט יותר סלחני מהמודל הקודם, ומה שהוא מניח זה שניתן להחלים, אבל הוא עושה את זה רק כדי לתת לנו קצת תקווה. לפי המודל הזה, אפשר להידבק שוב.

הנתון החשוב במודל הזה הוא מה שנקרא ה-R0 (או R-Naught) או reproduction , כלומר, קצב הגידול של המחלה. במילים אחרות, כמה כל אחד ידביק. הנתון הזה חשוב כמובן בשביל לאפשר פרדיקציות להתפשטות.

החישוב שלו אגב, אינו כל כך מורכב, והוא תוצאה של המשוואה הבאה:

כמות הקשרים של צומת ברשת (K) * יחידת זמן מוערכת להדבקה בין 2 גורמים (בטא)

חלקי זמן ההחלמה מה זה יחידת הזמן המוערכת להדבקה? כלומר, כמה מהר אנחנו מדביקים אחד את השני.

למשל, כדי להידבק באיידס, צריך ללכת לבר, לחפש בן זוג רנדומלי, לפתח כימיה ואז לפתח אפידמיה. כדי להידבק בקורונה צריך ללכת לבר.

איידס, אפרופו, זכה ל- R0 של 2-5 והשיא שייך כנראה לשפעת, עם R0 של 12-18.

הכוונה היא שמודל זה מניח שכל חולה שפעת ידביק לפחות שנים עשר אנשים, כי שפעת זה לא רק כיף, זה גם מדבק.

אז אם התוצאה של המשוואה היא מעל 1, זה אומר שהמגיפה תתפשט. מתחת ל-1 זה אומר שאפשר להישאר בבורסה. קצב ההחלמה גובר על קצב ההדבקה.

כדי להרגיע את עצמנו קצת, מישהו המציא את מודל SIR ( שזה Susceptible-Infected-Recovered) – הצד החיובי הוא שה-R בסוף המילה, כלומר ה-recovered, מציינת שניתן לא רק להחלים, אלא גם לפתח חסינות נגד המחלה ולכן אנשי ה-R לא נספרים במודל והם מקטינים את מספר הנדבקים הפוטנציאליים.

הצד השלילי הוא שיש עוד דרך לא להיספר במודל, וזה למות.

למרבה המזל, מודל SIR, בניגוד לאחיו הבכורים והמרושעים, יניח לרוב שבסוף כולם נרפאים/חסינים.

מכיוון שקשה להדביר מגפה שיש לה מקדם גבוה מ-2, עיקר המאמצים במודל זה הם לטובת שיטוח העקומה, כדי למנוע לחץ על מערכת הבריאות ולמשוך זמן לטובת חסינות עדר, כלומר, שעם הזמן מספיק אנשים ייתחסנו באופן טבעי והדבר יחליש את התפשטות המגפה. אז מה הבעיה? בואו נשתמש במודל SIR ונציל את העולם.

אז יש לנו כאן 2 בעיות.

אחת בתחום האפידימיולוגיה ואחת מעולם הרשת.

נתחיל עם זאת מעולם הרשת, כי לשם כך התכנסנו.

הבעיה היא עם אות אחת קטנה במשוואה והיא K.

ה-K מציין את מספר הקשרים המוערך של הצומת.

איך נעריך כמה קשרים יש לכל צומת?

מה, נעשה ממוצע? זו בעיה, כי כבר אמרנו שממוצע הקשרים לא יתאר אף אחד ברשת, ודיברנו על כך ארוכות בפרק 3. אנחנו עלולים לתת מספר נמוך מדי שיפספס את המרכזות או ה-super spreaders שלנו.

אז מבלי להיכנס ליותר מדי פירוט, ותודה לד"ר ברזל מאוניברסיטת בר אילן, ניתן לעשות שימוש לא ב-K עצמו , כלומר מספר הקשרים של הצומת, אלא בממוצע הקשרים שיש לשכנים של הצומת ברשת.

מספר הקשרים של השכנים של הצומת הוא אירוע מעניין ברשת. כי הוא מוביל למשפט מאד לא אינטואיטיבי, שנקרא "פרדוקס החברות". הפרדוקס, שמוכח מתמטית, הוא שיש לנו בממוצע פחות קשרים מלחברים שלנו, וזה בדרך כלל הפוך מאיך שאנחנו חושבים. למה זה קורה? אינטואיטיבית, יש מעט רכזות או מרכזי כובד ברשת. הרבה מאיתנו קשורים לרכזות או מרכזי כובד כאלה, כי זה מה שהופך אותם לרכזות. גם אם יש לנו מעט חברים, שלרובם פחות חברים מאיתנו, אבל מספיק שאחד מהחברים שלנו הוא רכזת, אז ממוצע של מס' הקשרים שלנו יהיה נמוך יותר משל חברינו כי הרכזת תקפיץ את הממוצע של החברים האפסים שלנו.

אז נסכם קלות:

דיברנו על המודלים SIS ו-SIR, כשההבדל בינהם הוא ש-SIS מניח שניתן להידבק שוב, ו-SIR מניח שניתן לפתח חסינות. שני המודלים עושים שימוש בנתונים האפידמיולוגיים של הוירוס, כלומר, שימוש במה שאנחנו יודעים על הוירוס, למשל, כמה הוא מדבק, וגם עושים שימוש בנתוני הרשת, כמו למשל מספר הקשרים. אמרנו שיש 2 בעיות: אחת רשתית, כלומר מה זה מספר קשרים ממוצע של צומת ברשת, אם אנחנו יודעים שהרשת היא powerlaw ולכן ממוצע הוא מונח בעייתי בה, ועל כך דיברנו כרגע.

הבעיה השניה היא מתחום האפידימיולוגיה, ולשם כך, בואו נראה את הדברים מהצד של הוירוס: אם לוירוס שלנו יש מזל, והוא מגיע לצומת מרכזי שבא במגע עם הרבה אנשים, אז יש לנו jackpot. המגפה תתרוצץ מהר מאד, במגבלות הקהילה ועל זה דיברנו בפרק הקודם בנושא קורונה, מוזמנים/ות לחזור אליו.

ועכשיו נוסיף לזה עוד נתון קטן: הדינאמיות של הרשת.

הטופולוגיה של הרשת היא סטאטית, אבל ההידבקות היא דינאמית. מה זה אומר?

זה לא מספיק שיש קשר בין צמתים ברשת. הקשר צריך להיות מתוזמן בצורה כזו שתאפשר הדבקה.

למשל, בפזיזותי, לקחתי את המשפחה שלי לחופשה במלון בחיפה וטיילנו בסטלה מאריס. מקום מאד יפה ומוכה תיירים. המזל הוא שסבתא שלי, חיפאית ותיקה שמגרדת את המאה מלמטה, היא אישה עירנית וכששמעה על מעללינו, עידכנה אותנו על מה שקורה בעולם. אז הבנו למה המלון נראה כמו פרסומת לרהיטים ולמה הבל בוי לא רצה להתחבק איתנו לצילום משותף.

חזרה לנושא הרשת הדינאמית,

אז היינו בסטלה מאריס וגם תיירת עם קורונה. אבל, כמו שאומר הנראטיב הציוני, היינו שם לפניה. אז ברשת סטאטית זה נראה שהדבקנו אחד את השני, אבל ברשת דינאמית, אין בינינו קשר.

כל זה טוב ויפה אבל קורונה, לעומת זאת, זוכה ליחסי הציבור שהיא זוכה לה בגלל הדבקה מהירה מאד.

וזה מביא אותנו לבעיה האפידימיולוגית: אנחנו פשוט לא יודעים מספיק על הקורונה.

אי הידיעה הזו בעצם מכדררת אותנו בין שני המודלים שדיברנו עליהם: ה-SIS וה-SIR.

אנחנו יודעים שאפשר להחלים מקורונה, ולכן את מודל SI שמניח וילונות לכולנו נשאיר לנגיף הבא.

השאלה היא האם ההחלמה כוללת גם חסינות מהידבקות, דבר שיכול לפתח חסינות עדר, או שאין חסינות וכמו שפעת, אפשר לחלות במחלה שוב. נכון להיום (10באפריל2020) נראה שקיימת כנראה חסינות שמתפתחת, כלומר, מי שנדבק והחלים כנראה שיש לו פחות סיכויים לחלות שוב.

אבל מה לגבי תקופת דגירה, כלומר תקופה שבה אנו מודבקים אבל עדיין לא מדבקים? לכן זה עוד משתנה שאנחנו צריכים למשוואות שלנו, וכאן נכנס מודל SEIR שזה Susceptible-Exposed-Infected-Recovered השוני הוא בהוספת ה-exposed , כלומר, החשופים שהם נדבקים אך אינם מדביקים.

לפיכך, אנחנו צריכים כל הזמן לעדכן את המודלים לפי הנתונים שמצטברים, בדיוק כמו שעושים במזג האוויר וכמו שאמרנו, התוצאות של המודלים האלה לא יהיו מושלמות אבל שימושיות, לטווח הקצר, לא כולל הפתעות.

אז זהו? הכאוס אומר לנו בעצם שאין גביע קדוש? האם אנחנו נידונים לתקרת זכוכית של פרדיקציה שלעולם לא נפרוץ? אז קודם כל, אני נגד להתייאש כל כך מהר.

חוצמזה, עצם הכרת חוקי הרשת, עליהם עברנו במהלך הפודקסט, מאפשרת לנו להבין טוב יותר את העבר וההווה וזה כבר הישג משמעותי. נזכיר שהתגליות לגבי חוקי הרשת הן תגליות חדשות יחסית בעולם ויש עוד לאן להתקדם.

בפרק אודות best practice במחקר הרשת נסקור לעומק כמה כיוונים שנראים עם פוטנציאל ויכולים אולי לסייע לנו למצוא חוקים חדשים לרשתות דינאמיות. ובלי ספויילירים, אבל אולי חדי העין ראו בתמונה למעלה של "משל הנהר" שלוש רמות של התייחסות: הנהר עצמו, הפרטים (מים/דגים) אבל יש גם זרמים בנהר. הזרמים בנהר הם הקהילות ואולי הן מפתח שיעזור לנו בנושא. חיפוש והבנה של חוקים אלו הוא משמעותי ביותר שכן אם העולם הוא רשת, אז הבנת החוקים שלה תאפשר לנו להבין טוב יותר את העולם.

ואולי, הפתרון יבוא בכלל ממקום אחר?

לתורת הכאוס יש יישומים בעולם האמיתי, ולא נפרוט את כולם, אבל ניתן כדוגמא למשל את המחקר

ערבוב כאוטי, או פינת יצירה בגן (Peteymills, Wikipedia)

בתחום הכאוס של הנוזלים, ספציפית, ערבוב כאוטי. אם ניקח דלי צבע לבן, ונשפוך לתוכו מעט צבע אדום, נוכל לחכות שבתהליך של דיפוזיה, הצבע האדום יתפזר בדלי ונקבל ורוד. אבל זה איטי ומשעמם כמו לראות צבע מתייבש.

נוכל גם לערבב בתנועה אחידה את הדלי ולקבל פיזור מהיר יותר.

אבל אם נבצע ערבוב כאוטי, הצבע ייתפזר מהר עוד יותר.

אז אולי אפשר לעשות השלכה מדיסיפלינת הכאוס לעולם הרשת? למשל להעברת מסרים ברשת.

אם נעלה מסר לרשת ונחכה שהוא יגיע לכולה, כנראה שנחכה הרבה זמן.

אם נעביר את המסר באופן רנדומלי, הסיכויים להצלחה הם גם לא גבוהים ואני מזכיר שכאוס זה לא רנדומיות. בניגוד לרנדומליות, לכאוס יש חוקים.

אבל אם נעביר את המסר תוך ניצול המושכים המוזרים של הרשת, למשל מרכזי הכובד שבה, הסיכויים שלנו להעביר את המסר יהיו גבוהים יותר ומהירים יותר.

אולי חבירה הדוקה יותר של מומחי כאוס ומומחי רשת תביא בשורה חדשה. אבל כבר אמרנו שהמילה כאוס פינתה את מקומה במחקר למושג מערכת מורכבת, וזה קצת חבל, כי בינינו, מי רוצה לקרוא על משהו מורכב?

אני רוצה לנצל את ההזדמנות ולהודות לאנשים שעושים לילות כימים בניתוח הנתונים של הקורונה ומפרסמים ומשפיעים על קבלת ההחלטות, ובמיוחד לפרופסור רמי פוגץ', ד"ר עמית רכבי, ד"ר ברוך ברזל, פרופסור יורם לוזון, דרור גולדין, איתמר מושקין ולעומר קורן מחברת webiks שמעבר ללהציל את המדינה, חלקם גם פעלו לסייע לפרק הזה, וניסו לתקן את הטעויות שעשיתי, אבל ללא הצלחה. האחריות כולה שלי.

רוצים.ות להרחיב את קהילת מדע הרשתות בישראל? ככל שתדרגו יותר, כך הפודקאסט יהיה חשוף לאנשים רבים יותר.

דרגו את הפודקאסט בספוטיפיי או באפל-פודקאסטס ו/או כיתבו ביקורת. ניתן לדרג גם בפודקאסט-אדיקט (בטאב של ה-reviews). מותר ומומלץ להעלות פוסט ולתייג את נטפריקס בפייסבוק/טוויטר/אינסטגרם או לינקדאין ושוב, פוסטים יצירתיים במיוחד יושמעו בפרקים הבאים.

ואם עוד לא עשיתם.ן לייק בדף של נטפריקס בפייסבוק, זה הזמן. אתרים עם יותר לייקים, מקבלים יותר חשיפהלפניות/הערות/הארות/הצעות ועוד: שלחו מייל!

ולא לשכוח לעשות Subscribe לפודקאסט באפליקציה החביבה עליכם.ן. מוערך מאד!

נתראה בפרק הבא של נטפריקס (:

#Network_Science #SNA #Social_Network Analysis #Graph_Theory #Data_Science #Social_Physics #Computer_Science #Statistics #Mathematics #Social_Science #Physics #Facebook #Podcast #covid19 #pandemic

#chaos #complex_system #connectome #machine_learning

[1] למשל ב (Sekara, Stopczynski, & Lehmann, 2016) מצביעים על "מושכים" (הנקראים "cores") ברשת מפגשים בין אנשים שמאפשרים מעקב טוב יותר אחרי הרשת. [2] דוגמא לקושי להפעיל לוגיקה דומה על גילוי שינויים ב (Fish & Caceres, 2017).

הרחבות לפרק 9: מרמיטה, רשתות דינאמיות והגביע הקדוש של עולם הנתונים (וקצת קורונה)

פוסטים אחרונים

2 comentarios