הרחבות לפרק 2: באמת עולם קטן? האמת על עולם הרשת

(ר' קישורים בטקסט)

מה מתרחש (: אני אסף שפירא וזה נטפריקס – הפודקאסט העברי הראשון למדע הרשתות.

בפרק הזה נלמד על חוקי הרשת דרך ההיסטוריה המרתקת של מחקרי הרשת. נראה איפה הם צדקו, איפה הם טעו ואולי אפילו הטעו ומה המשמעויות של התגליות שלהם, שלא פעם הקדימו את זמנם.

סטנלי מילגרם ידוע בזכות ניסוייו פורצי הדרך בתחום הפסיכולוגיה החברתית בשנות ה60. המחקר הידוע ביותר שלו, וכנראה אחד הניסויים המפורסמים ביותר בעולם, היה הניסוי הפסיכולוגי בו הראה מילגרם כי בהינתן התנאים המתאימים, אנשים נורמטיביים לחלוטין יכולים לציית לסמכות בצורה עיוורת. כך ניסה מילגרם לענות על השאלה- מה הפך את האומה הגרמנית הנורמטיבית למשתפת הפעולה הגדולה ביותר עם הנאצים.

מילגרם עשה עוד ניסויים שכנראה כל אחד מהם ראוי לפודקאסט, והניסוי שאנו נתמקד בו הוא ניסוי מפורסם ומטלטל לא פחות מקודמיו שהשאיר את חותמו על מחקר הרשת. אני מניח שרבים מכם שמעו עליו. אבל הפעם נצלול למאחורי הקלעים של הניסוי ונחשוף כמה תגליות מפתיעות ופחות מוכרות בו.

בלי יותר מדי ספויילרים, נגלה שמילגרם לא סיפר לנו את כל הסיפור ודווקא איך אותם ממצאים שניסה להדחיק, הם אלה שעומדים מאחורי הגילוי הגדול ביותר בעולם הרשת, גילוי משמעותי יותר אף ממה שמילגרם התכוון אליו.

בצבא היינו קוראים לזה פיצוחים, על שם תוכנית טלויזיה פופולרית בשנות ה80. למעשה היה אז רק ערוץ 1 אז כל תוכנית היתה פופולרית...

פיצוחים בצבא: חיילים מחפשים את המכנה המשותף כדי לייצר אמון (צילום: אנטול שפירא)

כשנפגשנו עם חייל שלא הכרנו מיחידה אחרת, היינו מחפשים מכר משותף ע"י כך שהיינו יושבים וזורקים שמות לאוויר עד שהיינו נתקלים בשם ששנינו מכירים. התחושה האינטואיטיבית, שבהינתן מספיק זמן נוכל למצוא כזה, היא שהדריכה את מילגרם בעריכת הניסוי.

סטנלי מילגרם ושותפו למחקר ג'פרי טראברס יצאו לדרך לבחון את מבנה הרשת האנושית בניסוי שקראו לו "בעיית העולם הקטן".

שני החוקרים יזמו מכתבי שרשרת בין יעדים רנדומליים ובדקו כמה תחנות יעבור כל מכתב. המטרה היתה לבחון את אורך השרשראות וכך לספק תשובה לשאלה: האם עולמנו הוא עולם קטן ואם כן, מה הקוטר שלו?

מסקנות הניסוי כבר שייכות לתרבות הפופולרית. אני מניח שרובנו מכירים את המושג "6 צעדים: או 6 degrees of separation, שמקורן באותו ניסוי. היישום הפופולרי של תפיסה זו נמצא בבסיס המשחק 7 צעדים מקווין בייקון ובו המשתתפים זורקים שם של שחקן קולנוע ואמורים למצוא קשר בינו לבין השחקן קווין בייקון שלא יעלה על 7 צעדים. קשר בהקשר זה הוא משחק משותף באותו סרט. במקומות מסויימים שחקנים דורגו לפי מספר ה"קווין בייקון" שלהם. שחקנים ששיחקו עם בייקון באותו סרט קיבלו ציון 1. שחקנים ששיחקו עם אותם שחקנים קיבלו ציון 2 וכן הלאה..

ההנחה הרווחת היא שכל אחד מאיתנו נמצא מרחק 6 צעדים ברשת ההיכרויות האנושית מכל אדם אחר ושעולמנו הוא אכן עולם קטן.

באמת?

בואו נצלול לפרטי הניסוי. מילגרם מאונ' ניו יורק וטראברס מאוניברסיטת הארוורד בחרו באופן רנדומלי 2 קבוצות של אנשים מהם תתחיל השרשרת: קבוצה אחת מבוסטון וקבוצה אחת מנברסקה. בוסטון נבחרה מכיוון שהיעד של שרשראות המכתבים היה איש פיננסים בוסטונאי שנבחר באופן רנדומלי והרצון היה להשוות את אורך השרשרת בין גורמים בתוך העיר לבין גורמים מרוחקים אותם ייצגה קבוצת נברסקה. נברסקה נבחרה כיוון שהיתה "חור" לדברי מילגרם.

מכתב השרשרת שנשלח ל-2 הקבוצות כלל הנחיה: ניתן לשלוח את המכתב רק לאדם שהשולח מכיר באופן אישי (ברמת שם פרטי או שנפגש עימו) ושלדעתו של השולח יש לנמען סיכוי לקדם את המכתב לכיוון אותו יעד שנבחר.

כל שליחה של המכתב לתחנה בשרשרת גובתה במכתב שנשלח לאוניברסיטת הארוורד למעקב.

גרף מהמאמר המקורי של מילגרם ובו אורך השרשראות ומכאן מושג 6-הצעדים

התוצאות שפורסמו היו מרעישות: כמעט 30% מהמכתבים הגיעו ליעדם כשממוצע אורך השרשראות היה 5.2 צעדים. אפילו קצר יותר מכפי שמוכר בתרבות הפופולרית שעוסקת ב-6 צעדים.

אמנם לא מדובר ברשת חובקת עולם אלא ברשת פנים-אמריקאית בלבד אבל זה עדיין נשמע מספר מרשים. הרבה יותר קטן ממה ששיערו אז.

אבל מה עוד התגלה בניסוי ולא כ"כ מוכר?

היעד היה איש פיננסים ולכן חלק מהשולחים ניסו לייצר שרשרת על בסיס היכרות מקצועית, כלומר, לקדם את המכתב דרך אנשי פיננסים שהם מכירים . זה אולי קצת מפתיע, אבל שרשראות אלו לא היו קצרות באופן משמעותי מהממוצע.

כנראה פחות מפתיע הוא שאורך השרשראות שיצאו מבוסטון היה קצר משמעותית מאורך השרשראות מנברסקה, שכן היעד היה בבוסטון, כך שהקירבה גיאוגרפית ייצרה גם קירבה ברשת.

אבל נתון אחר ומעניין היה שברשת התגלו תחנות מרכזיות. מתוך מאות המשתתפים בניסוי, היו שלושה אנשים ברשת שכ-48% מכלל השרשראות עברו דרכם. אלה היו אנשים שמקורבים ליעד, וכמחצית מהתעבורה עברה דרכם. ברשת שחקר מילגרם היה מספר קטן של צמתים שתפקידם היה גדול משמעותית משל שאר הצמתים ברשת, שלקחו חלק רק ב2 שרשראות ומטה.

מדוע גילויים אלו משמעותיים? לשם כך נדרש להכיר את תולדות מחקר הרשת.

מחקר הרשת במאה שעברה היה בעיקר אנקדוטלי ואופיו היה דומה למחקר של מילגרם: אוסף של גילויים מענינים שלא התגבשו לתיאוריה רחבה ומשמעותית.

אחת הסיבות לכך הוא היעדר דאטא. בעידן טרום-אינטרנט, היכולת של חוקר לאסוף נתונים על רשתות היה מוגבל מאד ולשם מחקר היה נאלץ לייצר בעצמו את המידע או לאוספו ידנית. הדבר הקשה על מחקר השוואתי ו/או הוצאת מסקנות גלובליות ובוודאי לא איפשר תובנות מבוססות ביג דאטה. למעשה, קשה היה לדמיין מדוע מחקר מסוג זה אפילו נדרש.

הניסוי של מילגרם, בהקשר זה, היה יוצא דופן בכך שייצר רשת שחרגה בגודלה הן מבחינת כמות משתתפים אך גם ברוחב יריעתה, במקרה הזה, הגיאוגרפית.

דוגמא לסוג המחקרים שהתנהלו במאה שעברה ניתן למצוא במחקרים של ג'ייקוב מורנו בשנות ה-30.

סוציוגרמה של מורנו של כיתה א. תשומת לב לכיוון הקשתות

כמו מילגרם, גם מורנו הגיע מעולם הפסיכולוגיה החברתית והיה פסיכיאטר ומחנך שעסק במיפוי רשתי של תלמידי כיתה בברוקלין מהגן ועד כיתה ח (קשר בהקשר זה היה: ליד מי רוצה התלמיד לשבת בכיתה). הרשתות שצייר נקראו סוציוגרמות והוא היה בין הראשונים לעשות בהן שימוש. היתרון של הסוציוגרמה היה בויזואליזציה הנוחה לעין של מפת הקשרים.

אותה ויזואליזציה חשפה שתי תופעות מענינות:

התופעה הראשונה היא תופעת הכוכבים: לא לכל אחד ברשת היה אותו תפקיד. המספרים נעו בין 2-4 תלמידים שרבים רצו להיות בקשר עימם לעומת רוב התלמידים שלהם היה קשר בודד או אף קשר. בסוציוגרמה של מורנו של כיתה א' למשל, מעל למחצית מהתלמידים היה קשר בודד או אף קשר.

תופעה נוספת שחשפה הויזואליזציה היא התגבשות של קהילות ברשת, כלומר, איזורים יותר צפופים ברשת. שיאה של התופעה נראה בסוציוגרמות של כיתות ג-ד. הסוציוגרמה של כיתות אלו חשפה שהצמתים ברשת התחלקו ל-2 קהילות מובהקות עם קשר בודד בינהן. מורנו שם לב שהמאפיין של הקהילות היה מגדרי.

למרות שמחקריו של מורנו עסקו ברשתות קטנות יותר משל מילגרם, ניתן לראות את אותן תופעות חוזרות בשני המחקרים, ובעוד מחקרים רבים נוספים שיבואו אחריהם.

התופעה, או התגלית הראשונה היא שברשת ישנם איזורים שבהם השחקנים או הצמתים צפופים או מקושרים יותר זה לזה. במקרה של מורנו הסיבה היתה מגדרית ובמקרה של מילגרם – גיאוגרפית.

מדובר בתגלית משמעותית בעולם הרשת: הצמתים ברשת אינם מפוזרים אקראית אלא מורכבים מקהילות אך לכך נקדיש פרק במיוחד.

התגלית השניה המשותפת לשני המחקרים היא שתפקידי השחקנים ברשת אינם אקראיים אף הם. יש צמתים מרכזיות עם הרבה קשרים אבל לרוב הצמתים יש קשר בודד או קשרים בודדים בלבד.

כפי שאנו יודעים מהמבוא, עולם הרשת משותף להרבה תחומי מחקר אך לצערנו אינטרדיסיפלינאריות לא היתה תופעה נפוצה ברוב המאה ה20. מעטים היו הממשקים בין מדעי החברה של סוציולוגיה/פסיכולוגיה ושל המדעים המדוייקים מתמטיקה/פיזיקה. נוסיף לכך שהנגישות לדאטא היתה מועטה ולפיכך קל להבין שמעט מאד היה ידוע על איך רשתות בנויות ומתנהלות.

על רקע נתק זה בין הדיסיפלינות, ניסו שני מתמטיקאים בשנות ה-50 לבנות מודל שיתאר את מבנה הרשת.

ארדוש ורני.

על ארדוש חייבים להגיד כמה מילים כי מלבד היותו חוקר רשת נלהב הוא היה תופעה רשתית בפני עצמה. ארדוש, הונגרי במוצאו, אהב מאד שיתופי פעולה מחקריים, וחוקרים רבים מצאו עצמם קשורים אקדמית לארדוש, כשקשר בהקשר זה הוא כתיבת מאמר משותף.

ארדוש ורשת שיתופי הפעולה האקדמאית שלו (שורטט ב-1970 ע"י רונלד גראהם)

בדומה לקווין בייקון, גם ארדוש זכה למשחק משלו בעולם האקדמיה ובו חוקרים קיבלו ציונים לפי מספר הארדוש שלהם. כלומר, כמה צעדים בינם לבין מחקר עם ארדוש. מספר ארדוש נמוך הוא אות כבוד לכל חוקר ולמתמטיקאים במיוחד. בהערת אגב על הערת אגב, ארדוש גם לקח חלק במאמציו המתמטיים של סטפן מנדל, שבזכות האלגוריתם שבנה, זכה בלוטו 14 פעמים.

חזרה למודל: ההנחה בבסיס המודל של ארדוש ורני היתה שהקשרים ברשת נוצרים באופן אקראי.

בקשרים אקראיים הכוונה היא שלכל צומת ברשת סיכוי שווה להיות מקושר לכל צומת אחר. הנחה זו גררה הנחה נוספת, שהקשרים ברשת ייתפלגו בצורה נורמלית. מהי אותה התפלגות? התפלגות נורמלית נקראת גם התפלגות פעמון על סמך צורתה, שכן יש לה שוליים צרים והיא גבוהה במרכזה. דוגמא להתפלגות כזו היא גובהם של אנשים בוגרים.

כך למשל, לפי ויקיפדיה, ב-2010 גובהם הממוצע של בני 20 בישראל היה כ 1.77. ההנחה היא שבקבוצת גיל זו, ישנם מעט גבוהים יותר ומעט נמוכים יותר אך הרוב שיימדד צפוי להיות באיזור גובה זה. ללא הנחה זו לא ניתן היה למשל לבנות כסאות שיתאימו לרוב האנשים.

ההנחה המובלעת במודל של ארדוש ורני היא שגם הרשת מתפלגת כך: יהיו מעט אנשים שיהיו להם הרבה קשרים ומעט אנשים שיהיו להם מעט קשרים (שולי הפעמון) אך לרוב יהיה באיזור המספר הממוצע של הקשרים. האמת שזו גם היתה ההנחה של מילגרם כשיצא לניסוי. הוא הניח שאורך השרשראות יתפלג נורמלית: יהיו מעט קצרות, מעט ארוכות אך רובן יהיה ממוצע.

הנחה מתמטית זו החזיקה מעמד לאורך המאה ה-20 עד תחילת המאה ה21. תחילתן של רשתות הענק.

פריצת האינטרנט ורשתות הענק (ה- World Wide Web, למשל) הביאו להתפתחות משמעותית במחקר הרשתות ולהבנה כי עולם הרשתות אינו אקראי כפי שהיה נהוג לחשוב .

אם את המודל הראשון הביא ארדוש, הרי שבמקרה או שלא במקרה, היה זה 40 שנה אח"כ שהונגרי אחר, אלברט לזלו ברבאשי, שהניח מודל חדש. מודל זה מבוסס על מחקרו פורץ הדרך שמשמש עד היום כבסיס להבנת רשתות.

אז מה היה מחקרו של ברבאשי?

ברבאשי ניסה להבין את מבנה רשת האינטרנט ע"י מחקר הקשרים בין האתרים השונים ברשת.

למה הכוונה? הרעיון מאחורי הגלישה באינטרנט הוא היכולת לעבור מאתר לאתר דרך לינקים/קישורים שהאתר מציע לגולשים. לינקים אלו היו הקשרים אחריהם התחקה ברבאשי.

לשם כך, ברבאשי השתמש ב-crawler /זחלנים ברשת שנדדו מאתר לאתר דרך אותם לינקים ומיפו את הרשת.

אגב, ברבאשי לא היה היחיד שעשה זאת. באותו זמן חברה בשם גוגל עשתה דבר דומה בהבדל קטן: גוגל גם אינדקסה את התוכן של האתרים. כמו שברבאשי עצמו יגיד ברבות הימים, הבדל קטן זה יביא לכך שהתמורה שקיבל על מאמציו תהיה גם היא קטנה במעט מזו של גוגל.

אם זאת, התרומה שלו למחקר הרשתות היתה אדירה וכמו דברים רבים במחקר הרשת - לא אינטואיטיבית.

כמה לא אינטואיטיבית נמחיש דרך הדוגמא הבאה:

בואו ננסה לדמיין כיצד תיראה שיחה בין 100 אנשים? עצם הרעיון נשמע מופרך. כל מי שחווה קבוצת וואטסאפ של הגן יוכל לספר שיהיה בלגן.

עכשיו תכפילו זאת במאות מיליונים. כאוס מוחלט. נשמע מייאש? אבל זוהי האינטרנט.

אך כשברבאשי התעמק בנתונים הוא גילה שהאינטרנט אינה מבולגנת או אקראית כמו שאולי דימיינו. לפי ארדוש ורני, היינו צריכים להניח שיהיו כמה אתרים מקושרים מאד באינטרנט, כמה אתרים זניחים ולא מקושרים ורוב האתרים מקושרים בצורה ממוצעת. זו התוצאה של אקראיות.

ברבאשי גילה, שהקשרים ברשת מתפלגים אחרת. התפלגות הנקראת Power Law.

הרעיון מאחורי התפלגות Power Law הוא שיש מעט שמחזיק מרובה ומרובה שמחזיק מעט.

בתרבות הפופולרית, רעיון דומה מוכר כחוק ה-80/20 או פארטו הטוען למשל שבחברה 80% מהעבודה נעשית ע"י 20% מהעובדים. הבעיה עם חוק פארטו זה שהוא פעמים רבות נשען על אינטואיציה ולכן 80% מהאנשים חושבים שהוא לא אמין ו-20% לא חושבים עליו כלל כי הם עסוקים בלעשות את העבודה של ה-80% האחרים. אם פארטו עוסק ב-80/20 אזי Power Law הוא קיצוני יותר מחלק את העולם ל-1 ו-99 בקירוב.

אמנם נשמע קיצוני, אבל זו המציאות.

אחת הדוגמאות המוכרות ביותר של יישום ה-Power Law הן בתחום הכלכלה:

לדעתי לא עובר שבוע בעיתון הכלכלי דה-מארקר ללא איזושהי כתבה שמציפה את הפער החברתי העצום, כל פעם במדינה אחרת, עם נתונים שמצביעים שאחוז קטן מהחברה מחזיק ברוב העושר. הדוגמא הבולטת בימינו היא חברות הענק (גוגל, אפל, אמזון וכד') שמחזיקות בנתח שוק אדיר וזאת למרות שמדובר בפחות מאחוז מכמות החברות בתחום בעולם.

בשביל דוגמא ציורית יותר שתעזור לנו לדמיין גרף Power Law נסתכל על עולם החי: נעמיד את כל בעלי החיים בכדור הארץ על גרף לאורך ציר הX כשציר ה-Y יהיה הגודל, ונסדר את החיות לפי גודלן. כל חיה תהיה עמודה בגרף.

אגב, הידעתם שהחיה הגדולה ביותר היא הלוויתן הכחול ובעולם ישנם כ10 אלפים כאלה?

מצוין, אז נציב את עשרת אלפים הלוויתנים בתחילת הגרף בתור עשרת אלפים העמודות הראשונות שלנו ואחריהם נציב את כל הפילים האפריקאיים ונמשיך לכל שאר החיות עבור דרך חתולים, דגים, ג'וקים, זבובים ועד החיידקים.

בהנחה שכל החיות יעמדו במקום, נגלה שקיבלנו גרף שבו יש חלקיק אחוז קטן מאד של עמודות גבוהות מאד (אלו הלוויתנים והפילים) אך רוב העמודות בו יהיו זעירות (נגיד היתושים והחיידקים) ועמודות אלה נקראות הזנב הארוך של ה-Power Law.

למה זה נקרא זנב ארוך? אם כבר בחיות עסקינן אז נשים לב שגרף ה-Power Law דומה במקצת לדינוזאור ולא לסתם דינוזאור, לברכיוזאורוס. ממבט צד. כשהוא עומד זקוף.

העמודות הגדולות יהוו את ראשו של הדינוזאור וכל שאר המינים הזעירים יהוו את זנבו הארוך. מאד.

בכדי להמחיש את ההבדל בין Power Law להתפלגות נורמלית, דמיינו שהחיות היו מתפלגות בצורת פעמון. המשמעות היתה שכמות החיידקים והיתושים בעולם תהיה פחות או יותר דומה לכמות הלוויתנים והפילים שכן שולי הפעמון אמורים להיות דומים.

אז איך ה-Power Law ייראה ברשת? אם נשים על ציר ה- X את כלל הצמתים ברשת ונמיינם לפי כמות

הקשרים שלהם בציר Y, מהגדול ביותר לקטן ביותר, נקבל זנב ארוך. נראה שישנם מעט צמתים גדולים ברשת שמחזיקים בהרבה קשרים. צמתים אלו מכונים: מרכזות או hubs, ואילו לרוב הצמתים ברשת ישנם קשרים בודדים, וצמתים אלו מכונים "הזנב הארוך" של ההתפלגות

ברשת האינטרנט, למשל, יהיו אלו אתרים כמו Google. בניגוד למעט אתרי הענק האלו, לרוב האתרים באינטרנט נגלה שיש רק קישור אחד-שניים או אין קישור בכלל (ורובם נמצאים בחלק של האינטרנט הנקרא deep web או הרשת העמוקה, שלפי הערכות מכיל כ90% מהאינטרנט).

אבל לא רק הקשרים ברשת מתפלגים Power Law אלא גם כמעט כל מדד אחר ברשת. ובדאטה הוא מופיע פעם אחרי פעם כמו שמראים המאמרים הרבים שנכתבו מאז ברבאשי, המסתמכים על בדיקות אמפיריות של רשתות אמיתיות. כשאני אומר רשתות אמיתיות הכוונה היא לדאטא של רשתות כפי שהן במציאות או בטבע ולא כתוצאה ממודלים מתמטיים תיאורטיים. כפי שניתן להבין מהדוגמאות עד כה, ההתפלגות אינה מאפיינת רשתות בלבד אך היא תופעה כה מובהקת ברשת עד כדי שנזכה אותה בתואר "חוק הרשת מס' 1". לפיכך גם נקדיש ל-Power Law פרק נפרד בו נדון גם מדוע יש Power Law ואיך זה עוזר לנו.

אז כל זה מזכיר לנו משהו? כנראה שאת הכוכבים בכיתה שגילה מורנו ואת אותן תחנות מרכזיות שמילגרם גילה ברשת.

אם נניח שהקשרים בכיתה מתפלגים נורמלית, היינו מצפים שמספר המקובלים יהיה שווה פחות או יותר למספר הלא מקובלים – כלומר – שוויון סימטרי בין קצוות התפלגות הפעמון. אך לא זה המצב.

מספר הלא מקובלים גדול בין פי 3 לפי 6 ויותר. יש להניח שאם היינו דוגמים את כלל בתי הספר היינו מקבלים זנב ארוך עוד יותר.

ואם בחינוך עסקינן, נחזור רגע לדוגמא של קבוצת הוואטסאפ של הגן שנתנו קודם. זאת שדימיינו כמבולגנת. בדיקה לעומק תגלה שגם אם רשת זו היא אולי חופרת לפעמים אבל היא אינה אקראית ועונה על חוק מס' 1, ה-powerlaw.

שימו לב שבקבוצת הגן יהיו מעט מאד אנשים שיכתבו בה הרבה, כלומר, בראש הדינוזאור יהיו מי שמשרד החינוך מינה לגננת ומי שרשות העתיקות מינתה לחפרן ראשי, אבל הרוב יהיו הזנב הארוך שסמלם יהיה אימוג'י של אגודל זקור

או שתיקה רועמת.

אז איפה הזנב הארוך בא לידי ביטוי בניסוי של מילגרם?

הדוגמא הבולטת ליישום החוק היא שמתוך מאות המשתתפים, כ-3 היו תחנות מרכזיות ברשת שאחראיות על 50% מהשרשראות. ה-3 הנ"ל הם אחוז אחד מתוך הדאטה דבר שתואם Power Law.

אבל אם הרשת האנושית מתפלגת Power Law, הרי שהיינו אמורים לחזות שבניסוי יהיו מעט מאד שרשראות מוצלחות ורוב מכריע של שרשראות כושלות שכן לפי ה-powerlaw אמורים להיות מעט אנשים עם הרבה קשרים ורובם המכריע של האנשים אוחזים בקשרים בודדים בלבד וקשרים בודדים אלו אמורים "לתקוע" את השרשראות ולהכשילן.

אזכיר שבניסוי של מילגרם, 64 מתוך 217 השרשראות שנשלחו הגיעו ליעדם ,שזה כמעט 30%.

30% זה מספר די גבוה. לא נשמע Power Law בכלל. היינו מצפים לאחוז בודד או משהו דומה. אז האם מילגרם גבר על ה-Power Law?

למעשה מה שעשה מילגרם הוא להקטין את הדגימה.

ככל שנקטין את הדגימה של הדאטה, יש לנו סיכוי גדול יותר לקבל הטייה בצורה של התפלגות נורמלית ונפרט על זה בפרק בנושא ה-Power Law. כך, במקום לעשות שימוש בנתון המקורי של כמות המשתתפים בניסוי (296) הוא בחר להתייחס לחצי הכוס המלאה, דהיינו, רק לכמות המשתתפים ששלחו מכתב (או המשתתפים הפעילים, כלומר, 217). מילגרם הקטין את הספירה בכ-80 משתתפים. כך הוקטנה הדגימה של הרשת בכמעט שליש, וקיצצה את הזנב הארוך האופייני ל-Power Law.

בפועל, אם נחשב גם את אלו שבחרו לא לשלוח, המספר של השרשראות המוצלחות יורד מ-30% לכ-20%.

ובכל זאת, מספר זה עדיין נשמע גבוה. בהתפלגות Power Law היינו מצפים שהמספר של המכתבים שהגיעו ליעדם יהיה נמוך משמעותית: סביב האחוזים הבודדים אם בכלל.

אבל רגע, אולי מילגרם צדק? מדוע בכלל להתחשב במשתתפים שבחרו לא להשתתף? הרי לכאורה הם מהווים רק "רעש" בדאטא של הניסוי ואין טעם לספור אותם. לא נלמד מהם כלום. זו לפחות היתה ההבנה של מילגרם.

אז Power Law או לא Power Law?

כמובן ש-Power Law. אל תתפתו לאנשים שיציעו לכם התפלגויות אחרות.

אז איך זה יכול להיות?

התשובה באה מכיוון מפתיע. ממילגרם-עצמו. אך לא מניסוי זה. אלא מניסוי קודם יותר.

הניסוי הגנוז של קנזס.

בשנת 2000, ג'ודית' קליינפלד, חוקרת פסיכולוגיה חברתית מארה"ב, ניסתה לעניין את תלמידיה לבצע ניסויים ואיזה ניסוי יותר מצית את הדימיון מניסוי "העולם הקטן" של מילגרם?

הפנטזיה שלה, כפי שתיארה אותה, היתה לא רק לשחזר את הניסוי של מילגרם אלא גם לשחזר את המשתתפים המקוריים דרך צאצאיהם ולכן לא התעצלה והלכה לארכיון באוניברסיטת ייל, שם אוחסנו מחקריו של מילגרם, בכדי לגלות מה שניתן על הניסוי המקורי.

בעודה מפשפשת בארגזים היא גילתה ניסוי קודם שערך מילגרם שמעולם לא פורסם. בניסוי זה, נשלחו כ-60 מכתבים מקבוצת אנשים שנבחרה בוויצ'יטה קנזאס (שוב, עיירה שהוגדרה כ"חור" ע"י מילגרם) ליעד: סטודנטית בקיימברידג'.

האיזכור היחיד שמצאה לניסוי הגנוז, מחוץ לארגזי הארכיון, היה בראיון עם מילגרם בו סיפר שבניסוי שערך בעבר, אחד מהמכתבים הגיע ליעדו בזמן שיא של 4 ימים. מה שמילגרם לא ציין הוא שמלבד מכתב זה, הגיעו ליעד רק 2 מכתבים נוספים. תוצאה של 7.5% בלבד.

תופעה שכן השתחזרה, היא תופעת האנשים המקושרים ברשת. מתוך 3 המכתבים שהגיעו ליעדם, שניים מהם עברו דרך אותו אדם.

זה לא יפתיע את אנשי ה-Power Law שבינינו:

בניסוי קנזס ניתן לראות בבירור גרף ובו עמודה גבוהה אחת של שרשרת מוצלחת מאד, 2 עמודות קטנות יותר המייצגות שרשראות עם הצלחה בינונית ועשרות עמודות קטנות מאד של שרשראות ללא הצלחה או אף ללא שליחה כלל.

כמו כן, ניתן לראות שגם ברשת זו ישנה תחנה מרכזית אחת ושאר התחנות העבירו קשר בודד או אף קשר. אז בהשוואה לניסוי המפורסם של מילגרם, ניסוי קנזס לא היה מוצלח. אבל אולי היה זה רק כשלון בודד שלא מעיד על התופעה?

למרבה המזל, קליינפלד לא היתה היחידה שניסתה לשחזר את הניסוי של מילגרם. רבים ניסו לשחזר את הניסוי של מילגרם אז יש לנו למה להשוות. אבל מה הסיבה לשיחזורים הרבים?

כנראה כי יש משהו שקוסם לנו בטענה שהעולם הוא קטן. כמו במשחק הפיצוחים בצבא, היכרות משותפת בין שני חיילים מאפשרת לבסס אמון. היכרות משותפת גורמת לנו להרגיש שאנו באותו צד. עולם קטן אומר בעצם שכולנו חלק מאותה משפחה.

אך למרבה האכזבה, תופעת הכשלון בניסויי השרשרת הוא סדרתי. גורל השיחזורים של הניסוי שנעשו במרוצת השנים, היה אפילו מר יותר מהניסוי הגנוז של קנזאס. אחוז ההשלמה היה כל כך נמוך עד שמרבית החוקרים נטו לומר שלא ניתן להסיק ממנו מסקנות כלל.

ואז הגיע האינטרנט. בעידן בו כל אחד יכול לשלוח הודעה לכל אחד, האם בכלל נדרשת הוכחה או ניסוי? האם האינטרנט לא בפני עצמו הוכחה שעולמנו הוא עולם קטן?

ניסוי שנערך ע"י עיתונאי בשם וילסון בשנת 2000 כלל שליחת מיילים מ-6 אנשים מרחבי ארה"ב, מהונולולו ועד אורגון שיעדם בחורה בשם טארה שהיתה אשת מחשבים באורגון.

בניגוד לניסויים קודמים, וילסון אישר למשתתפים לשלוח מיילים בכל תפוצה או כמות שיימצאו לנכון. המשתתפים ניצלו זאת ואלפי מיילים נשלחו ברשת, כשעותקים מהם מגיעים גם לוילסון, כמנהל הניסוי.

אבל אף מייל לא הגיע לטארה.

ניסוי אקדמאי-יותר מ-2003, שאף הוא היה כרוך בשליחת מיילים, נערך בהובלת דאנקן וואטס, שאף הוציא ספר הנקרא "6 צעדים".

מתוך כ-100 אלף איש שנרשמו לניסוי, רק 25% החלו שרשרת מיילים. מתוכן רק 384 הגיעו ליעדם.

זה 1.5% בלבד.

נוסיף לכך שהתוצאות שפירסם וואטס התחשבו רק בשרשראות שכבר החלו, כלומר, רק המשתתפים הפעילים, אחרת היינו מקבלים מספר נמוך בהרבה.

איך אפשר להסביר זאת?

קליינפלד, 30 שנה פרופסורית, וממאוכזבי מילגרם, בחרה בדרכה הציורית, להשתמש באנלוגיה הלקוחה מעולם ארוחת הבוקר: דייסת שיבולת שועל.

טענתה היא שבניגוד לדימוי של דייסה אחידה ומקושרת כפי שמילגרם ראה את הרשת או את העולם, היא טענה שהעולם הוא למעשה אוסף של גושים בדייסה לא מעורבבת. הגושים מקושרים בתוך עצמם אך הקשרים בינם לבין גושים אחרים חלשים עד לא קיימים.

מכיוון שמאז הטירונות ניסיתי לשמור מרחק מדייסות שיבולת שועל הרי שגם כאן נתנתק מאנלוגיה זו ולו מסיבה אחת: היא לא נכונה. וברשותכם, נעבור למינוח מקצועי יותר מאשר "גושים" ברשת.

המונח נקרא רכיבי קשירות או connected component.

בכדי להדגים רכיב קשירות מהו, נדמיין רשת המורכבת משני צמתים כחולים קשורים זה לזה, ולצידם , אך לא קשורים אליהם, שני צמתים אדומים הקשורים זה לזה.

בגרף זה שני רכיבי קשירות: הראשון 1-5 והשני 7-10

ברשת זו קיימים שני רכיבי קשירות: אדום וכחול.

רכיבי קשירות הם ה"איים" ברשת. הצמתים שבתוכם קשורים אך ורק לצמתים שברכיב.

אין להתבלבל בין רכיבי קשירות לקהילות (נקראות גם קלאסטרים, וגם הם מונח מתחום הרשת).

בקהילות, כמו שראינו אצל מורנו, רוב הקשרים של הצמתים הם אמנם בתוך הקהילה אך יש גם קשרים, מעטים, לצמתים מחוץ לקהילה. בניגוד לקהילה, לרכיב קשירות יש גבול מוגדר, כמו ל"אי".

כשקליינפלד תיארה את הרשת כמורכבת מ"גושי דייסה" היא התכוונה לכך שיש מספר רב של רכיבי קשירות או "איים" כאלה שיאפשרו קשרים בינם לבין עצמם אך לא ביניהם. לפי ההנחה שלה, העולם אינו קטן אלא מורכב מגלקסיות רחוקות.

לעומת זאת, תיאוריית 6 הצעדים טוענת שהרשת היא רכיב קשירות ענק וקוטרו הממוצע הוא 6 צעדים בממוצע, דבר ההופך את רכיב הקשירות ל"עולם קטן".

אז מי צודק? מי טועה?

התשובה היא: שניהם.

אך לפני שנכריע בכך, מילה בנושא מנותני החסות שלנו לעולם הרשת:

לפי מחקר שפירסמה פייסבוק, ב-2011 היו כ-700 מיליון משתמשים פעילים והמרחק הממוצע בינהם היה 3.75. אפילו פחות ממה שהראה מילגרם!

מה שמדהים עוד יותר הוא שב-2016 היו כ-1.6 מיליארד משתמשים פעילים, כלומר, פי 2 משתמשים אך המרחק הממוצע היה 3.5 כלומר, המרחק ירד.

נשמע מוזר: איך דווקא כשהרשת גדלה המרחק בין הצמתים יורד?

זהו פרדוקס "העולם הקטן". ככל שיש יותר צמתים וקשתות (קשרים) קיים סיכוי גדול יותר לקיצורי דרך ברשת.

עם זאת, קיים שוני בין חישובי המרחקים בפייסבוק לבין הניסיונות של מילגרם ודומיו.

בעוד בפייסבוק נבדקה הטופולוגיה של הרשת, הרי שבניסוי השרשראות נבדקה הפרקטיקה שלה.

הדבר דומה לניסיון למצוא את הדרך הכי קצרה בין שני מקומות לפי מפת דרכים (כפי שנעשה בפייסבוק) או לפי תעבורת המכוניות (הניסוי של מילגרם). ברור שמפת הדרכים תאפשר מסלולים קצרים יותר, לכל הפחות, אך יש לזכור שהיא אדישה לעבירות של אותן דרכים.

ועכשיו, חזרה לשאלה: נו, אז איך נראית הרשת?

היום, בעידן רשתות הענק והטכנולוגיה המתקדמת, אנחנו יכולים לשלוף את כלל הדאטה ולהציגו בפנינו והתמונה היא מרתקת, אבל אני מניח שבשלב זה רובנו לא נופתע שנגלה שכן, גם רכיבי הקשירות ברשת הם Power Law.

הרשת מכילה רכיב קשירות אחד ענק ומרכזי והרבה רכיבי קשירות זעירים. בתמונה זה ייראה קצת כמו גלקסיה של כוכבים: מרכז צפוף שיהווה רכיב הקשירות המרכזי והרבה כוכבים קטנים בפריפריה שלא נוגעים בליבה.

גם רכיב הקשירות המרכזי, בדומה לגלקסיה, נהיה רופף בקצוות. רוב הרשת מורכבת מאותה פריפריה. גם אם קיימים ממנה קשרים לרכיב המרכזי, הם בודדים.

(רכיב קשירות מרכזי ו"זנב ארוך" מסביב (ד"ר אורן צור, אונ' בן גוריון

כלומר, יהיו צמתים ברשת שלעולם לא נגיע אליהם גם באינסוף צעדים כי הם ברכיב קשירות נפרד.

בגלל זה, כל בדיקות הקוטר של הרשת נעשות על אותו רכיב קשירות מרכזי ענק.

אז מהו גודלו של אותו רכיב קשירות מרכזי?

התשובה היא: תלוי. תלוי האם אנחנו מתייחסים לטופולוגיית הרשת או לתעבורה שבה.

במילים אחרות, האם הקשרים או הקשתות ברשת שלנו הם קבועים או זמניים (מה שנקרא, טמפוראלים)?

אם נניח שהרשת מורכבת מקשרים קבועים (כמו חברות בפייסבוק למשל) אזי רכיבי הקשירות הסוררים יחברו עם הזמן יותר ויותר לרכיב הקשירות המרכזי הענק והעולם יהיה יותר ויותר קטן.

מחקרים מראים שבמקרה כזה, רכיב הקשירות מהווה כ-90% מהרשת מה שעושה את המחקר של פייסבוק, בכל זאת לא נעצבן אותם, ללגיטימי, שכן הוא בוחן את מרחק הצעדים ב-90% מהרשת.

לעומת זאת, אם נניח שהרשת מורכבת מקשרים זמניים (למשל, שיחות טלפון), אזי רכיבי הקשירות הקטנים לאו דווקא ייכחדו אלא להיפך, יווצרו כל הזמן – בין אם זה רכיבים חדשים או כאלה שהתנתקו עם הזמן מהרכיב המרכזי. במקרה כזה, רכיב הקשירות יהיה קטן הרבה יותר.

במקרה של האינטרנט, למשל, כפי שהזכרנו קודם, האיזור המוכר למנועי החיפוש (כלומר המקושר) הוא רק אחוז קטן מהדפים הקיימים אך עדיין מהווה את רכיב הקשירות הגדול. לעומתו ה-deep web או הרשת העמוקה, שלפי הערכות מכיל כ90% מהאינטרנט, מורכבת מדפים עם קשרים בודדים או בלי קשרים בכלל שמהווים "איים" צפים ברשת.

מילגרם, וחוקרים נוספים, פטרו את הרעש שבדאטא, כלומר, אותן שרשראות שלא התחברו או אפילו נשלחו, בטיעון שלחלק מהאנשים פשוט לא היה כוח לשלוח, אך אין זה אומר שהם אינם מקושרים.

טיעון זה בעייתי לוגית שכן קשה להוכיח אותו. יכול להיות שהיה להם רצון להשתלב בניסוי אבל לא היה להם למי לשלוח (לפחות למישהו שבעיניהם היה רלוונטי).

מבנה הרשת מלמד אותנו שמכיוון שהפריפריה של הרשת מבודדת יחסית וקשריה לליבה חלשים, אינטואיטיבית הסיכוי שלהם לייצר קשר משמעותי לליבת הרשת נמוך מאד.

עם זאת, בטיעון של מילגרם שלאנשים פשוט לא היה כח להשתתף בניסוי, יש רמז להיבט עמוק יותר של ה-Power Law ולהתנהגות הרשת ונתייחס לכך בפרק אודות ה-Power Law.

כך או כך, אותו "רעש" שמצאו החוקרים בדאטה ופטרו אותו כלא רלוונטי, הוא-הוא התגלית המשמעותית שחיכתה 40 שנה לברבאשי שיעלה אותה למרכז הבמה: "הרעש" מרכיב את הזנב הארוך של הרשת ואת ה-Power Law. הגילוי שיש רק מעט גורמים מרכזיים ברשת הוא אולי הגילוי המשמעותי ביותר על רשתות באשר הן.

מילגרם לא היה הראשון או האחרון שהתעלם מהרעש בדאטא. הרעש הוא תופעות שאינן מתאימות לתזה אך נראות שוליות. הנטיה הטבעית היא להתעלם מהן או לתרץ אותן כפי שעשה מילגרם.

אך התעמקות בגורמים לרעשים אלו הביאו לפריצות דרך משמעותיות במדע כמו למשל בתורת הקוואנטים או תורת הכאוס. כך גם במקרה זה – דווקא הרעש חושף לנו את האמת אודות הרשת.

אז מה למדנו?

רשתות עולם אמיתי אינן אקראיות והן מקיימות חוקים:

חוק מס' 1 הוא Power Law, יש מעט גורמים מרכזיים ברשת והשאר מהווים "זנב ארוך" עם קשרים בודדים עד לא קיימים. נושא מרתק אז נקדיש לו פרק נפרד.
רשת מתחלקת לרכיבי קשירות, או ל"איים" שאינם קשורים זה לזה, ומקיימים גם הם Power Law, כלומר, ישנו רכיב קשירות מרכזי אחד ענק והשאר זנב ארוך של רכיבי קשירות קטנים וזניחים.
הקשרים בתוך רכיב הקשירות המרכזי עונים על חוק העולם הקטן. ככל שרכיב זה יגדל, כך הקוטר שלו יקטן. כלומר ככל שיש יותר צמתים וקשרים ברשת, תיקטן כמות הצעדים הנדרשים בכדי להגיע מצומת לצומת.
ברשת קיימות קהילות ויש להן מאפיינים, למשל גיאוגרפיים במחקר של מילגרם ומגדריים במחקר של מורנו. מכיוון שהבנת הקהילות היא קריטית ליישומי ביג דאטא בעולם הרשת, גם לנושא זה נקדיש פרק נפרד

רוצים.ות להרחיב את קהילת מדע הרשתות בישראל? ככל שתדרגו יותר, כך הפודקאסט יהיה חשוף לאנשים רבים יותר.

דרגו את הפודקאסט בספוטיפיי או באפל-פודקאסטס ו/או כיתבו ביקורת. ניתן לדרג גם בפודקאסט-אדיקט (בטאב של ה-reviews). מותר ומומלץ להעלות פוסט ולתייג את נטפריקס בפייסבוק/טוויטר/אינסטגרם או לינקדאין ושוב, פוסטים יצירתיים במיוחד יושמעו בפרקים הבאים.

ואם עוד לא עשיתם.ן לייק בדף של נטפריקס בפייסבוק, זה הזמן. אתרים עם יותר לייקים, מקבלים יותר חשיפה.

לפניות/הערות/הארות/הצעות ועוד: שלחו מייל!

ולא לשכוח לעשות Subscribe לפודקאסט באפליקציה החביבה עליכם.ן.

נתראה בפרק הבא של נטפריקס (:

#NetworkScience #SNA #SocialNetworkAnalysis #GraphTheory #DataScience #SocialPhysics #תורת_הגרפים #Facebook

הרחבות לפרק 2: באמת עולם קטן? האמת על עולם הרשת

פוסטים אחרונים

Comments