איך תוכנת מחשב יכולה ללמוד הכל רק מפייסבוק שלך אוהב | מדע | סמית'סוניאן - מאמרים, בלוגים, מדע מפתיע, טכנולוגיה, מדע, התנהגות אנושית

הסיכויים הם שכאשר החלטת "לחבב" תוכנית טלוויזיה, להקה, עסק מקומי או עמוד פייסבוק של מוצר, לא דמיינת שלקליק הזה תהיה השלכה רבה. זה עשוי להראות לחברים שלך קצת על תחומי העניין שלך, ולעתים לגרום לעדכוני סטטוס מהדף להופיע בעדכון החדשות שלך.

עם זאת, "לייקים" זמינים באופן ציבורי לכל מי שיכול לראות בפייסבוק, אפילו אנשים שלא אישרת אותם כחברים. ולמחקר חדש שפורסם היום בכתב העת Proceedings of the National Academy of Sciences, קבוצת חוקרים יצרה תוכנית מחשב שיכולה לקחת "אהבות" של משתמש ולהביא במדויק מגוון עצום של מידע אודותיו או עליה - כולל גיל, אתניות., מנת משכל, נטיות פוליטיות, רמת השימוש בסמים ואפילו נטייה מינית.

במסגרת המחקר, קבוצת המחקר - שותפות בין מעבדת הפסיכומטריה באוניברסיטת קיימברידג 'למחקר של מיקרוסופט - קיימברידג' - ניתחה את הנתונים של 58, 000 משתמשי פייסבוק אמריקאים שבחרו לספק את הפרופילים שלהם ו"אהבתי "לניתוח באמצעות אפליקציית myPersonality של פייסבוק. החוקרים האכילו את "לייקים" אלה באלגוריתם, שנבנה במיוחד עבור פרויקט זה, ואז השוו את תחזיות המודל על מגוון מאפיינים למה שהם ידעו בוודאות על המשתמשים, שהגישו את התוכן של פרופילי הפייסבוק שלהם לניתוח. גם כן.

עבור כל זוג תכונות שנבדקו - נניח, קווקזית או אפרו-אמריקאית, או דמוקרטית או רפובליקנית - החוקרים בחרו צמד משתמשים, כאשר אחד מהם שייך לכל קטגוריה, והאלגוריתם נאלץ לבחור בעיוורון איזה משתמש מתאים לאיזו קטגוריה רק מבוסס על "אהבתי" שלהם. זה לא היה מושלם במאה אחוז להסיק אף אחת מהקטגוריות, אבל זה היה מדויק באופן לא מודע לחיזוי רבים, כולל כמה מאפיינים שכנראה לא הייתם מניחים שניתן לנחש מ"אהבתי "שלכם.

למשל, הוא מסיק כי המשתמש היה קווקזי ואמריקה אפריקאית 95 אחוז מהזמן, הדמוקרט והרפובליקנים 88 אחוז מהזמן והנוצרים והמוסלמים 82 אחוז מהזמן. פירוט הדיוק שלו בחיזוי רבים מהתכונות הנחשבות (כתזכורת, ערך 1 היה מסמל שהמודל מדויק במאה אחוז) נמצא מתחת.

הדגם ניבא מגוון של מאפייני משתמש ברמת דיוק לא נעימה. (תמונה באמצעות PNAS / Kosinski et al.)

עבור מרבית המשתמשים, רמת דיוק זו לא הייתה תלויה ב"אהבתי "ברורים שאפשר לקשר לתכונה הנחשבת. לדוגמה, פחות מחמישה אחוז מהמשתמשים שזוהו כהומואים "אהבו" נישואים הומואים, או דפים קשורים אחרים.

האלגוריתם, במקום זאת, צבר טונות של "לייקים" לכאורה לא קשורים לקבוצת משתמשים לשיעורים שחלקו דמיון צפוי. על ידי השוואה בין "לייקים" לתוצאות מבחן אישיות (גם חלק מאפליקציית myPersonality), החוקרים מצאו שמשתמשים ש"אהבו "" סופות רעמים ", " דו"ח קולברט ", " מדע "או" צ'יפס מתולתל "- כולם מעט סביר יותר שיש מנת משכל גבוהה גבוהה מאלו שלא. באופן דומה, משתמשים גברים ש"אהבו "" מק קוסמטיקה "או" Wicked The Musical "היו מעט יותר סבירים שהם הומואים, ואילו אלה שאהבו את" וו-טאנג קלאן "או" שאק "היו מעט פחות סבירים.

ניתוח כל ה"אהבתי "של המשתמש אפשר לאלגוריתם ליצור דיוקן כולל שלם, אך דיוקו הושפע מאוד מכמות ה"אהבתי" עבור כל משתמש. עבור אלה שבקצה הנמוך, עם 1-10 לייקים, התחזיות לא היו טובות יותר מהסיכוי, אבל עבור אלה עם 150 עד 300 "לייקים", האלגוריתם הצליח לשפר את יכולתו לנחש את תכונות המשתמשים במידה טובה אפילו יותר. .

החוקרים ערכו בעיקר את המחקר כדי להראות עד כמה המידע הזמין לציבור שלנו יכול לספר עלינו. ייתכן שלא תפרסם בפומבי את נטייתך המינית, את השקפותיך הפוליטיות או אם אתה משתמש בסמים, אך תוכנית מסוג זה יכולה לנתח את ה"אהבתי "שלך ולערוך ניחושים די מדויקים ללא קשר.

למרות שהמשתמשים הגישו את "לייקים" ופרופילים שלהם לניתוח באמצעות אפליקציה של צד שלישי, הגדרות הפרטיות של ברירת המחדל של פייסבוק פירושן שה"אהבתי "שלך הם ציבוריים לכל אחד. כבר היום האלגוריתמים של פייסבוק משתמשים בכאלה אוהבים כדי להכתיב אילו סיפורים בסופו של דבר בעדכוני החדשות של המשתמשים, ומפרסמים יכולים לגשת אליהם כדי לקבוע אילו המודעות היעילות ביותר להציג בפניכם כשאתם גולשים.