מבחן טיורינג מודד משהו, אבל זה לא "אינטליגנציה" | חדשנות | סמית'סוניאן - מאמרים, חדשנות, טכנולוגיה, מדע, טכנולוגיה וחלל

אלן טיורינג, אחד מאבות עידן המחשבים, היה אדם פיקח במיוחד. כל כך פיקח, למעשה, שהוא הבין שהמונח "בינה מכונה" כמעט חסר משמעות. מוטב, הוא נימק, לדבר על מה שמכונה יכולה לעשות בפועל: האם היא יכולה לדבר? האם זה יכול לקיים שיחה? לפחות זה משהו שאנחנו יכולים לנסות ללמוד. טיורינג הציע בסופו של דבר את מה שכונה "מבחן טיורינג": אם שופט לא יכול לדעת איזו משתי ישויות נסתרות היא אנושית ואשר מלאכותית, המכונה "עברה" את המבחן - וזה בדיוק מה אומרים שזה קרה בשבת האחרונה בלונדון.

תוכן קשור

עמק הסיליקון חייב את הצלחתו לגאון הטכנולוגי הזה שמעולם לא שמעת עליו
חיזויו של אלן טיורינג בן 60 שנה לדפוסים בטבע מוכח כנכון

"אנו ... גאים להכריז כי המבחן של אלן טיורינג עבר את הפעם הראשונה", אמר אחד המארגנים, קווין וורוויק מאוניברסיטת רידינג, עם פרסום התוצאות. צ'ט בוט המנצח נקרא בשם "יוג'ין גוסטמן", תוכנית מחשב שמחקה את אישיותו של ילד אוקראיני בן 13. "יוג'ין" הצליח לשכנע 33 אחוז מהשופטים שזה אנושי באירוע של יום שבת שהתקיים במשרדי החברה המלכותית בלונדון במלאת 60 שנה למותו של טיורינג. (טיורינג, הומוסקסואל, הורשע בחוסר מעש גס בשנת 1952 והוטל עליו לעבור "טיפול הורמונלי" במסגרת הסכם טיעון. שנתיים לאחר מכן נפטר מהרעלת ציאניד בהתאבדות לכאורה.)

אבל מילת זהירות היא בסדר. "אינטליגנציה" תמיד הייתה נושא חלקלק, ומבחן טיורינג בפרט היה מזמן מחלוקת. טיורינג תיאר איך זה יעבוד במאמר משנת 1950 שכותרתו "מכונות מחשוב ואינטליגנציה." הוא לקח את הרעיון ממשחק טרקלין ויקטוריאני מסורתי, שם אתה מנסה להבין אם האדם שמסתתר מאחורי וילון הוא גבר או אישה, רק על ידי שאילת שאלות. (את התשובות לשאלות היה צריך לרשום, כי הקול יהיה נתון.) כך תפעל הגרסה של טיורינג: יהיה לך שופט, שיושב מול שני וילונות, בלי לדעת מה עומד מאחוריהם. . מאחורי וילון אחד עומד אדם; מאחורי השני נמצא מחשב. השופט יכול לשאול שאלות של אחת משתי הישויות הנסתרות. על סמך התגובות, השופט מנסה להבין אם הישות הנסתרת היא אדם או מכונה. (טיורינג דמיין את השיחה כמתווכת על ידי מכונות טל-סוג; כיום, אנו יכולים להשתמש בכל סוג של ממשק אלקטרוני, טקסט מבוסס, כמו הסוג המשמש בחדרי צ'אט באינטרנט, או העברת הודעות מיידיות.)

טיורינג העלה השערה כי עד שנת 2000 "לחוקר ממוצע לא יהיה סיכוי של יותר מ -70 אחוז לזיהוי נכון" - כלומר, תוכנות מחשב היו מעניקות את השופטים 30 אחוז מהזמן - לאחר חמש דקות של תשאול. "חמש הדקות" חשובות. טיורינג לא דיבר על מגבלת זמן שהיא חלק מובנה במבחן, ואפשר היה לטעון שכדי שמכונה באמת תעבור את המבחן היא צריכה להיות מסוגלת להתמודד עם כל כמות של תשאול. יש להניח כי הקריטריונים של חמש דקות היו גבול שרירותי אך הכרחי. שנת 2000 באה והלכה, כאשר צ'אט בוטים רק עצרו את ההתקדמות. (ברגע מפוכח יותר, כשהוא ענה לשאלה של מראיין ב- BBC בשנת 1952, טיורינג אמר שיעברו מאה שנה עד שמכונה תעבור את המבחן.)

עוד בשנת 2012 הייתי שופט במרתון מבחן טיורינג, המערך הגדול ביותר שאי פעם במבחני טיורינג שנערכו פעם אחת; היא נערכה בפארק בלצ'לי, באנגליה, מקום עבודתו לשבירת הקוד החיונית של טיורינג במהלך השנים האחרונות של מלחמת העולם השנייה. (זה היה מאורגן על ידי אותה צוות שניהל את האירוע של יום שבת, וגם גרסה קודמת של יוג'ין הייתה המנצחת באותה תקופה.) ההתקנה לאירוע של יום שבת הייתה זהה לשנת 2012: השופטים הקלידו את שאלותיהם במחשב., ואז המתין לתגובות שיופיעו על המסכים שלהם; רובוטי הצ'אט יחד עם "בני האדם הנסתרים" היו בחדר אחר, מחוץ לטווח הראייה.

הדבר הראשון שהתוודעתי אליו הוא שכשאתה שופט במבחן טיורינג, חמש דקות עוברות די מהר. וככל שהשיחה קצרה יותר כך גדל היתרון של המחשב; ככל שהחקירה ארוכה יותר, כך גדל ההסתברות שהמחשב יסגיר את עצמו. אני רוצה לקרוא לזה אפקט הבובות: האם התנצלת אי פעם בפני בובת חנות כלבו בהנחה שרק נתקלת באדם חי? אם המפגש נמשך רק שבריר שנייה, כשאתם פונים לכיוון השני, אתם עשויים לדמיין שפשוט התחפשתם נגד בן אנוש. ככל שהמפגש ארוך יותר, כך בולטת בובת הבובה.

זה אותו דבר עם צ'אט בוטים. חילופי גיהינום אינם מגלים דבר - אך ככל שנכנסים אליו יותר, כך מתעוררות בעיות. מצאתי כי צ'אט בוטים נוטים לשנות את הנושא ללא סיבה. לעתים קרובות הם לא יכולים לענות על שאלות פשוטות. בסיכון להישמע מעורפל, הם פשוט לא נשמעים אנושיים . באחת משיחותיי ב -2012 הקלדתי בדיחה פשוטה - והישות איתה דיברתי שינית מייד את הנושא להמבורגרים. (מדען המחשבים סקוט אהרונסון חווה לאחרונה חוויה דומה כשפטפט עם יוג'ין דרך אתר האינטרנט של הבוט. אהרונסון שאל את יוג'ין כמה רגליים יש לגמל; זה ענה, "משהו בין 2 ל -4. אולי, שלוש? :-)))" מאוחר יותר, כשארונסון שאל כמה רגליים יש לו נמלה, יוג'ין שיעעל את אותה התשובה בדיוק, סמיילי משולש והכול.)

שים לב גם שיוג'ין אינו מחקה מבוגר דובר אנגלית דובר אנגלית; היא מתיימרת להיות נער אוקראיני צעיר וקצת, ומשוחחת באנגלית טובה למדי (אך רחוקה מלהיות מושלמת). כפי שלדימיר ווסלוב, אחד ממפתחי התוכנית, אמר ל- Mashable.com : "בילינו הרבה זמן בפיתוח דמות עם אישיות אמינה." למרות שיוג'ין יעסיק מישהו בכל נושא שהוא, הגיל שלו "הופך את זה למשהו הגיוני לחלוטין שהוא לא עושה זאת יודעת הכל. "יוג'ין לא יוצא ממש ומכריז על גילו ולאומיות; אך הוא יחשוף זאת אם נשאל - והתוצאה הסופית עשויה להיות מידה מסוימת של הקלות מצד השופטים, במיוחד בנוגע לדקדוק באנגלית ושימוש במילים. (אני מניח שרוב השופטים בשבת היו דוברי אנגלית ילידית, אם כי אינני יודע זאת בוודאות.) ככל הנראה הטבלאות היו הופכות אם יוג'ין אי פעם היה נתקל בדובר אוקראינית יליד כשופט.

המאבק לבניית מכונה מדברת מדגיש עד כמה השפה מורכבת. זה לא רק שאלה של דיבורים - אתה צריך לדבר על משהו, ומה שאתה אומר צריך להיות הגיוני - וזה צריך להיות הגיוני בהקשר של מה שהאדם האחר זה עתה אמר. עבורנו, זה קל; למחשבים, לא כל כך הרבה. וכך צ'אט בוטים מסתמכים על מגוון טריקים: שינון מגה-בתגובה של שימורים, או סורק באינטרנט לדיאלוג שעשוי להיות בקירוב לשיחה בה הם נמצאים כעת. במילים אחרות, מה שמכונה חסרה באינטליגנציה היא אולי תוכל לפצות בכוח המחשוב הגולמי. זו הסיבה שגוגל או סירי (העוזרת האישית של אייפון) יכולים להראות לנו כל כך חכמים: לסירי אולי אין "מוח", אבל יש לה גישה למסד נתונים כה עצום של מידע, היא יכולה להתנהג כאילו היא מתנהגת. זו הייתה אותה סוג של גישת כוח אמיץ שאפשרה ל"ווטסון "של יבמ לנצח בג'יפארדי! ב 2011.

כל זה מעלה שאלה מכריעה: מה זה בדיוק שמבחן טיורינג מודד? יש מבקרים שהציעו שמדובר בתגמולים ולא בתבונה. הפסיכולוג של ניו יורק גארי מרקוס, כותב ב- NewYorker.com, אומר שיוג'ין מצליח "להוציא לפועל סדרת 'תכניות' שנועדו להסוות את מגבלות התוכנית." סטיבן הרנאד, פסיכולוג ומדעי מחשב באוניברסיטת קוויבק במונטריאול, היה אפילו יותר ספקנים, ואמר ל"גרדיאן " שזה" שטות גמורה "לטעון שיוג'ין עבר את מבחן טיורינג. (לזכותו, טיורינג היה מודע היטב לנושא זה; הוא קרא לרעיון שלו "משחק החיקוי", ודיבר על אינטליגנציה רק במשורה.) באופן מביך עוד יותר, המחשב, שלא כמו האנושי, נאלץ להונות. "מבחן טיורינג הוא באמת מבחן להיות שקרן מצליח", אמר לי פאט הייז, מדען מחשבים במכון לזיהוי אנושי ומכונה בפנסקולה, פלורידה, בעקבות מרתון מבחן טיורינג ב -2012. "אם היה לך משהו שבאמת יכול לעבור את משחק החיקוי של טיורינג, זה היה 'חיקוי אנושי' מצליח מאוד."

ו"אנושי "הוא נקודת המפתח האחרת: האם לא יתכן שיש סוגים אחרים של אינטליגנציה בעולם, מעבר לסוג שמציג המין שלנו? מכונה אינטליגנטית באמת תהיה אינספור יישומים מעשיים, אך מדוע להתמקד ביצירת "אנשים" נוספים? אחרי הכל, יש לנו כבר המון אנשים. כפי שציין הבלשן נועם חומסקי, כאשר אנו שואפים לבנות מכונה שזזה מתחת למים, איננו דורשים ממנה "לשחות" - וצוללת היא הישג לא פחות מחוסר היכולת שלה לבצע את המסלול האחורי.

כן, יוג'ין מרשים, לפחות בפרצים קטנים. ובכל זאת, אפילו מיטב הצ'אטים הטובים ביותר מעדים בשאלות שילד שחצי מגילו העמיד פנים של יוג'ין יכול היה להתמודד עם בריזות. אולי באופן לא מפתיע, מרבית חוקרי ה- AI משקיעים מעט זמן באובססיביות במבחן טיורינג. אינטליגנציה מכונה היא למעשה התקדמות, ומהר למדי. תוכנת תרגום קולי לטקסט, שהיתה די פתטית רק לפני מספר שנים, משתפרת במהירות, כמו גם תוכניות תרגום לשפות. לאמזון לרוב יש מושג די טוב לגבי מה שאתה רוצה לקנות עוד לפני שאתה עושה. והמכונית הנהיגה העצמית של גוגל הייתה פנטזיה בלבד לפני עשור. אבל השיחה, כשאנחנו ממשיכים לגלות מחדש, היא ממש קשה, ולא סביר שזו תהיה הגבול בו AI מאיר ביותר. לעת עתה, אם אתה מחפש מישהו לשוחח איתו, אני ממליץ על בן אנוש אמיתי.

דן פאלק הוא עיתונאי מדעי שבסיסו בטורונטו.