https://frosthead.com

ה- AI האחרון מלמד את עצמו לשחק ללא עזרה אנושית

בשנה שעברה, תוכנית בינה מלאכותית בשם AlphaGo, שנוצרה על ידי צוות DeepMind של גוגל, ניצחה אלוף אנושי ב- Go, משחק אסטרטגיה סיני עתיק שהוא במובנים רבים מורכב יותר משחמט. כפי שדיווחה אמילי Matchar ל- Smithsonian.com באותה העת, זה היה הישג מדהים, מאחר שעד סוף 1997 היו אנשים שחזו כי ייקח מאה שנה למחשב להכות אדם בגו.

בעוד שההישגיות מרשימה, AlphaGo למדה לשחק את המשחק על ידי ניתוח משחקים קודמים ששיחקו על ידי בני אדם. אך כפי שמדווחה מררית קנדי ​​ב- NPR, גרסה חדשה של הבינה המלאכותית בשם AlphaGo Zero הבינה כיצד לשלוט בעצמה במשחק, ללא כל קלט או מניפולציה אנושית - קידום שיש לו השלכות גדולות על פיתוח AI עתידי.

על פי הודעה לעיתונות של DeepMind, גרסאות קודמות של AlphaGo למדו לשחק את המשחק על ידי לימוד משחקים בין שחקנים חובבים מקצועיים וחזקים, תוך שהם סופגים את כללי המשחק ואסטרטגיות משחק מוצלחות. AlphaGo Zero, לעומת זאת, לא בחן אף משחק שמשחק בני אדם. במקום זאת, ניתנו לו כללי המשחק ואז שיחקו נגד עצמו, תוך כדי שימוש בלימוד חיזוק בכדי ללמד את עצמו מהלכים נכונים ולא נכונים ואסטרטגיות לטווח הארוך. כאשר ה- AI שיחק את המשחק, הוא עדכן את הרשת העצבית המתקדמת שלה כדי לחזות טוב יותר את מהלכיו של יריבו.

החוקרים צפו בזמן שה- AI שולט במשחק בזמן אמת. אחרי שלושה ימים היא הצליחה להביס גרסה קודמת בשם AlphaGo Lee, שגברה על אדון גו הקוריאני לי סדול ב -4 מתוך 5 משחקים בשנת 2016. לאחר 21 יום היא העניקה את הטוב ביותר ל- AlphaGo Master, הגרסה שגברה על 60 שחקני ה- Go המקוונים וה- השחקן הטוב בעולם קי ג'י מוקדם יותר השנה. הגרסה האחרונה העניקה משחקי AlphaGo Master 100 ל- 0. לאחר 40 יום, היא הגיעה לרמות משחק שאיש לא ראה לפני כן. המחקר מופיע בכתב העת Nature.

"בתוך זמן קצר, AlphaGo Zero הבין את כל הידע של Go שנצבר על ידי בני אדם במשך אלפי שנות משחק", אומר החוקר הראשי דייוויד סילבר מ- DeepMind של גוגל בסרטון YouTube. "לפעמים דווקא בחרו לחרוג מזה וגילה משהו שבני האדם אפילו לא גילו בתקופה זו וגילו פיסות ידע חדשות שהן יצירתיות ורומנטיות במובנים רבים."

כפי שמדווחת Agence France-Presse, AlphaGo Zero הגיע לרמת שליטה זו בצורה יעילה בהרבה מקודמותיה. בעוד שבאיטראציה הקודמת היו 48 יחידות עיבוד נתונים ושיחקו 30 מיליון משחקי אימון במהלך מספר חודשים, לאפס היו רק 4 יחידות עיבוד ושיחקו 4.9 מיליון משחקי אימון במשך שלושה ימים. "אנשים נוטים להניח שלמידת מכונה עוסקת בנתונים גדולים וכמויות חישוב עצומות, אך למעשה מה שראינו עם AlphaGo Zero הוא שאלגוריתמים חשובים הרבה יותר", אומר סילבר ל- AFP.

אבל המחקר נוגע ליותר מסתם שליטה במשחק לוח. כפי שמדווח איאן דוגמא ב"גרדיאן ", סוג זה של טבולה ראסה, או צפחה ריקה, למידה עשויה להוביל לדור חדש של בינה מלאכותית למטרה כללית שעשויה לסייע בפתרון בעיות בשדות שניתן לדמות היטב במחשב, כמו הרכב תרופות., קיפול חלבון או פיזיקת חלקיקים. על ידי בניית הידע מהיסוד ללא הטיות או מגבלות אנושיות, האלגוריתמים יכולים ללכת לכיוונים שבני אדם טרם חשבו להסתכל.

בעוד אנשים רבים בקהילה של AI רואים את AlphaGo Zero כהישג גדול, גארי מרקוס, פרופסור לפסיכולוגיה באוניברסיטת ניו יורק המתמחה בבינה מלאכותית, אומר לקנדי של NPR כי הוא לא חושב שהאלגוריתם הוא באמת טאבולה ראסה מכיוון שידע אנושי קודם לבניית האלגוריתם. הוא גם לא חושב ש- tabula rasa AI הוא חשוב כמו שזה נראה. "[ב] ביולוגיה, מוח אנושי בפועל אינם טאבולה ראסה ... אני לא רואה את הסיבה התיאורטית העיקרית לכך שאתה צריך לעשות זאת, מדוע שתנטוש הרבה ידע שיש לנו על העולם", הוא אומר.

אף על פי כן, השליטה המהירה של אלפא גו מרשימה - וקצת מפחידה.

ה- AI האחרון מלמד את עצמו לשחק ללא עזרה אנושית