https://frosthead.com

AI שמשחק פוקר זה יודע מתי להחזיק אותם ומתי לקפל אותם

תוכנית מחשב בשם Pluribus העניקה את מקצוענים של פוקר בסדרה של שישה שחקנים ללא הגבלה של טקסס הולדם, והגיעה לאבן דרך במחקר הבינה המלאכותית. זה הבוט הראשון שהכה את בני האדם בתחרות מרובת משתתפים מורכבת.

כפי שדיווחו חוקרים ממעבדת AI בפייסבוק ומאוניברסיטת קרנגי מלון בכתב העת Science, פלוריבוס התגבר כמנצח במשחקים שנשלטו על ידי בני האדם וגם על האלגוריתם. בתחילה, מררית קנדי ​​כותבת ב- NPR, חמש גרסאות הבוט מול שחקן פוקר מקצועי אחד; בסבב הניסויים הבא שיחק בוט אחד לעומת חמישה בני אדם. לפי פוסט בבלוג בפייסבוק, ה- AI זכה בממוצע בסביבות 5 $ ליד, או 1, 000 דולר לשעה, כששיחק מול חמישה מתנגדים אנושיים. שיעור זה נחשב ל"מרווח הניצחון המכריע "בקרב אנשי פוקר.

בשיחה עם קנדי, אלוף טורניר הפוקר העולמי בארבע פעמים, דארן אליאס, מסביר שהוא עזר לאמן את פלוריבוס על ידי התמודדות מול ארבעה שולחנות של יריבי בוט והתראה על מדענים כאשר ה- AI טעה. עד מהרה, הבוט "השתפר מהר מאוד, [החל] מלהיות שחקן בינוני, בעיקרון לשחקן פוקר ברמה העולמית, תוך ימים ושבועות." החוויה, לדברי אליאס, הייתה "די מפחידה."

על פי דבריו של ג'יימס וינסנט של Verge, פלוריבוס - AI בעלות נמוכה באופן מפתיע, שהוכשר עם משאבי מחשוב ענן בשווי פחות מ -150 דולר - הדריך את אסטרטגיית הפוקר על ידי משחק נגד עותקים של עצמה ולמידה באמצעות ניסוי וטעייה. כפי שג'ניפר אוולט מציינת עבור Ars Technica, הבוט הבין מהר כי דרך הפעולה הטובה ביותר שלו הייתה שילוב של משחק ותנועות בלתי צפויות.

מרבית המקצוענים האנושיים נמנעים מ"הימורי דונקים ", שמוצא שחקן שמסיים סיבוב אחד בשיחה ומתחיל את הבא בהימור, אך פלוריבוס אימץ בקלות את האסטרטגיה הלא פופולרית. במקביל, כך מדווח אורלט, ה- AI הציע גם מידות הימורים לא שגרתיות והציג אקראיות טובה יותר מאשר יריבים.

"הכוח העיקרי שלה הוא היכולת להשתמש באסטרטגיות מעורבות, " אמר אליאס על פי הצהרת CMU. "זה אותו דבר שבני האדם מנסים לעשות. זה עניין של הוצאה להורג עבור בני אדם - לעשות זאת בצורה אקראית לחלוטין ולעשות זאת באופן עקבי. רוב האנשים פשוט לא יכולים. "

פלוריבוס הוא לא ה- AI הראשון שמשחק פוקר שהביס אנשי מקצוע אנושיים. בשנת 2017 פיתחו יוצרי הבוט, נועם בראון ותומאס סנדהולם, איטרציה קודמת של התוכנית שנקראה ליברטוס. AI זה הביס באופן מכריע ארבעה מקצוענים של פוקר על פני 120, 000 ידיים של טקסס הולדם עם שני שחקנים, אך כפי שמסביר פוסט הבלוג בפייסבוק, הוגבל על ידי העובדה שהוא מתמודד רק עם יריב אחד בכל פעם.

על פי Will Knight של MIT Technology Review, פוקר מציב אתגר ל- AI מכיוון שהוא כרוך במספר שחקנים ושפע של מידע נסתר. באופן יחסי, משחקים כמו שחמט וגו מעורבים רק שני משתתפים, ועמדות השחקנים גלויות לכולם.

כדי להתגבר על המכשולים הללו, בראון וסנדהולם יצרו אלגוריתם שתוכנן לחזות את המהלכים השניים-שלושה הבאים של היריבים ולא לאמוד את צעדיהם בסוף המשחק. למרות שאולי אסטרטגיה זו עשויה לתעדף רווח לטווח הקצר על פני זכיות לטווח הארוך, וינסנט של ורג 'כותב ש"החתולה לטווח הקצר היא באמת כל מה שאתה צריך. "

בכדי להתקדם, ניתן להשתמש בתוכניות מרובות-שחקנים כמו פלוריבוס לעיצוב תרופות המסוגלות להילחם בחיידקים עמידים לאנטיביוטיקה, כמו גם לשפר את אבטחת הסייבר ומערכות רובוטיות צבאיות. כפי ש על פי Ouellette של Ars Technica, יישומים פוטנציאליים אחרים כוללים פיקוח על משא ומתן רב צדדי, תמחור מוצרים ואסטרטגיות של הצעות מחיר למכירה פומבית של סיעור מוחות.

נכון לעכשיו, אומר בראון לנייט, האלגוריתם יישאר ברובו תחת מעטפות - בעיקר כדי להגן על תעשיית הפוקר המקוונת מפני הפסדים כספיים הרסניים.

החוקר מסיק, "זה יכול להיות מסוכן מאוד עבור קהילת הפוקר."

AI שמשחק פוקר זה יודע מתי להחזיק אותם ומתי לקפל אותם