https://frosthead.com

האם מחשבים יכולים לפענח שפה בת 5,000 שנה?

תרבות האינדוס, שפרחה לאורך רוב האלף השלישי לפני הספירה, הייתה החברה הנרחבת ביותר בתקופתה. בשיאו הוא הקיף שטח של יותר מחצי מיליון מיילים רבועים שבמרכזו מהווה כיום גבול הודו-פקיסטן. שרידי האינדוס נמצאו צפונית ככל ההימלאיה וכדרום עד מומבאי. זו הייתה התרבות האורבנית המוקדמת ביותר של תת היבשת והיא התהדרה בשתי ערים גדולות, אחת בהארפה ואחת במוהנג'ו דרו. עם זאת, למרות גודלו ואורך חייו, ולמרות כמעט מאה שנות חקירות ארכיאולוגיות, נותר הרבה על האינדוס אפוף מסתורין.

המעט שידוע לנו הגיע מחפירות ארכיאולוגיות שהחלו בשנות העשרים ונמשכות גם היום. במהלך העשורים, ארכיאולוגים הציגו ממצאים רבים רבים, כולל חותמות בולים, קמיעות וטבליות קטנות. רבים מהממצאים הללו נושאים את מה שנראה כדוגמאות לכתיבה - דמויות חקוקות הדומות, בין השאר, בפרסות מכונפות, גלגלים מדוברים ודגים זקופים. עם זאת, מה בדיוק יכול להיות המשמעות של אותם סמלים, נותרה אחת החידות המפורסמות ביותר במחקר של תרבויות קדומות.

היו קודים קשוחים אחרים לפיצוח בהיסטוריה. מצרים מבוקשים מצאו שבירת מזל עם גילוי אבן הרוזטה המפורסמת בשנת 1799, שהכילה טקסט מצרית ויוונית כאחד. המחקר של ההירוגליפים של המאיה התפוגג עד שבלשן רוסי בשם יורי קנורוזוב עשה שימוש חכם במאיה המדוברת בת זמננו בשנות החמישים. אבל אין אבן רוזטה של ​​הודו, ומלומדים לא יודעים אילו, אם בכלל, השפות היו אולי צאורות מזה שדיברו על ידי אנשי האינדוס.

לפני כ -22 שנה, בהיידראבאד, הודו, סטודנט בכיתה ח 'בשם ראג'ש ראו הפך את דף ספר הלימוד להיסטוריה ולמד לראשונה על התרבות המרתקת הזו ועל התסריט המסתורי שלה. בשנים שלאחר מכן, הלימודים והמקצוע של ראו לקחו אותו לכיוון אחר - הוא פצע את לימודי מדעי המחשב, אותם הוא מלמד היום באוניברסיטת וושינגטון בסיאטל - אך הוא פיקח בקפידה על מלגת אינדיוס, תוך שמירה על עשרות הכושלים ניסיונות הגיוני מהתסריט. אפילו כשחקר אינטליגנציה מלאכותית ורובוטיקה, צבר ראו ספרייה קטנה של ספרים ומונוגרפיות בכתב האינדיוס, בערך 30 מהם. על מדף הספרים הסמוך, הוא גם שמר את ספר הלימוד ההיסטורי היקר של כיתה ח 'שהכיר לו את הודו.

"זה פשוט היה מדהים לראות את מספר הרעיונות השונים שאנשים הציעו, " הוא אומר. כמה חוקרים טענו שהכתיבה הייתה מעין כתב שומרי; אחרים שכנו אותו במשפחת דרווידיאן; אחרים חשבו שזה קשור לשפה של אי הפסחא. ראו הבין שזו "ככל הנראה אחת הבעיות המאתגרות ביותר מבחינת ההיסטוריה העתיקה."

כניסיון לאחר ניסיון לא הצליח לפענח את התסריט, כמה מומחים החלו לאבד תקווה שאפשר לפענח אותה. בשנת 2004, שלושה חוקרים טענו במאמר שנוי במחלוקת כי לסמלי האינדיוס כלל לא היה תוכן לשוני. במקום זאת, ייתכן שהסמלים היו מעט יותר מאשר פיקטוגרמות המייצגות דמויות פוליטיות או דתיות. הכותבים הרחיקו לכת והציעו כי ההודו אינו בכלל תרבות קרוא וכתוב. עבור חלק מהתחומים, כל המסע אחר ניסיון למצוא שפה מאחורי אותם תחריטים באינדוס החל להידמות לתרגיל חסר תוחלת.

כעבור כמה שנים נכנס ראו לקלחת. עד אז אנשים שלמדו את התסריט היו ארכיאולוגים, היסטוריונים, בלשנים או קריפטולוגים. אבל ראו החליט לשדל את סודות תסריט האינדוס בעזרת הכלי שהכיר הכי טוב - מדעי המחשב.

ראג'ש ראו מרתק על ידי תרבות האינדוס מאז כיתה ח ', משתמש במדעי המחשב ומושג שנקרא "אנטרופיה מותנית" כדי לסייע בפענוח תסריט האינדוס. (באדיבות דייוויד זקס) במהלך העשורים, ארכיאולוגים הציגו ממצאים רבים רבים מתרבות התרבות האינדוס, כולל חותמות בולים, קמיעות וטבליות קטנות. (רוברט הרדינג / רוברט הרדינג תמונות עולמיות / קורביס) ראו ושותפיו פרסמו את ממצאיהם בכתב העת Science במאי. הם לא פענחו את השפה אך ממצאיהם חידדו את הבנתה. (רוברט הרדינג / רוברט הרדינג תמונות עולמיות / קורביס) ראו ועמיתיו בוחנים כעת מחרוזות ארוכות יותר של דמויות ממה שניתחו במאמר המדע . מציאת דפוסים תורם בתורו לקבוע לאילו משפחות שפות התסריט עשוי להשתייך. (באדיבות דייוויד זקס)

ביום קיץ בסיאטל, ראו בירך אותי למשרדו כדי להראות לי איך הוא ועמיתיו ניגשים לבעיה. הוא הציג אוסף של העתקים של רשמים של חותם חימר שהעלו ארכיאולוגים מאתרי אינדוס. הם קטנים - כמו שוקולדים מרובעים קטנים - וברובם תמונה של חיה מתחת לסדרה של סמלי אינדוס. רוב הדוגמאות של תסריט האינדוס הן מיניאטורות כמו אלה, הנושאות רק כמה תווים; לא התגלו מונוליטים מפוארים. ראו לי המלומדים לגבי תפקודם של כלבי הים הקטנים, אמר לי ראו, אולם תיאוריה אחת היא שהם עשויים לשמש כדי לאשר את איכות הסחורות. אחרת מציעה כי ייתכן שהחותמות היו דרך להבטיח כי סוחרים שילמו מיסים בעת כניסה לעיר או יציאה מהם - כלבי ים רבים נמצאו בין הריסות בתי שער, אשר עשויים לתפקד כמו דוכני אגרה עתיקים.

ראו ועמיתיו לא ביקשו לחולל ניסים - הם ידעו שאין להם מספיק מידע כדי לפענח את התסריט העתיק - אך הם שיערו שבאמצעות שיטות חישוביות, הם יכלו לפחות להתחיל לקבוע איזה סוג של כתיבת האינדוס. התסריט היה: האם זה קידד שפה, או לא? הם עשו זאת באמצעות מושג שנקרא "אנטרופיה מותנית".

למרות השם המרשים, האנטרופיה המותנית היא מושג די פשוט: זהו מדד לכמות האקראיות ברצף. קחו למשל את האלף-בית שלנו. אם היית לוקח אריחי Scrabble ומשליך אותם באוויר, אתה עלול למצוא כל מכתב ישן מופיע אחרי כל אחר. אך במילים באנגלית בפועל, יש סיכוי גדול יותר כי אותיות מסוימות יופיעו אחרי אחרות. Q תמיד באנגלית אחריו כמעט תמיד u . T יכול להיות אחריו r או e, אך פחות סיכוי שהוא יבוא על ידי n או b .

ראו ומשתפי הפעולה שלו - קבוצה בינלאומית הכוללת מדעני מחשבים, אסטרופיזיקאים ומתמטיקאי - השתמשו בתוכנת מחשב כדי למדוד את האנטרופיה המותנית של תסריט האינדוס. אחר כך הם מדדו את האנטרופיה המותנית של סוגים אחרים של מערכות - שפות טבעיות (שומרית, טמילית, סנסקריט ואנגלית), שפה מלאכותית (שפת תכנות המחשב Fortran) ומערכות לא לשוניות (רצפי DNA אנושיים, רצפי חלבון חיידקי, וכן שני מערכי נתונים מלאכותיים המייצגים קיצוניות גבוהה ונמוכה של אנטרופיה מותנית). כאשר השוו את כמות האקראיות בכתב האינדוס לזו של המערכות האחרות, הם גילו שהיא דומה ביותר לשיעורים שנמצאו בשפות הטבעיות. הם פרסמו את ממצאיהם במאי בכתב העת Science .

אם זה נראה כמו שפה, והיא מתנהגת כמו שפה, כנראה שהיא שפה, מציע העיתון שלהם. הממצאים אמנם לא מפענחים את התסריט, כמובן, אך הם מחדדים את הבנתנו בו והעניקו ביטחון לאותם ארכיאולוגים שעבדו תחת ההנחה שהתסריט של אינדיוס מקודד שפה.

לאחר פרסום העיתון, הפתיע ראו. השאלה לאיזו משפחה שפה שייכת התסריט, כך מתברר, היא שאלה רגישה: בגלל עידן תרבות האינדוס ומשמעותה, קבוצות עכשוויות רבות בהודו היו רוצות לטעון לה כאב קדמון ישיר. לדוגמא, האינדיאנים דוברי הטמילית בדרום יעדיפו ללמוד שהתסריט של האינדוס הוא סוג של פרוטו-דרווידיאני, מכיוון שטמילית היא צאצאית מפרוטו-דרווידיאן. דוברי הינדית בצפון מעדיפים שזו תהיה צורה ישנה של סנסקריט, אב קדמון להינדי. העיתון של ראו לא מסיק לאיזו משפחת שפה התסריט שייך, אם כי הוא מציין שהאנטרופיה המותנית דומה לטמילית הישנה - מה שגורם לחלק מהמבקרים "להאשים אותנו שאנחנו לאומנים דרווידיאנים", אומר ראו. "אכזריות ההאשמות וההתקפות הייתה בלתי צפויה לחלוטין."

ראו נוטל לעיתים הקלה בחזרתו לעולם המוערך פחות בפראות של מדעי המוח והרובוטיקה. אבל קריאת תסריט האינדוס נותרה מפתה, ו"מה שהיה פעם תחביב מונופול עכשיו יותר משליש מזמני ", הוא אומר. ראו ועמיתיו בוחנים כעת מחרוזות ארוכות יותר של דמויות ממה שניתחו במאמר המדע . "אם יש תבניות, " אומר ראו, "נוכל לבוא עם כללים דקדוקיים. זה יביא אילוצים לאילו סוגים של משפחות שפות "התסריט עשוי להשתייך.

הוא מקווה כי ממצאיו העתידיים ידברו בעד עצמם, ויסיתו פחות מתחרים ממתנגדים השורשים לאזור אחד בהודו לעומת אזור אחר. מצידו, כאשר ראו מדבר על המשמעות של תסריט האינדוס עבורו, הוא נוטה לדבר במונחים של הודו כולה. "המורשת של הודו הייתה מועשרת במידה ניכרת אם היינו מסוגלים להבין את התרבות האינדוס", הוא אומר. ראו ומשתפי הפעולה שלו עובדים על זה, שורה אחת של קוד מקור בכל פעם.

האם מחשבים יכולים לפענח שפה בת 5,000 שנה?