במשך זמן רב המתורגמן האוניברסלי היה אובססיה של תרבות הפופ. מסע בין כוכבים מציג אותה כמכונה כף יד, הדומה למיקרופון, שיכולה לתרגם את מרבית השפות באופן מיידי . מדריך הטרמפיסט לגלקסיה מתהדר בדג בבל, יצור שכאשר הוא תקוע באוזנו של מישהו מציע תרגום מיידי של כל שפה בגלקסיה.
לכן אין להתפלא כי בני האדם של ימינו מנסים ליצור מכשיר שעובד באותה מידה. עשרות אפליקציות תרגום לסמארטפונים קיימות, אך רובן מתורגמות מילים על בסיס פשוט אחד לאחד; משתמש מקליד או מדבר מילה והאפליקציה חוזרת בתרגום. כעת, המטרה, והנפילה הכספית האמיתית, היא שהנדסאים ויזמים יאפשרו לשני אנשים לשוחח בשפות שונות, בעוד מכשיר קטן מפטיר תרגומים בזמן אמת.
אפליקציות תרגום קיימות
בטיול ביוון, אנדרו לאודר דובר האנגלית חלה.
"הלכתי לבית המרקחת והם לא הבינו שום אנגלית, אז לא קיבלתי תרופות", אומר לאודר, מנכ"ל Vocre Translate. תוויות הסמים היו ממש יווניות מבחינתו. מחסומי שפה נפוצים בקרב מטיילים בעולם. במדינה זרה, עסקאות קטנות כמו קניית תרופות או קבלת הוראות - קושי נוסף שעומד בפני לאודר - הופכות למשימות הרקולאיות.
כשחזר ליד המדינה, לאודר יצר את Vocre Translate, אפליקציה לתרגום קולי וטקסט. זה התחיל כאפליקציית טקסט לטקסט (המכונה MyLangauge), ואז הפך בתחילה למודל של דיבור לטקסט שכמו אפליקציות אחרות כולל SayHi Translate השתמש במודל מסורתי בו מילה מתורגמת ישירות למילה אחרת. אמור "שלום", והטלפון החכם או הטאבלט ממצמצים "הורה" אוטומטית. "להתראות" הופך ל"סייונרה ". וכן הלאה, ממש כמו מתרגם טקסטים.
כדי ליצור את התרגום השמע הפשוט, היוצרים של אפליקציות אלה היו זקוקים לנתונים. Vocre שלף את המידע שלו מהקלטות ומסמכים ברשות הרבים, כמו סרטים ישנים או דיונים פומביים. "בעצם התחננו בשירות תמלול קולי שיאפשר לנו להשתמש בענן שלהם לצורך זיהוי דיבור", אומר לי בסר, מנכ"ל SayHi.
ברגע שהיה בידי המהנדסים נתוני שמע וטקסט, הם התאימו את השמע והטקסט, מילה במילה. תוכנת זיהוי קולי מזהה "גבינה" וממירה אותה לטקסט. זה מומר לצרפתית, והאפליקציה מוצאת את ההגייה הצרפתית ל"מאוג ".
עם זאת, אם משתמש מכנה במצחוק במשהו "גבינה", המתרגם לא עובד טוב כיוון ששפה מדוברת אינה כמעט סטטית כמו שפה כתובה. קדנה, סלנג, ניפוי, הגייה, ניב וזרימת שיחה יכולים לשנות משמעות
עם זאת, עם הזמן, לאודר רצה מכשיר שיחה יותר. בהודעת דוא"ל הוא אומר, "בהתבסס על נתוני השימוש שלנו, גילינו שאנשים מדברים בצורה שונה מאוד מהדרך בה הם כותבים. מילה מדוברת היא הרבה יותר ספונטנית והרבה פחות פורמלית ומילולית. "אז הוא השתמש בתרגום סטטיסטי למכונה, גישה שמשמשת גם גוגל שמשתמשת בנתונים כדי למצוא שימוש במילים נפוצות, ומעבירה את מודל התרגום המילה-למילה המסורתי. בעיקרון, Vocre לומד כפי שהוא משמש. "זה לומד על סמך כל שיחה, כל ביטוי שעובר עליה. זה משהו שמתחכם עם הזמן, "אומר לאודר.
עדיין, נכון לעכשיו, לשתי האפליקציות לוקח מספר שניות לתרגם, אך ללא ספק יעילים, במיוחד בשילוב עם שפת גוף, לשיחות עסקיות כמו הזמנת ארוחה. אחרי הכל, בני אדם מזמינים אוכל בשפות שאינן מקורות במשך שנים ומצליחים עדיין לאכול. אך הם לא הצליחו לנהל שיחות מעמיקות ומורכבות.
עם Vocre ו- SayHi, שיחות יכולות להתנודד בנוקשות, אבל זה לא אותו דבר כמו צ'אט בשפת האם שלך. גוגל מתכוונת לשנות זאת לחלוטין.
הגישה של גוגל (תרגום מכונה סטטיסטי)
כאשר לומדים שפה חדשה בבית הספר, אנו מתחילים במונחי אוצר מילים בודדים. אבל השפה היא יותר נזילה - מילים צריכות הקשר.
"הגישה [שגוגל] נוקטת היא גישה כללית יותר", אומר ג'וש אסטל, מהנדס תוכנה ב- Google Translate. "במקום לנסות לקודד את כל החוקים הללו, אנו מנסים ללמוד את הכללים על ידי הסתכלות בנתונים."
חברת הטכנולוגיה נמנעת משיטה אחת-לא-אחת, מילה-למילה, ובמקום זאת מעסיקה תרגום מכונה סטטיסטי, כשהיא לא מסתכלת על משמעות המילים אלא כיצד מודלים שפה, אותה היא לומדת באמצעות נתונים . אז הוא מכוון ליער ולא לעצים. דוגמה לאנגלית: אנו מכירים את ההגדרות של המילה "שבירה" ו"עלייה ". אבל הביטוי" להתפרק " אינו הצירוף המילולי של שתי המילים.
תרגום מכונה סטטיסטי מחייב נתונים. הרי זה. כדי שהשיטה תעבוד, היא לא זקוקה רק לעובדה ש"פראג '"הוא צרפתי לגבינה אלא למאה דוגמאות לשני" גשר "וגבינה המשמשים במשפטים בפועל.
אסטל אומרת שאם יש לדוברי אנגלית שני תפריטים, זהים למעט העובדה שהאחד מודפס באנגלית ואחד בסינית, "אתה בטח יכול להבין מה הדמות הסינית עבור 'מרק'." ההקשר הוא המלך. אך כדי ליצור את ההקשר הזה, אתה זקוק לגישה למיליוני תפריטים ולכל מסמך אחר שניתן להעלות על הדעת.
וזה בדיוק מה שיש לגוגל. ללא ענקית הרשת שתאסוף המוני נתונים, דג בבל מעולם האמיתי לא יכול היה להתקיים. זה סורק את האינטרנט ואוסף הכל - טקסט ושמע. לאחר מכן, הוא מזין את הנתונים האלה לאלגוריתמים שמשווים את הכל לכל השאר. השוואות אלה עוזרות להגיע לשורש של איך שפה עובדת באופן טבעי.
"דבר אחד שמפתיע אנשים כשאנחנו מדברים על תרגום הוא שלצוות שלנו אין בלשנים בנושא", אומרת אסטל. "השקנו 71 שפות, והייתי אומר שהצוות שלנו לא יודע לדבר את הרוב המכריע של אלה. מתרגם אנושי לא יוכל ללמוד את כל המונחים והדברים האלה מהר ככל שהנתונים שלנו יכולים ללמוד מהאינטרנט. "
מה הטעם?
כמו גוגל, פייסבוק רואה יתרונות. שקול את התוכן של אתר המדיה החברתית לתרגום.
"המשימה של פייסבוק היא לחבר את העולם כולו, ואחד המחסומים בחיבור העולם הוא לא שכולם מדברים באותה שפה", אומר טום סטוקי, מנהל הנדסה בפייסבוק. "בצד התרגום אני חושב שהחזון השאפתני באמת לעתיד הוא אם אתה יכול להשתמש בפייסבוק בשפת האם שלך ולתקשר עם כל שפה אחרת."
באוגוסט האחרון רכשה פייסבוק את ג'יביגו, אפליקציית תרגום לדיבור, הזמינה למכשירי אנדרואיד ו- iOS.
משתמשי הפייסבוק של Keen יציינו כי האתר החברתי כבר משתמש בתרגום מסוים. אם אי פעם היה לך פוסט ספרדי בדף שלך באנגלית, מיד ניתנה לך ההזדמנות לתרגם אותו לשפת האם שלך.
אבל סטוקי רואה במרכיב הקולי כמחלף משחק פוטנציאלי. עליית הסמארטפונים והטאבלטים מברכת על עולם המחובר זה לזה באופן תמידי, ועליית תוכנת זיהוי הדיבור מזמינה אמצעים חדשים לאינטראקציה ברשת. סטוקי רואה לעצמי עתיד בו משתמשים יכולים פשוט לדבר פקודה לסמארטפונים שלהם ולתקשר עם משתמשים אחרים, תוך הבדלי שפה בצד.
"אין שום ספק שיקרה בסופו של דבר, מכיוון שהמגבלות היחידות שיש הן כוחו של מנוע השפה וכמובן זמן עיבוד וכוח עיבוד, " הוא אומר.
לורה מרפי, פרופסור במחלקה למערכות בריאות ופיתוח עולמיות באוניברסיטת טוליין וספקן טכנולוגי מוכר, מטיל ספק בערך של מתרגם אוניברסלי, ואינו זקוק לדעת יותר משפה אחת.
היא חושבת שהמכשיר יכול להיות שימושי במידה מסוימת ביחסי נסיעות, עסקים ובינלאומיים אך לא פורץ דרך. ברמה מסוימת, יש לנו כבר מתרגמים (אנשים) במקום, ורובם העובדים ביחסי חוץ מכירים את השפות המתאימות. מכשיר, מעריך מרפי, יכול להיות בעל השלכות שליליות.
"אני חושב שזה יכול לגרום לאנשים להתעצל", אומר מרפי. תרגום שפות יכול להיות מאתגר נפשית על ידי אילוץ המוח - במיוחד כזה שיודע יותר משתי שפות - לעבוד בצורה אחרת, אך התרגיל בכל זאת מתגמל. המוח מושך ממקום של אמפתיה לשונית שאפילו המתרגם הקולי הטוב ביותר לא יכול היה להגיע אליה לעולם.
למרות שתקשורת אוניברסלית זו יכולה להיות חיובית, מרפי מכיר בכך, "זה עלול לגרום לאנשים לחשוב שהם מתקשרים כשהם לא." התרבות אינה תמיד מגולמת לחלוטין בשפה (קחו למשל סרקזם), ותקשורת אינה תמיד על המידע שמועבר.
מתי נוכל לצפות בטכנולוגיה זו?
"בשנת 2005 לקח לנו 40 שעות לתרגם 1, 000 משפטים", אומרת אסטל מגוגל. "כיום אנו מתרגמים את המקבילה ל -1, 000 משפטים בכל 10 מילישניות."
כפי שאומר במפורסם ריצ'רד אנדרסון בסדרת הטלוויזיה איש הששים מיליון דולר, "יש לנו את הטכנולוגיה." עכשיו זה רק לחכות לאיסוף וניתוח נתונים. כמה זמן ייקח נותר לא ידוע, לדברי אסטל. אבל הערכות זהירות שמו מכשיר כזה בידינו תוך עשור.
אמנם יוצרי אפליקציות כמו Bossier או חברות ענק כמו גוגל ופייסבוק לא רוצים לבנות גרסאות משלהם למגדל בבל המקראי, אבל הם רוצים לשים קץ לפטפטות. הוא צופה עולם בו כולנו מתקשרים, על רפואה, על פוליטיקה, על רעיונות.
וגם, העולם הזה אולי לא רחוק.
הערת העורך: עדכנו את הסיפור הזה ב- 4 באפריל 2014, כדי לתאר במדויק את הטכנולוגיה Vocre Translate.