https://frosthead.com

כיצד GPS לומד לדבר את השפה שלך

קארן ג'ייקובסן, זמרת ושחקנית קול אוסטרלית, קיבלה את המופע בשנת 2000, זמן קצר לאחר שהגיעה לניו יורק. המפיקים - טיפוסים של חברות - שלחו אותה לאולפן הקלטות במשך שלושה שבועות, שם בילתה ארבע שעות ביום באמירת דברים כמו "בצומת הבא, פנה שמאלה" ו"חישוב מחדש. "בסופו של דבר זה לא היה הקול שלה זה היה מתוח. "אמרתי 'בערך' 186 פעמים בערך", נזכר ג'ייקובסן. "סוג כזה יכול לגרום לך להשתולל."

תוכן קשור

  • מתלמי ל- GPS, ההיסטוריה הקצרה של מפות

שנתיים אחר כך היא קיבלה טלפון מחבר. "קארן, " פלט חבר שלה. "קניתי לבעלי את אחד הדברים החדשים ב- GPS, ושמנו אותו על הקול האוסטרלי. זה אתה! "כך גילה ג'ייקובסן כי קולה נותן הנחיות ל -400 מיליון אנשים ברחבי העולם.

עבודותיה מדגישות את ההכלאה של הדם והטכנולוגיה שנכנסת לקולות הנמצאים בכל מקום ואומרים לנו לאן לפנות: יותר ממיליארד אנשים מסתמכים על מפות גוגל בכל חודש, ו -80 אחוזים מפעילים את אפשרות הקול.

בימיו הראשונים של סינתזה קולית - חשבו על הצלילים הרובוטיים של Speak & Spell של סוף שנות השבעים - אלגוריתם המיר טקסט לזרם מונוטוני. ואז, ככל שגדלו מאגרי מידע, אפשר להקליט שחקן קול כמו ג'ייקובסן שמכריז קורפוס של הברות ומילים, אילו אלגוריתמים ישלבו וישתנו על פי כללים בסיסיים. לאחרונה, קודאי תוכנה בחברות כמו Nuance, המתכננת ממשקי ניווט למכוניות, פיתחו גישה שלישית - הפעלת למידה מעמיקה על סינתזת דיבור. זה מערבב מילים מוקלטות וקטעי טקסט מסונתזים, תוך הסתמכות על בינה מלאכותית כדי להפוך את ההגייה לאנושית עוד יותר. "הם נשמעים טבעיים באופן לא מסויים, " אומר קצין הטכנולוגיה הראשי של נואנס, ולד סג'ונה.

כמובן שמוזרויות השפה נותרות אתגר עבור מערכות קול. דובר גוגל אומר "" חשוב 'להתמודד' מול 'קנה', או 'לקרוא' לעומת 'לקרוא'. "אבל אני מקווה שהמשתמש תמיד יכול לנחש למה התכוונו." כעת, כאשר AI מלמד מערכות של חילוף מכוניות לדבר בצורה חכמה יותר, בשלב הבא הוא יחפש את העולם המקוון ויבין לאן אתה רוצה ללכת עוד לפני שתעשה זאת.

Preview thumbnail for video 'Subscribe to Smithsonian magazine now for just $12

הירשמו עכשיו למגזין סמיתסוניאן תמורת 12 דולר בלבד

מאמר זה הוא מבחר מתוך גיליון יולי / אוגוסט של המגזין סמיתסוניאן

קנה
כיצד GPS לומד לדבר את השפה שלך