האם רובוט יכול להיות מוזיקאי? "הווירטואוז" – סיפור מדע בדיוני מאת הרברט גולדסטון

Image result for herbert goldston maestro

עוד סיפור קלאסי במסגרת פרויקט סיפורי הרובוטים והמכונות החושבות של "יקום תרבות".

האומנם יוכלו רובוטים, או אינטליגנציה מלאכותית כלשהי, לבצע כל מה שיכולים לבצע בני אדם? למשל לנגן מוזיקה במה שייתפס על ידי בני אדם כרגש?

ומה עם להרגיש כמו בני אדם? איך נדע מה הרובוט ״מרגיש״? אם הרובוט יודע לנגן ״ברגש״ ואף מבחין בהבדל בין נגינה ״מכאנית״ לבין נגינה ״מרגשת״, ואולי אפילו מעדיף את הנגינה המרגשת, האם הוא זהה לבן אדם?

ד"ר אמנון סטופ

הסיפור הנבואי הזה הופיע לראשונה במגזין לפנטסיה ומדע בדיוני בפברואר 1953. מאז התפרסם, ואף הופיע בספר לימוד אנגלית בבתי ספר בארה"ב.

כל מה שמתואר בו התגשם מאז. לא עם רובוטים, אלא עם תוכנות מחשב שיכולות לנגן לחנים קיימים וגם ליצור חדשים. רק שורת המחץ המפתיעה לא התגשמה, וספק רב אם תתגשם אי פעם בעתיד…

הרברט גולדסטון (1920-2009), שזהו סיפור המדע הבדיוני היחיד שפרסם, היה עיתונאי, עורך עיתון  ואיש יחסי ציבור ניו יורקי שעסק רבות בפוליטיקה כאיש יחסי ציבו. הוא כתב ומאמרים ומחקרים על מחזאים כמו  צ'כוב שון אוקיסי  וג'ון אוסבורן .ב-2004 פירסם את הרומן The Wisenheimer Machine סאטירה על הבחירות לעיריית ניו יורק.

אלי אשד

הסיפור הופיע בעברית  ב"פנטסיה 2000" מספר 33  ב-1983 תרגום: מוניקה שדה.

ראו עוד:

הקראה של הסיפור "הווירטואוז"

עיבוד למחזה על פי "הווירטואוז"

"לא עבור רובוטים" – מאמר הבוחן את התממשות הסיפור "הוירטואוז" במציאות

מחשבים יוצרים מוזיקה: הערך בוויקיפדיה

אודות אלי אשד

סופר, מרצה ובלש תרבות. פרסם את הספרים "מטרזן ועד זבנג" - סיפורה של הספרות הפופולארית הישראלית" ( "בבל" 2003) ו"הגולם -סיפורו של קומיקס ישראלי" עם אורי פינק ( "מודן" 2003). פרסם מאמרים רבים בעיתונות, בכתבי עת וברשת בנושאי ספרות ותרבות פופולארית, מדע בדיוני, קומיקס ועוד.
הפוסט הזה פורסם בתאריך מדע בדיוני, עתידנות עם התגים , , , , , . קישור קבוע.

תגובה אחת על האם רובוט יכול להיות מוזיקאי? "הווירטואוז" – סיפור מדע בדיוני מאת הרברט גולדסטון

  1. מאת אלי אשד:‏

    הסיפור ה"וירטואוז" מתגשם במציאות .כפי שמראה הכתבה הזאת שפורסמה ב"הארץ":
    http://www.haaretz.co.il/gallery/music/.premium-1.3150496
    האם בקרוב למחשב תהיה נשמה?

    ניסויים בבינה מלאכותית מתרחשים כבר משנות הארבעים, אך עד העשור האחרון התחום לא הצליח לממש את ההבטחה. בשנים האחרונות היכולת ליצור "רשת עצבית מלאכותית" במחשבים השתפרה פלאים, מה שמאפשר לתוכנות למלא תפקידים שנתפשו עד כה כאנושיים לחלוטין, כמו הלחנת שירים

    12.12.2016 21:48
    עודד ירוןאיור: ליאו אלטמן

    בשנים האחרונות אנחנו נתקלים בבינה מלאכותית בכל מקום. החל במכוניות האוטונומיות של גוגל, טסלה ושלל יצרניות אחרות; דרך העוזרת האישית הווירטואלית "סירי", היכולה להזמין לנו מונית לפי פקודה קולית; וכלה בווטסון של IBM, שמאז הניצחון על מתמודדים אנושיים בשעשועון ג'פרדי, כבר הספיק להיות משולב בפרויקטים רפואיים המנסים להתמודד עם מחלת הסרטן ובשלל יישומים נוספים. כל אלה הן יכולות מרשימות, אך טכניות במהותן. עתה מבקשות ענקיות הטכנולוגיה לתת לבינה המלאכותית למלא את תפקידם של בני האדם גם במלאכות שנתפשו עד כה כאנושיות לחלוטין. הלחנת שירים, למשל.

    כך, במעבדת CSL של "סוני" הופקו כבר כמה שירים בסגנונות מוזיקליים (כמעט) מובחנים. שיר אחד שואב את השראתו מהביטלס, בעוד שאחר משלב בין יוצרים כמו ארווין ברלין, ג'ורג' גרשווין ודיוק אלינגטון. התוצאות אמנם לא מושלמות, אך במקרה דנן הדרך היא החשובה. איך תוכנה יכולה לקבל השראה? התשובה היא טכנולוגיה מתחום הלמידה החישובית, הנקראת "רשת נוירונים" (או "רשת עצבית מלאכותית") — אלגוריתמים שבאמצעותם מנסים חוקרים לחקות את פעילות המוח האנושי. במקום להזין לתוכנות פקודות, האלגוריתמים לומדים אותן בעצמם באמצעות דוגמאות. המון דוגמאות. הרשת העצבית מבוססת על מספר שכבות עיבוד; הראשונות מזהות במידע המוזן אליהן אלמנטים ספציפיים ומוגדרים מראש, וככל שמתווספות עוד ועוד שכבות עיבוד לומד האלגוריתם לזהות ולסווג אובייקטים שלמים, כמו למשל לזהות כשיש בתמונה כלב או לזהות תווי פנים ספציפיים.
    אבל המחקר בבינה מלאכותית והמודלים של רשתות נוירונים הם לא חידוש גדול. חלוץ הבינה המלאכותית ארתור סמואל יצר כבר ב-1956 תוכנה שלמדה לשחק דמקה בעצמה, ובשנים מאז היו אינספור מחקרים שקידמו את התחום. גם הרעיון של רשתות נוירונים נולד כבר בשנות ה-40, אבל במשך שנים התחום לא הצליח לממש את ההבטחה שהיתה טמונה בו.

    חוקרים בתחום אפילו דיברו על "החורף של הבינה המלאכותית" משנות השבעים ועד לתחילת שנות התשעים. אם כי חוקרים שונים כמובן מגדירים את התקופה אחרת.

    לצד האלגוריתם הלומד, בני אדם מסייעים עם כמה הנחיות קלות, זאת כדי להימנע משגיאות פשוטות כמו נגינה אטית מדי, חזרות על צלילים ועוד

    הפיתוחים הטכנולוגיים של בינה מלאכותית יוצרים את הדור הבא של הפשיעה 28.10.2016 כתבה זאת זמינה למנויים בלבד
    רק בעשור וחצי האחרונים, ובחמש השנים האחרונות במיוחד – חוזר הצבע ללחיים של חוקרים, חברות ומשקיעים בתחומים כאלה. זאת מפני שבשנים האחרונות, הולכת וצוברת תאוצה גרסה מתקדמת יותר של הטכנולוגיה שמכונה "למידה עמוקה" – שבה יש מספר גדול יותר ויותר של שכבות עיבוד של נוירונים. קפיצת הדרך החשובה ביותר בוצעה ב-2012, כאשר הפיתוח של החוקרים ג'פרי הינטון, אלכס קריז'בסקי ואיליה סוצקבר ניצחו בתחרות אימג'נט, שבה התוכנה נדרשה לזהות 1.5 מיליון תמונות.

    בין הדברים שהקשו על ההתפתחות בעשורים הקודמים היו כוח המחשוב והקושי לאסוף ולהתמודד עם כמויות הדוגמאות הדרושות. הפתרון לכך התפתח בשנים האחרונות בזכות העלייה בכוח חישוב גדול, והזמינות והכמות האדירה של דאטה (נתונים והיכולת לנתח אותם), כפי שהסביר ל"הארץ" ד"ר יונתן לזרסון, אלגוריתמאי בכיר בחברת זברה מדיקל ומומחה ללמידת מכונה. במידה רבה בזכות ההתפתחות של הכרטיסים הגרפיים, שמצוינים בעיבוד מקבילי (המפצל את הטיפול במטלה חישובית לכמה ליבות במקביל). הם אפשרו להאיץ את החישובים פי 30 בערך.

    האלגוריתם המוזיקלי של סוני, למשל, מסתמך על 13 אלף דפי תווים שמהם הוא שואב את המידע, ולאחר מכן מיישם את הידע הזה על פריטים חדשים אליהם הוא נחשף. "החברות עוברות להשתמש ברשתות עצבים עמוקות שנותנות יכולות שלא היו זמינות קודם לכן", מסביר ל"הארץ" ד"ר איל גרוס, חוקר למידת מכונה ואמן דיגיטלי. "זה מה שעורר מחדש את העניין בתחום הבינה המלאכותית — במוזיקה ותחומים רבים אחרים".

    הביטלס. מעבדות הבינה המלאכותית של "סוני" הפיקו חיקוי בינוני וסביר
    הביטלס. מעבדות הבינה המלאכותית של "סוני" הפיקו חיקוי בינוני וסביר אי־פי
    גם "גוגל" ניסתה את כוחה בהלחנת שירים, אולם בניגוד לסוני היא אינה מסתמכת רק על חומר כתוב, אלא נעזרת ביצירות מוזיקליות קיימות. "התעסקות עם תווים קלה יותר מפני שמדובר במידע שמרכיביו נפרדים ומובדלים זה מזה", אומר גרוס, ומציין כי פתרונות בינה מלאכותית מזן זה קיימים כבר "לא מעט שנים".

    לדברי החוקר דגלאס אק, לפרויקט "מג'נטה" יש שתי מטרות: לקדם את הבינה המלאכותית לכדי יצירת מוזיקה ואמנות, ולבנות קהילה של אמנים, מתכנתים וחוקרי למידה חישובית
    לטענת גוגל, התוכנה שפיתחה, "WaveNet", קובעת סטנדרט חדש בתחום תוכנות ההקראה (Text To Speech) ובכוחה לחקות קול אנושי — המוכר משירותי התרגום האוטומטי של החברה — לכדי דיבור רציף בדיוק של 50% יותר מן הנהוג כיום. בעזרת טכנולוגיה זו מסוגלת גוגל לצרף אותות שמע אחרים כגון נגינת פסנתר, ולחבר מנגינות ללא התערבות אנושית. "מה שהצליחו לעשות לאחרונה עם WaveNet זה לעבוד עם מידע מאודיו — ולא סתם מידע, אלא כזה שלא עבר אנליזה מקדימה (Raw audio)", אומר גרוס. הרזולוציה של מידע כזה גבוהה מאוד, ודורשת דגימה של מאות אלפי ביטים בשנייה, ולפיכך גם עוצמה חישובית אדירה. התוצאה מרשימה בהתאם, ומדמה סאונד אמיתי.

    "דברים כמו מוזיקה, וידיאו ודיבור הם סדרות זמן — בניגוד לתמונות, יש להם תלות ברצף ההיסטורי שלהם", מסביר גרוס. "כמו כן, מוזיקה היא הרבה פעמים מרובת ערוצים. כלומר, יש מספר סדרות זמן במקביל וכל אחת תלויה בהיסטוריה של כל האחרות".
    קהילת אמנים
    בחודש יוני האחרון השיקה גוגל את פרויקט "מג'נטה", המנסה לענות על השאלה "האם אנחנו יכולים להשתמש בלמידה חישובית כדי ליצור אמנות ומוזיקה מרגשות?". לדברי החוקר דגלאס אק, לפרויקט יש שתי מטרות: לקדם את הבינה המלאכותית לכדי יצירת מוזיקה ואמנות, ולבנות קהילה של אמנים, מתכנתים וחוקרי למידה חישובית, שישתמשו בתוכנת "TensorFlow" של החברה.

    בחודשים שחלפו מאז, התקדמו אק ונטשה ז'אק, מתמחה בחברה, בפיתוח. זאת על ידי שימוש בגישה שמכונה "למידה מתוגברת" — שם יפה לשילוב של האלגוריתם של WaveNet עם כמה עקרונות בסיסיים בהלחנת מוזיקה. כלומר, לצד האלגוריתם הלומד, בני אדם מסייעים עם כמה הנחיות קלות, זאת כדי להימנע משגיאות פשוטות כמו נגינה אטית מדי, חזרות על צלילים ועוד. באתר "Technology Review" נטען כי המערכת החדשה מקבלת ציון חיובי בכל פעם שהיא מייצרת רצף תווים שלא רק דומה לדפוסים שבהם הבחינה בשירים שהוזנו אליה, אלא גם שומרת על החוקים המוזיקליים שניתנו לה. "אלה חוקים פשוטים שנלקחו מספרי לימוד להלחנה", כתב אק בבלוג החברה. "השילוב של החוקים האלה עם למידה מתוגברת, והגיוון של של אלפי מלחינים אנושיים, נותן לנו שירים קליטים. הם נוגעים בדיוק בנקודה".

    האם כל זה אומר שמלחינים יכולים לצאת לפנסיה? האם אפשר להתחיל לדבר על מכונות מוזיקה יצירתיות? "ממש לא", משיב גרוס. "אנחנו רק בהתחלת הניסיון לעשות דברים שדומים למוזיקה אנושית. מה שכן, אולי אנשים שהם לא מלחינים יקבלו כלים שיעזרו להם ליצור מוזיקה". על הנקודה האחרונה הוא מתעכב. "לשיטתי", הוא מוסיף, "צריך להתייחס לטכנולוגיות האלו בתור כלים, ובשימוש בכלים יש לא מעט בחירות אמנותיות. למשל, כל השיטות של רשתות עצביות ולמידה חישובית ניזונות מדוגמאות, והדוגמאות הללו קובעות את אופי התוצאה".

    גם המערכת של "סוני" לא פעלה בחלל ריק. מוזיקאי בשם בנואה קארה בחר את הסגנון המוזיקלי המתאים, כתב את הטקסט, סייע בהפקה ובעצם היה מעורב בכל שלב כמעט של יצירת השירים. "הרשת העצבית מוציאה הרבה תוצאות, אך בסוף יש אדם שבוחר ואוצר את השירים הטובים והרלוונטיים", מסכם גרוס. "אלון עמית, שכתב מחוללי שירה ממוחשבים בשנות ה–90, דימה את זה לצלם. הוא אמנם לא ברא את הטבע או תכנן את העיר, אבל הוא זה שבוחר מה לצלם ואיך למקם את המצלמה — וזו בחירה אמנותית". וכאן, נותר האדם עליון על פני הבינה המלאכותית. בינתיים.

    —————————————————

    מבקר המוזיקה של "הארץ", בן שלו, על השירים הממוחשבים
    מכירים את הסצינה הזאת בסדרות אמריקאיות גרועות, שבה הנער הרגיש שמנגן בפסנתר וכותב שירים למגירה מרהיב עוז והולך לאודישן אצל הלהקה הכי מגניבה בתיכון? הוא מתיישב ליד הקלידים, מול פרצופיהם המגחכים של המתופף והגיטריסט הסופר־קולים, ומתחיל לנגן באצבעות מהססות. המלודיה היא מהזן הלעוס ביותר, אבל חברי הלהקה, שבעצמם מנגנים מוזיקה קיטשית, עפים עליה. הם מתחילים לזוז לפי הקצב, מחליפים ביניהם מבטים שאומרים "בוא'נה, לחנון יש את זה", המתופף לוקח את המקלות ומתחיל לנגן, הגיטריסט פורט אקורדים והזמרת מחייכת אל הנער הקלידן בצורה שרומזת על התפתחות רומנטית בפרק הבא (כרגע היא עדיין חברה של הגיטריסט). זהו, החנון עשה את זה, והכל בזכות כישרונו המוזיקלי (המוטל בספק, אבל לא חשוב).

    הקטע המוזיקלי של גוגל
    הסצינה הזאת עלתה במחשבה לשמע הקטע המוזיקלי בן הדקה וחצי שחשפו אנשי הבינה המלאכותית של "גוגל" לפני כמה חודשים. זהו התוצר הראשון של פרויקט "מג'נטה", ששואף ללמד מחשבים ליצור אמנות, והוא הולחן על ידי מחשב ללא שום סיוע אנושי. איך הוא נשמע? פחות או יותר כמו המנגינה שגאלה את הנער הטלוויזיוני מחנוניותו והפכה אותו לכוכב התיכון. כמה אקורדים משומשים שמשרים אווירה של אופטימיות שטחית ועליהם מלודיה שנגזרת מהם בצורה הכי צפויה. אחר כך יש התפתחות: המנגינה הבנאלית נהפכת לבנאלית וגם עצית במיוחד, ואז חוזרים לפתיחה הבנאלית בלבד. אם זאת פסגת ההישגים של הבינה המלאכותית בתחום ההלחנה, יעברו עוד הרבה מאוד שנים עד שהמחשב ינצח את מקבילו המוזיקלי של גארי קספרוב.

    כמה חודשים לאחר מכן, נחשפו שני שירים שנוצרו במעבדות הבינה המלאכותית של חברת "סוני" בפריז. בניגוד לקטע האינסטרומנטלי של גוגל, השירים של סוני כוללים לא רק לחן עירום, אלא גם מלים ועיבוד. הלחן הוא עבודה של מחשב, למלים ולעיבודים אחראים אנשים, מוזיקאים.

    אם נחשוב על שני השירים האלה כסינגל בעל שני צדדים, צד א' הוא שיר שנקרא "Daddy's car" והוא הולחן על ידי מחשב בסגנון הביטלס. גם העיבוד — שהוא מעשה ידי אדם, נזכיר — נעשה על פי פרמטרים ביטלסיים כגון הרמוניות קוליות, מה שהופך את התוצאה לחביבה בהכרח, אבל מקשה על האוזן להתמקד בלחן ולנסות להבין עד כמה הצליח המחשב. בעוד שהבית כושל לחלוטין, ככל שהשיר מתפתח מתהווה לה איזו תנועה מלודית והרמונית נאה. זה נשמע כמו חיקוי ביטלס אנושי לא רע, מה שמחזק את הרושם שההבחנה המהותית, לפחות מהבחינה האמנותית, היא לא בין שירים שמולחנים על ידי אדם לבין שירים שמולחנים על ידי מחשב, אלא בין שירים שמולחנים על ידי מוזיקאים נפלאים ומקוריים לבין שירים שמולחנים על ידי מוזיקאים בינוניים או על ידי מחשב.

    צד ב' ב"תקליטון" הבכורה של הבינה המלחינתית הוא שיר שנקרא "Mr. Shadow". זה שיר מעניין יותר מ"המכונית של אבא". הפעם הכוונה היתה כתיבה ג'זית מתוחכמת בהשראת יוצרים מהמחצית הראשונה של המאה ה–20. אלא שהמוזיקאים של סוני תפרו לשיר הזה עיבוד עכשווי, דיגיטלי, שבו הקול השר לובש דמות של מעין סייבורג. אם בשיר הביטלסי היה קשה להפריד בין הלחן לעיבוד, בין המחשב לאדם, כאן בלתי אפשרי לעשות את זה. אבל כשיר היברידי של מחשב־אדם הוא נשמע די טוב. מעניין. אף אחד לא היה מרים גבה אם הוא היה מופיע, למשל, באלבום האחרון של "בון איבר". את החנון מהסדרה האמריקאית, לעומת זאת, אין סיכוי שהוא היה מעביר אודישן.

כתיבת תגובה

האימייל שלך לא יוצג בבלוג. (*) שדות חובה מסומנים

*

תגי HTML מותרים: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

*