בחירת העורך

‎קורא‫/‬ת‫:‬

פריצת דרך בבינה המלאכותית: תוכנה שלמדה לבדה ויצרה ...

פריצת דרך בבינה המלאכותית: תוכנה שלמדה לבדה ויצרה ידע עצמאי

,
תחום הבינה המלאכותית כבר רשם אמנם הישגים בשנים האחרונות, אך בזמן האחרון חברת בת של גוגל חשפה פריצת דרך מרשימה, כאשר בינה מלאכותית לימדה את עצמה מיומנויות ללא עזרה חיצונית כלל. כיצד נראתה הטכנולוגיה בשלביה הראשונים, ולאן פנינו בעתיד?

הפרספטרון של רוזנבלט

בשנות החמישים פסיכולוג בשם פרנק רוזנבלט, המציא רכיב אלקטרוני שנקרא פרספטרון. באופן פעולתו חיקה הפרספטרון את פעולת הנוירונים במוח. הפרספטרון מסוגל לקלוט אותות חשמליים מפרספטרונים אחרים, ולהעביר בתגובה אות חשמלי ביציאה המחוברת לפרספטרון נוסף. רוזנבלט קיווה שניתן יהיה לחבר מספר רכיבים שכאלו אחד לשני, וליצור באמצעות כך "רשת נוירונים" שתהווה סוג של מוח פרימיטיבי. רוזנבלט בנה רשת נוירונים שכזו מרכיבים אלקטרוניים, וליצירתו קרא MARK1. הקלט היה מורכב מ-400 משבצות של חיישנים פוטואלקטריים, עליהם ניתן "לצייר" צורה כל-שהיא. ניתן היה לכייל את רגישות החיבור בין כל שני פרספטרונים, כך שפרספטרון מסוים יהיה רגיש מאוד לאות המגיע מכניסה אחת, אך אדיש יותר לאות המגיע מכניסה אחרת. באמצעות כיול הרגישות בין כל שני פרספטרונים ניתן היה ללמד את הרשת להוציא פלט עבור קלט מסוים. רוזנבלט הצליח ללמד את רשת הנוירונים לזהות צורות של מלבנים שצוירו על רשת הקלט של 400 המשבצות. בכל פעם רוזנבלט הזין דוגמא, וכייל את החיבורים בין הפרספטרונים עד שקיבל את התוצאה הרצויה. בסוף התהליך, המערכת ידעה להציג אות כאשר הוזן לה מלבן. במילים אחרות, היא ידעה לזהות מלבנים.

רוזנבלט הדגים הוכחת היתכנות לרעיון שנראה היה בדיוני באותה מידה שהיה עתידני – רכיבים אלקטרוניים, אשר חיבורם יחד יהווה מעין מוח מלאכותי. כדי להבין את גודל ההישג, חשוב לזכור את הרקע הטכנולוגי של התקופה. בשנות החמישים מחשבים היו גדולים יותר ממקררים; לא חוברו אליהם מקלדות וגם לא היו להם מסכים – אלו חידושים שיגיעו מאוחר יותר. הקלט בוצע באמצעות כרטיסיות מיוחדות, ואילו הפלט באמצעות מדפסת. אף על פי כן, לא עבר זמן רב עד שרוזנבלט הבין שבמקום לבנות את רשת הנוירונים, ניתן לדמות אותה במחשב – שימוש באלגוריתם, שידמה את פעולתה של הרשת, יחסוך את המאמץ הכרוך בחיווט ובכיול של הרכיבים הפיזיים. כיום, "פרספטרון" ידוע כשמו של האלגוריתם, ואילו הרכיב הממשי הפך לפריט היסטורי נשכח. מבקריו של רוזנבלט טענו שתהליך הלמידה והכיול הוא בעצם משחק אקראי בפרמטרים, וגם לאחר תהליך הלמידה, כאשר הרשת עובדת כמצופה, קשה מאוד להסביר מדוע וכיצד בדיוק היא עובדת. ההתלהבות מהטכנולוגיה החדשנית התחלפה באכזבה, כאשר עשורים שלמים לאחר מכן עדיין לא חלה שום התקדמות מרשימה ביכולותיהן של רשתות נוירונים מלאכותיות. כאשר רשתות נוירונים מלאכותיות יהפכו שוב למוקד עניין, החוקרים שיפרסמו את תוצאות מחקריהם יקראו לטכנולוגיה בשם חדש – "למידה עמוקה" – כדי להימנע מהסטיגמה השלילית.

"כחול עמוק" ואלפא-גו

ב-1997 אלוף השחמט, גארי קספרוב, שיחק כנגד מחשב-העל של IBM, "כחול-עמוק", שנבנה ותוכנת במיוחד כדי לשחק שחמט. כחול-עמוק לא היה רשת נוירונים, אלא מחשב-על סטנדרטי, אם ניתן בכלל לכנות מחשב-על בתואר "סטנדרטי". לאחר חמשת המשחקים הראשונים נראה היה שהכוחות שקולים: שני משחקים הסתיימו בניצחון של אחד הצדדים – פעם של קספרוב ופעם של כחול-עמוק – ושלושה משחקים הסתיימו בתיקו. אולם, לקספרוב הייתה הבנה מסוימת לגבי אופן פעולתו של כחול-עמוק. לפיכך, את המשחק השישי והמכריע הוא פתח במהלך ששם אותו בעמדת נחיתות, אך דובר על מהלך שהמחשב אמור היה להתקשות בהתמודדות איתו; או שכך לפחות האמין קספרוב. להפתעת כולם, כחול-עמוק ניצח את המשחק וקבע נקודת ציון היסטורית. קספרוב טען שהוא זיהה במהלכיו של המחשב תבונה ויצירתיות, המעידים על כך שיד אנושית כיוונה את כחול-עמוק מאחורי הקלעים. ב-IBM הכחישו את הטענות למרמה מכל וכל, כמובן. קספרוב דרש תחרות נוספת, אךIBM סירבו.

לעומת משחק השחמט, "גו" הוא משחק לוח שמקורו בסין העתיקה. הקהל הישראלי עשוי להכיר גרסה מאוד מופשטת של גו, אשר שווקה תחת השם "רברסי". ישנם מספר מדדים למידת מורכבותם של משחקי לוח – מספר המצבים האפשריים, מספר המהלכים האפשריים ומספר רמות המיומנות הקיימות. על פי מדדים אלו משחק ה-גו מורכב הרבה יותר משחמט; אולי זו הסיבה שמחשב הצליח להביס אלוף שחמט כבר ב-1997, אך מאז עברו כמעט שני עשורים נוספים עד שמחשב הצליח להביס אלוף גו. ראוי לציין ששחקני גו מדורגים באותו סולם דרגות הנהוג באומנויות לחימה; הסולם מתחיל בדרגות הנקראות "קיו" עבור מתחילים, וממשיך בדרגות "דאן" עבור מתקדמים, כאשר הדרגה הגבוהה ביותר עבור מקצוענים היא דאן-9. פיתוח מערכת בינה מלאכותית, שתשחק גו ברמה הגבוהה ביותר, נחשב לאתגר קשה במיוחד. אולם "דיפמיינד", חברת בת של גוגל, לקחה על עצמה את האתגר ופיתחה מערכת בשם "אלפא-גו".

למנוע הבינה המלאכותית של אלפא-גו הוזנו 160 אלף משחקים ששוחקו על ידי שחקנים מקצוענים, מהם היא למדה את המיומנויות הבסיסיות. לאחר מכן, נתנו החוקרים למערכת ה-אלפא-גו לשחק נגד עצמה. כפי שאחד היוצרים של אלפא-גו אמר: "למרות שתכנתנו את המכונה לשחק, אין לנו מושג אילו מהלכים היא תבצע. מהלכיה הם תופעה שנובעת מהאימון. אנו רק יוצרים את מערכות הנתונים והאלגוריתמים לאימון, אך המהלכים שהיא בוחרת בהם הם מחוץ לשליטתנו, והרבה יותר טובים משיכולנו אנחנו, כשחקני גו, להסיק".

לי סדול הוא שחקן גו מדרום-קוריאה, אשר הפך למקצועי כבר מגיל 12. אמנם אין דירוג אחד מוסכם, אך על פי אחד הדירוגים סדול מדורג במקום הרביעי בעולם. ב-2016 גוגל הציעה לסדול פרס של מיליון דולר, אם יצליח לנצח את אלפא-גו. שחקני גו מקצועיים הכירו את תוכנות הגו הטובות ביותר של התקופה, ושיערו שייקח עוד עשור לפחות עד שתוכנה תוכל לשחק ברמה של דאן-9. כולם ציפו שלי סדול ייצא מהתחרות הזו עם מיליון דולר ביד.

אולם ה-אלפא-גו הכתה את עולם חובבי הגו בתדהמה, כאשר הביסה את לי סדול בתחרות של חמישה משחקים. לאחר התחרות, סדול טען שאלפא-גו ביצעה מהלכים שאף שחקן אנושי לא היה מבצע. בזמן המשחק פרשנים נותרו מבולבלים לעיתים מהמהלכים של אלפא-גו, שנראו לכאורה חסרי פשר, אך כאשר המשחק התקדם נחשף ההיגיון שמאחוריהן. אלפא-גו ניצחה בשלושת המשחקים הראשונים. במהלך ההתמודדות זיהה סדול ביריבתו סגנון משחק שמעדיף לאסוף הרבה נצחונות קטנים ובטוחים על פני מהלכים גדולים ומסוכנים. במשחק הרביעי סדול נקט בטקטיקה שלא אפשרה לאלפא-גו לאסוף ניצחונות קטנים, והכריחה אותה לחשוב בגדול במקום. סדול ציפה שזו תהיה נקודת החולשה שלה, והוא אכן ניצח את המשחק הרביעי. בוודאי היו בקהל צופים רבים שנשמו לרווחה במחשבה שסדול מצא את נקודת התורפה של המחשב, ושגו נותר כמשחק בו הבינה האנושית עדיפה על זו המלאכותית. אולם אותה הטקטיקה לא עבדה שוב, ובמשחק החמישי סדול הפסיד לעיניהם המשתאות של 100 אלף צופים בשידור ישיר.

הגרסה הבאה של אלפא-גו המשיכה לשחק באמצעות רשת האינטרנט מול אלופי גו, שבתחילה לא היו מודעים לכך שהשחקן הקורא לעצמו "מאסטר" הוא בעצם בינה מלאכותית. מאוחר יותר צצו חשדות שמדובר במחשב, כיוון שמאסטר לא נח בין משחק למשחק. לאחר שמאסטר ניצח 59 משחקים ברצף, מול שחקני הגו הטובים בעולם, מפעיליו חשפו את האמת – שלא מדובר בשחקן בשר ודם. דיפמיינד, החברה שבנתה את אלפא-גו, זימנה את קה ז'י, המדורג כשחקן הגו הטוב בעולם, למשחק מול אלפא-גו וניצחה אותו 3-0. לאחר מכן, איגוד סיני של שחקני גו העניק לאלפא-גו את הדרגה דאן-9. צוות אלפא-גו פרסם 50 משחקים שאלפא-גו שיחקה כנגד עצמה כמתנה וכהוקרה לקהילת שחקני הגו. מומחי גו התרשמו מסגנון המשחק יוצא הדופן של אלפא-גו, ותיארו אותו כסגנון "לא אנושי". קה ז'י אמר: "לאחר שהאנושות בילתה אלפי שנים בשיפור הטקטיקה, מחשבים אומרים לנו שבני האדם טועים לחלוטין […] ארחיק ואומר שאף לא אדם בודד נגע בקצה האמת של גו".

אלפא-גו-זירו

"אם הרחקתי ראות, היה זה משום שעמדתי על כתפי ענקים", אמר אייזיק ניוטון. ניוטון נרשם בדפי ההיסטוריה כמדען גאון ופורץ דרך, אך הוא לא המציא הכל מאפס. ניוטון נולד לתוך עולם שכבר היו בו מדע, מתמטיקה ואסטרונומיה. החידושים שהביא ניוטון היו אבנים נוספות, המונחות בראש מגדל הידע האנושי ונשענות על כל האבנים שמתחתיהן. באופן דומה, אדם הלומד לשחק שחמט או גו לא נאלץ להמציא הכל מחדש; ישנם ספרים רבים המכילים מידע על יתרונותיהן וחסרונותיהן של שיטות ואסטרטגיות שונות. גם אלפא-גו למדה בתחילה מתוך מסד נתונים של משחקים מקצועיים, ורק לאחר מכן החלה לתרגל וללמוד ממשחקים נגד עצמה. בדיפמיינד שאלו את עצמם מה יקרה אם במקום ללמד את הבינה המלאכותית, פשוט יתנו לה להתחיל מאפס; הדבר היחיד שהיא תדע מראש הוא את חוקי המשחק. כל מיומנויות המשחק יילמדו אך ורק מתוך הניסיון שלה במשחק נגד עצמה. ובכן, המטרה הייתה לבחון האם היא תוכל להתחרות בבינה מלאכותית הנשענת על מיטב הידע הקיים? לגרסה הזו, המתחילה מאפס, הם קראו "אלפא-גו-זירו", ובשבוע שעבר פרסמו אנשי דיפמיינד מאמר שחשף את התוצאות.

היוצרים של אלפא-גו-זירו נתנו לה לשחק נגד עצמה במשך שלושה ימים. בזמן זה אלפא-גו-זירו הספיקה לשחק קרוב ל-5 מיליון משחקים. בהשוואה, גרסת האלפא-גו, שניצחה את לי סדול, עברה אימון במשך מספר חודשים. בתחילה, מהלכיה של אלפא-גו-זירו היו אקראיים לחלוטין, אך ככל ששיחקה יותר משחקים כך היא השתפרה, וממהלכיה נראה היה שהיא המציאה – בכוחות עצמה לחלוטין – טקטיקות ומושגים שנמצאו בשימוש בקרב שחקני גו אנושיים. יתרה מזאת, היא המציאה גם אסטרטגיות שלא היו ידועות לשחקני הגו המסורתי. לעיתים, הסדר בו אלפא-גו-זירו למדה את הטקטיקות היה מפתיע ושונה ממה ששחקנים אנושיים היו מצפים.

קיימת תבנית מסוימת במשחק, הנקראת "סולם". היא נחשבת לבסיסית, אך אלפא-גו-זירו למדה אותה רק בשלב מתקדם יחסית. תוך שלושה ימים בלבד הצליחה אלפא-גו-זירו להגיע לרמה בה היא מנצחת את קודמתה, אלפא-גו. לאחר ארבעה ימים היא כבר הביסה אותה, תוך יצירת מאזן של 100 ניצחונות אל מול 0 הפסדים. אלפא-גו-זירו ניצחה, למרות שהתבססה על חומרה חזקה פחות מזו של אלפא-גו, ועל אף שתהליך הלמידה של אלפא-גו היה ארוך הרבה יותר – מספר חודשים לעומת מספר ימים. בהמשך, אלפא-גו-זירו שיחקה גם כנגד הגרסה הטובה ביותר של קודמתה, גרסת ה"מאסטר". מאסטר, כאמור, ניצחה 60 משחקים מתוך 60 כנגד שחקני הגו הטובים ביותר בעולם. אולם כנגד גרסת המאסטר, המאזן היה 89-11 לטובת ה-אלפא-גו-זירו.  דמיס האסביס, המייסד של דיפמיינד, טען כי אלפא-גו-זירו היא כל-כך חזקה, משום שאיננה מוגבלת על ידי גבולות הידע האנושי.

הסינגולריות והאוורסט

מאז פריצת הדרך הטכנולוגית בה בני אדם גילו שיטות להדליק אש, אנו מתכננים ובונים כלים ומערכות שונות. נדמה שקצב ההתקדמות רק הולך ומתגבר. תיאוריית "הסינגולריות" גורסת כי בשלב בו תיווצר בינה מלאכותית מתוחכמת יותר מזו של בני האדם, היא תוכל לתכנן בינה מלאכותית טובה ממנה, שגם היא בתורה תתכנן את היורשת שלה, וכן הלאה. לפי התיאוריה, כשזה יקרה תהיה לבינה המלאכותית יכולת לחדש בכל תחומי המדע, וקצב ההתקדמות הטכנולוגית יהיה כה גדול עד שאף אחד לא יכול לשער כיצד ייראו החיים בתקופה שכזו.

אי שם במהלך ההיסטוריה, ישב מתכנת מול מחשב וכתב קוד שידע לנצח משחק של איקס-עיגול. משם והלאה, ככל שהטכנולוגיה הלכה והשתכללה, מערכות ממוחשבות למדו לנצח את טובי השחקנים במגוון הולך וגדל של משחקים. שחמט הוא משחק מורכב מאין כמוהו, אך גו הוא פסגת המורכבות, והמעוז האחרון שנותר לשחקנים בני אנוש אל מול המכונה. לו היו לאלפא-גו רגשות, היא בוודאי הייתה מוצאת את עצמה כמטפס הרים שכבש את פסגת האוורסט; כאשר בעודו מסתכל סביב, תחושת הניצחון מפנה מקום לתחושה אחרת – "מה עכשיו?", היא בוודאי הייתה שואלת את עצמה. למעשה, ייתכן שעבור בינה מלאכותית, פסגת האוורסט היא רק ההתחלה.


קרדיט תצלום:
Penn State
שתף:
 
  • דביר ווי

    עוסק בתחום ה-BI, בעל תואר ראשון בחשבונאות, ובלוגר על כלכלה ועסקים.