Reinforcement Learning – מאיפה מתחילים?
Reinforcement Learning היא תת תחום של Machine Learning בה ניתן לפתור בעיות בעזרת ביצוע סימולציות ממוחשבות. נשמע כמו מציאות מדומה? אנחנו לא רחוקים משם… MathWorks מציעה לכם קורס מקוון חינמי חדש בו תוכלו ללמוד בקלות איך ניתן לעשות את זה
איך גורמים לרובוט ללכת ישר? כמה מומנט נידרש להפעיל על מפרק של יד רובוטית כדי שהיא תרים חפץ מסוים? האם על המכונית לנווט ימינה או שמאלה על מנת להישאר בנתיב שלה בכביש הלא ישר? המטרה של Reinforcement Learning, או בקיצור RL, היא לבנות בקר חכם שיבחר בפעולה הטובה ביותר לביצוע במצב נתון.
ב-RL בחירת הפעולה נלמדת מניסיון, במקום להיות מתוכננת מראש (if… then…) כפי שנעשה בשיטות בקרה מסורתיות. גישה זו מתאימה ביותר למצבים בהם נרצה להריץ במהירות ובזול אלפי ואפילו מיליוני סימולציות ממוחשבות לאפיון מערכת, לדוגמה, רכב אוטונומי הנדרש למיליוני תרחישים שונים. במקום להשתמש באב-טיפוס פיזי ולהתנסות עליו, נעבור להשתמש בסימולציה ממוחשבת ובכך נצליח למדל מצבי קיצון שלא היינו יכולים לבחון במציאות.
אלגוריתם RL מבוסס על התהליך שבו ישנה סביבה (environment) שהיא המודל של המערכת שלנו, לצד סוכן (agent) הצופה ושולט בפעולות שהמערכת מבצעת (למשל, עצירה בתמרור עצור).
הסוכן לומד בעזרת ניסוי-וטעייה, תוך קבלת תגמול על פעולה טובה וקנס על פעולה שגויה.
אותו סוכן מקבל תצפיות (observations) על סמך הפעולות שהמערכת ביצעה, ובוחר את הפעולה הבאה (הטובה ביותר) עבור המערכת על בסיס הניסיון שצבר עד כה.
המגוון הרחב של הכשרות חינמיות ש-MathWorks מציעה כולל כעת קורס חדש של Reinforcement Learning. בקורס תוכלו ללמוד כיצד להשתמש ב- MATLAB וב- Simulink כדי ליצור סוכן של רובוט המנסה לבצע פעולות מיון במחסן.
כל שאתם צריכים כדי להתחיל זה דפדפן אינטרנט, בו תוכלו לעבוד בגרסה המקוונת של MATLAB. במהלך ה-OnRamp תקבלו הסברים נרחבים ותחשפו לכתיבת מודל RL בעצמכם. כל שלב ושלב ילווה במשוב מידי ובצורה כזאת תוכלו ללמוד ולהתנסות בעצמכם!
גם אם אתם לא יודעים Simulink או את התיאוריה שמאחורי גישת RL, מספיק שאתם מכירים MATLAB על מנת להתחיל. הקורס אורך כשעתיים, אך ניתן לעצור ולהמשיך באופן חופשי. כשתסיימו, תוכלו להוריד אישור רשמי שהשלמתם את הקורס!
מאז גרסת R2019a ניתן לממש פתרונות מבוססי RL בסביבת MATLAB בעזרת ה-Reinforcement Learning Toolbox. בגרסת R2021a נוספה אפליקציה אינטראקטיבית לתכנון ואימון פתרונות מבוססים RL מבלי צורך בכתיבת קוד. את כל הפרטים המלאים תוכלו למצוא בסקירת החידושים בבלוג זה (לחצו לסקירה האחרונה – ראו את סעיף 18).
אם עוד אין לכם רישיון ל-Reinforcement Learning Toolbox – נשמח לשוחח אתכם ולראות כיצד הכלי יוכל לסייע גם לכם. רוצים מידע נוסף? כתבו לנו