DATA Analytics בסביבת MATLAB

בסביבת MATLAB קיימים 4 כלים מרכזיים, אשר מאפשרים ביצוע של תהליכי סיווג, רגרסיה ואישכול. למידע נוסף על הכלים והיכולות:

Statistics & Machine Learning Toolbox
Fuzzy Logic Toolbox
Neural Networks Toolbox
Optimization Toolbox

Machine Learning with MATLAB

למידת מכונה ב-MATLAB –
דוגמא לפתרון בעיית סיווג

MATLABMachine Learning באמצעות MATLAB

לימוד מכונה, או Machine Learning, הינה תת-תחום במדעי המחשב ובבינה מלאכותית, העוסק בפיתוח אלגוריתמים המאפשרים למחשב ללמוד מתוך דוגמאות, ופועל במגוון משימות חישוביות בהן התכנות הקלאסי איננו אפשרי. במקרה זה הלימוד נעשה בהסתמך על מידע המגיע מתוך מדידות ונתונים, ולכן ניתן לשפר את ביצועי המערכת ככל שמספר המדידות גדל.

אלגוריתמים ללימוד מכונה משמשים ביישומים כגון חישוב פיננסי (אלגו-טריידינג, דירוג אשראי), עיבוד וידאו ותמונה (זיהוי פנים, זיהוי אובייקטים), חישוב ביולוגי (סיווג גידול, מציאת תרופות ו-DNA), ייצור אנרגיה (חיזוי צריכת אנרגיה וחיזוי עלות מסחר), עיבוד שפה טבעית (NLP), זיהוי דיבור ותמונה, ואף בפרסום ומערכות המלצה (סרטים, קניות וכו').

לימוד מכונה הוא חלק אינטגרלי וחשוב מ-Data Analytics, ענף אשר עוסק בפיתוח תובנות לקבלת החלטות ותכן טובים יותר, בהסתמך על מידע ונתונים. ברוב היישומים העסקיים, מודלים של לימוד מכונה מותקנים ורצים בסביבת web או database, והם חלק אינטגרלי ממערכות הארגון והחישוב לפי דרישה.

סביבת MATLAB מספקת כלים רבים המקלים על תהליך הפיתוח ומייעלים אותו.

כלים אלה מסייעים להתמודד עם האתגרים בהם אנו עלולים להתקל לאורך התהליך:

  • סביבת MATLAB מאפשרת לנו לעבוד עם מידע מסוגים שונים – אותות, תמונות, מידע פיננסי, טקסט ופורמטים נוספים.
  • MATLAB מכילה ספריות איכותיות ובהן פונקציות ואלגוריתמים הנמצאים בשימוש נפוץ בתעשייה בתחומים השונים, המאפשרים לנו לבצע מיצוי מאפיינים בלי להיות מומחים בתחום. כמו כן, MATLAB מכיל כלים שיעזרו לנו להעריך את איכות המאפיינים שיש לנו ולבצע בחירת מאפיינים כדי להשתמש במאפיינים הרלוונטיים ביותר.
  • סביבת MATLAB מכילה אפליקציות GUI מובנות, ההופכות את תהליך העבודה לאינטראקטיבי ויעיל, ומאפשרות לנו כמהנדסים להתמקד בפיתוח המודלים ולא בתכנות ו-debug. כמו כן, נוכל לקבל מודלים עם פרמטרים אופטימליים באמצעות טכניקות אופטימיזציה ש-MATLAB יכול לבצע לפי בחירתנו במהלך בניית המודל. MATLAB מאפשר לנו ליישם את קוד למידת המכונה שלנו על גבי פלטפורמות שונות החל מאפליקציות standalone ועד לאפליקציה שרצה על web sever. כמו כן, נוכל גם לייצר קוד שירוץ במערכת embedded.

לסיכום, MATLAB היא סביבה שלמה וגמישה לביצוע אנליזה ובניית מודלים, ולכן מהווה פלטפורמה מעולה לפיתוח אלגוריתמים של למידת מכונה.

נסקור את השלבים בתהליך למידת מכונה:

  1. גישה למידע וחקר ראשוני של המידע – בשלב זה נקרא את המידע מתוך קבצים, מאגרי מידע, או ישירות מחיישנים.
  2. עיבוד מקדים – בשלב זה אנחנו נטפל במידע הגולמי ונכין אותו לאלגוריתמי למידת המכונה. בשלב זה נטפל בערכים חריגים ונתונים חסרים, ננקה את המידע משגיאות או רעש, נבצע מיצוי מאפיינים, ונפעיל טכניקות של data reduction על מנת לצמצם את נפח המידע ולשמור את המידע הרלוונטי לבניית המודל ע"י שיטות כמו pca או mds.
  3. פיתוח מודל חיזוי – בשלב הזה יש לנו גמישות רבה לגבי טכניקת הלמידה בה נשתמש והפרמטרים השונים בטכניקה שנבחרה. נבצע אימון של מודלים שונים והשוואה ביניהם, נבצע אופטימיזציה של הפרמטרים, ולבסוף נבצע ולידציה של המודל כדי לוודא שהמודל שקיבלנו הוא רובסטי.
  4. שיתוף המודל המאומן – בשלב הזה נוכל להשתמש בשיטות שונות לפי הצורך, ולבצע אינטגרציה למערכות embedded, ענן, או כאפליקציית standalone.

ה-Classification Learner App

Classify Data Using the Classification Learner App

Classify Data Using the Classification Learner App

סיווג (Classification)

בחלק זה של לימוד מכונה ניתן לסווג את המידע שהתקבל למספר סופי של קטגוריות. בסביבת MATLAB קיימים אלגוריתמים הזמינים לשימוש, כגון: (Support Vector Machines (SVM, עצי החלטה, K-Nearest-Neighbor, Naïve Bayes, Logistic Regression, Discriminant Analysis ו-Neural Networks. כל האלגוריתמים הללו זמינים לשימוש ב-Classification Learner App.

Regression Learner App

Data Analytics with MATLAB

רגרסיה (Regression)

בחלק זה של לימוד מכונה בונים מודלים המשמשים לחיזוי של מידע רציף, כגון מידע על מזג אוויר או תנועתיות בשוק המניות. בסביבת MATLAB קיימים אלגוריתמים מובנים הכוללים מודלים ליניאריים, מודלים לא ליניאריים, רגולריזציה, Stepwise regression, עצי החלטה, רשתות ניורונים ו-Adaptive Neuro-Fuzzy Learning.

מציאת קבוצות פרחים

Iris Flower Clustering with Neural Clustering Tool

Iris Flower Clustering with Neural Clustering Tool

אישכול (Clustering)

בחלק זה של לימוד מכונה מזהים קבוצות ותבניות במידע. יצירת האשכולות מבוססת על מידע לא מסווג לצורך מציאת קבוצות טבעיות ותבניות. חלק מהיישומים כוללים זיהוי אובייקטים, Medical Imaging ו-Pattern Mining. בסביבת MATLAB קיימים אלגוריתמים מובנים הכוללים K-Means, Hidden Markov, Self-Organizing Maps, Fuzzy C-Means ועוד.

אפליקציות מובנות בתחום למידת המכונה

Neural Network Tools

  1. Neural Network Clustering
  2. Neural Network Fitting
  3. Neural Network Pattern Recognition Tool
  4. Neural Network Time Series

Regression Learner App

Classification Learner App

MATLAB
צרו קשר ונציגנו יחזרו אליכם בהקדם האפשרי

Feedback