DATA Analytics בסביבת MATLAB

MATLABText Analytics – אנליזה ומידול של מידע טקסטואלי

Text Analytics Toolbox מכיל אלגוריתמים וויזואליציות לעיבוד מקדים, אנליזה ומידול של טקסט. מודלים אלה יכולים להשתלב באפליקציות כמו ניתוח רגש, תחזוקה מונעת, וזיהוי נושא בטקסט.

Text Analytics Toolbox מכיל כלים לעיבוד טקסט ממקורות שונים כמו לוגים, אתרי חדשות, רשתות חברתיות, סקרים, ודו”חות. ניתן לקרוא טקסט מפורמטים שונים, לבצע עיבוד מקדים, ליצור אוצר למילים, להמיר טקסט לייצוג נומרי ולבנות מודלים סטטיסטיים.

באמצעות טכניקות למידת מכונה כמו LSD, LDA, ו- Word Embedding, נוכל לבצע אישכול ולבצע מיצוי מאפיינים לטקסט. מאפיינים אלה יכולים לשמש, יחד עם מאפיינים ממקורות אחרים, לבניית מודלים המתבססים על מידע מסוגים שונים כמו נומרי, טקסטואלי וכו’.

מאפיינים עיקריים:

  • עיבוד מקדים ונירמול טקסט
  • אלגוריתמים ללמידת מכונה, ביניהם (latent Dirichlet allocation (LDA ו- (latent semantic analysis (LSA
  • Word-embedding – אימון ושימוש במודלים מאומנים word2vec, FastText, GloVe
  • ויזואליזציות – Word cloud and text scatter plots
  • יבוא טקסט מקבצי PDF ו-Word
  • TF-IDF וניתוח תדירות מילים

MATLAB
צרו קשר ונציגנו יחזרו אליכם בהקדם האפשרי