Λογισμικό AutoML

Λογισμικό AutoML

Μετά από πολλά έτη βασικής και εφαρμοσμένης έρευνας και καινοτομίας, υλοποιήσαμε το όραμά μας για την αυτοματοποίηση των τεχνικών μηχανικής μάθησης με το λογισμικό AutoML. Από την αυτόματη προ-επεξεργασία και τον «καθαρισμό» των δεδομένων, έως την επιλογή ενός βέλτιστου μοντέλου, μέσα από χιλιάδες δυνητικά υποψήφια, αναπτύξαμε ένα μοναδικά εύχρηστο λογισμικό για την χρήση & αξιοποίηση αλγορίθμων AI από μη εξοικειωμένους χρήστες, αλλά και επιστήμονες δεδομένων.

Γενική Περιγραφή
Το AutoML είναι ένα λογισμικό γενικής χρήσης για την ανάλυση δομημένων δεδομένων υπό τη μορφή πίνακα και τη δημιουργία μοντέλων μηχανικής μάθησης. Στόχος είμαι η υποστήριξη ειδικών στον τομέα καθώς και στελεχών, business analysts & ερευνητών από άλλους κλάδους που θέλουν να έχουν μια εκτενή ανάλυση των δεδομένων τους και να δημιουργήσουν μοντέλα πρόβλεψης.
automl description
Δυνατότητες & Λειτουργίες
Το λογισμικό εκτελεί τα παρακάτω βασικά βήματα μέσα από ένα απλό interface:
automl interface
Ξεκινά από τον αυτόματο καθαρισμό των δεδομένων, και εκτελεί μια εκτενή στατιστική ανάλυση (Descriptive Statistics) με μεγάλη ποικιλία αποτελεσμάτων ώστε να αναδειχθούν επιμέρους χαρακτηριστικά της βάσεως δεδομένων. Στη συνέχεια εκτελούνται 4 βασικοί αλγόριθμοι μηχανικής μάθησης, και συγκεκριμένα:
  1. Γραμμική Παλινδρόμηση. Είναι το baseline μοντέλο, χρήσιμο για αρχική αξιολόγηση και σύγκριση ακρίβειας.
  2. Πολυωνυμική Παλινδρόμηση με ευρετική βελτιστοποίηση των υποψηφίων μη-γραμμικών αλληλεπιδράσεων των μεταβλητών. Εξάγουμε πέραν του μοντέλου τις καμπύλες αξιοπιστίας, ώστε να διερευνήσουμε κατά πόσον η εκπαίδευση και επιλογή του τελικού μοντέλου προέκυψε μέσα από μια συγκλίνουσα αλληλουχία.
  3. Τεχνητά νευρωνικά δίκτυα με ένα ταχύτατο αλγόριθμο που παρέχει ταυτόχρονα υψηλή ακρίβεια σε εκτός-δείγματος δεδομένα (generalization).
  4. XGBoost with Hyperparmeter tuning, όπου με έναν αλγόριθμο βελτιστοποίησης, εκπαιδεύουμε πολλαπλά μοντέλα και επιλέγουμε εκείνο που παρέχει της βέλτιστη ακρίβεια σε μια συστάδα από τυχαία υπο-δείγματα (cross validation).
Για όλα τα παραπάνω μοντέλα κάνουμε εκτενή ανάλυση σφαλμάτων για πόλωση και ετεροσκεδασμό, και εξαγάγουμε αναλυτικά metrics. Αντιστοίχως, αποθηκεύουμε το βέλτιστο μοντέλο και μπορούμε να κάνουμε προβλέψεις σε νέα δεδομένα. Επίσης, εξάγουμε την formula πρόβλεψης από την Πολυωνυμική Παλινδρόμηση, για άμεση χρήση σε μορφή υπολογιστικού φύλλου MS Excel.
chart rnd 1
chart rnd 2
Πέραν της Στατιστικής Ανάλυσης και την Εκπαίδευση ενός στιβαρού μοντέλου, προχωρούμε σε Ανάλυση Ευαισθησίας, όπου μπορούμε να δούμε την επιρροή μιας μεταβλητής (feature) στην Target Variable και να αναλύσουμε τη συμπεριφορά των μοντέλων μηχανικής μάθησης, τα οποία πολλές φορές χαρακτηρίζονται ως “black-box”.
Το τελικό στάδιο, είναι η αξιολόγηση της επάρκειας των δεδομένων από πλευράς όγκου. Εκτελούμε τα εκπαιδευμένα μοντέλα για πολλαπλά τυχαία υποσύνολα του δείγματος, αυξανόμενα σταδιακά. Η καμπύλες ακρίβειας που προκύπτουν, αναδεικνύουν πειραματικά την επάρκεια των δεδομένων και κατά πόσον χρειαζόμαστε επιπλέον.
chart rnd 3

Ζητήστε μια ζωντανή παρουσίαση των δυνατοτήτων του λογισμικού AutoML για να γνωρίσετε ένα μοναδικό εργαλείο για την αξιοποίηση των state-of-the-art αλγορίθμων τεχνητής νοημοσύνης για τη βέλτιστη αξιοποίηση των επιχειρησιακών ή/και ερευνητικών δεδομένων σας και την εξαγωγή πολύτιμών συμπερασμάτων που θα καθοδηγήσουν τις επιχειρηματικές αποφάσεις σας στο μέλλον.