Accessibility Tools

Skip to main content

Ονειρεύεσαι μια καριέρα στην Τεχνητή Νοημοσύνη; Μάθε όλα όσα χρειάζεσαι εδώ!

Της Γεωργίας Μανιάτη, #weLEADER και Speech Scientist στο AI Group της Samsung Electronics

Η Τεχνητή Νοημοσύνη (ΤΝ ή AI από τον αγγλικό όρο artificial intelligence) δεν είναι πλέον επιστημονική φαντασία. Είναι η πραγματικότητα του σήμερα και διαμορφώνει το μέλλον του αύριο. Από τα self-driving cars μέχρι τα έξυπνα ρομπότ και τους εικονικούς βοηθούς️, η Τεχνητή Νοημοσύνη αλλάζει τον τρόπο με τον οποίο ζούμε, εργαζόμαστε και αλληλεπιδρούμε με τον κόσμο γύρω μας.

Εάν θες να γίνεις μέρος αυτής της επανάστασης, να λύσεις προβλήματα με καινοτόμες λύσεις και να αφήσεις το δικό σου σημάδι στον κόσμο, τότε η καριέρα στην Τεχνητή Νοημοσύνη είναι για σένα! Σε αυτό το άρθρο, θα βρεις όλα όσα χρειάζεσαι για να ξεκινήσεις αυτό το συναρπαστικό ταξίδι στον κόσμο του AI.

Αρχικά, ας δούμε τι ακριβώς είναι η Τεχνητή Νοημοσύνη και πώς λειτουργεί!

Πρόκειται για έναν όρο-ομπρέλα. Καλύπτει ένα ευρύ φάσμα συστημάτων που λειτουργούν με ελαφρώς διαφορετικούς τρόπους, και τα αποτελέσματά τους μιμούνται τη συμπεριφορά των ευφυών όντων. Μπορεί να μιμούνται ικανότητες του ανθρώπου, όπως η λήψη αποφάσεων ή η παραγωγή γλώσσας και ομιλίας. Παραδείγματα τέτοιων εφαρμογών αποτελούν οι εξατομικευμένες συστάσεις για παρακολούθηση ταινιών, οι βοηθοί παραγωγής κειμένου, οι φωνητικοί βοηθοί (τύπου Siri), τα έξυπνα σπίτια, κ.ά. Στην ουσία, η ΤΝ είναι απλά ένα λογισμικό, ένα πρόγραμμα στον υπολογιστή, αλλά - λόγω των πιο πάνω δυνατοτήτων της - συχνά αναπαρίσταται στην ποπ κουλτούρα ως ανθρωπόμορφο όν ή ρομπότ.

Τα πιο διαδεδομένα συστήματα τεχνητής νοημοσύνης χρησιμοποιούν μαθηματικά για να ανακαλύψουν μοτίβα στα δεδομένα, με τη μέθοδο που ονομάζουμε μηχανική μάθηση. Ξεκινώντας από μεγάλα δεδομένα, οι αλγόριθμοι αναλύουν ένα-ένα τα παραδείγματα, και ανακαλύπτουν κοινά χαρακτηριστικά μεταξύ των παραδειγμάτων. Η ανακάλυψη αυτών των μοτίβων στην ουσία αποτελεί τη μάθηση, και τα χαρακτηριστικά που μαθαίνει ο αλγόριθμος τα αποθηκεύει σε ένα μοντέλο. Αν το σκεφτούμε, αυτός ο τρόπος μάθησης, μέσω της έκθεσης σε παραδείγματα, σε εμπειρία, μέσω αμέτρητων δοκιμών και λαθών, μοιάζει με τον τρόπο που μαθαίνει και ο άνθρωπος. 

Η διαδικασία της μηχανικής μάθησης μπορεί να εφαρμοστεί σε κάθε είδους δεδομένα.  Είτε είναι κείμενο, εικόνα, ήχος, όλα τα δεδομένα μπορούν να περιγραφούν με αριθμούς και να ανακαλυφθούν μαθηματικά μοτίβα σε αυτά.  Μπορούμε να εκπαιδεύσουμε μοντέλα ακόμα και σε διαφορετικά είδη δεδομένων ταυτόχρονα - είναι σαν να συνδυάζουμε δύο διαφορετικούς χάρτες μοτίβων, για παράδειγμα από κείμενο σε εικόνα ή από κείμενο σε φωνή.

Διαφορές του Generative AI (παραγωγική τεχνητή νοημοσύνη) με το ΑΙ!

Στη μη-παραγωγική τεχνητή νοημοσύνη δεν παράγουμε νέο περιεχόμενο, αλλά λαμβάνουμε μία απόφαση ή κάνουμε μία πρόβλεψη. Για παράδειγμα, με βάση την προηγούμενη συμπεριφορά και τις προτιμήσεις των χρηστών, μπορούμε να τους προτείνουμε ταινίες ή προϊόντα. Με βάση τα χαρακτηριστικά των μηνυμάτων ηλεκτρονικού ταχυδρομείου, μπορούμε να τα ταξινομούμε ως spam ή όχι. Μπορούμε να εκπαιδεύσουμε έναν αλγόριθμο σε πολλές φωτογραφίες από σκύλους και γάτες, και στη συνέχεια να του ζητήσουμε να ταξινομήσει μία νέα εικόνα ανάλογα με ποιο από τα δύο ζώα περιέχει. 

Μια παραγωγική χρήση της ΤΝ στο τελευταίο παράδειγμα θα ήταν να χρησιμοποιήσουμε το εκπαιδευμένο μοντέλο, που είναι σαν χάρτης με χαρακτηριστικά, και να του ζητήσουμε πώς μοιάζει μία γάτα σε συγκεκριμένη περιοχή του. Το μοντέλο θα παράξει μία ολοκαίνουργια εικόνα που δεν έχει δει ποτέ, αλλά προκύπτει από τα χαρακτηριστικά της περιοχή αυτής. Έτσι η παραγωγική ΤΝ δημιουργεί νέο περιεχόμενο. Τα μοντέλα παραγωγικής ΤΝ μπορούν να εκτελούν σύνθετες εργασίες, να απαντούν σε ερωτήσεις, να γράφουν ποιήματα και μουσική, ακόμη και να δημιουργούν βίντεο από το μηδέν. Είναι μαθηματικά, όχι μαγεία. 

Παρόλο που τα αποτελέσματα είναι πολύ πειστικά, είναι σημαντικό να καταλάβουμε ότι αποτελούν μόνο προβλέψεις που βασίζονται σε δεδομένα εκπαίδευσης. Είναι πολύ μεγάλος ο κίνδυνος της μεροληψίας, όταν παράγονται άδικα ή μη ισορροπημένα αποτελέσματα λόγω ανακριβειών ή κενών στα δεδομένα εκπαίδευσης. Για αυτό πρέπει να έχουμε κατά νου ότι η ανθρώπινη και η τεχνητή νοημοσύνη δεν είναι εφάμιλλες. Οι άνθρωποι μπορούν ενστικτωδώς να κατανοήσουν το περικείμενο μιας κατάστασης και να εφαρμόσουν κοινή λογική. Τα συστήματα τεχνητής νοημοσύνης προσεγγίζουν τον κόσμο μόνο μέσα από το περιορισμένο και συχνά μονοδιάστατο «παράθυρο» που τους έχουμε ανοίξει εμείς με τα δεδομένα εκπαίδευσης.

Είναι σημαντικό να κατανοήσουμε πώς λειτουργούν και να αποφασίσουμε πότε και πώς θέλουμε να τα χρησιμοποιήσουμε. Στα σωστά χέρια, τα συστήματα AI μπορούν να αποτελέσουν απίστευτα ισχυρά εργαλεία. Βοηθούν στη διαχείριση τεράστιων συνόλων δεδομένων, ανακαλύπτουν μοτίβα που οι άνθρωποι δεν μπορούν να αντιληφθούν και αυτοματοποιούν πολύπλοκες διαδικασίες. Αλλά εναπόκειται στον άνθρωπο να διασφαλίσει ότι η στόχευσή τους θα είναι προς το καλύτερο δυνατό. 

Η δική μου εμπειρία στο χώρο της ΤΝ.

Εργάζομαι στη δημιουργία συστημάτων συνθετικής ομιλίας (text-to-speech synthesis). Οι αλγόριθμοι σύνθεσης ομιλίας εκπαιδεύονται ταυτόχρονα σε κείμενο και φωνή, ώστε να  μπορούν να λαμβάνουν γραπτές προτάσεις ως είσοδο και να τις μετατρέπουν σε προφορικό λόγο. Εφαρμογές όπως οι φωνητικοί βοηθοί, οι αναγνώστες οθόνης, οι χάρτες πλοήγησης, τα audiobooks, εκπαιδευτικές εφαρμογές εκμάθησης ξένων γλωσσών και προφοράς και ανακοινώσεις σε αεροδρόμια και σιδηροδρομικούς σταθμούς, χρησιμοποιούν αυτή την τεχνολογία. Όλα τα παραπάνω την καθιστούν μια σημαντική τεχνολογία προσβασιμότητας. Σήμερα με βρίσκετε στη Samsung ως ειδική επιστήμονα τεχνολογιών φωνής και γλώσσας, επομένως η τεχνολογία στην οποία δουλεύω “δίνει φωνή” στον βοηθό της Samsung, Bixby, που βρίσκεται στα κινητά, αλλά ενσωματώνεται και ως λογισμικό προσβασιμότητας στις συσκευές της εταιρείας γενικότερα (π.χ. οικιακές συσκευές). 

Όσο για το υπόβαθρό μου, οι προπτυχιακές μου σπουδές ήταν σε non-STEM και συγκεκριμένα στη Γλωσσολογία. Αργότερα, ειδικευτηκα στη μηχανική μάθηση για την ομιλία και τη γλώσσα στο μεταπτυχιακό μου. 

Αν μου ζητήσει κάποιο άτομο να περιγράψω μια τυπική μου μέρα, θα απαντήσω πως “Δεν υπάρχει τυπική μέρα”Είμαστε μικρή ομάδα που κάνουμε ανάπτυξη μιας τεχνολογίας που χρησιμοποιείται σε μία ευρεία γκάμα προϊόντων της εταιρείας και είναι ενσωματωμένη σε εκατομμύρια συσκευές στον κόσμο. Ταυτόχρονα, κάνουμε έρευνα, δηλαδή συνεχώς πειραματιζόμαστε με νέες τεχνικές, νέα δεδομένα και νέα μοντέλα. 

Όσον αφορά το πρώτο κομμάτι, σίγουρα μέσα στη μέρα μου θα περάσω κάποιο χρόνο επικοινωνίας με ομάδες από όλο τον κόσμο που προσαρμόζουν τη μηχανή μας στις γλώσσες τους. Συχνά χρειάζεται να καθοδηγήσω, να εκπαιδεύσω συναδέλφους, να επιλύσω προβλήματα και να προτείνω ένα πλάνο δράσης για την εκάστοτε γλώσσα. Όσον αφορά στην έρευνα και εξέλιξη της μηχανής, μέσα στην ομάδα, θα δουλέψω μαζί με τους μηχανικούς σε καποιο project που αφορα τη βελτίωση ή την προσθηκη νέων ικανοτήτων στο σύστημα ανάλογα με τον επόμενο στόχο της ομάδας. Κάποια συνάντηση για brainstorming, οργάνωση δράσης ή για follow-up σε πειράματα, και αξιολόγηση του αν και κατά πόσο βελτιώνουμε την τεχνολογία μας είναι κομμάτι της μέρας μου. 

Ανάλογα με τους στόχους της εταιρείας, μου έχει τύχει για κάποιες περιόδους να ασχολούμαι αποκλειστικά με το κομμάτι της υποστήριξης ομάδων για την εξάπλωση προϊόντων σε νέες γλώσσες. Έχω δουλέψει περιοδικά στα γραφεία της εταιρείας σε Αμερική, Κορέα, Κίνα, Ηνωμένο Βασίλειο και Πολωνία. Άλλες φορές, προέχει η βελτίωση του αλγορίθμου και η έρευνα σε νέες τεχνικές και δεδομένα, οπότε οι μέρες μου έχουν περισσότερο διάβασμα, πειράματα, ή ακόμα και συγγραφή επιστημονικών άρθρων και παρουσίαση σε συνέδρια. Η συνεχής επιμόρφωση σχετικά με τις εξελίξεις στον τομέα είναι απαραίτητη, επομένως ένα μέρος της δουλειάς περιλαμβάνει παρακολούθηση συνεδρίων και MOOC courses.

Σου φαίνονται όλα αυτά ενδιαφέροντα; Ξεκίνα και εσύ τώρα!

Στον τομέα της ΤΝ (ανεξαρτήτως εφαρμογής) απασχολούνται απόφοιτες και απόφοιτοι Πληροφορικής και σχολών του Πολυτεχνείου, εφόσον έχουν παρακολουθήσει μαθήματα σχετικά με αλγορίθμους, επιστήμη δεδομένων, μηχανική μάθηση. Δεν είναι όμως αυτός ο μόνος δρόμος για να μπεις στο χώρο! Για κάποιο άτομο που δεν έχει τέτοιο υπόβαθρο προπτυχιακά, ο πιο ξεκάθαρος τρόπος είναι ένα μεταπτυχιακό στη μηχανική μάθηση. Αυτό έκανα κι εγώ το 2015, ακολουθώντας στο Εδιμβούργο ένα διεπιστημονικό μεταπτυχιακό ειδίκευσης σε μηχανική μάθηση για γλώσσα και φωνή. Πλέον υπάρχουν παρόμοια μεταπτυχιακά και στην Ελλάδα. Η εφαρμογή της ΤΝ σε όλους τους τομείς δημιουργεί ευκαιρίες για να εισέλθουν στο χώρο άτομα με διαφορετικές αφετηρίες. Φυσικά, απαιτείται ένα ικανό επίπεδο γνώσης προγραμματισμού και άλγεβρας.

Πλέον υπάρχουν πολλά online resources όπως μαθήματα, σεμινάρια, αλλά κομβικό ρόλο παίζει η hands-on εξάσκηση. Το Kaggle είναι μία πλατφόρμα που προσφέρει ένα τεράστιο αποθετήριο από μοντέλα, δεδομένα και κώδικα που δημοσιεύονται από την κοινότητα για την επιστήμη των δεδομένων και τη μηχανική μάθηση. Ενώ μαθήματα που καλύπτουν τους πιο εξελιγμένους αλγορίθμους και τα ανοιχτά (open source) μοντέλα δημοσιεύονται άμεσα στην πλατφόρμα του Andrew Ng, Deep Learning AI.

Σημαντικό ρόλο παίζουν και τα soft skills! Στο χώρο αυτό θέτουμε δύσκολα προβλήματα (όπως, πώς μπορούμε να κάνουμε μία συνθετική φωνή να τραγουδάει;) και προσπαθούμε να βρούμε λειτουργικές λύσεις. Για να αναλύσουμε αυτά τα πολύπλοκα ζητήματα σε επιμέρους διαχειρίσιμες ενότητες, είναι απαραίτητη η κριτική σκέψη, η προσοχή στη λεπτομέρεια και το αναλυτικό μυαλό, η επιμονή και η υπομονή, καθώς αποτελούν θεμελιώδη στοιχεία της ικανότητας επίλυσης προβλημάτων. Η δημιουργική σκέψη, από την άλλη, μας βοηθά να υπερβούμε τους περιορισμούς που συχνά υπάρχουν στα δεδομένα και την τεχνολογία και να βρούμε καινοτόμες λύσεις. Ο χώρος είναι ερευνητικός και κάθε χρόνο πραγματοποιούνται αρκετά συνέδρια όπου παρουσιάζονται πρόοδοι και νέες μέθοδοι. Επομένως, σημαντικά χαρακτηριστικά όσων ασχολούνται με το πεδίο είναι η περιέργεια, η διάθεση για αυτοβελτίωση και η προσαρμοστικότητα σε νέα εργαλεία, τεχνολογίες και μεθοδολογίες. Οι ομάδες είναι συχνά διεπιστημονικές και μπορεί να περιλαμβάνουν επιστήμονες δεδομένων, μηχανικούς, εμπειρογνώμονες του τομέα και στελέχη επιχειρήσεων, για αυτό η ομαδικότητα, η συνεργασία και η αποτελεσματική επικοινωνία είναι απαραίτητα στοιχεία για την επιτυχή συνεργασία.

Κλείνοντας, να θυμάστε:

  • Η αυτομόρφωση δε σταματάει ποτέ στο χώρο της τεχνητής νοημοσύνης.
  • Η συνεργασία και η ομαδικότητα είναι απαραίτητες για την επιτυχία.
  • Η ηθική και η κοινωνική ευθύνη οφείλουν να καθοδηγούν όσες/ους δημιουργούν συστήματα ΤΝ.
  • Το μέλλον ανήκει σε όσες/ους τολμούν να ονειρευτούν και να καινοτομήσουν.

Το άρθρο έχει επιμεληθεί η ομάδα του WE LEAD, του μη κερδοσκοπικού οργανισμού για την μείωση του έμφυλου χάσματος και τη γυναικεία ενδυνάμωση στο χώρο της τεχνολογίας.

Γεωργία Μανιάτη, #weLEADER kai Speech Scientist στο AI Group της Samsung Electronics

Με ένα ισχυρό υπόβαθρο στην υπολογιστική γλωσσολογία, την τεχνητή νοημοσύνη και τη σύνθεση ομιλίας, η Γεωργία Μανιάτη είναι σήμερα Speech Scientist στο AI Group της Samsung Electronics, εστιάζοντας στην ανάπτυξη συνθετικών φωνών που ενισχύουν τη φυσικότητα στην αλληλεπίδραση των χρηστών με την παγκόσμια γκάμα συσκευών της εταιρείας και με το φωνητικό βοηθό Bixby. Ο ρόλος της περιλαμβάνει την ανάληψη ερευνητικών πρωτοβουλιών και την υποστήριξη της συνεργασίας μεταξύ ερευνητικών ομάδων της εταιρείας διεθνώς, με ιδιαίτερη έμφαση στη βελτιστοποίηση των δεδομένων και των τεχνικών μηχανικής μάθησης για την ενίσχυση των δυνατοτήτων των τεχνολογιών μετατροπής κειμένου σε ομιλία για κάθε γλώσσα. Ως Α’ Αντιπρόεδρος του Συνδέσμου Υποτρόφων του Ιδρύματος Ωνάση, η ηγεσία και η στρατηγική κατεύθυνση βρίσκονται στο επίκεντρο της συνεισφοράς της, ενώ αποστολή της είναι η προώθηση της εκπαίδευσης και της καινοτομίας, μέσω της σύλληψης, του σχεδιασμού και της υλοποίησης αντίστοιχων έργων. Είναι αφοσιωμένη στην ανάπτυξη πρωτοβουλιών γραμματισμού στην τεχνητή νοημοσύνη (AI literacy), και ασχολείται ενεργά με την επικοινωνία και την εκλαΐκευση εννοιών τεχνητής νοημοσύνης, με πρόσφατες ομιλίες της στα OpenConf, Athens Science Festival και TEDx Mavili Square. Συνδέσου με την Γεωργία εδώ!

Ενδιαφέρεσαι να μάθεις περισσότερα για το χώρο της τεχνολογίας; Συνέχισε εδώ! O απόλυτος οδηγός για είσοδο στην τεχνολογία από το WE LEAD και το neolaia.gr σε περιμένει. Θα βρεις άρθρα, συνεντεύξεις, προτάσεις, παρουσιάσεις εταιρειών, αλλά και ιστορίες ανθρώπων και επαγγελματιών από τον ευρύτερο τομέα της τεχνολογίας που θα σε εμπνεύσουν. Tech awaits you, just as you are!

Πηγή: neolaia.gr