Ποιες είναι οι προϋποθέσεις για τη μηχανική εκμάθηση;

Αυτό το ιστολόγιο σχετικά με τις προϋποθέσεις για τη μηχανική εκμάθηση θα σας βοηθήσει να κατανοήσετε τις βασικές έννοιες που πρέπει να γνωρίζετε προτού ξεκινήσετε με τη μηχανική μάθηση.

Η Μηχανική Εκμάθηση είναι αναμφίβολα η πιο απαιτούμενη τεχνολογία της εποχής! Εάν είστε αρχάριος που ξεκινά με τη Μηχανική Μάθηση, είναι σημαντικό να γνωρίζετε τις προϋποθέσεις για τη Μηχανική Μάθηση. Αυτό το ιστολόγιο θα σας βοηθήσει να κατανοήσετε τις διαφορετικές έννοιες που πρέπει να γνωρίζετε προτού ξεκινήσετε τη Μηχανική Εκμάθηση.

Για να αποκτήσετε σε βάθος γνώση της Τεχνητής Νοημοσύνης και της Μηχανικής Μάθησης, μπορείτε να εγγραφείτε ζωντανά από την Edureka με 24ωρη υποστήριξη και πρόσβαση σε όλη τη διάρκεια ζωής.





Ακολουθεί μια λίστα θεμάτων καλύπτεται σε αυτό το ιστολόγιο:

  1. Προαπαιτούμενα για Μηχανική Εκμάθηση
  2. Κατανόηση της μηχανικής εκμάθησης με μια περίπτωση χρήσης

Προαπαιτούμενα για Μηχανική Εκμάθηση

Για να ξεκινήσετεΜηχανική εκμάθηση πρέπει να είστε εξοικειωμένοι με τις ακόλουθες έννοιες:



  1. Στατιστική
  2. Γραμμική άλγεβρα
  3. Λογισμός
  4. Πιθανότητα
  5. Γλώσσες προγραμματισμού

Στατιστική

Οι στατιστικές περιέχουν εργαλεία που μπορούν να χρησιμοποιηθούν για να πάρουν κάποιο αποτέλεσμα από τα δεδομένα. Υπάρχουν περιγραφικές στατιστικές που χρησιμοποιούνται για τον μετασχηματισμό ακατέργαστων δεδομένων σε ορισμένες σημαντικές πληροφορίες. Επίσης, μπορούν να χρησιμοποιηθούν στατιστικά συμπεράσματα για τη λήψη σημαντικών πληροφοριών από ένα δείγμα δεδομένων αντί για τη χρήση πλήρους συνόλου δεδομένων.

Για να μάθετε περισσότερα για Στατιστικά μπορείτε να διαβάσετε τα ακόλουθα ιστολόγια:

Γραμμική άλγεβρα

Γραμμικές προσφορές άλγεβραςμε διανύσματα, πίνακες και γραμμικούς μετασχηματισμούς. Είναι πολύ σημαντικό στη μηχανική εκμάθηση, καθώς μπορεί να χρησιμοποιηθεί για τον μετασχηματισμό και την εκτέλεση λειτουργιών στο σύνολο δεδομένων.



Λογισμός

Ο υπολογισμός είναι ένα σημαντικό πεδίο στα μαθηματικά και παίζει αναπόσπαστο ρόλο σε πολλούς αλγόριθμους μηχανικής μάθησης. Το σύνολο δεδομένων με πολλές δυνατότητες είναιχρησιμοποιείται για την κατασκευή μοντέλων μηχανικής μάθησης, καθώς οι λειτουργίες είναι πολλαπλές πολλαπλές μεταβλητές λογισμός παίζει σημαντικό ρόλο για τη δημιουργία ενός μοντέλου μηχανικής μάθησης. Οι ενοποιήσεις και οι διαφοροποιήσεις είναι απαραίτητες.

Πιθανότητα

Η πιθανότητα συμβάλλει στην πρόβλεψη της πιθανότητας των συμβάντων, μας βοηθά να θεωρήσουμε ότι η κατάσταση μπορεί ή δεν θα συμβεί ξανά. Για μηχανική εκμάθηση, η πιθανότητα είναι α θεμέλιο.

Mathematics

Για να μάθετε περισσότερα σχετικά με την Πιθανότητα, μπορείτε να το διαβάσετε Ιστολόγιο

Γλώσσα προγραμματισμού

Είναι σημαντικό να γνωρίζουμε γλώσσες προγραμματισμού όπως το R και το Python προκειμένου να υλοποιήσουμε ολόκληρη τη διαδικασία Μηχανικής Μάθησης. Και οι δύο Python και R παρέχουν ενσωματωμένες βιβλιοθήκες που καθιστούν πολύ εύκολη την εφαρμογή αλγορίθμων Machine Learning.

Εκτός από τις βασικές γνώσεις προγραμματισμού, είναι επίσης σημαντικό να γνωρίζετε πώς να εξαγάγετε, να επεξεργαστείτε και να αναλύσετε δεδομένα. Αυτή είναι μια από τις πιο σημαντικές δεξιότητες που απαιτούνται για τη μηχανική εκμάθηση.

Για να μάθετε περισσότερα σχετικά με τον προγραμματισμό γλώσσες για μηχανική εκμάθηση, μπορείτε να διαβάσετε τα ακόλουθα ιστολόγια:

  1. Οι καλύτερες βιβλιοθήκες Python για την επιστήμη δεδομένων και τη μηχανική μάθηση

Θήκη χρήσης μηχανικής εκμάθησης

Η μηχανική εκμάθηση έχει να κάνει με τη δημιουργία ενός αλγορίθμου που μπορεί να μάθει από δεδομένα για να κάνει μια πρόβλεψη όπως τα είδη αντικειμένων που υπάρχουν στην εικόνα ή η μηχανή προτάσεων, ο καλύτερος συνδυασμός φαρμάκων για τη θεραπεία της συγκεκριμένης ασθένειας ή του φιλτραρίσματος ανεπιθύμητων μηνυμάτων.

Η μηχανική μάθηση βασίζεται σε μαθηματικές προϋποθέσεις και αν γνωρίζετε γιατί τα μαθηματικά χρησιμοποιούνται στη μηχανική μάθηση θα το κάνει διασκεδαστικό. Πρέπει να γνωρίζετε τα μαθηματικά πίσω από τις συναρτήσεις που θα χρησιμοποιήσετε και ποιο μοντέλο είναι κατάλληλο για τα δεδομένα και γιατί.

Ας ξεκινήσουμε λοιπόν με ένα ενδιαφέρον πρόβλημα της πρόβλεψης των τιμών των κατοικιών, έχοντας ένα σύνολο δεδομένων που περιέχει μια ιστορία διαφορετικών χαρακτηριστικών και τιμών, προς το παρόν, θα εξετάσουμε την περιοχή του χώρου διαβίωσης σε τετραγωνικά πόδια και τις τιμές.

Τώρα έχουμε ένα σύνολο δεδομένων που περιέχει δύο στήλες όπως φαίνεται παρακάτω:

Πρέπει να υπάρχει κάποια συσχέτιση μεταξύ αυτών των δύο μεταβλητών για να μάθουμε ότι θα χρειαστεί να χτίσουμε ένα μοντέλο που να προβλέπει την τιμή των σπιτιών, πώς μπορούμε να το κάνουμε;

Ας γράψουμε αυτά τα δεδομένα και ας δούμε πώς μοιάζει:

Εδώ ο άξονας X είναι η τιμή ανά τετραγωνικό μέτρο χώρου διαμονής και ο άξονας Υ είναι η τιμή του σπιτιού. Εάν σχεδιάσουμε όλα τα σημεία δεδομένων θα λάβουμε ένα διάγραμμα διασποράς που μπορεί να αναπαρασταθεί από μια γραμμή όπως φαίνεται στο παραπάνω σχήμα και αν εισαγάγουμε κάποια δεδομένα, τότε θα προβλέψει κάποιο αποτέλεσμα. Στην ιδανική περίπτωση, πρέπει να βρούμε μια γραμμή που θα τέμνει τα μέγιστα σημεία δεδομένων.

Εδώ προσπαθούμε να δημιουργήσουμε μια γραμμή που ορίζεται ως:

Y = mX + c

Αυτή η μέθοδος πρόβλεψης της γραμμικής σχέσης μεταξύ του στόχου (εξαρτημένη μεταβλητή) και της μεταβλητής πρόβλεψης (ανεξάρτητη μεταβλητή) ονομάζεται γραμμική παλινδρόμηση. Μας επιτρέπει να μελετήσουμε και να συνοψίσουμε μια σχέση μεταξύ δύο μεταβλητών.

  • X = Ανεξάρτητη μεταβλητή
  • Y = Εξαρτημένη μεταβλητή
  • c = y-τομή
  • m = Κλίση γραμμής

Αν λάβουμε υπόψη την εξίσωση έχουμε τιμές για το Χ που είναι μια ανεξάρτητη μεταβλητή, οπότε το μόνο που πρέπει να κάνουμε είναι να υπολογίσουμε τις τιμές για τα m και c για να προβλέψουμε την τιμή του Y.

Λοιπόν, πώς βρίσκουμε αυτές τις μεταβλητές;

Για να βρούμε αυτές τις μεταβλητές, μπορούμε να δοκιμάσουμε μια δέσμη τιμών και να βρούμε μια γραμμή που τέμνει τον μέγιστο αριθμό σημείων δεδομένων. Αλλά, πώς μπορούμε να βρούμε την καλύτερη γραμμή;

Έτσι, για να βρούμε τη γραμμή που ταιριάζει καλύτερα, μπορούμε να χρησιμοποιήσουμε τη συνάρτηση σφάλματος με λιγότερα τετράγωνα που θα βρει το σφάλμα μεταξύ της πραγματικής τιμής του y και της προβλεπόμενης τιμής y`.

Η συνάρτηση σφάλματος ελάχιστων τετραγώνων μπορεί να αναπαρασταθεί χρησιμοποιώντας την ακόλουθη εξίσωση:

Χρησιμοποιώντας αυτήν τη συνάρτηση μπορούμε να ανακαλύψουμε το σφάλμα για κάθε προβλεπόμενο σημείο δεδομένων συγκρίνοντάς το με την πραγματική τιμή του σημείου δεδομένων. Στη συνέχεια, παίρνετε το άθροισμα όλων αυτών των σφαλμάτων και τετράγωνά τους για να μάθετε την απόκλιση στην πρόβλεψη.

Εάν προσθέσουμε τον τρίτο άξονα στο γράφημα μας που περιέχει όλες τις πιθανές τιμές σφάλματος και το σχεδιάσουμε σε τρισδιάστατο χώρο, θα μοιάζει με αυτό:

webdriver σελήνιο με παράδειγμα αγγουριού στην έκλειψη

Στην παραπάνω εικόνα, οι ιδανικές τιμές θα ήταν στο κάτω μαύρο μέρος που θα προβλέψει τις τιμές κοντά στο πραγματικό σημείο δεδομένων. Το επόμενο βήμα είναι να βρείτε τις καλύτερες δυνατές τιμές για m και c. Αυτό μπορεί να γίνει χρησιμοποιώντας την τεχνική βελτιστοποίησης που ονομάζεται gradient descent.

Η κατάβαση κλίσης είναι μια επαναληπτική μέθοδος, όπου ξεκινάμε με την αρχικοποίηση ορισμένων τιμών για τις μεταβλητές μας και τις βελτιώνουμε αργά ελαχιστοποιώντας το σφάλμα μεταξύ της πραγματικής τιμής και της προβλεπόμενης τιμής.

Τώρα αν νομίζουμε ότι οι τιμές του διαμερίσματος δεν εξαρτώνται πραγματικά μόνο από την τιμή ανά τετραγωνικά πόδια, υπάρχουν πολλοί παράγοντες, όπως ο αριθμός των υπνοδωματίων, των μπάνων κ.λπ. Εάν λάβουμε υπόψη αυτά τα χαρακτηριστικά, τότε η εξίσωση θα φαίνεται κάτι σαν αυτό

Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c

Πρόκειται για πολυγραμμική παλινδρόμηση που ανήκει στη γραμμική άλγεβρα, εδώ μπορούμε να χρησιμοποιήσουμε πίνακες μεγέθους mxn όπου το m είναι χαρακτηριστικά και το n είναι σημεία δεδομένων.

Ας εξετάσουμε μια άλλη κατάσταση όπου μπορούμε να χρησιμοποιήσουμε την πιθανότητα να βρούμε την κατάσταση του σπιτιού, προκειμένου να ταξινομήσουμε ένα σπίτι με βάση το εάν είναι σε καλή κατάσταση ή σε κακή κατάσταση. Για αυτό, για να δουλέψουμε θα πρέπει να χρησιμοποιήσουμε μια τεχνική που ονομάζεται Logistic Regression, η οποία λειτουργεί για την πιθανότητα συμβάντων που αντιπροσωπεύονται από μια λειτουργία σιγμοειδούς.

Σε αυτό το άρθρο, καλύψαμε τις προϋποθέσεις της μηχανικής μάθησης και πώς εφαρμόζονται στη μηχανική μάθηση. Βασικά, αποτελείται από στατιστικά στοιχεία, λογισμούς, γραμμική άλγεβρα και θεωρία πιθανότητας. Το Calculus έχει τεχνικές που χρησιμοποιούνται για βελτιστοποίηση, η γραμμική άλγεβρα έχει αλγόριθμους που μπορούν να λειτουργήσουν σε τεράστια σύνολα δεδομένων, με πιθανότητα να προβλέψουμε την πιθανότητα εμφάνισης και τα στατιστικά στοιχεία μας βοηθούν να συμπεράνουμε χρήσιμες πληροφορίες από το δείγμα συνόλων δεδομένων.

Τώρα που γνωρίζετε τις προϋποθέσεις για τη μηχανική εκμάθηση, είμαι βέβαιος ότι θέλετε να μάθετε περισσότερα. Ακολουθούν μερικά ιστολόγια που θα σας βοηθήσουν να ξεκινήσετε με την Επιστήμη δεδομένων:

Εάν επιθυμείτε να εγγραφείτε για ένα πλήρες μάθημα Τεχνητής Νοημοσύνης και Μηχανικής Μάθησης, η Edureka διαθέτει μια ειδικά επιμελημένη που θα σας κάνει ικανό σε τεχνικές όπως η εποπτευόμενη μάθηση, η μη εποπτευόμενη εκμάθηση και η επεξεργασία φυσικής γλώσσας. Περιλαμβάνει εκπαίδευση σχετικά με τις τελευταίες εξελίξεις και τεχνικές προσεγγίσεις στην Τεχνητή Νοημοσύνη & Μηχανική Μάθηση όπως η Βαθιά Μάθηση, τα Γραφικά Μοντέλα και η Ενίσχυση Μάθησης.