Τι είναι ένα νευρωνικό δίκτυο; Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα

Αυτό το ιστολόγιο για το τι είναι νευρωνικά δίκτυα θα σας παρουσιάσει τις βασικές έννοιες των νευρωνικών δικτύων και τον τρόπο με τον οποίο μπορούν να λύσουν σύνθετα προβλήματα βάσει δεδομένων.

Με την πρόοδο στη Μηχανική Μάθηση, έχει πάρει έναν υψηλό δρόμο. Η βαθιά εκμάθηση θεωρείται η πιο προηγμένη τεχνολογία που έχει δημιουργηθεί για την επίλυση σύνθετων προβλημάτων που χρησιμοποιούν τεράστια σύνολα δεδομένων. Αυτό το ιστολόγιο για το τι είναι νευρωνικά δίκτυα θα σας παρουσιάσει τις βασικές έννοιες των νευρωνικών δικτύων και τον τρόπο με τον οποίο μπορούν να λύσουν σύνθετα προβλήματα βάσει δεδομένων.



Για να μάθετε σε βάθος την Τεχνητή Νοημοσύνη και τη Βαθιά Μάθηση, μπορείτε να εγγραφείτε ζωντανά από την Edureka με υποστήριξη 24/7 και πρόσβαση σε όλη τη διάρκεια ζωής.



Ακολουθεί μια λίστα θεμάτων που θα καλυφθούν σε αυτό Ιστολόγιο:

  1. Τι είναι το Νευρωνικό Δίκτυο;
  2. Τι είναι η βαθιά μάθηση;
  3. Διαφορά μεταξύ AI, ML και, DL
  4. Ανάγκη για βαθιά μάθηση
  5. Περίπτωση χρήσης βαθιάς μάθησης
  6. Πώς λειτουργούν τα νευρικά δίκτυα;
  7. Το νευρικό δίκτυο εξηγείται με παράδειγμα

Απλός ορισμός ενός νευρικού δικτύου

Διαμορφώθηκε σύμφωνα με τον ανθρώπινο εγκέφαλο, α Το Neural Network δημιουργήθηκε για να μιμείται τη λειτουργικότητα ενός ανθρώπινου εγκεφάλου . Ο ανθρώπινος εγκέφαλος είναι ένα νευρωνικό δίκτυο που αποτελείται από πολλαπλούς νευρώνες, ομοίως, ένα τεχνητό νευρικό δίκτυο (ANN) αποτελείται από πολλαπλά άτομα (εξηγείται αργότερα).



Νευρωνικό δίκτυο - Τι είναι ένα νευρικό δίκτυο - Edureka

Ένα νευρικό δίκτυο αποτελείται από τρία σημαντικά επίπεδα:

  • Επίπεδο εισόδου: Όπως υποδηλώνει το όνομα, αυτό το επίπεδο δέχεται όλες τις εισόδους που παρέχονται από τον προγραμματιστή.
  • Κρυφό στρώμα: Μεταξύ της εισόδου και της στρώσης εξόδου είναι ένα σύνολο επιπέδων γνωστών ως κρυμμένα στρώματα. Σε αυτό το επίπεδο, εκτελούνται υπολογισμοί που έχουν ως αποτέλεσμα την έξοδο.
  • Επίπεδο εξόδου: Οι είσοδοι περνούν από μια σειρά μετασχηματισμών μέσω του κρυφού επιπέδου που οδηγεί τελικά στην έξοδο που παραδίδεται μέσω αυτού στρώμα.

Πριν φτάσουμε στα βάθη του τρόπου λειτουργίας ενός νευρικού δικτύου, ας καταλάβουμε τι είναι η βαθιά μάθηση.



Τι είναι η βαθιά μάθηση;

Το Deep Learning είναι ένα προηγμένο πεδίο της Μηχανικής Μάθησης που χρησιμοποιεί τις έννοιες των Νευρωνικών Δικτύων για την επίλυση περιπτώσεων υψηλής υπολογιστικής χρήσης που περιλαμβάνουν την ανάλυση πολυδιάστατων δεδομένων. Αυτοματοποιεί τη διαδικασία εξαγωγής χαρακτηριστικών, διασφαλίζοντας ότι απαιτείται ελάχιστη ανθρώπινη παρέμβαση.

παράδειγμα απομακρυσμένης μεθόδου επίκλησης μεθόδου

Λοιπόν, τι ακριβώς είναι η Deep Learning;

Η βαθιά μάθηση είναι προχωρημένη υποπεδίο της Μηχανικής Μάθησης που χρησιμοποιεί αλγόριθμους εμπνευσμένους από τη δομή και τη λειτουργία του εγκεφάλου που ονομάζεται Artificial Neural Networks.

Διαφορά μεταξύ AI, ML και DL (Τεχνητή νοημοσύνη έναντι μηχανικής μάθησης έναντι βαθιάς μάθησης)

Οι άνθρωποι τείνουν συχνά να το σκέφτονται , , και Βαθιά μάθηση είναι τα ίδια αφού έχουν κοινές εφαρμογές. Για παράδειγμα, το Siri είναι μια εφαρμογή AI, Machine learning και Deep learning.

Πώς σχετίζονται λοιπόν αυτές οι τεχνολογίες;

  • Τεχνητή νοημοσύνη είναι η επιστήμη της δημιουργίας μηχανών για να μιμούνται τη συμπεριφορά των ανθρώπων.
  • Μηχανική εκμάθηση είναι ένα υποσύνολο της Τεχνητής Νοημοσύνης (AI) που εστιάζει στη λήψη αποφάσεων από τις μηχανές, δίνοντάς τους δεδομένα.
  • Βαθιά μάθηση είναι ένα υποσύνολο της μηχανικής μάθησης που χρησιμοποιεί την έννοια των νευρωνικών δικτύων για την επίλυση σύνθετων προβλημάτων.

Συνοψίζοντας, το AI, η Machine Learning και η Deep Learning είναι αλληλοσυνδεόμενα πεδία. Μηχανική εκμάθηση και βαθιά βοηθήματα μάθησης Τεχνητή νοημοσύνη παρέχοντας ένα σύνολο αλγορίθμων και νευρωνικών δικτύων για επίλυση προβλήματα βάσει δεδομένων.

Τώρα που είστε εξοικειωμένοι με τα βασικά, ας καταλάβουμε τι οδήγησε στην ανάγκη για βαθιά μάθηση.

Ανάγκη για βαθιά μάθηση: Περιορισμοί παραδοσιακών αλγορίθμων και τεχνικών μηχανικής μάθησης

Η μηχανική εκμάθηση ήταν μια σημαντική ανακάλυψη στον τεχνικό κόσμο, οδήγησε στην αυτοματοποίηση μονότονων και χρονοβόρων εργασιών, βοήθησε στην επίλυση σύνθετων προβλημάτων και στη λήψη πιο έξυπνων αποφάσεων. Ωστόσο, υπήρχαν μερικά μειονεκτήματα στη μηχανική εκμάθηση που οδήγησαν στην εμφάνιση της βαθιάς μάθησης.

Ακολουθούν ορισμένοι περιορισμοί της μηχανικής μάθησης:

  1. Δεν είναι δυνατή η επεξεργασία δεδομένων υψηλής διαστάσεων: Η μηχανική εκμάθηση μπορεί να επεξεργαστεί μόνο μικρές διαστάσεις δεδομένων που περιέχουν ένα μικρό σύνολο μεταβλητών. Αν θέλετε να αναλύσετε δεδομένα που περιέχουν 100 δευτερόλεπτα μεταβλητών, τότε η Μηχανική Εκμάθηση δεν μπορεί να χρησιμοποιηθεί.
  2. Η τεχνική χαρακτηριστικών είναι χειροκίνητη: Εξετάστε μια περίπτωση χρήσης όπου έχετε 100 μεταβλητές πρόβλεψης και πρέπει να περιορίσετε μόνο τις σημαντικές. Για να το κάνετε αυτό, πρέπει να μελετήσετε χειροκίνητα τη σχέση μεταξύ καθεμιάς από τις μεταβλητές και να καταλάβετε ποιες είναι σημαντικές για την πρόβλεψη της παραγωγής. Αυτή η εργασία είναι εξαιρετικά κουραστική και χρονοβόρα για έναν προγραμματιστή.
  3. Δεν είναι ιδανικό για την ανίχνευση αντικειμένων και την επεξεργασία εικόνας: Δεδομένου ότι η ανίχνευση αντικειμένων απαιτεί δεδομένα διαστάσεων, η Μηχανική Εκμάθηση δεν μπορεί να χρησιμοποιηθεί για την επεξεργασία συνόλων δεδομένων εικόνας, είναι ιδανική μόνο για σύνολα δεδομένων με περιορισμένο αριθμό χαρακτηριστικών.

Πριν φτάσουμε στα βάθη του Neural Networks, ας εξετάσουμε μια πραγματική περίπτωση χρήσης όπου εφαρμόζεται η Deep Learning.

Περίπτωση / εφαρμογές βαθιάς μάθησης

Γνωρίζατε ότι το PayPal επεξεργάζεται πάνω από 235 δισεκατομμύρια δολάρια σε πληρωμές από τέσσερα δισεκατομμύρια συναλλαγές από περισσότερους από 170 εκατομμύρια πελάτες του; Χρησιμοποιεί αυτόν τον τεράστιο όγκο δεδομένων για να εντοπίσει πιθανές δόλιες δραστηριότητες μεταξύ άλλων λόγων.

Με τη βοήθεια των αλγορίθμων Deep Learning, το PayPal εξόρυξε δεδομένα από το ιστορικό αγορών του πελάτη τους, καθώς και για να εξετάσει μοτίβα πιθανής απάτης που αποθηκεύονται στις βάσεις δεδομένων του για να προβλέψει εάν μια συγκεκριμένη συναλλαγή είναι δόλια ή όχι.

Η εταιρεία βασίζεται στην τεχνολογία Deep Learning & Machine Learning για περίπου 10 χρόνια. Αρχικά, η ομάδα παρακολούθησης της απάτης χρησιμοποίησε απλά, γραμμικά μοντέλα. Αλλά με την πάροδο των ετών η εταιρεία άλλαξε σε μια πιο προηγμένη τεχνολογία Μηχανικής Μάθησης που ονομάζεται Deep Learning.

Ο διευθυντής κινδύνου απάτης και ο Επιστήμονας δεδομένων στο PayPal, Ke Wang, ανέφεραν:

«Αυτό που απολαμβάνουμε από την πιο σύγχρονη, προηγμένη μηχανική μάθηση είναι η ικανότητά του να καταναλώνει πολύ περισσότερα δεδομένα, να χειρίζεται στρώματα και επίπεδα αφαίρεσης και να μπορεί να« βλέπει »πράγματα που μια απλούστερη τεχνολογία δεν θα μπορούσε να δει, ακόμη και τα ανθρώπινα όντα να μην μπορώ να δω. '

Ένα απλό γραμμικό μοντέλο μπορεί να καταναλώσει περίπου 20 μεταβλητές. Ωστόσο, με την τεχνολογία Deep Learning μπορεί κανείς να εκτελέσει χιλιάδες σημεία δεδομένων. Επομένως, εφαρμόζοντας Βαθιά τεχνολογία μάθησης, το PayPal μπορεί τελικά να αναλύσει εκατομμύρια συναλλαγές για να εντοπίσει τυχόν δόλια δραστηριότητα.

Τώρα ας πάμε στα βάθη ενός Νευρωνικού Δικτύου και καταλάβουμε πώς λειτουργούν.

Πώς λειτουργεί ένα νευρωνικό δίκτυο;

Για να κατανοήσουμε τα νευρωνικά δίκτυα, πρέπει να το αναλύσουμε και να κατανοήσουμε την πιο βασική μονάδα ενός νευρικού δικτύου, δηλαδή ένα Perceptron.

Τι είναι το Perceptron;

Το Perceptron είναι ένα νευρωνικό δίκτυο ενός επιπέδου που χρησιμοποιείται για την ταξινόμηση γραμμικών δεδομένων. Έχει 4 σημαντικά συστατικά:

  1. Είσοδοι
  2. Βάρη και προκατάληψη
  3. Λειτουργία αθροίσματος
  4. Λειτουργία ενεργοποίησης ή μετασχηματισμού

Η βασική λογική πίσω από ένα Perceptron είναι η εξής:

τι κάνει το trim στην Java

Οι εισόδους (x) που λαμβάνονται από το επίπεδο εισόδου πολλαπλασιάζονται με τα καθορισμένα βάρη τους w. Οι πολλαπλασιασμένες τιμές προστίθενται στη συνέχεια για να σχηματίσουν το σταθμισμένο άθροισμα. Το σταθμισμένο άθροισμα των εισόδων και τα αντίστοιχα βάρη τους εφαρμόζονται στη συνέχεια σε μια σχετική συνάρτηση ενεργοποίησης. Η λειτουργία ενεργοποίησης χαρτογραφεί την είσοδο στην αντίστοιχη έξοδο.

Βάρη και προκατάληψη στη βαθιά μάθηση

Γιατί πρέπει να αντιστοιχίσουμε βάρη σε κάθε είσοδο;

Μόλις τροφοδοτηθεί μια μεταβλητή εισόδου στο δίκτυο, μια τυχαία επιλεγμένη τιμή εκχωρείται ως το βάρος αυτής της εισόδου. Το βάρος κάθε σημείου εισαγωγής δείχνει πόσο σημαντική είναι αυτή η εισαγωγή στην πρόβλεψη του αποτελέσματος.

Η παράμετρος προκατάληψης, από την άλλη πλευρά, σας επιτρέπει να ρυθμίσετε την καμπύλη λειτουργίας ενεργοποίησης με τέτοιο τρόπο ώστε να επιτυγχάνεται ακριβής έξοδος.

Λειτουργία αθροίσματος

Μόλις κατανεμηθούν στις εισόδους κάποιο βάρος, λαμβάνεται το προϊόν της αντίστοιχης εισόδου και βάρους. Η προσθήκη όλων αυτών των προϊόντων μας δίνει το σταθμισμένο ποσό. Αυτό γίνεται από τη συνάρτηση αθροίσματος.

Λειτουργία ενεργοποίησης

Ο κύριος στόχος των λειτουργιών ενεργοποίησης είναι να αντιστοιχίσει το σταθμισμένο άθροισμα στην έξοδο. Οι λειτουργίες ενεργοποίησης όπως το tanh, το ReLU, το σιγμοειδές και ούτω καθεξής είναι παραδείγματα λειτουργιών μετασχηματισμού.

Για να μάθετε περισσότερα σχετικά με τις λειτουργίες του Perceptrons, μπορείτε να το διαβάσετε Ιστολόγιο

Πριν από εμάς ολοκληρώστε αυτό το ιστολόγιο, ας πάρουμε ένα απλό παράδειγμα για να κατανοήσουμε πώς λειτουργεί ένα Νευρωνικό Δίκτυο.

Τα νευρικά δίκτυα εξηγούνται με ένα παράδειγμα

Εξετάστε ένα σενάριο στο οποίο πρόκειται να δημιουργήσετε ένα Τεχνητό Νευρωνικό Δίκτυο (ANN) που ταξινομεί τις εικόνες σε δύο κατηγορίες:

  • Κατηγορία Α: Περιέχει εικόνες μη ασθενών φύλλων
  • Κατηγορία Β: Περιέχει εικόνες ασθενών φύλλων

Λοιπόν, πώς δημιουργείτε ένα νευρωνικό δίκτυο που ταξινομεί τα φύλλα σε ασθένειες και μη ασθένειες καλλιέργειες;

Η διαδικασία ξεκινά πάντα με την επεξεργασία και τον μετασχηματισμό της εισόδου με τέτοιο τρόπο ώστε να μπορεί εύκολα να υποβληθεί σε επεξεργασία. Στην περίπτωσή μας, κάθε εικόνα φύλλου θα χωρίζεται σε pixel ανάλογα με τη διάσταση της εικόνας.

Για παράδειγμα, εάν η εικόνα αποτελείται από 30 επί 30 εικονοστοιχεία, τότε ο συνολικός αριθμός των εικονοστοιχείων θα είναι 900. Αυτά τα εικονοστοιχεία παρουσιάζονται ως πίνακες, οι οποίες στη συνέχεια τροφοδοτούνται στο επίπεδο εισόδου του Νευρωνικού Δικτύου.

Ακριβώς όπως το πώς οι εγκέφαλοί μας έχουν νευρώνες που βοηθούν στην οικοδόμηση και τη σύνδεση σκέψεων, ένα ANN έχει perceptrons που δέχονται εισόδους και τις επεξεργάζονται μεταδίδοντάς τα από το επίπεδο εισόδου στο κρυφό και τέλος στο επίπεδο εξόδου.

Καθώς η είσοδος μεταφέρεται από το επίπεδο εισόδου στο κρυφό επίπεδο, αντιστοιχεί ένα αρχικό τυχαίο βάρος σε κάθε είσοδο. Οι είσοδοι πολλαπλασιάζονται έπειτα με τα αντίστοιχα βάρη τους και το άθροισμά τους αποστέλλεται ως είσοδος στο επόμενο κρυφό επίπεδο.

Εδώ, εκχωρείται μια αριθμητική τιμή που ονομάζεται προκατάληψη σε κάθε perceptron, η οποία σχετίζεται με τη στάθμιση κάθε εισόδου. Περαιτέρω, κάθε perceptron περνά μέσω ενεργοποίησης ή συνάρτησης μετασχηματισμού που καθορίζει εάν ένα συγκεκριμένο perceptron ενεργοποιείται ή όχι.

Ένα ενεργοποιημένο perceptron χρησιμοποιείται για τη μετάδοση δεδομένων στο επόμενο επίπεδο. Με αυτόν τον τρόπο, τα δεδομένα διαδίδονται (Διάδοση προς τα εμπρός) μέσω του νευρικού δικτύου έως ότου οι αντιλήπτες φτάσουν στο επίπεδο εξόδου.

παραδείγματα προγράμματος java για βρόχο

Στο επίπεδο εξόδου, προκύπτει μια πιθανότητα που αποφασίζει εάν τα δεδομένα ανήκουν στην κατηγορία Α ή στην κατηγορία Β.

Ακούγεται απλό, έτσι δεν είναι; Λοιπόν, η ιδέα πίσω από τα Νευρωνικά Δίκτυα βασίζεται αποκλειστικά στη λειτουργία του ανθρώπινου εγκεφάλου. Χρειάζεστε σε βάθος γνώση διαφόρων μαθηματικών εννοιών και αλγορίθμων. Ακολουθεί μια λίστα ιστολογίων για να ξεκινήσετε:

  1. Τι είναι η βαθιά μάθηση; Ξεκινώντας με τη βαθιά μάθηση
  2. Βαθιά μάθηση με Python: Οδηγός για αρχάριους στη βαθιά μάθηση

Εάν βρήκατε αυτό το ιστολόγιο σχετικό, ρίξτε μια ματιά στο από την Edureka, μια αξιόπιστη διαδικτυακή εταιρεία εκμάθησης με δίκτυο περισσότερων από 250.000 ικανοποιημένων μαθητών σε όλο τον κόσμο. Το μάθημα Εκπαίδευσης Edureka Deep Learning with TensorFlow Certification βοηθά τους μαθητές να γίνουν ειδικοί στην εκπαίδευση και τη βελτιστοποίηση βασικών και συνελικτικών νευρωνικών δικτύων χρησιμοποιώντας έργα και εργασίες σε πραγματικό χρόνο, μαζί με έννοιες όπως η λειτουργία SoftMax, τα Αυτόματα κωδικοποιητές Neural Networks, το Restricted Boltzmann Machine (RBM).