Τεχνικές μοντελοποίησης στο Business Analytics με R

Το ιστολόγιο παρέχει μια σύντομη εισαγωγή των Τεχνικών Μοντελοποίησης στο Business Analytics με τον R.



Διαφορετικές τεχνικές μοντελοποίησης:

Μπορούμε να χωρίσουμε οποιοδήποτε πρόβλημα σε μικρότερες διαδικασίες:



Ταξινόμηση - είναι, όπου ταξινομούμε τα δεδομένα. Π.χ. ασθένειες όλες οι ασθένειες παρουσιάζουν συγκεκριμένη συμπεριφορά και μπορούμε να τις ταξινομήσουμε περαιτέρω.

Για παράδειγμα: ασθένειες που μειώνουν την ανοσία, ασθένειες που προκαλούν πονοκέφαλο κ.λπ.



Οπισθοδρόμηση - περιλαμβάνει την εύρεση σχέσης μεταξύ πολλαπλών μεταβλητών.

Για παράδειγμα: πώς το βάρος ενός ανθρώπου σχετίζεται με το ύψος του.

ΑνωμαλίαΑνίχνευση - είναι βασικά μια διακύμανση.



Για παράδειγμα: Στην περίπτωση υψηλής τάσης ή χαμηλής τάσης.

Ένα άλλο παράδειγμα θα μπορούσε να περιλαμβάνει ρυθμιζόμενη συμπεριφορά που περιλαμβάνει οδήγηση στη δεξιά ή την αριστερή πλευρά με βάση τη χώρα. Η ανωμαλία εδώ είναι κάποιος που οδηγεί από το αντίθετο.

πώς να αντιστρέψετε έναν πύθωνα χορδών

Ένα άλλο παράδειγμα θα μπορούσε να είναι η εισβολή στο δίκτυο. Εδώ, ένας πιστοποιημένος χρήστης συνδέεται στον ιστότοπο της εταιρείας σας και, στη συνέχεια, εάν κάποιος μη εξουσιοδοτημένος χρήστης συνδεθεί, είναιΑνόλι.

Σημασία χαρακτηριστικού - Βασικά δίνει πολλά χαρακτηριστικά, όπως ύψος, βάρος, θερμοκρασία, καρδιακό παλμό. Ένα σημείο που πρέπει να σημειωθεί είναι ότι όλα αυτά τα χαρακτηριστικά είναι σημαντικά για μια εργασία.

Για παράδειγμα: Κάποιος προσπαθεί να προβλέψει, σε ποια ώρα θα φτάσει το γραφείο. Κάθε χαρακτηριστικό παίζει σημαντικό ρόλο, αλλά δεν είναι όλα τα χαρακτηριστικά γνωρίσματα.

Κανόνες σύνδεσης - Με πιο απλούς όρους, είναι να αναλύσουμε ή να προβλέψουμε την επόμενη συμπεριφορά, όπου περιστρέφεται γύρω από τη μηχανή προτάσεων.

Για παράδειγμα: Ένα άτομο που αγοράζει ψωμί μπορεί επίσης να αγοράσει γάλα. Αν αναλύσουμε τις προηγούμενες συμπεριφορές αγορών, όλα τα είδη στο καλάθι έχουν σχέση. Σε αυτήν την περίπτωση, υπάρχει πιθανότητα το άτομο που αγοράζει ψωμί να αγοράζει επίσης γάλα.

Ομαδοποίηση - Είναι μια από τις παλαιότερες τεχνικές στα στατιστικά. Στην πραγματικότητα, μπορεί κανείς να μοντελοποιήσει πάντα οποιοδήποτε πρόβλημα, είτε είναι ταξινόμηση είτε ομαδοποίηση, που σημαίνει ομαδοποίηση παρόμοιων οντοτήτων.

Για παράδειγμα:

1) Πάρτε ένα καλάθι με μήλα και πορτοκάλια, στα οποία μπορούμε να διαχωρίσουμε τα μήλα από τα πορτοκάλια.

2) Μια σημαντική περίπτωση χρήσης για την ομαδοποίηση είναι η υγειονομική περίθαλψη. Σχεδόν όλα τα στατιστικά στοιχεία και η ανάλυση ξεκίνησαν με περιπτώσεις χρήσης της υγειονομικής περίθαλψης. Για να προχωρήσουμε βαθύτερα, υπάρχει ένας όρος ομαδοποίησης που ονομάζεται κοόρτες (άτομα με παρόμοιες ασθένειες), έτσι ώστε να μπορούν να μελετηθούν ξεχωριστά από τους υπάρχοντες πελάτες. Για παράδειγμα, εάν 10 άτομα πάσχουν από πυρετό και άλλα 10 άτομα από πονοκέφαλο, θα βρούμε τι είναι κοινό μεταξύ τους και θα δημιουργήσουμε φάρμακα.

Εξαγωγή χαρακτηριστικών - Στην ακρίβεια εξαγωγής χαρακτηριστικών, η εγκυρότητα και η αστοχία είναι αρκετά σχετικές. Με άλλα λόγια, η εξαγωγή χαρακτηριστικών μπορεί να χαρακτηριστεί ως αναγνώριση προτύπων.

Για παράδειγμα:

Στην αναζήτηση Google, όταν ένας χρήστης εισάγει έναν όρο, προκύπτει αποτελέσματα. Τώρα, ένα σημαντικό ερώτημα που τίθεται είναι πώς γνώριζε, ποια σελίδα είναι σχετική και μη σχετική με τον όρο; Αυτό μπορεί να απαντηθεί με εξαγωγή χαρακτηριστικών και αναγνώριση προτύπων, όπου προσθέτει εξέχοντα χαρακτηριστικά. Ας πούμε ότι δίνεται μια φωτογραφία, ορισμένες κάμερες εντοπίζουν πρόσωπα, επισημαίνουν το πρόσωπο για να δώσουν όμορφες εικόνες, οι οποίες χρησιμοποιούν επίσης αναγνώριση χαρακτηριστικών.

Εποπτευόμενη μάθηση έναντι μη εποπτευόμενης μάθησης

προς το) Κατηγορία πρόβλεψης - Οι τεχνικές περιλαμβάνουν παλινδρόμηση, λογιστική, νευρωνικά δίκτυα και δέντρα αποφάσεων. Μερικά παραδείγματα περιλαμβάνουν τον εντοπισμό απάτης (όπου ένας υπολογιστής μαθαίνει και προβλέπει την επόμενη απάτη από το προηγούμενο ιστορικό απάτης). Στη μη εποπτευόμενη μάθηση, δεν μπορεί κανείς να προβλέψει με παραδείγματα καθώς δεν υπάρχουν ιστορικά δεδομένα.

σι) Κατηγορία ταξινόμησης - Λαμβάνοντας ένα παράδειγμα, είτε η συναλλαγή είναι δόλια είτε όχι, μπαίνει στην κατηγορία ταξινόμησης. Εδώ, παίρνουμε ιστορικά δεδομένα και τα ταξινομούμε με δέντρα αποφάσεων ή σε περίπτωση που δεν παίρνουμε καθόλου ιστορικά δεδομένα, τότε αρχίζουμε άμεσα σε δεδομένα και προσπαθούμε να εκμεταλλευτούμε μόνοι μας τις δυνατότητες. Για παράδειγμα, εάν πρέπει να γνωρίζουμε τους υπαλλήλους, οι οποίοι είναι πιθανό να εγκαταλείψουν τον οργανισμό ή είναι πιθανό να παραμείνουν. Σε περίπτωση που πρόκειται για έναν νέο οργανισμό, όπου δεν μπορούμε να χρησιμοποιήσουμε ιστορικά δεδομένα, μπορούμε πάντα να χρησιμοποιούμε ομαδοποίηση για εξαγωγή δεδομένων.

ντο) Κατηγορία εξερεύνησης - Αυτή είναι μια ευθεία μέθοδος, που έρχεται με, τι σημαίνει μεγάλα δεδομένα. Στην μη εποπτευόμενη μάθηση, ονομάζεται βασικά συστατικά και ομαδοποίηση.

ρε) Κατηγορία συνάφειας - εδώ εμπλέκονται πολλά στοιχεία όπως cross-sell / up sell, ανάλυση καλαθιού αγοράς. Στην ανάλυση καλαθιών, δεν υπάρχει εποπτευόμενη μάθηση καθώς δεν υπάρχουν ιστορικά δεδομένα. Έτσι, παίρνουμε δεδομένα απευθείας και βρίσκουμε συσχετίσεις, αλληλουχία και ανάλυση παραγόντων.

Έχετε μια ερώτηση για εμάς; Αναφέρετέ τα στην ενότητα σχολίων και θα επικοινωνήσουμε μαζί σας.

Σχετικές αναρτήσεις: