SQL For Data Science: Λύση μιας στάσης για αρχάριους

Αυτή η ανάρτηση ιστολογίου στο SQL for Data Science θα σας βοηθήσει να κατανοήσετε πώς μπορεί να χρησιμοποιηθεί η SQL για την αποθήκευση, την πρόσβαση και την ανάκτηση δεδομένων για την ανάλυση δεδομένων.

Από τη στιγμή που η Data Science κατατάσσεται στο νούμερο 1 ως η πιο πολλά υποσχόμενη δουλειά της εποχής, προσπαθούμε όλοι να συμμετάσχουμε στον αγώνα . Αυτή η ανάρτηση ιστολογίου στο SQL for Data Science θα σας βοηθήσει να κατανοήσετε πώς μπορεί να χρησιμοποιηθεί η SQL για την αποθήκευση, την πρόσβαση και την ανάκτηση δεδομένων για την ανάλυση δεδομένων.



πρόγραμμα για την αντιστροφή ενός αριθμού σε java

Ακολουθεί μια λίστα θεμάτων που θα είναι καλύπτεται σε αυτό το ιστολόγιο:



    1. Γιατί απαιτείται SQL για την Επιστήμη Δεδομένων;
    2. Τι είναι το SQL;
    3. Βασικά στοιχεία της SQL
    4. Εγκατάσταση MySQL
    5. Χέρια

Γιατί απαιτείται SQL για την Επιστήμη Δεδομένων;

Γνωρίζατε ότι παράγουμε περισσότερα από 2,5 quintillion byte δεδομένων κάθε μέρα; Αυτός ο ρυθμός παραγωγής δεδομένων είναι ο λόγος πίσω από τη δημοτικότητα τεχνολογιών υψηλών προδιαγραφών όπως Επιστημονικά δεδομένα , , και ούτω καθεξής.

Η απόκτηση χρήσιμων πληροφοριών από δεδομένα είναι αυτό που ονομάζεται Επιστήμη Δεδομένων. Η Επιστήμη των Δεδομένων περιλαμβάνει την εξαγωγή, επεξεργασία και ανάλυση τόνων δεδομένων. Προς το παρόν αυτό που χρειαζόμαστε είναι που μπορεί να χρησιμοποιηθεί για την αποθήκευση και διαχείριση αυτού του τεράστιου όγκου δεδομένων.



Τι είναι η Επιστήμη των Δεδομένων - Edureka

Εδώ είναι που SQL έρχεται.

Το SQL μπορεί να χρησιμοποιηθεί για την αποθήκευση, την πρόσβαση και την εξαγωγή τεράστιων όγκων δεδομένων, προκειμένου να πραγματοποιηθεί πιο ομαλή η όλη διαδικασία της Επιστήμης Δεδομένων.



Τι είναι το SQL;

SQL που σημαίνει Structured Query Language είναι μια γλώσσα ερωτημάτων που στοχεύει στη διαχείριση των σχεσιακών βάσεων δεδομένων.

Αλλά τι ακριβώς είναι μια σχεσιακή βάση δεδομένων;

Μια σχεσιακή βάση δεδομένων είναι μια ομάδα καλά καθορισμένων πινάκων από τους οποίους μπορείτε να έχετε πρόσβαση στα δεδομένα, να επεξεργάζεστε, να ενημερώνετε και ούτω καθεξής, χωρίς να χρειάζεται να αλλάξετε τους πίνακες της βάσης δεδομένων. Το SQL είναι το πρότυπο (API) για σχεσιακές βάσεις δεδομένων.

Επιστρέφοντας στη SQL, ο προγραμματισμός SQL μπορεί να χρησιμοποιηθεί για την εκτέλεση πολλαπλών ενεργειών σε δεδομένα όπως ερωτήματα, εισαγωγή, ενημέρωση, διαγραφή εγγραφών βάσης δεδομένων. Παραδείγματα σχεσιακών βάσεων δεδομένων που χρησιμοποιούν SQL περιλαμβάνουν βάση δεδομένων MySQL, Oracle κ.λπ.

Για να μάθετε περισσότερα για το SQL, μπορείτε να διαβάσετε το παρακάτω ιστολόγια:

  1. Κατανόηση των τύπων δεδομένων SQL - Όλα όσα πρέπει να γνωρίζετε για τους τύπους δεδομένων SQL
  2. ΔΗΜΙΟΥΡΓΙΑ ΠΙΝΑΚΑ σε SQL - Όλα όσα πρέπει να ξέρετε για τη δημιουργία πινάκων σε SQL

Προτού ξεκινήσουμε με μια επίδειξη στο SQL, ας εξοικειωθούμε με τις βασικές εντολές SQL.

Βασικά στοιχεία της SQL

Το SQL παρέχει ένα σύνολο απλών εντολών για την τροποποίηση πινάκων δεδομένων, ας δούμε μερικές από τις βασικές εντολές SQL:

  • ΔΗΜΙΟΥΡΓΙΑ ΔΕΔΟΜΕΝΩΝ - δημιουργεί μια νέα βάση δεδομένων
  • ΔΗΜΙΟΥΡΓΙΑ ΠΙΝΑΚΑ - δημιουργεί έναν νέο πίνακα
  • ΕΙΣΑΓΩΓΗ - εισάγει νέα δεδομένα σε μια βάση δεδομένων
  • ΕΠΙΛΟΓΗ - εξάγει δεδομένα από μια βάση δεδομένων
  • ΕΝΗΜΕΡΩΣΗ - ενημερώνει τα δεδομένα σε μια βάση δεδομένων
  • ΔΙΑΓΡΑΦΗ - διαγράφει δεδομένα από μια βάση δεδομένων
  • ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ ALTER - τροποποιεί μια βάση δεδομένων
  • ΠΙΝΑΚΑΣ ALTER - τροποποιεί έναν πίνακα
  • ΠΙΝΑΚΑΣ ΠΡΟΣΤΑΣΙΑΣ - διαγράφει έναν πίνακα
  • ΔΗΜΙΟΥΡΓΙΑ ΔΕΙΚΤΗΣ - δημιουργεί ένα ευρετήριο για αναζήτηση ενός στοιχείου
  • ΔΕΙΚΤΗΣ ΠΡΟΣΤΑΣΙΑΣ - διαγράφει ένα ευρετήριο

Για να κατανοήσετε καλύτερα το SQL, ας εγκαταστήσουμε το MySQL και να δούμε πώς μπορείτε να παίξετε με δεδομένα.

Εγκατάσταση MySQL

Η εγκατάσταση της MySQL είναι μια απλή εργασία. Εδώ είναι βήμα προς βήμα οδηγό που θα σας βοηθήσουν να εγκαταστήσετε το MySQL στο σύστημά σας.

Μόλις ολοκληρώσετε την εγκατάσταση MySQL, ακολουθήστε την παρακάτω ενότητα για μια απλή επίδειξη που θα σας δείξει πώς μπορείτε να εισαγάγετε, να χειριστείτε και να τροποποιήσετε δεδομένα.

SQL For Data Science - Επίδειξη MySQL

Σε αυτήν την επίδειξη, θα δούμε πώς να δημιουργούμε βάσεις δεδομένων και να τις επεξεργαζόμαστε. Αυτή είναι μια επίδειξη επιπέδου για αρχάριους για να ξεκινήσετε με την ανάλυση δεδομένων στο SQL.

Ας ξεκινήσουμε λοιπόν!

Βήμα 1: Δημιουργήστε μια βάση δεδομένων SQL

Μια βάση δεδομένων SQL είναι μια αποθήκη αποθήκευσης όπου τα δεδομένα μπορούν να αποθηκευτούν σε δομημένη μορφή. Τώρα ας δημιουργήσουμε μια βάση δεδομένων χρησιμοποιώντας MySQL :

ΔΗΜΙΟΥΡΓΙΑ ΔΕΔΟΜΕΝΩΝ edureka ΧΡΗΣΗ edureka

Στον παραπάνω κώδικα, υπάρχουν δύο εντολές SQL:

Σημείωση : Οι εντολές SQL ορίζονται με κεφαλαία γράμματα και ένα ερωτηματικό χρησιμοποιείται για τον τερματισμό μιας εντολής SQL.

  1. ΔΗΜΙΟΥΡΓΙΑ ΔΕΔΟΜΕΝΩΝ: Αυτή η εντολή δημιουργεί μια βάση δεδομένων που ονομάζεται «edureka»

  2. ΧΡΗΣΗ: Αυτή η εντολή χρησιμοποιείται για την ενεργοποίηση της βάσης δεδομένων. Εδώ ενεργοποιούμε τη βάση δεδομένων «edureka».

Βήμα 2: Δημιουργήστε έναν πίνακα με τις απαιτούμενες δυνατότητες δεδομένων

Η δημιουργία ενός πίνακα είναι τόσο απλή όσο η δημιουργία μιας βάσης δεδομένων. Απλά πρέπει να ορίσετε τις μεταβλητές ή τα χαρακτηριστικά του πίνακα με τους αντίστοιχους τύπους δεδομένων τους. Ας δούμε πώς μπορεί να γίνει αυτό:

μετατροπή συμβολοσειράς σε ημερομηνία στην Java
ΔΗΜΙΟΥΡΓΙΑ ΠΙΝΑΚΑΣ παιχνιδιών (TID INTEGER NOT NULL PRIMARY KEY AUTO_INCREMENT, Item_name TEXT, Price INTEGER, Quantity INTEGER)

Στο παραπάνω απόσπασμα κώδικα εμφανίζονται τα ακόλουθα πράγματα:

  1. Χρησιμοποιήστε την εντολή 'ΔΗΜΙΟΥΡΓΙΑ ΠΙΝΑΚΑ' για να δημιουργήσετε έναν πίνακα που ονομάζεται παιχνίδια.
  2. Ο πίνακας παιχνιδιών περιέχει 4 δυνατότητες, δηλαδή, TID (Transaction ID), Item_name, Price και Quantity.
  3. Κάθε μεταβλητή καθορίζεται με τους αντίστοιχους τύπους δεδομένων.
  4. Η μεταβλητή TID δηλώνεται ως πρωτεύον κλειδί. Ένα πρωτεύον κλειδί υποδηλώνει βασικά μια μεταβλητή που μπορεί να αποθηκεύσει μια μοναδική τιμή.

Μπορείτε να ελέγξετε περαιτέρω τις λεπτομέρειες του καθορισμένου πίνακα χρησιμοποιώντας την ακόλουθη εντολή:

ΠΕΡΙΓΡΑΦΗ παιχνίδια

Βήμα 3: Εισαγωγή δεδομένων στον πίνακα

Τώρα που δημιουργήσαμε έναν πίνακα, ας το συμπληρώσουμε με μερικές τιμές. Νωρίτερα σε αυτό το ιστολόγιο, ανέφερα πώς μπορείτε να προσθέσετε δεδομένα σε έναν πίνακα χρησιμοποιώντας απλώς μια εντολή, δηλαδή, ΕΙΣΑΓΩΓΗ INTO.

Ας δούμε πώς γίνεται αυτό:

INSERT INTO παιχνίδια ΤΙΜΕΣ (NULL, 'Train', 550, 88) INSERT INTO παιχνίδια VALUES (NULL, 'Hotwheels_car', 350, 80) INSERT INTO παιχνίδια VALUES (NULL, 'Magic_Pencil', 70, 100) INSERT INTO VALUES παιχνιδιών ( NULL, 'Dog_house', 120, 54) INSERT INTO παιχνίδια VALUES (NULL, 'Skateboard', 700, 42) INSERT INTO παιχνίδια VALUES (NULL, 'GI Joe', 300, 120)

Στο παραπάνω απόσπασμα κώδικα, απλώς προσθέσαμε 6 παρατηρήσεις στον πίνακα «παιχνίδια» χρησιμοποιώντας την εντολή INSERT INTO. Για κάθε παρατήρηση, εντός των παρενθέσεων, έχω καθορίσει την τιμή κάθε μεταβλητής ή λειτουργίας που ορίστηκε κατά τη δημιουργία του πίνακα.

Η μεταβλητή TID έχει οριστεί σε NULL, καθώς αυξάνεται αυτόματα από το 1.

Τώρα ας εμφανίσουμε όλα τα δεδομένα που υπάρχουν στον πίνακα μας. Αυτό μπορεί να γίνει χρησιμοποιώντας την παρακάτω εντολή:

ΕΠΙΛΕΞΤΕ * ΑΠΟ παιχνίδια


Βήμα 4: Τροποποιήστε τις καταχωρίσεις δεδομένων

Ας πούμε ότι αποφασίσατε να αυξήσετε την τιμή του G.I. Τζο γιατί σε κάνει πολλούς πελάτες. Πώς θα ενημερώσετε την τιμή της μεταβλητής σε μια βάση δεδομένων;

Είναι απλό, απλώς χρησιμοποιήστε την παρακάτω εντολή:

ΕΝΗΜΕΡΩΣΗ παιχνιδιών SET Τιμή = 350 WHERE TID = 6

Η εντολή ΕΝΗΜΕΡΩΣΗ σάς επιτρέπει να τροποποιήσετε τυχόν τιμές / μεταβλητές που είναι αποθηκευμένες στον πίνακα. Η παράμετρος SET σάς επιτρέπει να επιλέξετε ένα συγκεκριμένο χαρακτηριστικό και η παράμετρος WHERE χρησιμοποιείται για τον προσδιορισμό της μεταβλητής / τιμής που θέλετε να αλλάξετε. Στην παραπάνω εντολή, έχω ενημερώσει την τιμή της καταχώρισης δεδομένων της οποίας το TID είναι 6 (G.I. Joe).

Τώρα ας δούμε τον ενημερωμένο πίνακα:

ΕΠΙΛΕΞΤΕ * ΑΠΟ παιχνίδια

Μπορείτε επίσης να τροποποιήσετε αυτό που θέλετε να εμφανίζεται απλώς αναφερόμενοι στις στήλες που θέλετε να προβάλετε. Για παράδειγμα, η παρακάτω εντολή θα εμφανίζει μόνο το όνομα του παιχνιδιού και την αντίστοιχη τιμή του:

pass by value vs pass by referensi java
SELECT Item_name, Τιμή ΑΠΟ παιχνίδια

Βήμα 5: Ανάκτηση δεδομένων

Έτσι, μετά την εισαγωγή των δεδομένων και την τροποποίησή τους, είναι πλέον καιρός να εξαγάγετε και να ανακτήσετε τα δεδομένα σύμφωνα με τις επιχειρηματικές απαιτήσεις. Εδώ μπορούν να ανακτηθούν δεδομένα για περαιτέρω ανάλυση δεδομένων και μοντελοποίηση δεδομένων.

Λάβετε υπόψη ότι αυτό είναι ένα απλό παράδειγμα για να ξεκινήσετε με το SQL, ωστόσο, σε σενάρια πραγματικού κόσμου τα δεδομένα είναι πολύ πιο περίπλοκα και μεγάλα σε μέγεθος. Παρ 'όλα αυτά, οι εντολές SQL παραμένουν οι ίδιες και αυτό κάνει το SQL τόσο απλό και κατανοητό. Μπορεί να επεξεργαστεί πολύπλοκα σύνολα δεδομένων με ένα σύνολο απλών εντολών SQL.

Τώρα ας ανακτήσουμε δεδομένα με μερικές τροποποιήσεις. Ανατρέξτε στον παρακάτω κώδικα και προσπαθήστε να καταλάβετε τι κάνει χωρίς να κοιτάξετε την έξοδο:

ΕΠΙΛΟΓΗ * ΑΠΟ παιχνίδια ΟΡΙΑ 2

Το μάντεψες! Εμφανίζει τις δύο πρώτες παρατηρήσεις που υπάρχουν στον πίνακα μου.

Ας δοκιμάσουμε κάτι πιο ενδιαφέρον.

ΕΠΙΛΕΞΤΕ * ΑΠΟ παιχνίδια ΠΑΡΑΓΓΕΛΙΑ ΑΝΑ Τιμή ASC

Όπως φαίνεται στο σχήμα, οι τιμές διευθετούνται σε σχέση με την αύξουσα σειρά της μεταβλητής τιμής. Αν θέλετε να αναζητήσετε τα τρία είδη που αγοράσατε πιο συχνά, τι θα κάνατε;

Είναι πολύ απλό!

ΕΠΙΛΟΓΗ * ΑΠΟ παιχνίδια ΠΑΡΑΓΓΕΛΙΑ ΜΕ ΠΟΣΟΤΙΚΟ ΟΡΙΟ 3

Ας δοκιμάσουμε ένα ακόμη.

ΕΠΙΛΕΞΤΕ * ΑΠΟ παιχνίδια ΠΟΥ ΑΠΟΣΤΑΣΗ> 400 ΠΑΡΑΓΓΕΛΙΑ ΑΝΑ Τιμή ASC


Αυτό το ερώτημα εξάγει τις λεπτομέρειες των παιχνιδιών των οποίων η τιμή είναι μεγαλύτερη από 400 και τακτοποιεί την έξοδο σε αύξουσα σειρά της τιμής.

Έτσι μπορείτε να επεξεργαστείτε δεδομένα χρησιμοποιώντας SQL. Τώρα που γνωρίζετε τα βασικά του SQL για την Επιστήμη δεδομένων, είμαι βέβαιος ότι θέλετε να μάθετε περισσότερα. Ακολουθούν μερικά ιστολόγια για να ξεκινήσετε:

  1. Τι είναι η επιστήμη δεδομένων; Ένας οδηγός για αρχάριους στην επιστήμη δεδομένων
  2. MySQL Tutorial - Ένας οδηγός για αρχάριους για να μάθετε τη MySQL

Εάν επιθυμείτε να εγγραφείτε για ένα πλήρες μάθημα Τεχνητής Νοημοσύνης και Μηχανικής Μάθησης, η Edureka διαθέτει μια ειδικά επιμελημένη που θα σας κάνει ικανό σε τεχνικές όπως η εποπτευόμενη μάθηση, η μη εποπτευόμενη εκμάθηση και η επεξεργασία φυσικής γλώσσας. Περιλαμβάνει εκπαίδευση σχετικά με τις τελευταίες εξελίξεις και τεχνικές προσεγγίσεις στην Τεχνητή Νοημοσύνη & Μηχανική Μάθηση όπως η Βαθιά Μάθηση, τα Γραφικά Μοντέλα και η Ενίσχυση Μάθησης.