Ερωτήσεις συνέντευξης για την Επιστήμη δεδομένων Google: Το μόνο που πρέπει να ξέρετε για να το σπάσετε

Αυτό το άρθρο σάς παρέχει μια σειρά από το Google Data Science Interview Questiosn, τη διαδικασία συνέντευξης και τις προϋποθέσεις για να υποβάλετε αίτηση για εργασία στο Google.

Η πρόσληψη σε μια παγκοσμίου φήμης εταιρεία όπως η Google είναι μια δουλειά ονείρου για πολλούς ανθρώπους. Έχουν μερικούς από τους πιο ταλαντούχους ερευνητές επιστημονικής τεχνητής νοημοσύνης, και στον κόσμο. Δεν υπάρχουν πολλές πηγές για το Google Ερωτήσεις για συνέντευξη στο διαδίκτυο και δεν είναι εύκολο να βρεις δουλειά εκεί. Έτσι, θα καλύψω τα ακόλουθα θέματα σε αυτό το άρθρο:



Περιγραφή εργασίας και απαιτήσεις

Με μέσο μισθό 169.067 $ , συμπεριλαμβανομένου του μπόνους. Ο μισθός του Google Data Scientist κυμαίνεται από 120.000 $ - 280.000 $ . Με αυτόν τον υψηλό μισθό, πρέπει να γνωρίζετε τις σωστές απαιτήσεις για την εργασία που υποβάλλετε αίτηση. Αν και οι απαιτήσεις διαφέρουν από θέση σε θέση, Παρακάτω είναι μερικές από τις κοινές:

Ελάχιστη απαίτηση:



πώς να βγείτε από ένα πρόγραμμα στην Java

google

πώς να αποκτήσετε το μήκος ενός πίνακα σε javascript
  • Μεταπτυχιακό στην Ποσοτική Πειθαρχία (Στατιστική, Έρευνα Επιχειρήσεων, Επιστήμη Υπολογιστών)
  • 2 χρόνια εργασιακής εμπειρίας στον τομέα που σχετίζεται με την Ανάλυση δεδομένων
  • Εμπειρία με στατιστικό λογισμικό (π.χ. Ρ , , MATLAB, Pandas) και
  • Εμπειρία με γλώσσες βάσης δεδομένων (π.χ. SQL )

Ευθύνες:



  • Εργαστείτε με μεγάλα, πολύπλοκα σύνολα δεδομένων. Λύστε δύσκολα, μη ρουτίνα προβλήματα ανάλυσης, εφαρμόζοντας προηγμένες αναλυτικές μεθόδους όπως απαιτείται
  • Διεξαγωγή ανάλυσης που περιλαμβάνει συλλογή δεδομένων και προδιαγραφές απαιτήσεων, επεξεργασία, ανάλυση, συνεχή παραδοτέα και παρουσιάσεις
  • Κατασκευάστε και δοκιμάστε πρωτότυπους αγωγούς επαναληπτικά για να παρέχετε πληροφορίες σε κλίμακα
  • Αναπτύξτε περιεκτική γνώση των δομών και μετρήσεων δεδομένων της Google, υποστηρίζοντας αλλαγές όπου απαιτείται για την ανάπτυξη προϊόντων
  • Αλληλεπιδράστε διαλειτουργικά, κάνοντας επιχειρηματικές προτάσεις (π.χ. κόστος-ωφέλεια, πρόβλεψη, ανάλυση πειράματος)
  • Έρευνα και ανάπτυξη μεθόδων ανάλυσης, πρόβλεψης και βελτιστοποίησης για τη βελτίωση της ποιότητας των προϊόντων που αντιμετωπίζει η Google

Διαδικασία συνέντευξης στο Google Data Science

Η εκκαθάριση της σύντομης λίστας είναι από μόνη της μια δύσκολη εργασία, η οποία εξαρτάται εξ ολοκλήρου από τη δική σας Βιογραφικό σημείωμα, συνοδευτική επιστολή και το Εμπειρία . Google Επιστημονικά δεδομένα Οι ερωτήσεις συνέντευξης είναι ένα μείγμα από πειράγματα εγκεφάλου και τεχνικά ερωτήματα. Συνήθως, η πρώτη διαδικασία είναι η τηλεφωνική συνέντευξη.

Τηλεφωνική συνέντευξη:

Αποτελείται από ερωτήσεις που βασίζονται κυρίως σε (συγκεκριμένο και θεωρητικό) και βασίζεται σε μεγάλο βαθμό . Οι ερωτήσεις ποικίλλουν επίσης ανάλογα με τα έργα στα οποία έχετε εργαστεί.
  • Περίπτωση 1: Οι συνεντεύξεις ρώτησαν για τεχνικές εξαγωγής χαρακτηριστικών, PCA (Χρησιμοποιείται σε έργα), ανάλυση συσχέτισης, ορισμένες τεχνικές ταξινόμησης που χρησιμοποιήθηκαν (SVM, GBM, neural net). Γιατί όχι υλικοτεχνική παλινδρόμηση, γιατί GBM; - Βασικά ερωτήσεις που περιστρέφονται γύρω από το διαχωρισμό της τάξης.
  • Περίπτωση 2: Γιατί να χρησιμοποιήσετε την επιλογή χαρακτηριστικών; Εάν δύο προγνωστικοί παράγοντες συσχετίζονται σε μεγάλο βαθμό, ποια είναι η επίδραση στους συντελεστές της λογιστικής παλινδρόμησης; Ποια είναι τα διαστήματα εμπιστοσύνης των συντελεστών;
  • Περίπτωση 3: Ένας δίσκος περιστρέφεται σε έναν άξονα και δεν γνωρίζετε την κατεύθυνση με την οποία περιστρέφεται ο δίσκος. Σας παρέχεται ένα σετ καρφιτσών. Πώς θα χρησιμοποιήσετε τις ακίδες για να περιγράψετε με ποιον τρόπο περιστρέφεται ο δίσκος;
Μετά τις τηλεφωνικές συνεντεύξεις, είναι ο Γύρος πρόσωπο με πρόσωπο και κωδικοποίηση. Ας συζητήσουμε λοιπόν μερικές από τις πιο κοινές ερωτήσεις συνέντευξης για την επιστήμη δεδομένων Google. Αν και αυτές οι ερωτήσεις μπορεί να μην τεθούν ακριβώς όπως δίνεται παρακάτω, προσπάθησα να καλύψω πολλές από αυτές.

Ερωτήσεις συνέντευξης για την Επιστήμη δεδομένων Google

Αυτές οι ερωτήσεις δεν είναι παζλ, καθώς η Google έχει σταματήσει να υποβάλλει αυτές τις ερωτήσεις αντ 'αυτού, έχουν παρόμοιες ερωτήσεις τις οποίες καλούν Ερωτήσεις επίλυσης προβλημάτων . Ζητούνται πολλές ερωτήσεις μηχανικής μάθησης, από γενικές έως πρακτικές. Google βασικά καλύπτει το εύρος των θεμάτων και όχι το Βάθος. Ε1. Βρίσκεστε σε καζίνο και έχετε δύο ζάρια για να παίξετε. Κερδίζετε 10 $ κάθε φορά που ρίχνετε ένα 5. Εάν παίζετε μέχρι να κερδίσετε και μετά σταματήσετε, ποια είναι η αναμενόμενη πληρωμή; Ε2. Πρόκειται να φτάσετε με αεροπλάνο στο Λονδίνο, θέλετε να μάθετε αν πρέπει να φέρετε μια ομπρέλα ή όχι. Καλέστε τρεις από τους τυχαίους φίλους σας και ως καθένας τους εάν βρέχει. Η πιθανότητα ότι ο φίλος σας λέει την αλήθεια είναι 2/3 και η πιθανότητα ότι παίζουν μια φάρσα σε σας ψέματα είναι 1/3. Εάν και οι 3 λένε ότι βρέχει, τότε ποια είναι η πιθανότητα να βρέχει πραγματικά στο Λονδίνο. Ε3. Πώς θα προσθέσει νέο Facebook μέλη στη βάση δεδομένων των μελών, και κωδικοποιούν τις σχέσεις τους με άλλους στη βάση δεδομένων; Ε4. Πώς θα ελέγξετε ότι υπάρχει αυξημένη πιθανότητα ενός χρήστη να παραμείνει ενεργός μετά από 6 μήνες, δεδομένου ότι ένας χρήστης έχει περισσότερους φίλους τώρα; Ε5. Σας δίνονται 40 κάρτες με τέσσερα διαφορετικά χρώματα - 10 πράσινες κάρτες, 10 κόκκινες κάρτες, 10 μπλε κάρτες και 10 κίτρινες κάρτες. Οι κάρτες κάθε χρώματος αριθμούνται από ένα έως δέκα. Δύο κάρτες συλλέγονται τυχαία. Μάθετε την πιθανότητα οι κάρτες που έχουν επιλεγεί να μην έχουν τον ίδιο αριθμό και το ίδιο χρώμα. Ε6. Δημιουργήστε ένα πρόγραμμα σε μια γλώσσα της επιλογής σας για να διαβάσετε ένα αρχείο κειμένου με διάφορα tweets. Η έξοδος πρέπει να είναι 2 αρχεία κειμένου-ένα που περιέχει τη λίστα με όλες τις μοναδικές λέξεις μεταξύ όλων των tweets μαζί με τον αριθμό των επαναλαμβανόμενων λέξεων και το δεύτερο αρχείο πρέπει να περιέχει τον μεσαίο αριθμό μοναδικών λέξεων για όλα τα tweets. Ε7. Τι θα κάνετε αν η κατάργηση των τιμών που λείπουν από ένα σύνολο δεδομένων προκαλεί προκατάληψη; Ε8. Ένας δίσκος περιστρέφεται σε έναν άξονα και δεν γνωρίζετε την κατεύθυνση με την οποία περιστρέφεται ο δίσκος. Σας παρέχεται ένα σετ καρφιτσών. Πώς θα χρησιμοποιήσετε τις ακίδες για να περιγράψετε με ποιον τρόπο περιστρέφεται ο δίσκος; Ε9. Πώς θα σχεδιάσετε μια μηχανή προτάσεων για εργασίες; Ε10. Τι είδους προϊόν θέλετε να δημιουργήσετε στο Google; Ε11. Τα αυτοκίνητα εμφυτεύονται με tracker ταχύτητας, έτσι ώστε οι ασφαλιστικές εταιρείες να μπορούν να παρακολουθούν την κατάσταση οδήγησης. Με βάση αυτό το νέο σχήμα, τι είδους επιχειρηματικές ερωτήσεις μπορούν να απαντηθούν; Ε12. Πώς μπορείτε να αποφασίσετε εάν ένας αλγόριθμος είναι καλύτερος από τον άλλο; Ε13. Ένα κουτί έχει 12 κόκκινες κάρτες και 12 μαύρες κάρτες. Ένα άλλο κουτί έχει 24 κόκκινες κάρτες και 24 μαύρες κάρτες. Θέλετε να τραβήξετε δύο κάρτες τυχαία από ένα από τα δύο κουτιά, ποιο κουτί έχει μεγαλύτερη πιθανότητα να πάρει κάρτες του ίδιου χρώματος και γιατί; Ε14. Ποια είναι η διαφορά μεταξύ ενός μοντέλου με σάκους και ενός ενισχυμένου μοντέλου; Ε15. Δημιουργείτε μια αναφορά για μεταφορτώσεις περιεχομένου χρήστη κάθε μήνα και παρατηρείτε μια ξαφνική αύξηση του αριθμού των μεταφορτώσεων για τον μήνα Ιανουάριο. Η αύξηση των μεταφορτώσεων είναι, ιδίως στις μεταφορτώσεις εικόνων. Ποια νομίζετε ότι θα είναι η αιτία για αυτό και πώς θα δοκιμάσετε αυτήν την ξαφνική ακίδα; Ε16. Έχετε μια επιχείρηση ένδυσης και θέλετε να βελτιώσετε τη θέση σας στην αγορά. Πώς θα το κάνετε από το επίπεδο του εδάφους; Ε17. Πώς θα αποφασίσετε ποιες εκδόσεις των δύο αλγόριθμων Surge Pricing λειτουργεί καλύτερα για οποιαδήποτε αεροπορική εταιρεία; Ε18. Ποιος είναι ο βαθμός ελευθερίας για το λάσο; Ε19. Ποια είναι η διαφορά μεταξύ της επανάληψης, της γεννήτριας και της κατανόησης λίστας στο Python; Ε20. Δεδομένου ενός συνόλου ιστοσελίδων και αλλαγών στον ιστότοπο, πώς θα δοκιμάσετε τη νέα δυνατότητα ιστότοπου για να διαπιστώσετε εάν η αλλαγή λειτουργεί θετικά; Ε21. Λαμβάνοντας υπόψη έναν πίνακα διαστάσεων MxN με κάθε κελί που περιέχει ένα αλφάβητο, βρείτε αν υπάρχει μια συμβολοσειρά ή όχι. Ε22. Πώς θα δημιουργήσετε ένα σύστημα προσωρινής αποθήκευσης χρησιμοποιώντας μια προηγμένη δομή δεδομένων όπως το hashmap; Ε23. Εάν μπορούσατε να λάβετε το σύνολο δεδομένων για οποιοδήποτε θέμα ενδιαφέροντος, ανεξάρτητα από τις μεθόδους συλλογής ή τους πόρους, τότε πώς θα μοιάζει το σύνολο δεδομένων και τι θα κάνετε με αυτό; Ε24. Τι είναι οι μέθοδοι ανίχνευσης ανωμαλιών; Ε25. Πώς λειτουργεί η προσωρινή αποθήκευση και πώς τη χρησιμοποιείτε στην Επιστήμη δεδομένων; Λοιπόν, παιδιά, με αυτό καταλήγουμε σε αυτό το άρθρο. Οι ερωτήσεις συνέντευξης της Επιστήμης δεδομένων Google είναι κυρίως βασισμένο σενάριο και απαιτούν να έχετε Ικανότητες επίλυσης προβλημάτων και επιπλέον πρέπει να γνωρίζετε πώς να εφαρμόσετε την Επιστήμη Δεδομένων σε αυτές τις καταστάσεις. Ελπίζω ότι αυτό θα σας δώσει μια προοπτική να προετοιμαστείτε για οποιαδήποτε συνέντευξη για την επιστήμη δεδομένων στο μέλλον. Είτε πρόκειται για Google, Microsoft, Apple ή Uber. Όλοι οι τεχνολογικοί γίγαντες υποβάλλουν παρόμοια είδη ερωτήσεων όσον αφορά την Επιστήμη δεδομένων, καθώς είναι ένα τεράστιο και ταυτόχρονα νέο πεδίο. σε κάνει ικανό στα εργαλεία και τα συστήματα που χρησιμοποιούνται από τους Data Science Professionals. Περιλαμβάνει εκπαίδευση στατιστικής, Επιστήμης δεδομένων, Python, Apache Spark & ​​Scala, Tensorflow και Tableau. Το πρόγραμμα σπουδών καθορίστηκε από εκτεταμένη έρευνα για 5000+ περιγραφές θέσεων εργασίας σε όλο τον κόσμο. Αν έχετε απορίες, μη διστάσετε να αναφέρετε στην παρακάτω ενότητα σχολίων.