Η καμπύλη Gauss στις πιθανότητες
Στη σειρά του ΒΗΜΑ-Science για όσους θέλουν να φτιάξουν ξανά τη… σχέση τους με τα Μαθηματικά προχωρούμε στον τρόπο σύνδεσης των διαφόρων ειδών δεδομένων με τη συχνότητα που αυτά εμφανίζονται στην καθημερινότητά μας.
Από το προηγούμενο σημείωμά μας κρατούμε δύο πολύ σημαντικά πράγματα:
Η κατανομή είναι μια συλλογή τιμών, της δίνουμε και ένα όνομα ρεαλιστικό (ή και όχι, η ονομασία δεν παίζει ρόλο), π.χ. «ύψη αγοριών» ή «μικρά θηρία», και αυτή τη συλλογή μάς βολεύει να την απεικονίζουμε στην επιφάνεια που ορίζει ένα ζεύγος καθέτων μεταξύ τους αξόνων. Στον έναν άξονα, για παράδειγμα, τα ύψη και στον άλλον πόσα παιδιά έχουν το αντίστοιχο ύψος.
Ήδη από τα μέσα του 18ου αιώνα παρατηρήθηκε ότι αυτές οι απεικονίσεις των κατανομών, των παρμένων από τη ζωή (οι διακυμάνσεις στο βάρος μιας μπαγκέτας ψωμιού κάθε ημέρα από τον ίδιο φούρνο επί έναν χρόνο ή το ύψος των παιδιών σε μια τάξη), έδιναν μια καμπύλη με συμπυκνωμένη πληροφορία και το πολύ σημαντικό, που δεν τονίζεται πάντα όσο πρέπει, είναι πως μπορεί το σχήμα της να προκύπτει από τα δεδομένα, αλλά αυτό το σχήμα μπορεί να προσεγγιστεί θεωρητικά, και στα περισσότερα σημεία της, από κάποιον μαθηματικό τύπο. Αρα με «μαθηματικά εργαλεία» να αποσπούμε πληροφορίες από την κατανομή αυτήν.
Τα στοιχεία
Εχει πολύ ενδιαφέρον λοιπόν να δούμε πρώτα πώς μπαίνουν σε… τάξη τα δεδομένα. Διότι αυτά θα είναι στη συνέχεια το απαραίτητο «καύσιμο» για τη δημιουργία των κατανομών και από εκεί των εκτιμήσεων που θα γίνουν με βάση τα εργαλεία της στατιστικής. Αφού ανάμεσα στις άλλες υπηρεσίες της στατιστικής είναι οι όσο γίνεται πιο έγκυρες εκτιμήσεις με βάση ένα δείγμα μόνον από το σύνολο των δεδομένων.
Για ό,τι μας ενδιαφέρει εδώ χωρίζουμε τα στοιχεία πρώτα σε «κατηγορικά» και σε «αριθμητικά». Ο παράξενος όρος «κατηγορικά» οφείλεται στο ότι αναφέρεται σε στοιχεία που ανήκουν σε διάφορες κατηγορίες. Μπορεί να είναι εντελώς περιγραφικά (nominal), όπως για παράδειγμα όταν μια εταιρεία καταχωρίζει στοιχεία για τους υπαλλήλους της: φύλο, εθνικότητα, θέση στην επιχείρηση, και δεν μπορούν να καταταχθούν με βάση κάποιο μέγεθος. Μπορεί να αντιστοιχηθούν και αριθμοί σε κάποιες κατηγορίες, όπως το 1 για το «Ναι» και το 0 για το «Οχι», αλλά δεν θα λειτουργούν ως αριθμοί και δεν θα γίνονται πράξεις με αυτούς. Ας πούμε στα κατηγορικά στοιχεία για έναν ποδοσφαιριστή θα έμπαιναν οι ομάδες στις οποίες έχει παίξει. Υπάρχουν όμως και τα διατάξιμα (ordinal) κατηγορικά στοιχεία που ενέχουν και την έννοια μιας κατάταξης χωρίς συγκεκριμένη (αριθμητική) «απόσταση» μεταξύ τους. Για παράδειγμα, η εκπαίδευση: Πρωτοβάθμια, Δευτεροβάθμια, Τριτοβάθμια ή στο παράδειγμα του ποδοσφαιριστή τέτοια δεδομένα θα ήταν το σε ποια θέση παίζει (αμυντικός, μέσος, επιθετικός).
Υπάρχουν όμως και τα γνήσια αριθμητικά δεδομένα, ή αλλιώς ποσοτικά δεδομένα, που θα τα χωρίσουμε σε διακριτά και σε συνεχή. Στην πρώτη περίπτωση μπορούμε να συναντήσουμε ορισμένες μόνον τιμές. Ενα παράδειγμα διακριτών δεδομένων είναι οι πόντοι ενός μπασκετμπολίστα, διότι θα έχουμε να κάνουμε μόνον με ακέραιους θετικούς αριθμούς. Τα δεδομένα για τη θερμοκρασία, αντίθετα, ανήκουν στα συνεχή. Και μια και αναφέρθηκε η θερμοκρασία, αξίζει να επισημανθεί πως ανήκει επίσης στα λεγόμενα «δεδομένα με αυθαίρετο μηδέν» (αφού το ορίζουμε εμείς), με τη συνέπεια όμως να μην έχει νόημα ο πολλαπλασιασμός αλλά μόνον η πρόσθεση και η αφαίρεση. Αλλο τέτοιο μέγεθος είναι ο δείκτης νοημοσύνης. Στα ποσοτικά δεδομένα με απόλυτο μηδέν είναι γνωστό και ορισμένο το πού βρίσκεται το 0. Στο υψόμετρο βρίσκεται στην επιφάνεια της θάλασσας και στην ταχύτητα όταν το κινητό παραμένει… ακίνητο.
Στα ποσοτικά
Χρειάζεται αρκετή ευελιξία για να κινείται κάποιος μέσα σε όλες αυτές τις διαιρέσεις και υποδιαιρέσεις. Για παράδειγμα, από κατηγορικά δεδομένα, όπως είναι το πόσα τρίποντα πέτυχε κάποιος (μπήκε ή δεν μπήκε το τρίποντο) μπορούμε να φθάσουμε σε ποσοτικά δεδομένα όταν κάνουμε τη διαίρεση τρίποντα/προσπάθειες για τρίποντα.
Και ακριβώς εδώ είναι το κατάλληλο σημείο να κάνει την είσοδό της και η «πιθανότητα να συμβαίνει κάτι». Το αν θα έλθει ένα νόμισμα κορόνα ή γράμματα είναι κάτι τυχαίο. Γι’ αυτό και ό,τι βάλουμε να συμβολίζει την έκβαση στο στρίψιμο θα λέγεται «τυχαία μεταβλητή». Και μας ενδιαφέρει πολύ να γνωρίζουμε την πιθανότητα μια τυχαία μεταβλητή να παίρνει συγκεκριμένη τιμή.
Πνευματική Γυμναστική
Εχουμε τρία ζευγάρια ξύλινες μπάλες με τρία διαφορετικά χρώματα: Λευκό, κόκκινο και μπλε. Στο κάθε χρώμα έχουμε μια μπάλα πιο βαριά από την άλλη, ας πούμε κατά 5 γραμμάρια. Αλλά όλες οι ελαφριές μπάλες έχουν το ίδιο βάρος και όλες οι βαριές επίσης. Με τη βοήθεια ενός ζυγού ακριβείας, που έχει από έναν δίσκο αριστερά και δεξιά, θέλουμε να ξεχωρίσουμε τις ελαφριές από τις βαριές. Με πόσες το λιγότερο ζυγίσεις θα το καταφέρουμε;
Οι λύσεις των προηγούμενων κουίζ
- Την προηγούμενη Κυριακή είχε τεθεί το εξής ερώτημα: Από την κορυφή ενός κύβου (εκεί που είναι η συνάντηση τριών εδρών) φέρουμε τη διαγώνιο που αντιστοιχεί και βρίσκεται επάνω σε κάθε μία από τις δύο αυτές έδρες. Πόση είναι η γωνία που σχηματίζεται μεταξύ τους; Η λύση ήταν πολύ απλή, γι’ αυτό και θεωρήθηκε μάλλον δύσκολη στη σύλληψή της. Για τη λύση λοιπόν αρκεί να φέρει κάποιος τη διαγώνιο της απέναντι έδρας που θα ενώνει τα άκρα των δύο άλλων διαγωνίων. Διότι έτσι προκύπτει ένα επίπεδο ισόπλευρο τρίγωνο αφού οι διαγώνιοι των εδρών του κύβου είναι ίσες μεταξύ τους. Στο ισόπλευρο τρίγωνο όμως όλες οι γωνίες είναι ίσες με 60 μοίρες. Αρα και η ζητούμενη γωνία θα είναι 60 μοιρών.
- Εδώ ζητούσαμε το να δικαιολογήσουμε τον τύπο του εμβαδού οποιουδήποτε τριγώνου που είναι: Βάση Χ ύψος / 2. Αν ξεκινήσουμε από ένα ορθογώνιο παραλληλόγραμμο που γνωρίζουμε πως το εμβαδόν του είναι το γινόμενο της βάσης επί του ύψους και σκεφθούμε πως αποτελείται από δύο τρίγωνα ορθογώνια (αρκεί να τραβήξουμε τη διαγώνιο) βλέπουμε ότι για το καθένα από τα τρίγωνα θα ισχύει ότι το εμβαδό τους είναι βάση Χ ύψος / 2. Επειδή όμως αυτό είναι μερική περίπτωση, πηγαίνουμε σε ένα πλάγιο παραλληλόγραμμο που πάλι αποτελείται από δύο τρίγωνα όχι πλέον ορθογώνια. Επειδή όμως ένα πλάγιο παραλληλόγραμμο μπορεί να μετασχηματιστεί σε ορθογώνιο ισοδύναμο (δηλαδή να έχουν ίσα εμβαδά), έχουμε ξανά την προηγούμενη περίπτωση: Εμβαδόν = Βάση Χ ύψος και το μισό για καθένα από τα δύο τρίγωνα. Χώρια βέβαια από τη γενικευμένη απόδειξη του τύπου για το εμβαδόν.
- Πολυτεχνείο: Ξεκινούν σήμερα Παρασκευή οι εκδηλώσεις μνήμης για την 51η επέτειο της εξέγερσης
- Συνταγή: Ριγκατόνι στο φούρνο με τριμμένο τυρί και κοτόπουλο
- Αποκάλυψη in: Έψαξαν τις κάμερες για το ύποπτο «φορτίο» της τραγωδίας στα Τέμπη προ …δύο ημερών
- Δεκάδες νεκροί από αεροπορικές επιδρομές του Ισραήλ σε Συρία, Λίβανο και Λωρίδα της Γάζας
- Ντόναλντ Τραμπ: Οι άνθρωποι του νεοεκλεγμένου προέδρου των ΗΠΑ
- The KVB: Έρχονται στην Ελλάδα για δύο βραδιές σκοτεινής δημιουργικότητας