Υποθέσεις και μηδενικά
Στη σειρά του ΒΗΜΑ-Science για όσους θέλουν να φτιάξουν ξανά τη «σχέση» τους με τα Μαθηματικά, βλέπουμε σημαντικά εργαλεία των επαγγελματιών της Στατιστικής και καταλαβαίνουμε με ποια λογική βγαίνουν μερικά από τα στατιστικά αποτελέσματα που έχουν να κάνουν με την καθημερινότητά μας
Η Στατιστική έχει τη δική της γλώσσα, συνθηματική, ενίοτε και ακατανόητη για τους μη ειδικούς. Αυτό έχει ως συνέπεια για όποιον δεν την καταλαβαίνει, η δειγματοληψία να του φαίνεται παρακινδυνευμένη ως προς την εγκυρότητά της, η διαδικασία εξαγωγής των αποτελεσμάτων σκοτεινή και τα συμπεράσματα από αυτά διαβλητά. Με αποτέλεσμα κάποιες φορές εδώ να αναφύεται και μια παραδοξότητα. Να μας φαίνεται δηλαδή κατανοητός και άρα αξιόπιστος ο απλός μέσος όρος των τιμών από μια δειγματοληψία παρόλο που εκεί εύκολα μπορεί να κρύβεται κάποια προσπάθεια παραπλάνησης. Αντίθετα, όταν μας πουν ότι για ένα δείγμα ο βαθμός αξιοπιστίας είναι 95% να σκεφτόμαστε «μήπως το έχουν παρακάνει;».
«Λεξιλόγιο»
Εμείς θα εισέλθουμε στη… στατιστική επικράτεια προσεκτικά και συντεταγμένα. Πρώτα χρειάζεται εξοικείωση με τη γλώσσα των «κατοίκων». Το πρώτο είναι η λέξη «υπόθεση». Οι άνθρωποι της στατιστικής επιστήμης κάνουν την εξής διάκριση: Υπάρχουν οι επιστημονικές υποθέσεις, π.χ. τα ηλεκτρικά φορτία όταν κινούνται δημιουργούν μαγνητικό πεδίο. Εκείνοι όμως δεν ασχολούνται με αυτές αλλά με τις λεγόμενες στατιστικές υποθέσεις και εκεί εξετάζουν τον τρόπο συμπεριφοράς κάποιας ή κάποιων από τις λεγόμενες τυχαίες μεταβλητές. Η λέξη «τυχαίο» εδώ να εννοηθεί με την έννοια ότι δεν ξέρουμε από πριν τι τιμές θα πάρει ακριβώς. Τυχαία μεταβλητή είναι π.χ. το σωματικό βάρος των παιδιών και σε μια υπόθεση μπορεί να ζητούμε να συγκριθεί το βάρος των παιδιών στην 1η Δημοτικού σε Αθήνα και Θεσσαλονίκη. Το σύνολο των παιδιών που μας ενδιαφέρει στην καθεμία από τις δύο πόλεις είναι ο πληθυσμός και επειδή συνήθως δεν θα κάνουμε μετρήσεις βάρους σε όλα τα παιδιά αλλά θα επιλέξουμε ένα αντιπροσωπευτικό υποσύνολό τους, αυτό είναι το στατιστικό δείγμα. Και όπως αναφέραμε και σε προηγούμενη φορά, δουλειά μας θα είναι, από αυτό το μικρότερο δείγμα, με τη βοήθεια των κατάλληλων εργαλείων, να βγάλουμε όσο γίνεται πιο κοντινό στην αλήθεια συμπέρασμα για όλον τον πληθυσμό.
Η αξία της απόρριψης
Συχνά έχουμε σε ένα πρόβλημα δύο υποθέσεις που να πρέπει να ερευνήσουμε την αλήθεια τους. Σχετίζονται μεταξύ τους αλλά δεν μπορούν να είναι σωστές και οι δύο. Εχει επικρατήσει να συμβολίζεται με Η0 και ονομάζεται «μηδενική υπόθεση» (null hypothesis) αυτή που αμφισβητείται (και άρα συμβολικά θέλουμε να εκμηδενίσουμε την όποια πιθανότητα έχει να ισχύει) και με ΗΑ ή και Η1 η λεγόμενη «εναλλακτική», που συνήθως πιστεύουμε πως είναι και η πιο λογική. Ισως θα ήταν πιο ακριβές να αποκαλούσαμε την Η0 «την προς μηδενισμό» υπόθεση.
Και στην ερώτηση γιατί δεν περιοριζόμαστε να εξετάσουμε μόνο την εναλλακτική υπόθεση ΗΑ η απάντηση είναι πως πρόκειται για επιστημονικά καθιερωμένη και παραδεκτή μέθοδο και αν δεν πορευθούμε έτσι η αποδοχή από την κοινότητα θα είναι μηδαμινή.
Αυτό άλλωστε γινόταν έτσι εδώ και αιώνες. Το ότι «η Γη είναι επίπεδη» θα μπορούσε να είναι μια υπόθεση Η0 και το ότι είναι σφαιρική αντίστοιχα η ΗΑ. Ο Κοπέρνικος ασχολήθηκε με το να αποδείξει πρώτα ότι δεν μπορεί να υφίσταται η Η0.
Εξάσκηση
Σίγουρα χρειάζεται κάποια εξάσκηση για να διατυπώνει κάποιος σωστά την Η0. Οι επαΐοντες μας συνιστούν να ξεκινούμε ρίχνοντας στο τραπέζι μια ερώτηση σχετική με τις μεταβλητές που μπαίνουν στο πρόβλημα και από εκεί να βγάζουμε την Η0. Για παράδειγμα: Μαθαίνουν πιο γρήγορα τα παιδιά μια ξένη γλώσσα σε σχέση με τους ενηλίκους; Με βάση την ερώτηση αυτή προκύπτει ως Η0 η εξής: Η ηλικία δεν έχει επίδραση στην εκμάθηση μιας ξένης γλώσσας.
Αλλο παράδειγμα: Παίρνοντας κάθε ημέρα ασπιρίνη μειώνεται η πιθανότητα για καρδιακό επεισόδιο; Η0: Η καθημερινή λήψη ασπιρίνης δεν επηρεάζει τη συχνότητα των καρδιακών επεισοδίων. Και στον γνωστό ισχυρισμό: Facebook χρησιμοποιούν πιο πολύ οι μεγαλύτεροι σε ηλικία; Μια Η0 θα είναι: Δεν παίζει ρόλο η ηλικία στη χρήση του Facebook.
Και ένα ακόμη πιο κοντά στην πραγματικότητα παράδειγμα: Για ένα γόνατο μετά από αρθροσκόπηση ας πούμε ότι σήμερα χρειάζεται κατά μέσον όρο να περάσουν 4.5 ημέρες για να πατήσει κάποιος ελεύθερα. Προτείνεται μια νέα σειρά ασκήσεων για τη μετεγχειρητική γυμναστική όσων έχουν χειρουργηθεί στο γόνατο. Δεν ξέρουμε τα αποτελέσματα. Μπορεί να μειωθούν οι ημέρες αλλά και να αυξηθούν αν δεν είναι οι σωστές ασκήσεις. Ποια είναι εδώ η Η0; Η ερώτηση θα είναι: Τι θα γίνει αν οι ασκήσεις δεν έχουν αποτέλεσμα; Τότε θα χρειάζονται 4.5 ημέρες για την επαναφορά. Η εναλλακτική ΗΑ θα διατυπωθεί ως εξής: Ο μέσος όρος επαναφοράς δεν θα είναι 4.5 ημέρες. Ή αλλιώς: ΗΑ ≠ 4.5.
Πνευματική Γυμναστική
- Ποια είναι η πιθανότητα ένας δεκαψήφιος αριθμός (δηλαδή κάποιος μεταξύ 1 000 000 000 και 9 999 999 999) να αποτελείται από δέκα εντελώς διαφορετικά ψηφία;
- Το γνωστό «παράδοξο της σύμπτωσης των γενεθλίων»: Πόσα άτομα (όχι δίδυμα αδέλφια μέσα σε αυτό το σύνολο) σε μια γιορτή στο σπίτι (σε άλλες εποχές βέβαια) θα πρέπει να βρεθούν μαζί ώστε η πιθανότητα δύο να έχουν γεννηθεί την ίδια ημέρα του χρόνου να είναι μεγαλύτερη από 50%;
Οι λύσεις των προηγούμενων κουίζ
- Στη συνεδρίαση ενός συμβουλίου τράπεζας, τα 17 μέλη, πριν από την έναρξη, θα αντάλλασσαν χειραψίες όλοι με όλους. Αλλά 4 μέλη, για δικούς τους λόγους, δεν έδωσαν μεταξύ τους τα χέρια. Ζητούσαμε να βρεθεί πόσες χειραψίες έγιναν τελικά. Αρχίζουμε κάνοντας τη σκέψη ότι αν ήταν ν τα πρόσωπα στο συμβούλιο, το καθένα ανταλλάσσει χειραψία με (ν-1) άτομα, δηλαδή τα υπόλοιπα εκτός από τον εαυτό του. Αρα συνολικά θα έχουμε αριθμό χειραψιών: ν φορές το (ν-1); Οχι ακριβώς διότι έτσι θα έχει μετρηθεί δυο φορές μια χειραψία. Πρώτα του Α με τον Β και μετά του Β με τον Α. Αρα, για να είμαστε σωστοί, θα πρέπει να διαιρέσουμε διά του 2. Και πάλι όμως δεν τελειώσαμε. Διότι έχουμε και τους 4 που δεν ήθελαν να ανταλλάξουν χειραψία. Θα κάνουμε όμως κάτι πολύ απλό γι’ αυτό. Βρίσκουμε πόσες χειραψίες θα αντάλλασσαν μεταξύ τους οι 4 και θα τις αφαιρέσουμε από το σύνολο, όπως το υπολογίσαμε πριν. Για ν = 17 λοιπόν θα έχουμε 17 (17 – 1) / 2 = 136. Για ν = 4 : 4 (4-1) / 2 = 6. Αρα ο αριθμός χειραψιών που ψάχνουμε θα είναι: 136 – 6 = 130.
- Είχαμε δυο ολόιδια μεγάλα βάζα, 50 μπαλάκια κόκκινα και 50 μπλε. Κάποιος με δεμένα μάτια θα έπρεπε να βάλει το χέρι του σε ένα από τα βάζα και να ανασύρει ένα μπαλάκι. Θέλαμε να μεγιστοποιηθεί η πιθανότητα το μπαλάκι που θα βγάλουμε να είναι κόκκινο. Το ποιο βάζο θα μας φέρουν δεν το ελέγχουμε, άρα εκεί είναι «φίφτι-φίφτι» που λέμε και μάθαμε να του αποδίδουμε πιθανότητα (1/2). Τώρα, και εντελώς εμπειρικά να το σκεφτούμε, αν στο ένα βάζο είχαμε βάλει μόνο ένα κόκκινο θα ήταν καλή τακτική. Τότε αν Κ1, Κ2, Μ1, Μ2 είναι τα μπλε και τα ακόκκινα στο αντίστοιχο δοχείο, το 1 ή το 2, η πιθανότητα για τα κόκκινα στο 1 είναι Κ1 / (Κ1 + Μ1) και για τα κόκκινα στο 2 είναι: Κ2 / (Κ2 + Μ2). Και στην περίπτωση που βάζουμε στο πρώτο ένα μόνο κόκκινο, θα δώσει: Πιθανότητα Κ1: 0,5 x (1 / (1 + 0)) + 0,5 x (49 / (49 + 50)) = 0,747474.
- Δημοφιλή κινεζικά router βρέθηκαν να συμμετέχουν σε κυβερνοεπιθέσεις
- Απολαυστικά Χριστούγεννα με την καλύτερη τηλεοπτική παρέα
- Φλωρίδης για αλλαγές στη Δικαιοσύνη: Ο χρόνος για τις τελεσίδικες αποφάσεις θα πάει από 1.500 μέρες στις 630
- Ατμοσφαιρική ρύπανση: Συνδέεται με εισαγωγές σε νοσοκομεία για ζητήματα ψυχικής υγείας
- Δημήτρης Ήμελλος: Το τελευταίο αντίο στον αγαπημένο ηθοποιό
- Formula 1: Τέλος ο Sergio Perez από τη Red Bull – Ποιος τον αντικατέστησε