Η κατανομή Poisson, είναι ένας στατιστικός τύπος που χρησιμοποιείται για να βρούμε την πιθανότητα να συμβεί κάτι σε ένα διάστημα χρόνου, έχοντας ήδη κάποια δεδομένα, χωρίς να εξαρτιέται αυτό από άλλους παράγοντες.
https://el.wikipedia.org/wiki/%CE%9A%CE%B1%CF%84%CE%B1%CE%BD%CE%BF%CE%BC%CE%AE_%CE%A0%CE%BF%CF%85%CE%B1%CF%83%CF%83%CF%8C%CE%BDΠώς μπορούμε να το κάνουμε αυτό στο ποδόσφαιρο; Υπολογίζοντας την πιθανότητα των γκολ για κάθε ομάδα.
Τι θα χρειαστεί να υπολογίσουμε:
- Τη δύναμη στην επίθεση της κάθε ομάδας.
- Τη δύναμη στην άμυνα της κάθε ομάδας.
Ας πάρουμε ένα τυχαίο ματς, το Τόττεναμ-Έβερτον.
Στα 380 ματς της Πρέμιερ, οι γηπεδούχοι σκόραραν 567 γκολ και οι φιλοξενούμενοι σκόραραν 459 γκολ. Άρα κατά μέσο όρο οι γηπεδούχοι βάζουν 567 / 380 = 1,492 γκολ και οι φιλοξενούμενοι 459 / 380 = 1,207.
Ονομάζουμε ΜΟΓ = 1,492 και ΜΟΦ = 1,207. Είναι οι μέσοι όροι σε όλο το πρωτάθλημα ή σε όσα ματς θέλουμε εμείς πριν υπολογίσουμε.
Η δυναμική της επίθεσης κάθε ομάδας, υπολογίζεται από το δικό της μέσο όρο γκολ που σκοράρει, διά το συνολικό μέσο όρο.
Η Τόττεναμ σκόραρε 35 γκολ σε 19 παιχνίδια, άρα ο μέσος όρος είναι 35/19 = 1,842. Η δυναμική της επίθεσης της Τόττεναμ είναι δηλαδή 1,842/1,492 = 1,235. Σε απλά ελληνικά, η Τόττεναμ σκοράρει κατά μέσο όρο 23% περισσότερα γκολ από τις υπόλοιπες ομάδες. Άρα δυναμική επίθεσης γηπεδούχου ΔΕΓ = 1,235.
H Έβερτον σκόραρε 24 γκολ σε 19 ματς, άρα η δυναμική της θα είναι (24/19) / 1,207 = 1,046.
ΔΕΦ = 1,046.
Πάμε για τις δυναμικές της άμυνας τώρα. Η άμυνα υπολογίζεται με το πόσα γκολ βάζει ο αντίπαλος:
Η Τόττεναμ δέχτηκε 15 γκολ σε 19 ματς, άρα η δυναμική της άμυνας της είναι (15/19) / 1,207 = 0,653 = ΔΑΓ
Η Έβερτον δέχτηκε 25 γκολ σε 19 ματς, άρα η δυναμική της άμυνας της είναι (25/19) / 1,315 = 0,881 = ΔΑΦ
Τελικός υπολογισμός:
Η γηπεδούχος θα σκοράρει ΔΕΓ*ΔΑΦ*ΜΟΓ = 1,235*0,881 * 1,492 = 1,623 γκολ
Η φιλοξενούμενη θα σκοράρει ΔΕΦ*ΔΑΓ*ΜΟΦ = 1,046 * 0,653 * 1,207 = 0,824 γκολ.
Εδώ έρχεται η κατανομή poisson για να δώσει τις πιθανότητες και εξηγούνται στο παρακάτω βίντεο:
https://www.youtube.com/watch?v=ZZW2b84T0cwΤο excel έχει ως συνάρτηση την κατανομή poisson. Μπορούμε να υπολογίσουμε over, under κλπ σουμάροντας τις πιθανότητες των σκορ.
Επίσης είναι ένας τρόπος να βρούμε το value στα ματς, πχ αν ένα αποτέλεσμα δίνεται ως απόδοση 2,00 το over και η κατανομή μας δίνει πιθανότητα μεγαλύτερη του 50%, τότε είναι value.
Θα ρωτήσει κάποιος "Πόση προιστορία χρειάζομαι για να προβλέψω;". Γνώμη μου είναι να μην παίρνουμε πολλά ματς πίσω, πχ 1-2 χρόνια. Στην ουσία θέλουμε να δούμε τι συμβαίνει τη συγκεκριμένη χρονιά. Η εμπειρία μου δείχνει ότι μετά τα πρώτα 10-12 ματς της χρονιάς, μπορούμε να ξεκινήσουμε.