UP | HOME

Διάλεξη 5: Γνωστές Κατανομές

Table of Contents

Από βιβλίο Καραγιαννίδη και Χατζηδιαμαντή: σελίδες 255,271

Σύνοψη

Αρχικά είναι σημαντικό κανείς να διακρίνει τις κατανομές βάση της φύσεως των τυχαίων μεταβλητών τους. Να τις χωρίσει, δηλαδή, σε διακριτές και συνεχείς κατανομές.

Διακριτές

Table 1: Μια γενική εικόνα των διακριτών κατανομών
Κατανομή Περιγραφή ΣΜΠ
Bernoulli Πείραμα με 2 αποτελέσματα: 0,1 fx(x)={px=1q=1px=0
Διωνυμική Επιτυχίες σε n Bernoulli fx(x)=(nx)px(1p)nx
Πολυωνυμική Πείραμα με k αποτελέσματα (Γενίκευση πολυωνυμικής) f(x1,x2,)=(nx1,x2,)p1x1,p2x2,
Γεωμετρική Πλήθος δοκιμών πριν την πρώτη επιτυχία fX(x)=p(1p)x1
Πασκάλ Πλήθος δοκιμών πριν την κοστή επιτυχία1 fXk(x)=(x1k1)pk(1p)xk
Υπεργεωμετρική Πλήθος επιτυχιών σε τυχαία δειγματοληψία fXK(x)=(Nknx)(kx)(Nn)
Poisson Πλήθος αποτελεσμάτων εντός δεδομένου χρόνου fX(x)=λxx!eλ
Ομοιόμορφη (-_-) fX(x)={1ba,x[a,b]0elsewhere
Table 2: Πίνακας αναφοράς για ΔΚ
Κατανομή μ σ2
Bernoulli p p(1p)
Διωνυμική np np(1p)
Γεωμετρική 1p qp2
Πασκάλ kp kqp2
Υπεργεωμετρική np np(1p)NnN1
Poisson λ λ

Συνεχείς

Εφεξής ΣΚ.

Table 3: Συνοπτικός πίνακας για τις ΣΚ.
Κατανομή Περιγραφή ΣΜΠ
Gaussian Γιατί γίνεται να υπάρξει μάθημα μηχανικού χωρίς Gauss? fX(x)=12πσ2e(xμ)22σ2
Λογαριθμοκανονική Αντίγραψε την μα άλλαξε την να μην μας καταλάβουνε fX(x)=12πσ2xe(lnxμ)22σ2
Εκθετική Όπου λογάριθμος και εκθετική. Ενδεικτική του χρόνου μεταξύ δύο γεγονότων fX(x)=λeλx
Erlang Εκθετική μα για τον χρόνο μεταξύ κ γεγονότων fX(x)=λk1xk1(k1)!λeλx
Laplace Αντίγραψε την μα άλλαξε την να μην μας καταλάβουνε fX(x)=12λeλ\absx
Κατανομή μ σ2
Gaussian μ σ2
Λογαριθμοκανονική eμ+σ22 e2μ+σ2(eσ21)
Εκθετική 1λ 1λ2
Erlang kλ kλ2

Διακριτές Κατανομές

Bernoulli

Η κατανομή Bernoulli είναι πολύ απλή στην κατανόηση: έστω ότι έχουμε ένα πείραμα με μόνο δύο πιθανά αποτελέσματα (επιτυχία ή αποτυχία), με το αποτέλεσμα του να δίνεται από την τιμή της τμ X, 1 ή 0 αντίστοιχα. Αυτού του είδους τα πειράματα λέγονται πειράματα Bernoulli, και η X λέμε πως ακολουθεί κατανομή Bernoulli:

Έχει ΣΜΠ:

(1)fX(x)={psuccess1pfailure

Το οποίο σε μορφή συναρτήσεων συνεχούς χρόνου μπορεί να γραφτεί ως εξής:

fX(x)=pδ(x1)+(1p)δ(x)

Binomial

Χτίζοντας επί της Bernoulli: Έστω ότι επαναλαμβάνουμε το πείραμα Bernoulli n φορές. Η τυχαία μεταβλητή που μετρά το πλήθος των επιτυχιών σε n ανεξάρτητες δοκιμές Bernoulli ακολουθεί διωνυμική κατανομή και η ΣΜΠ της δίνεται από την:

(2)fx(x)=px(x)=(nx)px(1p)nx

Η διωνυμική κατανομή μπορεί να χρησιμοποιηθεί όταν η σειρά με την οποία ήρθαν τα αποτελέσματα έχει σημασία.

Μπορεί να γραφεί ως pdf με την χρήση δ functions, όπως είδαμε και στην Bernoulli.

(3)Fy(y)=k=0y(nk)pk(1p)nk

Γεωμετρική κατανομή

Έστω και πάλι πως επαναλαμβάνουμε ένα πείραμα Bernoulli X φορές: τόσες όσες χρειάζεται για να έχουμε την πρώτη επιτυχία. Η τυχαία μεταβλητή X, που περιγράφει τον αριθμό των δοκιμών μέχρι την πρώτη επιτυχία ακολουθεί γεωμετρική κατανομή με:

(4)fX(x)=p(1p)x1

Προκύπτει πολύ εύκολα, όπως και οι περισσότερες διακριτές κατανομές με την λογική

Pascal

Όταν μία τμ X λέμε πως ακολουθεί κατανομή Pascal, ή αλλιώς αρνητική διωνυμική, τότε η τιμή της είναι ενδεικτική του πλήθους των δοκιμών που χρειάστηκαν μέχρι την $k$-οστή επιτυχία ( ή του πλήθους των αποτυχιών που χρειάστηκαν, με μία μικρή μεταβολή στους τύπους )

Αν και το όνομα είναι αρκετά παραπλανητικό, έχει άμεση σχέση με την γεωμετρική κατανομή. Ακόμα ο όρος (k1x1) έχει αυτή την μορφή καθώς ξέρουμε ήδη πως το τελευταίο στοιχείο θα είναι (η $k$οστή) επιτυχία.

Υπεργεωμετρική

Μια πολύ ενδιαφέρουσα κατανομή γιατί αν και συναντάει ευρεία εφαρμογή σε πειράματα Bernoulli μπορεί να επεκταθεί και σε συνθετότερα πειράματα (με περισσότερα αποτελέσματα).

  • Το γενικό concept (εξήγηση για πειράματα Bernoulli)

    Έστω οτι έχουμε πραγματοποιήσει N επαναλήψεις ενός πειράματος Bernoulli, στις οποίες οι k ήταν επιτυχίες. Αυτό προφανώς σημαίνει πως οι (Nk) ήταν αποτυχίες. Αν ορίσουμε τμ Χ τέτοια ώστε να περιγράφει το πλήθος επιτυχιών σε μία τυχαία δειγματοληψία (επιλογή n τυχαίων στοιχείων εκ των Ν ), τότε εκείνη λέμε οτι ακολουθεί υπεργεωμετρική κατανομή, και η ΣΜΠ της δίνεται από την:

    (5)fX(x)=(Nknx)(kx)(Nn)
  • Επέκταση για z διαφορετικά αποτελέσματα

    Τώρα αν το πείραμα μας δεν έχει μόνο 2 αλλά z διαφορετικά αποτελέσματα και \(N_i\forall iέφεραν το $i$οστό αποτέλεσμα έχουμε2:

    (6)f(x1,x2,x3,x4,)=(N1x1)(N2x2)(N3x3)(N4x4)(Nn)

Συνεχείς

Gaussian Κανονική

  • Η μόνη της οποίας το πλήρες μοντέλο προσδιορίζεται από μόνο δύο ροπές. Αν ξέρεις μέση τιμή και διασπορά ξέρεις τα πάντα.
  • Η γραφική της παράσταση είναι πολύ εύκολη στην αναγνώριση: καμπάνα
  • Συχνά, μία μεταβλητή ακολουθεί κανονική κατανομή την συμβολίζουμε ως: XN(μ,σ2)
  • Εξαιρετικά κρίσιμη όπως θα φανεί σε επόμενη διάλεξη γιατί προσεγγίζει όλες τις κατανομές.
    • Με αυτόν τον τρόπο, για παράδειγμα, σχετίζεται με τον θόρυβο στις τηλεπικοινωνίες.

Μετασχηματισμός μεταβλητής με κανονική κατανομή

Έστω ότι έχουμε τμ X που ακολουθεί κανονική κατανομή:

(7)XN(μ,σ2)

τότε:

(8)Y=aX+bYN(αμ+b,ασ)

Κανονικοποίηση

  • Αν δεν έχεις διαβάσει προηγουμένως μια μαθηματική ανάλυση (έστω την επόμενη παράγραφο) ίσως το αντικείμενο αυτής δεν είναι τόσο ξεκάθαρο.
  • Η ΑΣΚ της κανονικής κατανομής έχει την μορφή:
(9)FX(x)=xfx(r)dr==12πxμσeu22du=Φ(xμσ)
  • Το ολοκλήρωμα είναι μόνο αριθμητικά υπολογίσιμο, αναγκάζοντας μας να στραφούμε σε πίνακες για τον υπολογισμό του.
  • Την ίδια στιγμή, παρατηρώντας την παραπάνω σχέση προκύπτει πως η ΑΣΚ μιας οποιασδήποτε τμ XN(μ,σ2) ανάγεται στην ΑΣΚ της N(0,1)
  • Οπότε μπορούμε να πούμε ότι κανονικοποιούμε την κανονική κατανομή υιοθετώντας την σχέση z=xμσ

Σχέση με Φ

Ορίζουμε συνάρτηση

(10)Φ(x)=12πxeu22du

όπως άλλωστε είδαμε και στην προηγούμενη παράγραφο. Έχουμε έτσι:

(11)FX(x)=Φ(xμσ2)

Ισχύει η ιδιότητα:

(12)Φ(x)=1Φ(x)
  • [ ] Προς ανάπτυξη: Ροπογεννήτρια συνάρτηση και Φ όπως την είδαμε εδώ.

Σχέση με Gaussian Q

Ορίζουμε συνάρτηση:

(13)Q(x)=1Φ(x)

της οποίας η εφαρμογή στα τηλεπικοινωνιακά συστήματα υπογραμμίζεται στο βιβλίο των Καραγιαννίδη, Χατζηδιαμαντή. Δεν αναλύθηκε ιδιαίτερα στην διάλεξη, πέραν από την σύνδεσή της με την συνάρτηση λάθους

(14)erfc=complimentary erf(x)=1erf(x)=2Q(2x)

Ακόμα, μέσω αυτής ορίζονται ουσιαστικά τα Όρια Chernoff - Rubin

Εκθετική κατανομή

  • Πολύ σημαντικές ιδιότητες:
(15)Pr{X>a+b}=Pr{X>a}Pr{X>b}(16)Pr{X>a+b|X>a}=Pr{X>b}
  • η δεύτερη ιδιότητα λέγεται memoryless property

Erlang

  • Όπως γράφει και παραπάνω, χρήσιμη όταν μας ενδιαφέρει ο χρόνος μεταξύ k διαδοχικών γεγονότων και όχι μόνο δύο, στην οποία περίπτωση και χρησιμοποιούμε την εκθετική κατανομή.
  • Αναφέρθηκε το παράδειγμα της ουράς σουπερμαρκετ, αυξανόμενου αριθμού πελατών.

Ακόμα

Αναφερθήκαμε συνοπτικά σε

  • Rayleigh
  • Weibull

Footnotes:

1

Τώρα να ρωτήσει κανείς γιατί δεν λέγεται η Πασκάλ υπεργεωμετρική και λέγεται αρνητική διωνυμική?

2

Ακόμα, εξ’ ορισμού ισχύει: i=1zNi=N

Originally created on 2022-10-19 Wed 00:00