Rozkład prawdopodobieństwa

Z testwiki
Wersja z dnia 08:38, 24 lut 2025 autorstwa imported>Blakocha (Linki już są w innych miejscach. Wycofano ostatnią zmianę treści (wprowadzoną przez Aureliusz-X86) i przywrócono wersję 76084861 autorstwa Beno)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacji Przejdź do wyszukiwania

Rozkład prawdopodobieństwamiara probabilistyczna określona na zbiorze wartości pewnej zmiennej losowej (wektora losowego). Formalnie rozkład prawdopodobieństwa można rozpatrywać bez odwołania się do zmiennych losowych.

Definicja formalna

Rozkład prawdopodobieństwa – to miara probabilistyczna P określona na σ-ciele podzbiorów borelowskich pewnej przestrzeni polskiej Y. Dla rozkładów ciągłych jako przestrzeń polską wybiera się przestrzeń euklidesowa n.

Rozkład prawdopodobieństwa nazywamy jednowymiarowym, jeżeli zmienna losowa jest 1-wymiarowa (tj. n=1), a wielowymiarowym, jeżeli n>1.

Zastosowanie zmiennych losowych

Przestrzenią probabilistyczną nazywa się trójkę uporządkowaną, złożoną z: a) przestrzeni zdarzeń elementarnych Ω, b) określonego na niej σ-ciała , którego elementy są nazywane zdarzeniami losowymi, c) miary probabilistycznej P, przyporządkowującej zdarzeniom liczby zwane prawdopodobieństwami.

Tak określone prawdopodobieństwo jest jednak niewygodne do badania, gdy Ω jest zbiorem bez zadanych jakichkolwiek relacji między jego elementami. Dlatego definiuje się funkcję zwaną zmienną losową, która przyporządkowuje elementom przestrzeni Ω elementy jakiejś przestrzeni mierzalnej Y o pożądanych właściwościach[uwaga 1]. Najczęściej jako przestrzeń mierzalną wykorzystuje się przestrzeń euklidesową, tj. Y=n,n+. Wtedy zmienną losową nazywa się wektorem losowym.

Przeciwobraz każdego zbioru mierzalnego w Y jest zdarzeniem losowym. Podzbiory mierzalne przestrzeni Y tworzą σ-ciało, które oznaczać będziemy symbolem (Y). Ponieważ zmienna losowa nie musi być funkcją różnowartościową, więc ten sam zbiór mierzalny A(Y) można w ogólnym przypadku otrzymać z wielu różnych zdarzeń o różnych prawdopodobieństwach. Aksjomaty σ-ciała zapewniają, że wśród tych zdarzeń jest także ich suma i do niej jest przypisane największe prawdopodobieństwo. Suma ta jest równa przeciwobrazowi zbioru A, czyli X1(A).

Rozkład zmiennej losowej X – to funkcja PX określona na sigma ciele (Y) taka że prawdopodobieństwo zdarzenia A(Y) jest równe prawdopodobieństwu przypisanemu przeciwobrazowi X1(A) zdarzenia A:

PX(A)=P(X1(A)).

Rozkład PX jest nową miarą probabilistyczną. Jest on w przestrzeni stanów Y odpowiednikiem miary probabilistycznej P.

Uwaga 1:

Zapis PX gdzie X jest zdarzeniem, a nie zmienną losową jest stosowany na oznaczenie prawdopodobieństwa warunkowego.

Uwaga 2:

Niżej omówiono rozkłady ciągłe i dyskretne. Oprócz nich istnieją także rozkłady nie mieszczące się w żadnej z tych kategorii – na przykład rozkład o dystrybuancie Cantora.

Rozkład ciągły

Szablon:Osobny artykuł Jeżeli istnieje funkcja f:Y[0,), taka że

P(A)=Af(x)dx

(całka Lebesgue’a) dla dowolnego zbioru borelowskiego A(Y), to funkcję tę nazywa się gęstością rozkładu prawdopodobieństwa (funkcją gęstości prawdopodobieństwa).

Nazwa pochodzi od intuicji fizycznych (zob. gęstość masy). O rozkładzie P mającym gęstość mówi się, że jest ciągły (lub typu ciągłego).

Powyższa definicja jest poprawna dla dowolnych rozkładów prawdopodobieństwa, także wielowymiarowych – wówczas x jest wektorem.

Rozkład PX zmiennej losowej X spełniający powyższe warunki definiuje się analogicznie. O zmiennej losowej również mówi się wówczas, iż jest ciągła (lub typu ciągłego).

Rozkład dyskretny

Szablon:Osobny artykuł Rozkład P nazywa się dyskretnym, jeśli jest skupiony na zbiorze przeliczalnym, tzn. istnieje zbiór (co najwyżej) przeliczalny SY dla którego P(S)=1. Jeżeli

S={si:iI} oraz pi=P({si}) dla każdego iI,

to dla dowolnego zbioru borelowskiego A

P(A)=P(AS)=iIpi1A(si),

gdzie 1A to indykator (funkcja charakterystyczna) zbioru A.

Zatem zbiór par {(si,pi):iI} jednoznacznie wyznacza rozkład P. Stąd dowolny zbiór tej postaci, gdzie pi>0 oraz pi=1 (co wynika z własności rozkładu), nazywa się czasami rozkładem (dyskretnym). Odwzorowanie sipi, oznaczane pmf(si)=pi, nosi nazwę funkcji masy prawdopodobieństwa i jest ono dyskretnym odpowiednikiem gęstości prawdopodobieństwa.

Dyskretna zmienna losowa X to zmienna losowa o rozkładzie dyskretnym. Wówczas można go zdefiniować podobnie jak wyżej równością

PX({xi})=P(X1(A)),

jednakże w tym wypadku zachodzi dodatkowo

P(X1(A))=P({ωΩ:X(ω)=xi})= oznP(X=xi)= oznpmfX(xi),

gdzie {xi}iI jest zbiorem wszystkich wartości przyjmowanych przez zmienną X.

Dystrybuanta rozkładu jednowymiarowego

Szablon:Osobny artykuł Dystrybuantą jednowymiarowego rozkładu prawdopodobieństwa P nazywa się funkcję FP:, zdefiniowana wzorem:

FP(t)=P((,t]).

Dystrybuanta rozkładu zmiennej losowej X, to dystrybuanta FPX, oznaczana zwykle symbolem FX, otrzymana z rozkładu tej zmiennej losowej:

FX(t)=PX({x:xt})

Jeśli rozkład P ma gęstość f, jego dystrubuanta FP wyraża się wzorem:

FP(t)=tf(x)dx.

Dystrybuanta w pełni wyznacza rozkład, tzn. dwie zmienne o tej samej dystrybuancie muszą mieć ten sam rozkład; obrazuje to poniższy przykład.

Przykłady

1) Niech Ω1={O,R} będzie przestrzenią zdarzeń elementarnych doświadczenia polegającego na rzucie monetą, które może z jednakowym prawdopodobieństwem dać dwa wyniki: orła i reszkę, tj.

P(O)=12 oraz P(R)=12.

Jeżeli zmienna X:Ω1 jest określona równościami

X(O)=1 oraz X(R)=1,

to jej rozkład PX jest określony następująco:

P(XA)={0,dla A={1,1},12,dla A={1} lub A={1},1,dla A={1,1},

a funkcja masy prawdopodobieństwa ma postać:

P(X=x)={0,dla x1  i   x1,12,dla x=1 lub x=1.

Oznacza to, że zmienna losowa X odwzorowuje zdarzenia

Ω1O1X(O)=1,
Ω1R  1X(R)=  1

oraz zachowuje prawdopodobieństwo określone na (Ω1,) przekształcając je w rozkład określony na (,()).

Z definicji dystrybuanty wynika, iż prawdopodobieństwo zdarzenia

A={ωΩ:a<X(ω)b}= ozn{a<Xb}

dane jest wzorem

P(XA)=P(a<Xb)=FX(b)FX(a).

Dystrybuanta zmiennej X to funkcja FX:[0,1] określona wzorem

FX(t)={0,dla t1,12,dla 1<t1,1,dla t>1.

2) Niech Ω2={O,R,K} będzie przestrzenią zdarzeń elementarnych rzutu monetą, wyżej opisanego, przy czym dodatkowo uwzględnimy upadek na kant, który prawie na pewno się nie zdarzy. Jeżeli

P(O)=P(R)=12 oraz P(K)=0,

to zmienna losowa Y:Ω2 określona równościami

Y(O)=1,Y(R)=1 oraz Y(K)=7,

ma taki sam rozkład PY (oraz funkcję masy) co zmienna X określona wyżej, mimo iż są one różne.

Także dystrybuanta FY zmiennej Y dana jest tym samym wzorem co dystrybuanta FX zmiennej X.

Dystrybuanta rozkładu wielowymiarowego

Szablon:Osobny artykuł Jeśli X jest wektorem losowym, tzn. X:Ωn, to rozważa się wówczas przedziały wielowymiarowe, tzn. zbiory będące iloczynami kartezjańskimi przedziałów, mające postać

(,t1]×(,t2]××(,tn].

Dystrybuanta FP:n ma postać

FP(t1,t2,,tn)=P((,t1]×(,t2]××(,tn]).

Stosuje się następujący zapis dystrybuanty rozkładu zmiennej losowej:

FX(t1,t2,,tn)=P({X:X1t1X2t2Xntn}),

gdzie X=(X1,X2,,Xn).

Oznaczając t=(t1,t2,,tn) powyższy wzór można zapisać w skrócie

FX(t)=P(Xt).

Jeśli rozkład wielowymiarowy P ma gęstość f, jego dystrybuanta FP wyraża się za pomocą całki Lebesgue’a:

FP(t)=(,t1]×(,t2]××(,tn]f(t)dt,

co można zapisać w prostszej wersji (ale tylko wtedy, gdy całkę Lebesgue’a da się rozbić w poniższy sposób):

FP(t)=t1t2tnf(t1,t2,,tn)dtndt2dt1.

Rozkład osobliwy

Df. Zmienna losowa X ma rozkład osobliwy (singularny), jeśli ma ciągłą dystrybuantę oraz istnieje zbiór A, taki że ma on zerową miarę Lebesgue’a λ(A) i jednostkowy rozkład prawdopodobieństwa P(A), tzn.

λ(A)=0 oraz P(A)=1.

Rozkład arytmetyczny

Df. Rozkładami arytmetycznymi nazywa się rozkłady skoncentrowane na zbiorze punktów postaci kc, gdzie k.

Tw. To, iż rozkład P jest skupiony na zbiorze {2πkt:k} jest równoważne temu, iż jego funkcja charakterystyczna φ ma okres równy t bądź φ(t)=1 dla pewnego t0.

Analizując funkcje charakterystyczne można stwierdzić, że arytmetyczne są rozkłady:

geometryczny, Bernoulliego i Poissona.

Rozkłady jedno- i dwupunktowe są przesuniętymi rozkładami arytmetycznymi.

Popularne rozkłady

Rozkłady ciągłe

Wybrane rozkłady gęstości prawdopodobieństwa:
fN(x)rozkład normalny,
fE(x)rozkład wykładniczy,
fR(x)rozkład jednostajny,
fT(x)rozkład trójkątny,
fD(x) – rozkład delty Diraca dla zmiennej pewnej.

Szablon:Osobny artykuł

Rozkłady dyskretne

Szablon:Osobny artykuł

Pozostałe

Statystyka

Jeśli mamy na myśli rzeczywiste prawdopodobieństwa wystąpienia danej wartości cechy w populacji, to mówimy o rozkładzie w populacji. Jeśli mamy na myśli prawdopodobieństwa wystąpienia danej cechy wyznaczone podczas badania statystycznego, to mówimy o rozkładzie empirycznym.

Zobacz też

Szablon:Commons

Uwagi

Szablon:Uwagi

Przypisy

Szablon:Przypisy

Szablon:Rozkłady statystyczne

Szablon:Kontrola autorytatywna

it:Variabile casuale#Distribuzione di probabilità
Błąd rozszerzenia cite: Istnieje znacznik <ref> dla grupy o nazwie „uwaga”, ale nie odnaleziono odpowiedniego znacznika <references group="uwaga"/>