Rozkład Pascala

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania


Szablon:Rozkład prawdopodobieństwa infobox

Rozkład Pascala (ujemny rozkład dwumianowy)dyskretny rozkład prawdopodobieństwa opisujący m.in. liczbę sukcesów i porażek w niezależnych i posiadających równe prawdopodobieństwo sukcesu próbach Bernoulliego. Jest uogólnieniem rozkładu geometrycznego dla wielu prób.

Termin „ujemny rozkład dwumianowy” nie jest w pełni usystematyzowany. Może dotyczyć jednego z kilku wariantów funkcji opisujących te same zmienne losowe z subtelnymi różnicami w parametryzacji – liczby prób, albo sukcesów lub porażek (czasem liczonych bez ostatniego), przy określonej wartości jednej z tych zmiennych. Momenty i inne charakterystyki poszczególnych wersji rozkładu różnią o proste transformacje[1][2][3]. Nazwa „rozkład Pascala” opisuje z reguły warianty dla wartości całkowitych, liczonych bez ostatniego zdarzenia[3].

Wariant dla liczby sukcesów przed r porażką

Rozważmy ciąg X1,X2, niezależnych prób Bernoulliego z prawdopodobieństwem sukcesu równym p. Ustalmy liczbę r. Obserwujemy ten ciąg do momentu stwierdzenia r-tej porażki. Oznaczmy ten moment przez T. O zmiennej losowej Tr mówimy, że ma ujemny rozkład dwumianowy NB(r,p) z parametrami r oraz p.

Niech X ma rozkład NB(r,p). Wtedy X=k (gdzie k=0,1,2,) jeśli w r+k-tym momencie zaszła porażka oraz w ciągu X1,,Xr+k1 zaszło r1 porażek. Zatem

P(X=k)=(r+k1r1)(1p)r1p(r+k1)(r1)(1p),

czyli

P(X=k)=(r+k1r1)(1p)rpk.

Na rozkład ten można spojrzeć w następujący sposób: rozważamy ciąg niezależnych zmiennych Y1,,Yr o rozkładzie geometrycznym z parametrem sukcesu 1p odpowiadające obserwacji naszego ciągu po porażce r1 do porażki r włącznie. Niech Y=Y1++Yr. Wtedy zmienna losowa X=Yr, zliczająca jedynie liczbę sukcesów, ma rozkład ujemny dwumianowy z parametrami r oraz p. Z tego otrzymujemy natychmiast wzór na wartość oczekiwaną zmiennej losowej o tym rozkładzie

E(X)=r11pr=rp1p.

W podobny sposób można wyprowadzić wzór na wariancję.

Dla porównania, w trochę innej definicji ujemnego rozkładu dwumianowego, porażkę zastępuje się sukcesem oraz nie odejmuje się parametru r od momentu zajścia r-tego sukcesu. Otrzymujemy wtedy zmienną losową X o następujący rozkładzie

P(X=k)=(k1r1)pr(1p)kr,kr.

Zmienna ta jest sumą r niezależnych zmiennych o rozkładzie geometrycznym z parametrem sukcesu p.

Inne warianty

Rozkład był prezentowany w literaturze na kilka różnych sposobów, z subtelnymi zmianami parametryzacji[1][2][3]. Różnice w notacji dotyczą m.in. stosowania równoważności pomiędzy liczbą prób n, sukcesów k i porażek r, np. n=k+r, tego, czy nośnik zaczyna się od 0 czy 1, oraz z możliwości przedstawienia wzoru z użyciem różnych form symbolu Newtona, także z wykorzystaniem tożsamości kombinacji dopełniających:

(nk)=n!k!(nk)!=(nnk).

Poniższa tabela przedstawia niektóre spotykane formy rozkładu.

X zlicza: Nośnik i funkcja rozkładu prawdopodobieństwa Wzór
k sukcesów, przy danych r porażkach dla k{0,1,2,}f(k;r,p)Pr(X=k)= (k+r1k)pk(1p)r[4][5]
(k+r1r1)pk(1p)r (wariant opisany powyżej)
(n1k)pk(1p)r
n prób, przy danych r porażkach dla n{r,r+1,r+2,}f(n;r,p)Pr(X=n)=
(n1r1)pnr(1p)r
(n1nr)pnr(1p)r
r porażek, przy danych k sukcesach dla r{0,1,2,}f(r;k,p)Pr(X=r)= (k+r1r)pk(1p)r[2][6]
(k+r1k1)pk(1p)r[7][8][9][10]
(n1r)pk(1p)r
n prób, przy danych k sukcesach dla n{k,k+1,k+2,}f(n;k,p)Pr(X=n)=
(n1k1)pk(1p)nk[2][10][11][12][13][14]
(n1nk)pk(1p)nk
k sukcesów, przy danych n próbach (rozkład dwumianowy – dla porównania) dla k{0,1,2,,n}f(k;n,p)Pr(X=k)= (nk)pk(1p)r

Wzór można także rozszerzyć dla niecałkowitych wartości r z użyciem funkcji gamma, np.:

f(r,k,p)=(k+r1)!k!(r1)!pr(1p)k=(k+r1r1)pr(1p)k=Γ(r+k)k!Γ(r)pr(1p)k

opisuje, jakie jest prawdopodobieństwo, że czas oczekiwania na r-ty sukces będzie wynosił k+r.

Przypisy

Szablon:Przypisy

Bibliografia

Szablon:Rozkłady statystyczne