Rozkład Pascala
Szablon:Rozkład prawdopodobieństwa infobox
Rozkład Pascala (ujemny rozkład dwumianowy) – dyskretny rozkład prawdopodobieństwa opisujący m.in. liczbę sukcesów i porażek w niezależnych i posiadających równe prawdopodobieństwo sukcesu próbach Bernoulliego. Jest uogólnieniem rozkładu geometrycznego dla wielu prób.
Termin „ujemny rozkład dwumianowy” nie jest w pełni usystematyzowany. Może dotyczyć jednego z kilku wariantów funkcji opisujących te same zmienne losowe z subtelnymi różnicami w parametryzacji – liczby prób, albo sukcesów lub porażek (czasem liczonych bez ostatniego), przy określonej wartości jednej z tych zmiennych. Momenty i inne charakterystyki poszczególnych wersji rozkładu różnią o proste transformacje[1][2][3]. Nazwa „rozkład Pascala” opisuje z reguły warianty dla wartości całkowitych, liczonych bez ostatniego zdarzenia[3].
Wariant dla liczby sukcesów przed porażką
Rozważmy ciąg niezależnych prób Bernoulliego z prawdopodobieństwem sukcesu równym Ustalmy liczbę Obserwujemy ten ciąg do momentu stwierdzenia -tej porażki. Oznaczmy ten moment przez O zmiennej losowej mówimy, że ma ujemny rozkład dwumianowy NB(r,p) z parametrami oraz
Niech ma rozkład NB(r,p). Wtedy (gdzie ) jeśli w -tym momencie zaszła porażka oraz w ciągu zaszło porażek. Zatem
czyli
Na rozkład ten można spojrzeć w następujący sposób: rozważamy ciąg niezależnych zmiennych o rozkładzie geometrycznym z parametrem sukcesu odpowiadające obserwacji naszego ciągu po porażce do porażki włącznie. Niech Wtedy zmienna losowa zliczająca jedynie liczbę sukcesów, ma rozkład ujemny dwumianowy z parametrami oraz Z tego otrzymujemy natychmiast wzór na wartość oczekiwaną zmiennej losowej o tym rozkładzie
W podobny sposób można wyprowadzić wzór na wariancję.
Dla porównania, w trochę innej definicji ujemnego rozkładu dwumianowego, porażkę zastępuje się sukcesem oraz nie odejmuje się parametru od momentu zajścia -tego sukcesu. Otrzymujemy wtedy zmienną losową o następujący rozkładzie
Zmienna ta jest sumą r niezależnych zmiennych o rozkładzie geometrycznym z parametrem sukcesu
Inne warianty
Rozkład był prezentowany w literaturze na kilka różnych sposobów, z subtelnymi zmianami parametryzacji[1][2][3]. Różnice w notacji dotyczą m.in. stosowania równoważności pomiędzy liczbą prób sukcesów i porażek np. tego, czy nośnik zaczyna się od 0 czy 1, oraz z możliwości przedstawienia wzoru z użyciem różnych form symbolu Newtona, także z wykorzystaniem tożsamości kombinacji dopełniających:
Poniższa tabela przedstawia niektóre spotykane formy rozkładu.
| zlicza: | Nośnik i funkcja rozkładu prawdopodobieństwa | Wzór |
|---|---|---|
| sukcesów, przy danych porażkach | dla | [4][5] |
| (wariant opisany powyżej) | ||
| prób, przy danych porażkach | dla | |
| porażek, przy danych sukcesach | dla | [2][6] |
| [7][8][9][10] | ||
| prób, przy danych sukcesach | dla | |
| [2][10][11][12][13][14] | ||
| sukcesów, przy danych próbach (rozkład dwumianowy – dla porównania) | dla |
Wzór można także rozszerzyć dla niecałkowitych wartości z użyciem funkcji gamma, np.:
opisuje, jakie jest prawdopodobieństwo, że czas oczekiwania na -ty sukces będzie wynosił
Przypisy
Bibliografia
- ↑ 1,0 1,1 Szablon:Cytuj
- ↑ 2,0 2,1 2,2 2,3 Szablon:Cytuj
- ↑ 3,0 3,1 3,2 Szablon:Cytuj
- ↑ Szablon:Cytuj
- ↑ Szablon:Cytuj
- ↑ Szablon:Cytuj
- ↑ Szablon:MathWorld
- ↑ SAS Institute, „Negative Binomial Distribution”, SAS(R) 9.4 Functions and CALL Routines: Reference, Fourth Edition, SAS Institute, Cary, NC, 2016.
- ↑ Szablon:Cytuj
- ↑ 10,0 10,1 Szablon:Cytuj
- ↑ Szablon:Cytuj
- ↑ Szablon:Cytuj
- ↑ Szablon:Cytuj
- ↑ Szablon:Cytuj