Wariancja
Wariancja – miara zmienności zmiennej losowej będąca wartością oczekiwaną kwadratu różnicy wartości zmiennej losowej X i jej wartości oczekiwanejSzablon:R. W statystyce opisowej obliczana jest jako średnia arytmetyczna kwadratów odchyleń (różnic) poszczególnych wartości cechy od średniejSzablon:R.
Wariancja zmiennej losowej oznaczana jako lub zdefiniowana jest wzoremSzablon:R:
gdzie:
- jest wartością oczekiwaną zmiennej losowej podanej w nawiasach kwadratowych,
- jest wartością oczekiwaną zmiennej
Innym, często prostszym, sposobem wyznaczania wariancji jest wzór:
Wariancja jest momentem centralnym drugiego rzędu zmiennej losowej.
Jeżeli ponadto oraz jest σ-ciałem zdarzeń, to wariancją warunkową nazywamy:
Statystyka opisowa
Jako jedna z najpopularniejszych miar w statystyce opisowej służąca do opisu danego kompletnego zbioru danychSzablon:R, wariancja zdefiniowana jest dla zbioru obserwacji z cechą wzoremSzablon:R:
gdzie oznacza średnią wartość cechy, a liczebność zbioru.
Wyrażona jest w jednostkach miary badanej cechy podniesionych do kwadratuSzablon:R.
Dane pogrupowane
W przypadku obliczania wariancji dla danych pogrupowanych w postaci szereg rozdzielczego punktowego, wykorzystuje się wzorySzablon:R:
gdzie oznacza liczbę klas szeregu punktowego, – liczebność i-tej klasy, a – liczebność całej zbiorowości (odpowiednik we wzorze powyżej).
W przypadku szeregu rozdzielczego przedziałowego za wartość przyjmuje się środki poszczególnych przedziałów Szablon:R:
Ze względu na przyjęcie jako reprezentacji przedziałów wartości środkowych wariancja liczona według powyższego wzoru jest przybliżeniem wariancji dla danych kompletnychSzablon:R.
Estymatory
Wariancja próby losowej o wartościach gdzie jest następująca:
Wariancję dla populacji można estymować za pomocą n-elementowej próby losowej. Estymator największej wiarygodności:
jest zgodnym, lecz obciążonym estymatorem wariancji (jest nieobciążony asymptotycznie). Innymi słowy, gdybyśmy z populacji losowali próbkę wielokrotnie i obliczali jego wyniki, to ich średnia nie byłaby równa wariancji w całej populacji. Dlatego też częściej używa się również zgodnego, lecz nieobciążonego estymatora:
W przypadku, gdy znamy dokładną wartość oczekiwaną w populacji, wówczas estymator
jest już nieobciążony i zgodny.
Własności wariancji
Dla zmiennych losowych i dowolnych stałych zachodzą następujące własności:
1.
Dowód. Korzystając z własności wartości oczekiwanej (wartość oczekiwana stałej jest równa tej stałej), mamy:
2.
Dowód. Korzystamy z własności wartości oczekiwanej mówiącej o tym, że jeżeli zmienna losowa jest dodatnio określona prawie wszędzie to jej wartość oczekiwana jest dodatnia. Ponieważ zmienna losowa jest dodatnio określona, mamy:
3.
Dowód. Korzystając z definicji wariancji, a następnie z liniowości wartości oczekiwanej mamy:
4.
Dowód. Korzystamy z własności wartości oczekiwanej mówiącej o tym, że dla stałej i z liniowości:
5. w ogólnym przypadku; (gdzie to kowariancja)
Dowód. Sprawdzone zostanie tylko twierdzenie dla sumy, twierdzenie dla różnicy rozwiązuje się analogicznie. Czyli mamy:
Korzystając z liniowości wartości oczekiwanej i definicji kowariancji, mamy:
Z powyższego twierdzenia łatwo wysnuć wniosek, że jeżeli zmienne i są niezależne, zachodzi:
Pierwiastek kwadratowy z wariancji definiujemy jako odchylenie standardowe.
Pierwiastek z estymatora nieobciążonego wariancji jest często używany jako estymator odchylenia standardowego, jednak jest wówczas obciążony (zobacz odchylenie standardowe).
Zobacz też
Przypisy
Błąd rozszerzenia cite: Znacznik <ref> o nazwie „pwn”, zdefiniowany w <references>, nie był użyty wcześniej w treści.
Błąd rozszerzenia cite: Znacznik <ref> o nazwie „statystyka131”, zdefiniowany w <references>, nie był użyty wcześniej w treści.
Błąd rozszerzenia cite: Znacznik <ref> o nazwie „wasilewska163”, zdefiniowany w <references>, nie był użyty wcześniej w treści.
Błąd rozszerzenia cite: Znacznik <ref> o nazwie „wasilewska165166”, zdefiniowany w <references>, nie był użyty wcześniej w treści.
Błąd rozszerzenia cite: Znacznik <ref> o nazwie „wasilewska233234”, zdefiniowany w <references>, nie był użyty wcześniej w treści.
Błąd rozszerzenia cite: Znacznik <ref> o nazwie „wasilewska239”, zdefiniowany w <references>, nie był użyty wcześniej w treści.
Błąd rozszerzenia cite: Znacznik <ref> o nazwie „wasilewska241”, zdefiniowany w <references>, nie był użyty wcześniej w treści.