Kryterium Chauveneta

Z testwiki
Wersja z dnia 19:10, 3 kwi 2023 autorstwa imported>Mateusz Tcky (growthexperiments-addlink-summary-summary:3|0|0)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacji Przejdź do wyszukiwania
Wykres przedstawiający Kryterium Chauveneta

Kryterium Chauveneta – heurystyczny warunek pozwalający na stwierdzenie, czy dana obserwacja z wykres próby statystycznej jest tzw. obserwacją odstającą, która powstała na skutek błędu pomiaru. Obserwację taką należy odrzucić przed dalszymi analizami statystycznymi.

Przykład zastosowania

Wykonując jakiś pomiar powtarzamy go kilka razy, aby otrzymać dokładniejszy wynik. Im więcej pomiarów, tym dokładniejszy wynik. Jednak może się zdarzyć, że przy którejś z kolei próbie coś zakłóciło nam pomiar, przez co znacznie różni się od pozostałych wyników. W takiej sytuacji powstaje pytanie, czy pomiar ten należy brać pod uwagę, czy nie. Aby znaleźć odpowiedź na to pytanie, należy skorzystać z kryterium Chauveneta. (Przy założeniu, że pomiar wielkości x ma rozkład normalny).

Uwagi

  • Kryterium nie jest dobre przy małej liczności próby N.
  • Kryterium nie jest dobre gdy istnieje więcej niż jedna obserwacja odstająca.
  • Stosowanie tego kryterium jest słuszne pod warunkiem, że podejrzany wynik jest przejawem jakiegoś błędu, a nie odzwierciedleniem jakiegoś istotnego efektu.

Definicja

Zakładając, że wyniki pomiarów podlegają rozkładowi normalnemu o wartości oczekiwanej x i odchyleniu standardowym σx, prawdopodobieństwo wystąpienia wyniku o wartości |xxpod|>kσx wynosi P. Według kryterium Chauveneta iloczyn liczby podejrzanych wyników n i prawdopodobieństwa P musi być mniejszy od 0,5.

npod=nP<12.

Objaśnienie

Załóżmy, że dla pomiarów x1,x2,x3,,xn jeden z nich znacznie różni się od pozostałych (np. x9 albo x26). Podejrzany pomiar oznaczmy ogólnie jako xpod.

Następnie należy obliczyć statystykę (liczba odchyleń standardowych) k dla podejrzanej wartości xpod i z tablicy funkcji błędu znaleźć prawdopodobieństwo P wystąpienia wyniku poza kσ (niektóre tablice przedstawiają prawdopodobieństwo P wystąpienia wyniku w tσ).

k=|xxpod|σx,

gdzie:

k – liczba odchyleń standardowych, o którą wynik xpod (podejrzany) różni się od wartości średniej x,
xpod – wartość podejrzana,
xśrednia arytmetyczna,
σxodchylenie standardowe (estymator największej wiarygodności).

jeżeli npod=nP<12 to pomiar można odrzucić.

Przykład

Treść doświadczenia: Długość ściany pewnego budynku została zmierzona 5 razy w wyniku czego otrzymano wyniki:
xi wartość pomiaru
x1 5,24
x2 5,31
x3 5,40
x4 5,45
x5=xpod 5,93

Piąty pomiar wyraźnie różni się od pozostałych. Powstają wątpliwości, czy wynik ten nie wpłynie negatywnie na ostateczny wynik pomiaru. Dlatego stosując kryterium Chauveneta możemy sprawdzić, czy dany pomiar odrzucić czy trzeba zostawić.

Zadanie: Za pomocą kryterium Chauveneta sprawdzimy, czy pomiar piąty można odrzucić czy nie.

Dane:

N = 5 (liczba wykonanych pomiarów)
xpod = 5,93 m
xi – wartość danego pomiaru
k – liczba odchyleń standardowych
n – liczba podejrzanych wyników

Obliczenia:

  1. Obliczamy średnią arytmetyczną:
    x=1Ni=1Nxix=5,24+5,31+5,40+5,45+5,935=5,466 [m].
  2. Obliczamy odchylenie standardowe (Estymator największej wiarygodności):
    σx=1N1i=1N(xix)2σx=0,2717167642969.
  3. Obliczamy wyznacznik k:
    k=|xxpod|σxk=1,707660553.
  4. Odczytujemy prawdopodobieństwo z tablic: W tym punkcie należy skorzystać z odpowiednich tablic[1] i odczytać konkretną wartość prawdopodobieństwa P[%] dla wartości k obliczonej w poprzednim punkcie.
  5. Obliczenie wyznacznika npod:
    • npod=n(1P100) – jeżeli tablica przedstawia prawdopodobieństwo P wystąpienia wyniku w kσ,
    • npod=nP – jeżeli tablica przedstawia prawdopodobieństwo P wystąpienia wyniku poza kσ,
  6. Jeżeli npod<0,5 to sprawdzany pomiar należy odrzucić.

Zobacz też

Przypisy

Szablon:Przypisy

Bibliografia

  • Witold Suchecki, Metody opracowania wyników pomiarowych, Politechnika Warszawska.
  • Andrzej Bluszcz, Estymatory średniej i dyspersji, Politechnika Śląska.