Parametrické vs neparametrické
Statistika je jedna ze studií, která nám umožňuje porozumět dynamice populace pomocí vzorků vybraných z určité populace, která nás zajímá. Je nezbytné, aby tyto vzorky byly náhodné. Mnoho vzorců je vytvořeno se začleněním matematiky, aby bylo možné odvodit parametry populace. Přirozeně každá populace může mít „normální rozložení“, kde má rozptyl dat/vzorků tvar zvonu v grafu frekvence. Při normální distribuci se většina vzorků soustředí kolem průměru a 68 %, 95 %, 99 % dat se nachází v rozmezí 1, 2 a 3 standardních odchylek. Parametrické a neparametrické statistiky závisí na tom, zda se uvažuje normální rozdělení či nikoli.
Co je to parametrická statistika?
Parametrická statistika je statistika, ve které jsou data/vzorky považovány za čerpány z normálního rozdělení. Definice parametrické statistiky je „statistika, která předpokládá, že data pocházejí z určitého typu rozdělení pravděpodobnosti a vyvozuje závěry o parametrech rozdělení“. Do této skupiny patří většina známých elementárních statistických metod. Ve skutečnosti nemusí být normálně distribuovány. Proto je tento typ statistiky založen na více předpokladech. Pokud jsou data/vzorky normálně nebo téměř normálně rozděleny, vzorce mohou poskytovat přesné výsledky a závěry. Pokud je však předpoklad normální distribuce nesprávný, parametrické statistiky mohou být docela zavádějící.
Co je to neparametrická statistika?
Neparametrické statistiky jsou také známé jako statistiky bez distribuce. Výhodou tohoto typu statistiky je to, že nemusí vycházet z předpokladu, jak tomu bylo dříve u parametriky. Neparametrické statistické výpočty berou v úvahu mediány než průměr. Pokud se tedy jedna nebo dvě odchylují od střední hodnoty, jejich vliv je zanedbáván. Obecně je preferována parametrická statistika, protože má větší sílu zamítnout falešnou hypotézu než neparametrická metoda. Jedním z nejznámějších neparametrických testů je Chí-kvadrát test. Existují neparametrické analogy pro některé parametrické testy, jako je Wilcoxonův T test pro t-test párových vzorků, Mann-Whitney U test pro t-test nezávislých vzorků, Spearmanova korelace pro Pearsonovu korelaci atd. Pro jeden výběrový t-test neexistuje žádný srovnatelný neparametrický test.
Jaký je rozdíl mezi parametrickým a neparametrickým?
• Parametrická statistika závisí na normálním rozdělení, ale neparametrická statistika nezávisí na normálním rozdělení.
• Parametrické statistiky vytvářejí více předpokladů než neparametrické statistiky.
• Parametrická statistika používá jednodušší vzorce ve srovnání s neparametrickou statistikou.
• Pokud se předpokládá, že populace je normálně rozmístěna nebo se blíží normálnímu rozložení, je nejvhodnější použít parametrickou statistiku. Pokud ne, je nejlepší použít neparametrickou metodu.
• Většina běžně známých metod elementární statistiky patří do parametrické statistiky. Neparametrická statistika se používá střídmě a používá se pro speciální případy.