Variance versus standardní odchylka
Variace je běžný jev ve studiu statistiky, protože kdyby neexistovaly žádné odchylky v datech, pravděpodobně bychom statistiku na prvním místě nepotřebovali. Variace je popsána jako rozptyl ve statistice, což je míra vzdálenosti hodnot od jejich průměru. Rozptyl je malý nebo malý, pokud jsou hodnoty seskupeny blíže k průměru. Směrodatná odchylka je dalším měřítkem, které popisuje rozdíl mezi očekávanými výsledky a jejich skutečnými hodnotami. Ačkoli oba úzce souvisejí, existují rozdíly mezi rozptylem a směrodatnou odchylkou, které budou popsány v tomto článku.
Nezpracované hodnoty nemají v žádné distribuci smysl a nemůžeme z nich odečíst žádné smysluplné informace. Právě pomocí směrodatné odchylky jsme schopni ocenit význam hodnoty, protože nám říká, jak daleko jsme od střední hodnoty. Rozptyl je konceptem podobný směrodatné odchylce kromě toho, že se jedná o druhou mocninu SD. Má smysl porozumět pojmům rozptyl a směrodatná odchylka pomocí příkladu.
Předpokládejme, že farmář pěstuje dýně. Má deset dýní různých hmotností, které jsou následující.
2,6, 2,6, 2,8, 3,0, 3,1, 3,2, 3,3, 3,5, 3,6, 3,8. Průměrnou hmotnost dýní lze snadno vypočítat, protože jde o součet všech hodnot dělený 10. V tomto případě je to 3,15 libry. Žádná z dýní však neváží tolik a jejich hmotnost se liší od 0,55 libry lehčí až po 0,65 libry těžší, než je průměr. Nyní můžeme zapsat rozdíl každé hodnoty od průměru následujícím způsobem
-0,55, -0,55, -0,35, -0,15, -0,05, 0,15, 0,35, 0,45, 0,65.
Co vyvodit z těchto rozdílů od průměru?, Pokusíme-li se najít průměrný rozdíl, uvidíme, že nemůžeme najít střední hodnotu jako při sčítání, záporné hodnoty se rovnají kladným hodnotám a průměrný rozdíl tak nelze vypočítat. Proto bylo rozhodnuto umocnit všechny hodnoty před jejich sečtením a nalezením střední hodnoty. V tomto případě se čtvercové hodnoty zobrazí následovně
0,3025, 0,3025, 0,1225, 0,0225, 0,0025, 0,0025, 0,1225, 0,2025, 0,4225.
Nyní lze tyto hodnoty sečíst a vydělit deseti, abychom dostali hodnotu, která je známá jako rozptyl. Tento rozptyl je v tomto příkladu 0,1525 libry. Tato hodnota nemá velký význam, protože jsme rozdíl umocnili před zjištěním jejich průměru. To je důvod, proč potřebujeme najít druhou odmocninu rozptylu, abychom dospěli ke standardní odchylce. V tomto případě je to 0,3905 libry.
Ve zkratce:
• Rozptyl i směrodatná odchylka jsou měřítkem rozptylu hodnot v jakýchkoli datech.
• Rozptyl se vypočítá jako průměr druhých mocnin jednotlivých rozdílů od průměru vzorku
• Směrodatná odchylka je druhá odmocnina z rozptylu.