Standardní odchylka vs. průměr
V deskriptivní a inferenční statistice se k popisu souboru dat, který odpovídá jeho centrální tendenci, rozptylu a šikmosti, používá několik indexů. Ve statistickém odvození jsou tyto běžně známé jako odhady, protože odhadují hodnoty parametrů populace.
Centrální tendence označuje a lokalizuje střed distribuce hodnot. Průměr, modus a medián jsou nejčastěji používané indexy při popisu centrální tendence souboru dat. Rozptyl je množství šíření dat z centra distribuce. Rozsah a standardní odchylka jsou nejběžněji používané míry rozptylu. Pearsonovy koeficienty šikmosti se používají k popisu šikmosti distribuce dat. Zde se šikmost vztahuje k tomu, zda je datová sada symetrická vůči středu nebo ne, a pokud ne, jak je zkreslená.
Co to znamená?
Mean je nejčastěji používaný index centrální tendence. Pro daný soubor dat se průměr vypočítá tak, že se vezme součet všech hodnot dat a pak se vydělí počtem dat. Například hmotnosti 10 osob (v kilogramech) jsou změřeny na 70, 62, 65, 72, 80, 70, 63, 72, 77 a 79. Pak může být průměrná hmotnost deseti osob (v kilogramech) vypočítané následovně. Součet vah je 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Průměr=(součet) / (počet údajů)=710 / 10=71 (v kilogramech).
Jako v tomto konkrétním příkladu, střední hodnota souboru dat nemusí být datovým bodem souboru, ale bude pro daný soubor dat jedinečná. Průměr bude mít stejné jednotky jako původní data. Proto může být označen na stejné ose jako data a může být použit při srovnání. Také neexistuje žádné omezení znaménka pro průměr datové sady. Může být záporný, nulový nebo kladný, protože součet datové sady může být záporný, nulový nebo kladný.
Co je standardní odchylka?
Standardní odchylka je nejběžněji používaný index rozptylu. Pro výpočet směrodatné odchylky se nejprve vypočítají odchylky hodnot dat od průměru. Střední odmocnina odchylek se nazývá standardní odchylka.
V předchozím příkladu jsou příslušné odchylky od průměru (70 – 71)=-1, (62-71)=-9, (65-71)=-6, (72-71)=1, (80-71)=9, (70-71)=-1, (63-71)=-8, (72-71)=1, (77-71)=6 a (79-71)=8. Součet čtverců odchylky je (-1)2+ (-9)2+ (-6)2+ 1 2+92+ (-1)2+ (-8)2 + 12+ 62 + 82=366. Směrodatná odchylka je √(366/10)=6,05 (v kilogramech). Z toho lze usoudit, že většina údajů je v intervalu 71±6.05, za předpokladu, že datová sada není výrazně zkreslená, a v tomto konkrétním příkladu tomu tak skutečně je.
Vzhledem k tomu, že směrodatná odchylka má stejné jednotky jako původní data, poskytuje nám míru toho, jak moc se data odchylují od středu; větší směrodatná odchylka větší rozptyl. Směrodatná odchylka bude také nezáporná hodnota bez ohledu na povahu dat v sadě dat.
Jaký je rozdíl mezi směrodatnou odchylkou a průměrem?
• Směrodatná odchylka je mírou rozptylu od středu, zatímco střední hodnota měří polohu středu souboru dat.
• Směrodatná odchylka je vždy nezáporná hodnota, ale střední hodnota může mít jakoukoli skutečnou hodnotu.