Populace vs. vzorová standardní odchylka
Ve statistice se k popisu souboru dat, který odpovídá jeho centrální tendenci, rozptylu a šikmosti, používá několik indexů. Směrodatná odchylka je jedním z nejběžnějších měřítek rozptylu dat od středu souboru dat.
Vzhledem k praktickým obtížím nebude možné při testování hypotézy využít data z celé populace. Proto využíváme datové hodnoty ze vzorků k vyvozování závěrů o populaci. V takové situaci se nazývají odhady, protože odhadují hodnoty parametrů populace.
Je nesmírně důležité používat při vyvozování nezaujaté odhady. Odhad je považován za nestranný, pokud se očekávaná hodnota tohoto odhadu rovná parametru populace. Například používáme výběrový průměr jako nestranný odhad pro průměr populace. (Matematicky lze ukázat, že očekávaná hodnota výběrového průměru se rovná průměru populace). V případě odhadu směrodatné odchylky základního souboru je nestranným odhadem i výběrová směrodatná odchylka.
Co je směrodatná odchylka populace?
Když lze vzít v úvahu data z celé populace (například v případě sčítání), je možné vypočítat směrodatnou odchylku populace. Pro výpočet směrodatné odchylky základního souboru se nejprve vypočítají odchylky hodnot dat od průměru základního souboru. Odmocnina (kvadratický průměr) odchylek se nazývá standardní odchylka populace.
Ve třídě s 10 studenty lze snadno sbírat data o studentech. Pokud je hypotéza testována na této populaci studentů, není potřeba používat výběrové hodnoty. Například hmotnosti 10 studentů (v kilogramech) jsou změřeny na 70, 62, 65, 72, 80, 70, 63, 72, 77 a 79. Pak je průměrná hmotnost deseti lidí (v kilogramech) (70+62+65+72+80+70+63+72+77+79)/10, což je 71 (v kilogramech). Toto je průměr populace.
Nyní, abychom vypočítali směrodatnou odchylku populace, vypočítáme odchylky od průměru. Příslušné odchylky od průměru jsou (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 a (79 – 71)=8. Součet čtverců odchylky je (-1)2 + (-9)2 + (-6)2 + 1 2 + 92 + (-1)2 + (-8)2+ 12 + 62 + 82 =366. Směrodatná odchylka populace je √(366/10)=6,05 (v kilogramech). 71 je přesná průměrná váha studentů třídy a 6.05 je přesná standardní odchylka hmotnosti od 71.
Co je vzorová směrodatná odchylka?
Když se k odhadu parametrů základního souboru použijí data ze vzorku (o velikosti n), vypočítá se směrodatná odchylka vzorku. Nejprve se vypočítají odchylky hodnot dat od průměru vzorku. Vzhledem k tomu, že se místo průměru populace (který není známý) používá výběrový průměr, není vhodné brát kvadratický průměr. Aby se kompenzovalo použití výběrového průměru, součet čtverců odchylek se místo n vydělí (n-1). Vzorová směrodatná odchylka je druhou odmocninou této hodnoty. V matematických symbolech S=√{∑(xi-ẍ)2 / (n-1)}, kde S je výběrová směrodatná odchylka, ẍ je průměr vzorku a xi jsou datové body.
Nyní předpokládejme, že v předchozím příkladu jsou populací studenti celé školy. Poté bude třída pouze ukázkou. Pokud se při odhadu použije tento vzorek, bude směrodatná odchylka vzorku √(366/9)=6.38 (v kilogramech), protože 366 bylo děleno 9 místo 10 (velikost vzorku). Faktem je, že není zaručeno, že se jedná o přesnou hodnotu standardní odchylky populace. Je to pouze odhad.
Jaký je rozdíl mezi standardní odchylkou populace a výběrovou směrodatnou odchylkou?
• Směrodatná odchylka populace je přesná hodnota parametru použitá k měření rozptylu od středu, zatímco výběrová směrodatná odchylka je pro ni nestranný odhad.
• Směrodatná odchylka populace se vypočítá, když jsou známa všechna data týkající se každého jednotlivce v populaci. Jinak se vypočítá standardní odchylka vzorku.
• Směrodatná odchylka populace je dána vztahem σ=√{ ∑(xi-µ)2/ n} kde µ je průměr populace a n je velikost populace, ale výběrová směrodatná odchylka je dána vztahem S=√{ ∑(xi-ẍ)2 / (n-1)} kde ẍ je průměr vzorku a n je velikost vzorku.