Vzorek vs populace
Populace a Vzorek jsou dva důležité pojmy v předmětu „Statistika“. Jednoduše řečeno, populace je největší sbírka položek, které máme zájem studovat, a vzorek je podmnožinou populace. Jinými slovy, vzorek by měl představovat populaci s menším, ale dostatečným počtem položek. Jedna populace může mít několik vzorků s různými velikostmi.
Ukázka
Vzorek se může skládat ze dvou nebo více položek, které byly vybrány ze základního souboru. Nejnižší možná velikost vzorku je dvě a nejvyšší by se rovnala velikosti populace. Existuje několik způsobů, jak vybrat vzorek z populace. Teoreticky je výběr „náhodného vzorku“nejlepším způsobem, jak dosáhnout přesných závěrů o populaci. Tento typ vzorků se také nazývá pravděpodobnostní vzorky, protože každá položka v populaci má stejnou příležitost být zahrnuta do vzorku.
Technika ‚jednoduchého náhodného vzorkování‘je nejznámější technikou náhodného vzorkování. V tomto případě jsou položky, které mají být vybrány do vzorku, vybrány náhodně ze souboru. Takový vzorek se nazývá ‚Simple Random Sample‘neboli SRS. Další oblíbenou technikou je „systematické vzorkování“. V tomto případě jsou položky pro vzorek vybrány na základě konkrétního systematického pořadí.
Příklad: Každý 10. člověk ve frontě je vybrán jako vzorek.
V tomto případě je systematické pořadí každý 10. člověk. Statistik může tento řád smysluplně definovat. Existují další techniky náhodného vzorkování, jako je shlukové vzorkování nebo stratifikované vzorkování, a způsob výběru se mírně liší od výše uvedených dvou.
Pro praktické účely lze použít nenáhodné vzorky, jako jsou vzorky pro pohodlí, úsudkové vzorky, vzorky sněhové koule a účelové vzorky. Navíc položky vybrané do nenáhodných vzorků se týkají náhody. Ve skutečnosti každá položka populace nemá stejnou příležitost být zahrnuta do nenáhodných vzorků. Tyto typy vzorků se také nazývají vzorky bez pravděpodobnosti.
Populace
Jakýkoli soubor entit, které je zajímavé prozkoumat, je jednoduše definován jako „populace“. Populace je základem pro vzorky. Jakákoli sada objektů ve vesmíru může být populací na základě prohlášení o studiu. Obecně by populace měla být poměrně velká a měla by být obtížné odvodit některé charakteristiky individuálním zvážením jejích položek. Měření, která mají být v populaci zkoumána, se nazývají parametry. V praxi se parametry odhadují pomocí statistik, které jsou relevantními měřeními vzorku.
Příklad: Při odhadování průměrné známky z matematiky 30 studentů ve třídě z průměrných známek z matematiky 5 studentů je parametrem Průměrná známka z matematiky třídy. Statistika je průměrná známka z matematiky 5 studentů.
Vzorek vs populace
Zajímavý vztah mezi vzorkem a populací je ten, že populace může existovat bez vzorku, ale vzorek nemusí existovat bez populace. Tento argument dále dokazuje, že vzorek závisí na populaci, ale je zajímavé, že většina závěrů o populaci závisí na vzorku. Hlavním účelem vzorku je co nejpřesněji odhadnout nebo odvodit některá měření populace. Vyšší přesnost lze odvodit z celkového výsledku získaného z několika vzorků stejné populace spíše než z jednoho vzorku. Další důležitou věcí je vědět, že při výběru více než jednoho vzorku z populace může být jedna položka také zahrnuta do jiného vzorku. Tento případ je známý jako „vzorky s náhradami“. Navíc investování relevantních měření populace ze vzorku a získání téměř podobného výstupu je skvělou příležitostí, jak ušetřit náklady a časovou hodnotu.
Je důležité vědět, že když se zvětší velikost vzorku, zvýší se i přesnost odhadu pro parametr populace. Logicky, aby byly lepší odhady pro populaci, velikost vzorku by neměla být příliš malá. Dále je třeba vzít v úvahu náhodné vzorky, které mají lepší odhady. Proto je zásadní věnovat pozornost velikosti a náhodnosti vzorku, aby byl reprezentativní, aby bylo možné získat nejlepší odhady pro populaci.