Medián vs. průměr (průměr)
Medián a průměr jsou měřítkem ústřední tendence v popisné statistice. Aritmetický průměr je často považován za průměr souboru pozorování. Proto je zde průměr považován za průměr. Průměr však není vždy aritmetický průměr.
Průměr
Aritmetický průměr je součet hodnot dat dělený počtem hodnot dat, tj.
[latex]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
Pokud data pocházejí z prostoru vzorků, nazývá se to výběrový průměr ([latex]\bar{x} [/latex]), což je popisná statistika vzorku. Ačkoli je to nejběžněji používaná popisná míra pro vzorek, nejedná se o robustní statistiku. Je velmi citlivý na odlehlé hodnoty a oscilace.
Vezměte si například průměrný příjem občanů konkrétního města. Protože jsou všechny hodnoty dat sečteny a poté rozděleny, příjem extrémně bohaté osoby významně ovlivňuje průměr. Proto střední hodnoty nejsou vždy dobrým vyjádřením dat.
V případě střídavého signálu se proud procházející prvkem periodicky mění z kladného směru do záporného směru a naopak. Pokud vezmeme průměrný proud procházející prvkem za jedinou periodu, dostane 0, což znamená, že prvkem neprošel žádný proud, což samozřejmě není pravda. Proto ani v tomto případě není aritmetický průměr dobrým měřítkem.
Aritmetický průměr je dobrým ukazatelem, když jsou data rovnoměrně rozložena. Pro normální rozdělení je průměr roven modu a mediánu. Má také nejnižší rezidua při zvažování střední kvadratické chyby; proto je nejlepším popisným měřítkem, když je požadováno reprezentovat datovou sadu jediným číslem.
Median
Hodnoty středního datového bodu po seřazení všech datových hodnot ve vzestupném pořadí jsou definovány jako medián datové sady.
• Pokud je počet pozorování (datových bodů) lichý, pak medián je pozorování přesně uprostřed seřazeného seznamu.
• Pokud je počet pozorování (datových bodů) sudý, pak je medián průměrem dvou středních pozorování v seřazeném seznamu.
Medián rozděluje pozorování do dvou skupin; tj. skupina (50 %) hodnot vyšších a skupina (50 %) hodnot nižších než je medián. Mediány se specificky používají ve zkreslených distribucích a představují data mnohem lépe než aritmetický průměr.
Medián vs. průměr (průměr)
• Průměr i medián jsou měřítkem centrální tendence a shrnují data. Průměr je nezávislý na poloze datových bodů, ale medián se vypočítá pomocí pozice.
• Průměr je silně ovlivněn odlehlými hodnotami, zatímco medián ovlivněn není.
• Medián je proto lepším měřítkem než průměr v případech vysoce zkreslených distribucí.
• Ve standardním normálním rozdělení jsou průměry a medián stejné.