Základy analýzy dát

Dátová matica (dátový súbor):

  • V riadkoch sú pozorovania
  • V stĺpcoch sú premenné

Numerické premenné

Opisné štatistiky

  • Rozsah = n (počet jednotiek)
  • Minimum = min
  • Maximum = max
  • Rozpätie = R (max-min)
  • Aritmetický priemer = x̄ (ťažisko)
Vzorec na aritmetický priemer
  • Rozptyl = S2
vzorec na rozptyl
  • Smerodajná odchýlka = S (ako sú nahusto pri sebe)
vzorec smerodajnej ochýlky
  • Medián = med (v extrémoch sa nehýbe)
    • Usporiadame si všetky hodnoty od najmenšej po najväčšiu
    • Nájdeme hodnotu v strede

!     Ak sú v strede dve hodnoty, spravíme ich aritmetický priemer

  • 1. Kvartil a 3. Kvartil = Q1 , Q3

Stred hodnôt od začiatku (konca) k mediánu

  • Medzikvartilové rozpätie = IQR

IQR=Q3-Q1

Spôsoby zobrazovania numerických premenných

5-bodové zhrnutie

Obsahuje: min, Q1, med, Q3, max

Dot plot
Dot plot
Box plot
Box plot
Histogram
Histogram