Keskmine vs mediaan vs režiim
Keskmine, mediaan ja moodus on kirjeldavas statistikas kasutatavad keskse tendentsi peamised mõõdikud. Need on üksteisest täiesti erinevad ja ka juhtumid, mil neid kasutatakse andmete kokkuvõtmiseks, on erinevad.
Tähendab
Aritmeetiline keskmine on andmeväärtuste summa jagatud andmeväärtuste arvuga, st
[lateks]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
Kui andmed pärinevad valimiruumist, nimetatakse seda valimi keskmiseks ([lateks]\bar{x} [/lateks]), mis on valimit kirjeldav statistika. Kuigi see on valimi jaoks kõige sagedamini kasutatav kirjeldav mõõt, ei ole see usaldusväärne statistika. See on väga tundlik kõrvalekallete ja võnkumiste suhtes.
Mõelge näiteks konkreetse linna elanike keskmisele sissetulekule. Kuna kõik andmeväärtused summeeritakse ja seejärel jagatakse, mõjutab äärmiselt jõuka inimese sissetulek keskmist oluliselt. Seetõttu ei kujuta keskmised väärtused andmeid alati hästi.
Samuti varieerub vahelduvsignaali korral elementi läbiv vool perioodiliselt positiivsest suunast negatiivsesse suunda ja vastupidi. Kui võtame elementi ühes perioodis läbiva keskmise voolu, annab see 0, mis tähendab, et elementi ei ole läbinud, mis ilmselgelt pole tõsi. Seetõttu ei ole ka sel juhul aritmeetiline keskmine hea mõõt.
Aritmeetiline keskmine on hea näitaja, kui andmed on ühtlaselt jaotunud. Normaaljaotuse korral on keskmine võrdne mooduse ja mediaaniga. Sellel on ka madalaimad jäägid, kui võtta arvesse ruudu keskmist viga; Seetõttu on see parim kirjeldav meede, kui andmekogumit tuleb esitada ühe numbriga.
Mediaan
Keskmise andmepunkti väärtused pärast kõigi andmeväärtuste järjestamist kasvavas järjekorras määratletakse andmestiku mediaanina. Mediaan on 2. kvartiil, 5. detsiil ja 50. protsentiil.
• Kui vaatluste (andmepunktide) arv on paaritu, siis mediaan on vaatlus täpselt järjestatud loendi keskel.
• Kui vaatluste (andmepunktide) arv on paaris, on mediaan järjestatud loendi kahe keskmise vaatluse keskmine.
Mediaan jagab vaatluse kahte rühma; st rühm (50%) väärtusi, mis on mediaanist kõrgemad ja rühm (50%) madalamaid väärtusi. Mediaane kasutatakse spetsiaalselt kallutatud jaotuste korral ja need esindavad andmeid üsna paremini kui aritmeetiline keskmine.
Režiim
Mode on vaatluste komplektis kõige enam esinev arv. Andmekogumi režiim arvutatakse, leides komplekti iga elemendi sageduse.
• Kui ühtki väärtust ei esine rohkem kui üks kord, pole andmekogumil režiimi.
• Vastasel juhul on kõik suurima sagedusega esinevad väärtused andmestiku režiim.
Komplektis võib olla rohkem kui 1 režiim; seetõttu ei ole režiim andmestiku ainulaadne statistika. Ühtlase jaotuse korral on üks režiim. Diskreetse tõenäosusjaotuse moodus on punkt, kus tõenäosusmassi funktsioon saavutab kõrgeima punkti. Ül altoodud tõlgenduste põhjal võime öelda, et globaalsed maksimumid on režiimid.
Kaaluge kõigi kolme meetme rakendamist järgmise andmekogumi puhul.
ANDMED: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Keskmine=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12
Mediaan=9 (13. element)
Režiim=9 (9. sagedus=5)
Mis vahe on keskmisel, mediaanil ja režiimil?
• Aritmeetiline keskmine on väärtuste (vaatluste) summa jagatud vaatluste arvuga. See ei ole usaldusväärne statistika ja sõltub suuresti vaadeldava jaotuse normaaljaotuse olemusest. Üksik kõrvalekalle võib põhjustada keskmise olulise nihke, andes suhteliselt eksitavad väärtused. Seda mõistet saab laiendada geomeetrilisele keskmisele, harmoonilisele keskmisele, kaalutud keskmisele ja nii edasi.
• Mediaan on vaatluste kogumi keskmised väärtused ja seda mõjutavad kõrvalekalded suhteliselt vähem. See võib anda hea hinnangu kokkuvõtliku statistikana väga kallutatud juhtudel.
• Režiim on andmestiku kõige levinumad vaatlusväärtused. Kui jaotus on positiivselt kallutatud, jääb režiim mediaani vasakule ja negatiivse kallutamise korral mediaani paremale poole.
• Kui see on positiivselt kallutatud, vastab keskmine mediaanile; kui negatiivselt kallutatud keskmine on mediaanist vasakul.
• Normaaljaotuses on kõik kolm, keskmine, moodus ja mediaan, võrdsed.