Kategoorilised andmed vs arvandmed
Andmed on viitamise või analüüsi eesmärgil kogutud faktid või teave. Sageli kogutakse neid andmeid asjaomase subjekti atribuutidena. See atribuut võib erineda, seega võib seda muutuvat atribuuti pidada muutujaks. Muutujad võivad omada erinevat tüüpi väärtusi ja need on kogutud andmetele omased.
Muutujad võivad olla kas kvalitatiivsed või kvantitatiivsed; st kui muutuja on kvantitatiivne, on vastused numbrid ja mõõdetud atribuudi suurust saab teatud täpsusega öelda. Teine tüüp, kvalitatiivsed muutujad, mõõdavad kvalitatiivseid atribuute ja muutujate poolt eeldatud väärtusi ei saa anda suuruse ega ulatuse järgi. Muutujaid endid nimetatakse kategoorilisteks muutujateks ja kategoorilise muutuja abil kogutud andmed on kategoorilised andmed.
Lisateavet arvandmete kohta
Arvulised andmed on põhimõtteliselt muutujast saadud kvantitatiivsed andmed ja väärtusel on suurus/suurusaste. Saadud arvulised andmed jagatakse veel kolme kategooriasse, tuginedes Stanley Smith Stevensi väljatöötatud teooriale. Numbrilised andmed võivad olla kas järgarv, intervall või suhe. Andmete tüüp määratakse väärtuste mõõtmismeetodi järgi ja tüüpe nimetatakse mõõtmistasemeteks.
Inimese kaal, kahe punkti vaheline kaugus, temperatuur ja aktsia hind on arvandmete näited.
Statistikas on enamus meetoditest tuletatud arvandmete analüüsiks. Arvandmete analüüsimisel kasutatakse põhiliselt kirjeldavat statistikat, regressiooni ja muid järeldusmeetodeid.
Lisateave kategooriliste andmete kohta
Kategoorilised andmed on kvalitatiivse muutuja väärtused, sageli arv, sõna või sümbol. Need toovad välja tõsiasja, et vaadeldaval juhul kuulub muutuja ühte paljudest saadaolevatest valikutest. Seetõttu kuuluvad nad ühte kategooriasse; sellest ka nimi kategooriline.
Inimese poliitiline kuuluvus, rahvus, inimese lemmikvärv ja patsiendi veregrupp on kvalitatiivsed tunnused. Mõnikord võib arvu saada kategoorilise väärtusena, kuid arv ise ei esinda mõõdetud atribuudi suurust. Üks näide on sihtnumber.
Samuti kuuluvad kõik kategoorilised väärtused nominaalsesse andmetüüpi, mis on teist tüüpi, mis põhineb mõõtmistasemetel. Kategooriliste andmete analüüsimiseks kasutatavad meetodid erinevad numbriliste andmete analüüsimise meetodist, kuid nende aluseks olev põhimõte võib olla sama.
Mis vahe on kategoorilistel ja numbrilistel andmetel?
• Arvulised andmed on kvantitatiivse muutuja jaoks saadud väärtused ja neil on muutuja kontekstiga seotud suurusjärk (seega on need alati numbrid või sümbolid, millel on arvväärtus). Kategoorilised andmed on kvalitatiivse muutuja jaoks saadud väärtused; Kategoorilised andmenumbrid ei oma suurusjärgu.
• Numbrilised andmed kuuluvad alati kas järgu-, suhte- või intervallitüüpi, samas kui kategoorilised andmed kuuluvad nomina altüüpi.
• Kvantitatiivsete andmete analüüsimiseks kasutatavad meetodid erinevad kategooriliste andmete analüüsimiseks kasutatavatest meetoditest, isegi kui põhimõtted on samad, on vähem alt rakendusel olulisi erinevusi.
• Arvulisi andmeid analüüsitakse statistiliste meetodite abil kirjeldavas statistikas, regressioonis, aegridades ja paljus muus.
• Kategooriliste andmete puhul kasutatakse tavaliselt kirjeldavaid ja graafilisi meetodeid. Kasutatakse ka mõningaid mitteparameetrilisi teste.