Põhiline erinevus klassifikatsiooni ja regressioonipuu vahel on see, et klassifikatsioonis on sõltuvad muutujad kategoorilised ja järjestamata, samas kui regressioonis on sõltuvad muutujad pidevad või järjestatud täisväärtused.
Klassifikatsioon ja regressioon on õppimismeetodid kogutud andmete põhjal prognoosimudelite loomiseks. Mõlemad tehnikad on graafiliselt esitatud klassifikatsiooni- ja regressioonipuudena või õigemini vooskeemidena andmete jaotustega pärast iga sammu või õigemini "haruna" puus. Seda protsessi nimetatakse rekursiivseks partitsiooniks. Sellised valdkonnad nagu kaevandamine kasutab neid klassifitseerimis- ja regressiooniõppe meetodeid. See artikkel keskendub klassifikatsioonipuule ja regressioonipuule.
Mis on klassifikatsioon?
Klassifikatsioon on meetod, mida kasutatakse skeemi saamiseks, mis näitab andmete korraldust, alustades lähtemuutujast. Sõltuvad muutujad klassifitseerivad andmed.
Joonis 01: Andmekaeve
Klassifikatsioonipuu algab sõltumatu muutujaga, mis jaguneb kahte rühma, mis on määratud olemasolevate sõltuvate muutujate järgi. Selle eesmärk on selgitada vastuseid kategoriseerimise vormis, mille põhjustavad sõltuvad muutujad.
Mis on regressioon
Regressioon on ennustusmeetod, mis põhineb eeldataval või teadaoleval numbrilisel väljundväärtusel. See väljundväärtus on rekursiivse partitsioonide jada tulemus, kusjuures igal sammul on üks arvväärtus ja teine sõltuvate muutujate rühm, mis hargnevad teise paarini, nagu see.
Regressioonipuu algab ühe või mitme eelkäija muutujaga ja lõpeb ühe lõpliku väljundmuutujaga. Sõltuvad muutujad on kas pidevad või diskreetsed arvmuutujad.
Mis vahe on klassifikatsioonil ja regressioonil?
Klassifikatsioon vs regressioon |
|
Puu mudel, kus sihtmuutuja võib võtta diskreetse väärtuste komplekti. | Puu mudel, kus sihtmuutuja võib võtta pidevaid väärtusi, tavaliselt reaalarvusid. |
Sõltuv muutuja | |
Klassifitseerimispuu puhul on sõltuvad muutujad kategoorilised. | Regressioonipuu puhul on sõltuvad muutujad numbrilised. |
Väärtused | |
Seal on määratud arv järjestamata väärtusi. | On kas diskreetsed, kuid järjestatud väärtused või mittediskreetsed väärtused. |
Ehitamise eesmärk | |
Regressioonipuu koostamise eesmärk on sobitada regressioonisüsteem igale determinandi harule nii, et tekib eeldatav väljundväärtus. | Klassifitseerimispuu hargneb, nagu määrab eelmisest sõlmest tuletatud sõltuv muutuja. |
Kokkuvõte – klassifikatsioon vs regressioon
Regressiooni- ja klassifikatsioonipuud on kasulikud meetodid, mis võimaldavad kaardistada protsessi, mis viitab uuritud tulemusele, olgu siis klassifikatsioonis või üksikus arvväärtuses. Klassifikatsioonipuu ja regressioonipuu erinevus on nendest sõltuv muutuja. Klassifikatsioonipuudel on sõltuvad muutujad, mis on kategoorilised ja järjestamata. Regressioonipuudel on sõltuvad muutujad, mis on pidevad väärtused või järjestatud tervikväärtused.