Andmekaevanduse ja OLAP-i erinevus

Andmekaevanduse ja OLAP-i erinevus
Andmekaevanduse ja OLAP-i erinevus

Video: Andmekaevanduse ja OLAP-i erinevus

Video: Andmekaevanduse ja OLAP-i erinevus
Video: Kuidas valida parimad päikeseprillid? 2024, November
Anonim

Andmekaeve vs OLAP

Nii andmekaeve kui ka OLAP on kaks levinumat äriteabe (BI) tehnoloogiat. Ärianalüüs viitab arvutipõhistele meetoditele kasuliku teabe tuvastamiseks ja äriandmetest ammutamiseks. Andmekaeve on arvutiteaduse valdkond, mis tegeleb suurtest andmehulkadest huvitavate mustrite eraldamisega. See ühendab paljusid tehisintellekti, statistika ja andmebaaside haldamise meetodeid. OLAP (online analüütiline töötlemine), nagu nimigi viitab, on mitmemõõtmeliste andmebaaside päringute tegemise viiside kogum.

Andmekaeve on tuntud ka kui teadmiste avastamine andmetes (KDD). Nagu eelpool mainitud, on tegemist arvutiteaduse valdkonnaga, mis tegeleb toorandmetest senitundmatu ja huvitava info ammutamisega. Seoses andmete eksponentsiaalse kasvuga, eriti sellistes valdkondades nagu äri, on andmekaevandamine muutunud väga oluliseks vahendiks selle suure andmehulga ärianalüüsiks teisendamiseks, kuna mustrite käsitsi eraldamine on viimastel aastakümnetel muutunud näiliselt võimatuks. Näiteks kasutatakse seda praegu mitmesuguste rakenduste jaoks, nagu sotsiaalvõrgustike analüüs, pettuste tuvastamine ja turundus. Andmekaevandamine tegeleb tavaliselt nelja järgmise ülesandega: rühmitamine, klassifitseerimine, regressioon ja seostamine. Klasterdamine on sarnaste rühmade tuvastamine struktureerimata andmete põhjal. Klassifikatsioon on õppimisreeglid, mida saab rakendada uutele andmetele ja mis sisaldab tavaliselt järgmisi samme: andmete eeltöötlus, modelleerimise kavandamine, õppimine/funktsioonide valik ja hindamine/valideerimine. Regressioon on minimaalse veaga funktsioonide leidmine andmete modelleerimiseks. Ja assotsiatsioon otsib seoseid muutujate vahel. Andmekaevet kasutatakse tavaliselt sellistele küsimustele vastamiseks, nagu millised on peamised tooted, mis võivad aidata järgmisel aastal Wal-Martis suurt kasumit teenida.

OLAP on süsteemide klass, mis pakuvad vastuseid mitmemõõtmelistele päringutele. Tavaliselt kasutatakse OLAP-i turunduse, eelarve koostamise, prognoosimise ja sarnaste rakenduste jaoks. On ütlematagi selge, et OLAP-i jaoks kasutatavad andmebaasid on konfigureeritud keeruliste ja ad-hoc päringute jaoks, pidades silmas kiiret jõudlust. Tavaliselt kasutatakse OLAP-i väljundi kuvamiseks maatriksit. Read ja veerud on moodustatud päringu mõõtmete järgi. Sageli kasutavad nad kokkuvõtete saamiseks mitme tabeli liitmise meetodeid. Näiteks saab selle abil teada saada Wal-Martis selle aasta müüki võrreldes eelmise aastaga? Milline on järgmise kvartali müügiprognoos? Mida saab öelda trendi kohta, vaadates protsentide muutust?

Kuigi on ilmne, et andmekaeve ja OLAP on sarnased, kuna need töötavad andmetel, et saada teavet, tuleneb peamine erinevus sellest, kuidas nad andmetega töötavad. OLAP-i tööriistad pakuvad mitmemõõtmelist andmeanalüüsi ja annavad andmetest kokkuvõtteid, kuid vastupidiselt keskendub andmekaevandamine andmekogumi suhtarvudele, mustritele ja mõjudele. See on OLAP-tehing agregeerimisega, mis taandub andmete toimimisele "liitmise" kaudu, kuid andmekaevandamine vastab "jagamisele". Teine märkimisväärne erinevus on see, et kuigi andmekaevetööriistad modelleerivad andmeid ja tagastavad rakendatavaid reegleid, kasutab OLAP reaalajas võrdlus- ja kontrastivõtteid vastav alt ärimõõtmele.

Soovitan: