Erinevus juhendatud ja järelevalveta masinõppe vahel

Sisukord:

Erinevus juhendatud ja järelevalveta masinõppe vahel
Erinevus juhendatud ja järelevalveta masinõppe vahel

Video: Erinevus juhendatud ja järelevalveta masinõppe vahel

Video: Erinevus juhendatud ja järelevalveta masinõppe vahel
Video: Terves kehas terve teadmine: Üliõpilaste hinnang farmakoloogia ja ravimite manustamise õppele 2024, November
Anonim

Peamine erinevus – juhendatud ja järelevalveta masinõpe

Järelevalvega õpe ja juhendamata õpe on masinõppe kaks põhikontseptsiooni. Juhendatud õpe on masinõppe ülesanne, mille käigus õpitakse funktsioon, mis vastendab sisendi väljundiks näidissisend-väljundpaaride põhjal. Järelevalveta õpe on masinõppe ülesanne, mille käigus tuletatakse sildistamata andmete põhjal peidetud struktuuri kirjeldav funktsioon. Peamine erinevus juhendatud ja järelevalveta masinõppe vahel on see, et juhendatud õpe kasutab märgistatud andmeid, samas kui järelevalveta õpe kasutab märgistamata andmeid.

Masinõpe on arvutiteaduse valdkond, mis annab arvutisüsteemile võimaluse õppida andmetest ilma selgesõnaliselt programmeerimata. See võimaldab analüüsida andmeid ja ennustada nende mustreid. Masinõppe rakendusi on palju. Mõned neist on näotuvastus, žestituvastus ja kõnetuvastus. Masinõppega on seotud erinevaid algoritme. Mõned neist on regressioon, klassifitseerimine ja rühmitamine. Levinuimad programmeerimiskeeled masinõppepõhiste rakenduste arendamiseks on R ja Python. Kasutada saab ka teisi keeli, nagu Java, C++ ja Matlab.

Mis on juhendatud õpe?

Masinõppepõhistes süsteemides töötab mudel algoritmi järgi. Juhendatud õppe puhul on mudel juhendatud. Esiteks on vaja modelli välja õpetada. Saadud teadmiste abil suudab see ennustada vastuseid tulevasteks juhtumiteks. Mudelit koolitatakse märgistatud andmekogumi abil. Kui süsteemile antakse välja näidisandmed, saab see tulemust ennustada. Järgnev on väike väljavõte populaarsest IRISe andmestikust.

Erinevus juhendatud ja juhendamata õppimise vahel_Joonis 02
Erinevus juhendatud ja juhendamata õppimise vahel_Joonis 02

Vastav alt ül altoodud tabelile nimetatakse atribuutideks tupplehe pikkust, tupplehe laiust, tupplehe pikkust, tupplehe laiust ja liike. Veerud on tuntud kui funktsioonid. Ühel real on andmed kõigi atribuutide kohta. Seetõttu nimetatakse ühte rida vaatluseks. Andmed võivad olla kas numbrilised või kategoorilised. Mudelile antakse vaatlused koos vastava liiginimega sisendiks. Kui tehakse uus vaatlus, peaks mudel ennustama liigi tüüpi, kuhu see kuulub.

Järelevalvega õppes on klassifitseerimise ja regressiooni algoritmid. Klassifitseerimine on märgistatud andmete klassifitseerimise protsess. Mudel lõi piirid, mis eraldasid andmekategooriad. Kui mudelile esitatakse uusi andmeid, saab seda kategoriseerida selle alusel, kus punkt on olemas. K-Lähimad Naabrid (KNN) on klassifitseerimismudel. Sõltuv alt k väärtusest otsustatakse kategooria. Näiteks kui k on 5, siis kui konkreetne andmepunkt on A-kategooria ja kuue B-kategooria andmepunkti lähedal, klassifitseeritakse andmepunkt kui A.

Regressioon on eelmiste andmete trendi ennustamise protsess, et ennustada uute andmete tulemust. Regressiooni korral võib väljund koosneda ühest või mitmest pidevast muutujast. Ennustus tehakse joone abil, mis katab enamiku andmepunkte. Lihtsaim regressioonimudel on lineaarne regressioon. See on kiire ja ei nõua häälestusparameetreid nagu KNN-is. Kui andmed näitavad paraboolset trendi, siis lineaarse regressiooni mudel ei sobi.

Erinevus juhendatud ja juhendamata õppimise vahel
Erinevus juhendatud ja juhendamata õppimise vahel

Need on mõned näited juhendatud õppealgoritmidest. Üldiselt on juhendatud õppemeetoditest saadud tulemused täpsemad ja usaldusväärsemad, kuna sisendandmed on hästi teada ja märgistatud. Seetõttu peab masin analüüsima ainult peidetud mustreid.

Mis on juhendamata õppimine?

Järelevalveta õppes mudelit ei juhendata. Mudel töötab iseseisv alt, et ennustada tulemusi. See kasutab märgistamata andmete põhjal järelduste tegemiseks masinõppe algoritme. Üldiselt on järelevalveta õppealgoritmid raskemad kui juhendatud õppealgoritmid, kuna teavet on vähe. Klasterdamine on järelevalveta õppimise tüüp. Seda saab kasutada algoritmide abil tundmatute andmete rühmitamiseks. K-keskmine ja tiheduspõhine klasterdamine on kaks klasterdamisalgoritmi.

k-keskmise algoritm, asetab iga klastri jaoks juhuslikult k tsentroidi. Seejärel määratakse iga andmepunkt lähimale tsentroidile. Eukleidilist kaugust kasutatakse kauguse arvutamiseks andmepunktist tsentroidini. Andmepunktid on jaotatud rühmadesse. K tsentroidi asukohad arvutatakse uuesti. Uus tsentroidi asukoht määratakse kõigi rühma punktide keskmise järgi. Jällegi määratakse iga andmepunkt lähimale tsentroidile. Seda protsessi korratakse seni, kuni tsentroidid enam ei muutu. k-mean on kiire klasterdamisalgoritm, kuid klastripunktide lähtestamist pole täpsustatud. Samuti on klastripunktide initsialiseerimisel põhinevates klastrimudelites suur varieeruvus.

Teine rühmitamisalgoritm on tiheduspõhine klasterdamine. Seda tuntakse ka kui tiheduspõhiseid müraga ruumiklastrirakendusi. See toimib, määratledes klastri maksimaalse tihedusega ühendatud punktide kogumina. Need on kaks parameetrit, mida kasutatakse tiheduspõhise klastrite jaoks. Need on Ɛ (epsilon) ja miinimumpunktid. Ɛ on naabruskonna maksimaalne raadius. Minimaalsed punktid on minimaalne punktide arv Ɛ naabruses klastri määratlemiseks. Need on mõned näited rühmitustest, mis kuuluvad järelevalveta õppimisse.

Üldiselt ei ole järelevalveta õppealgoritmidega genereeritud tulemused kuigi täpsed ja usaldusväärsed, sest masin peab enne peidetud mustrite ja funktsioonide määramist sisendandmed määratlema ja märgistama.

Milline on juhendatud ja järelevalveta masinõppe sarnasus?

Nii juhendatud kui ka järelevalveta õpe on masinõppe tüübid

Mis vahe on juhendatud ja järelevalveta masinõppel?

Järelevalvega vs järelevalveta masinõpe

Järelevalvega õpe on masinõppe ülesanne, mille eesmärk on õppida funktsioon, mis vastendab sisendi väljundiks näidissisend-väljundpaaride põhjal. Järelevalveta õpe on masinõppe ülesanne, mis tuletab märgistamata andmetest peidetud struktuuri kirjeldavat funktsiooni.
Põhifunktsioonid
Järelevalvega õppe puhul ennustab mudel tulemust märgistatud sisendandmete põhjal. Järelevalveta õppimisel ennustab mudel tulemust ilma märgistatud andmeteta, tuvastades mustrid ise.
Tulemuste täpsus
Järelevalvega õppemeetodite abil saadud tulemused on täpsemad ja usaldusväärsemad. Järelevalveta õppemeetodite abil saadud tulemused ei ole kuigi täpsed ja usaldusväärsed.
Peamised algoritmid
Järelevalvega õppes on regressiooni ja klassifitseerimise algoritmid. Järelevalveta õppe puhul on rühmitamiseks algoritme.

Kokkuvõte – juhendatud vs järelevalveta masinõpe

Järelevalvega õpe ja järelevalveta õpe on masinõppe kahte tüüpi. Juhendatud õpe on masinõppe ülesanne, mille eesmärk on õppida funktsioon, mis vastendab sisendi väljundiks näidissisend-väljundpaaride põhjal. Järelevalveta õpe on masinõppe ülesanne, mille eesmärk on tuletada funktsioon, mis kirjeldab märgistamata andmetest peidetud struktuuri. Erinevus juhendatud ja järelevalveta masinõppe vahel seisneb selles, et juhendatud õpe kasutab märgistatud andmeid, samas kui järelevalveta kallutamine kasutab märgistamata andmeid.

Soovitan: