types machine learning
Denne opplæringen forklarer typene maskinlæring, dvs. overvåket, uten tilsyn, forsterkning og semi-overvåket læring med enkle eksempler. Du vil også lære forskjeller mellom tilsyn mot tilsyn uten læring:
I Forrige veiledning , har vi lært om maskinlæring, dens bruk og applikasjoner. Vi har også sett en sammenligning av Machine Learning Vs Artificial Intelligence.
Machine Learning er et vitenskapsfelt som tar for seg dataprogrammer som lærer gjennom erfaring og forutsier produksjonen.
Hovedfunksjonen i ML er å lære av erfaring. Læringen skjer når systemet matet med treningsinndata gjør endringer i parametrene og justerer seg for å gi ønsket resultat. Resultatet er målverdien som er definert i treningsdataene.
=> Les gjennom hele opplæringsserien for maskinlæring
Hva du vil lære:
- Typer maskinlæring
- Virkelig eksempel på overvåket og uten tilsyn læring
- Forskjellen mellom tilsyn mot tilsyn uten læring
- Semi-overvåket læring
- Konklusjon
Typer maskinlæring
Maskinlæringsprogrammer er klassifisert i tre typer som vist nedenfor.
- Overvåket
- Uten tilsyn
- Forsterkningslæring
La oss forstå hver av disse i detalj !!
# 1) Veiledet læring
Overvåket læring skjer i nærvær av en veileder, akkurat som læring utført av et lite barn med hjelp av læreren sin. Når et barn blir opplært til å gjenkjenne frukt, farger, tall under tilsyn av en lærer, er denne metoden veiledet læring.
I denne metoden blir hvert trinn av barnet sjekket av læreren, og barnet lærer av utdataene det må produsere.
Hvordan overvåket læring fungerer?
I den overvåkede ML-algoritmen er utdataene allerede kjent. Det er en kartlegging av inngang med utgangen. Derfor, for å lage en modell, blir maskinen matet med mange treningsinndata (med kjent inngang og tilsvarende utdata).
Treningsdataene hjelper til med å oppnå et nøyaktighetsnivå for den opprettede datamodellen. Den innebygde modellen er nå klar til å mates med nye inngangsdata og forutsi resultatene.
Hva er et merket datasett?
Datasettet med utganger kjent for en gitt inngang kalles et merket datasett. For eksempel, et bilde av frukt sammen med fruktnavnet er kjent. Så når et nytt bilde av frukt vises, sammenlignes det med treningssettet for å forutsi svaret.
Overvåket læring er en rask læringsmekanisme med høy nøyaktighet. De veiledede læringsproblemene inkluderer regresjons- og klassifiseringsproblemer.
Noen av de veiledede læringsalgoritmene er:
- Beslutningstrær,
- K-nærmeste nabo,
- Lineær regresjon,
- Support Vector Machine og
- Nevrale nettverk.
Eksempel på veiledet læring
- I det første trinnet mates et treningsdatasett til maskinlæringsalgoritmen.
- Med treningsdatasettet justerer maskinen seg ved å gjøre endringer i parametrene for å bygge en logisk modell.
- Den innebygde modellen brukes deretter til et nytt datasett for å forutsi resultatet.
Typer overvåket læringsalgoritmer
- Klassifisering: I denne typen problemer forutsier vi responsen som spesifikke klasser, for eksempel “ja” eller “nei”. Når bare to klasser er til stede, kalles det en binær klassifisering. For mer enn 2 klasseverdier kalles det en Multi-class Classification. De forutsagte responsverdiene er diskrete verdier. For eksempel, Er det bildet av solen eller månen? Klassifiseringsalgoritmen skiller dataene i klasser.
- Regresjon: Regresjonsproblemer forutsier responsen som kontinuerlige verdier, for eksempel å forutsi en verdi som spenner fra - uendelig til uendelig. Det kan ta mange verdier. For eksempel, den lineære regresjonsalgoritmen som brukes, forutsier kostnadene for huset basert på mange parametere som beliggenhet, nærliggende flyplass, størrelse på huset osv.
# 2) Uovervåket læring
Uovervåket læring skjer uten hjelp fra en veileder akkurat som en fisk lærer å svømme av seg selv. Det er en uavhengig læringsprosess.
I denne modellen er målverdiene ukjente / umerkede ettersom det ikke er noen utdata som er kartlagt med inngangen. Systemet må lære av seg selv fra datainngangen til det og oppdage de skjulte mønstrene.
Hva er umerket datasett?
Et datasett med ukjente utgangsverdier for alle inngangsverdiene kalles et umerket datasett.
Hvordan fungerer ikke-veiledet læring?
Siden det ikke er noen kjente utgangsverdier som kan brukes til å bygge en logisk modell mellom inngang og utgang, blir noen teknikker brukt til å utvide dataregler, mønstre og datagrupper med lignende typer. Disse gruppene hjelper sluttbrukerne med å forstå dataene bedre, samt å finne en meningsfull utgang.
Matede innganger er ikke i form av en riktig struktur akkurat som treningsdata er (i veiledet læring). Det kan inneholde outliers, støyende data osv. Disse inngangene blir tilført systemet. Mens du trener modellen, er inngangene organisert for å danne klynger.
De ikke-overvåkede læringsalgoritmene inkluderer klynging og tilknytningsalgoritmer som:
- Apriori,
- K-betyr klynging og andre tilknytningsregelgruvedriftalgoritmer.
Når nye data blir matet til modellen, vil den forutsi utfallet som en klassemerke som inngangen tilhører. Hvis klassemerket ikke er til stede, genereres en ny klasse.
Mens den gjennomgår prosessen med å oppdage mønstre i dataene, justerer modellen parametrene av seg selv, derfor kalles den også selvorganiserende. Klyngene vil bli dannet ved å finne ut likhetene mellom inngangene.
For eksempel, mens du kjøper produkter på nettet, hvis smør legges i handlekurven, foreslår det at du kjøper brød, ost osv. Den uten tilsyn modellen ser på datapunktene og forutsier de andre attributtene som er knyttet til produktet.
Eksempel på tilsyn uten læring
Typer algoritmer uten tilsyn
- Clustering Algorithm : Metodene for å finne likhetene mellom dataelementer som samme form, størrelse, farge, pris osv. Og gruppere dem for å danne en klynge er klyngeanalyse.
- Outlier Detection : I denne metoden er datasettet søket etter alle slags ulikheter og avvik i dataene. For eksempel, en høyverdig transaksjon på kredittkort oppdages av systemet for svindeloppdagelse.
- Association Rule Mining : I denne typen gruvedrift finner den ut de mest forekommende artikelsettene eller assosiasjoner mellom elementer. Foreninger som 'produkter som ofte kjøpes sammen' osv.
- Autokodere: Inngangen komprimeres til en kodet form og gjenskapes for å fjerne støyende data. Denne teknikken brukes til å forbedre bilde- og videokvaliteten.
# 3) Forsterkningslæring
I denne typen læring lærer algoritmen ved tilbakemeldingsmekanisme og tidligere erfaringer. Det er alltid ønsket at hvert trinn i algoritmen tas for å nå et mål.
Så når neste trinn skal tas, får det tilbakemeldinger fra forrige trinn, sammen med læringen fra opplevelsen for å forutsi hva som kan være det neste beste trinnet. Denne prosessen kalles også en prøve-og-feil-prosess for å nå målet.
Forsterkningslæring er en langsiktig iterativ prosess. Jo mer antall tilbakemeldinger, jo mer nøyaktig blir systemet. Grunnleggende forsterkningslæring kalles også Markov Decision Process.
Eksempel på forsterkningslæring
Eksempel på forsterkningslæring er videospill, der spillerne fullfører visse nivåer i et spill og tjener belønningspoeng. Spillet gir tilbakemelding til spilleren gjennom bonusbevegelser for å forbedre hans / hennes ytelse.
Forsterkningslæring brukes i opplæring av roboter, selvdrevne biler, automatisk styring av lager, etc.
Noen populære algoritmer for forsterkningslæring inkluderer:
- Q-læring,
- Dype kontroversielle nettverk
- Temporal Difference
Figuren nedenfor beskriver tilbakemeldingsmekanismen til forsterkningslæring.
- Inngangen observeres av agenten som er AI-elementet.
- Denne AI-agenten handler på miljøet i henhold til avgjørelsen.
- Svaret fra miljøet sendes til AI i form av en belønning som tilbakemelding.
- Tilstand og handlinger utført på miljøet lagres også.
(bilde kilde )
Virkelig eksempel på overvåket og uten tilsyn læring
For veiledet læring:
#1) La oss ta et eksempel på en kurv med grønnsaker som har løk, gulrot, reddik, tomat osv., Og vi kan ordne dem i form av grupper.
#to) Vi lager en treningstabell for å forstå Supervised Learning.
Treningsdatatabellen karakteriserer grønnsakene basert på:
- Form
- Farge
- Størrelse
Form | Farge | Størrelse | Grønnsak |
---|---|---|---|
Det er mer nøyaktig enn uten tilsyn, da inngangsdata og tilsvarende utdata er kjent, og maskinen trenger bare å gi spådommer. | Den har mindre nøyaktighet ettersom inndataene er umerket. Dermed må maskinen først forstå og merke dataene og deretter gi spådommer. | ||
Rund | brun | Stor | Løk |
Rund | Nett | Medium | Tomat |
Sylindrisk | Hvit | Stor | Reddik |
Sylindrisk | Nett | Medium | Gulrot |
Når denne treningsdatatabellen mates til maskinen, vil den bygge en logisk modell ved å bruke formen, fargen, størrelsen på grønnsaken osv. For å forutsi resultatet (grønnsaken).
Når en ny inngang mates til denne modellen, vil algoritmen analysere parametrene og sende navnet på frukten.
For uten tilsyn læring:
I uten tilsyn læring skaper det grupper eller klynger basert på attributter. I ovennevnte eksempeldatasett er parameteren vegetabilsk:
# 1) Form
Grønnsakene er gruppert etter form.
- Rund: Løk og tomat.
- Sylindrisk: Reddik og gulrot.
Ta en annen parameter som størrelse.
# 2) Størrelse
Grønnsakene er gruppert basert på størrelse og form:
- Middels størrelse og rund form: Tomat
- Stor størrelse og rund form: Løk
I uten tilsyn læring har vi ikke noe treningsdatasett og resultatvariabler mens vi er i veiledet læring. Treningsdataene er kjent og brukes til å trene algoritmen.
Forskjellen mellom tilsyn mot tilsyn uten læring
Overvåket | Uten tilsyn |
---|---|
I overvåkede læringsalgoritmer er utdataene for den gitte inngangen kjent. | I ikke-overvåket læringsalgoritmer er utdataene for den gitte inngangen ukjent. |
Algoritmene lærer av merket datasett. Disse dataene hjelper til med å evaluere nøyaktigheten på treningsdataene. | Algoritmen er forsynt med umerkede data der den prøver å finne mønstre og assosiasjoner mellom dataelementene. |
Det er en prediktiv modelleringsteknikk som spår fremtidige resultater nøyaktig. | Det er en beskrivende modelleringsteknikk som forklarer det virkelige forholdet mellom elementene og historien til elementene. |
Den inkluderer klassifiserings- og regresjonsalgoritmer. | Det inkluderer klynging og tilknytningsregler læringsalgoritmer. |
Noen algoritmer for veiledet læring er Lineær regresjon, Naïve Bayes og Nevrale nettverk. | Noen algoritmer for uten tilsyn læring er k- betyr klynging, Apriori, etc. |
Denne typen læring er relativt kompleks da den krever merkede data. | Det er mindre komplisert ettersom det ikke er behov for å forstå og merke data. |
Det er en online prosess med dataanalyse og krever ikke menneskelig interaksjon. | Dette er en sanntidsanalyse av data. |
Semi-overvåket læring
Den semi-supervised læringsmetoden tar både merkede og umerkede opplæringsdatainnganger. Denne typen læring er nyttig når det er vanskelig å hente ut nyttige funksjoner fra umerkede data (overvåket tilnærming) og dataeksperter synes det er vanskelig å merke inngangsdataene (uten tilsyn).
Bare en liten mengde merkede data i disse algoritmene kan føre til nøyaktigheten til modellen.
Eksempler av semi-supervised learning inkluderer CT-skanning og MR der en medisinsk ekspert kan merke noen få poeng i skanningen for sykdom mens det er vanskelig å merke alle skanningene.
standard gateway ikke tilgjengelig windows 10 wifi
Konklusjon
Maskinlæringsoppgavene er i stor grad klassifisert i Overvåket, Unsupervised, Semi-Supervised og Reinforcement Learning-oppgaver.
Overvåket læring er læring ved hjelp av merkede data. ML-algoritmene mates med et treningsdatasett der utdataene er kjent for hver inngangsdata for å forutsi fremtidige resultater.
Denne modellen er veldig nøyaktig og rask, men den krever høy kompetanse og tid til å bygge. Disse modellene krever også ombygging hvis dataene endres. ML-oppgaver som regresjon og klassifisering utføres under et overvåket læringsmiljø.
Uovervåket læring foregår uten hjelp fra en veileder. Inngangsdataene som er matet til ML-algoritmene er umerket, dvs. for hver inngang er ingen utgang kjent. Algoritmen i seg selv finner ut trendene og mønsteret i inngangsdataene og skaper en sammenheng mellom de forskjellige attributtene til inngangen.
Denne typen læring er nyttig for å finne mønstre i data, lage klynger av data og sanntidsanalyse. Oppgaver som Clustering, KNN-algoritmer osv. Kommer under tilsyn uten læring.
Semi-Supervised læringsoppgaver fordelen med både overvåket og ikke-overvåket algoritmer ved å forutsi resultatene ved hjelp av både merkede og umerkede data. Forsterkningslæring er en type tilbakemeldingsmekanisme der maskinen lærer av konstant tilbakemelding fra miljøet for å oppnå sitt mål.
I denne typen læring utfører AI-agenter noen handlinger på dataene og miljøet gir en belønning. Forsterkningslæring brukes av flerspillerspill for barn, selvkjørende biler, etc.
Følg med på vår kommende veiledning for å lære mer om maskinlæring og kunstig nevralt nettverk!
=> Besøk her for den eksklusive maskinlæringsserien
Anbefalt lesing
- Data Mining Vs Machine Learning Vs Artificial Intelligence Vs Deep Learning
- De 11 mest populære maskinlæringsverktøyene i 2021
- Machine Learning Tutorial: Introduksjon til ML og dets applikasjoner
- Python datatyper
- C ++ datatyper
- Typer av risikoer i programvareprosjekter
- Typer av migrasjonstesting: Med testscenarier for hver type
- De 15 beste læringsstyringssystemene (LMS of the Year 2021)