Ohjattu koneoppiminen: Mikä on, algoritmit, esimerkki

Sisällysluettelo:

Anonim

Mitä on valvottu koneoppiminen?

Ohjatussa oppimisessa koulutat konetta käyttämällä tietoja, jotka on hyvin "merkitty ". Se tarkoittaa, että joillekin tiedoille on jo merkitty oikea vastaus. Sitä voidaan verrata oppimiseen, joka tapahtuu esimiehen tai opettajan läsnä ollessa.

Valvottu oppimisalgoritmi oppii merkittyistä harjoitustiedoista, auttaa sinua ennustamaan odottamattomien tietojen tuloksia.

Tarkan valvotun koneoppimismallin onnistunut rakentaminen, skaalaus ja käyttöönotto vie aikaa ja teknistä asiantuntemusta korkeasti koulutettujen datatieteilijöiden tiimiltä. Lisäksi datatieteilijän on rakennettava malleja uudelleen varmistaakseen, että annetut näkemykset pysyvät paikkansa, kunnes sen tiedot muuttuvat.

Tässä opetusohjelmassa opit:

  • Mitä on valvottu koneoppiminen?
  • Kuinka valvottu oppiminen toimii
  • Valvottujen koneoppimisalgoritmien tyypit
  • Valvotut vs. valvomaton koneoppimistekniikat
  • Haasteet valvotussa koneoppimisessa
  • Ohjatun oppimisen edut:
  • Ohjatun oppimisen haitat
  • Parhaita käytäntöjä valvotulle oppimiselle

Kuinka valvottu oppiminen toimii

Haluat esimerkiksi kouluttaa koneen auttamaan sinua ennustamaan, kuinka kauan kestää ajaa kotiin työpaikallasi. Täällä aloitat luomalla joukon merkittyjä tietoja. Nämä tiedot sisältävät

  • Sääolosuhteet
  • Päivän aika
  • Lomat

Kaikki nämä yksityiskohdat ovat syöttösi. Lähtö on aika, joka kului ajamaan takaisin kotiin kyseisenä päivänä.

Tiedät vaistomaisesti, että jos ulkona sataa, kestää kauemmin ajaa kotiin. Mutta kone tarvitsee tietoja ja tilastoja.

Katsotaanpa nyt, kuinka voit kehittää tämän esimerkin valvotun oppimismallin, joka auttaa käyttäjää määrittämään työmatkan ajan. Ensimmäinen asia, jonka tarvitset luoda, on harjoitusjoukko. Tämä harjoitusjoukko sisältää koko työmatka-ajan ja vastaavat tekijät, kuten sään, ajan jne. Tämän harjoitusjoukon perusteella koneesi saattaa nähdä, että sateen määrän ja kotiisi kulumisen välillä on suora yhteys.

Joten se varmistaa, että mitä enemmän sataa, sitä kauemmin aiot palata kotiisi. Se saattaa myös nähdä yhteyden poistuessasi olevan ajan ja tiellä olevan ajan välillä.

Mitä lähempänä olet klo 18, sitä kauemmin kestää palata kotiin. Koneesi saattaa löytää joitain suhteita leimattuihin tietoihin.

Tämä on tietomallisi alku. Se alkaa vaikuttaa siihen, kuinka sade vaikuttaa ihmisten ajamiseen. Se alkaa myös nähdä, että enemmän ihmisiä matkustaa tiettynä kellonaikana.

Valvottujen koneoppimisalgoritmien tyypit

Regressio:

Regressiotekniikka ennustaa yhden lähtöarvon harjoitustietojen avulla.

Esimerkki : Voit ennustaa talon hinnan regressiolla harjoitustiedoista. Syöttömuuttujat ovat sijainti, talon koko jne.

Vahvuudet : Lähdöillä on aina todennäköisyys tulkinta, ja algoritmi voidaan säännellä yliasennuksen välttämiseksi.

Heikkoudet : Logistinen regressio voi olla heikompaa, kun päätösrajoituksia on useita tai ei-lineaarisia. Tämä menetelmä ei ole joustava, joten se ei vangitse monimutkaisempia suhteita.

Logistinen regressio:

Logistinen regressiomenetelmä, jota käytetään arvioimaan erilliset arvot annettujen riippumattomien muuttujien joukon perusteella. Se auttaa sinua ennustamaan tapahtuman todennäköisyyden sovittamalla tietoja logit-funktioon. Siksi sitä kutsutaan myös logistiseksi regressioksi. Kun se ennustaa todennäköisyyden, sen lähtöarvo on välillä 0 ja 1.

Tässä on muutamia regressioalgoritmeja

Luokittelu:

Luokittelu tarkoittaa tuotoksen ryhmittelyä luokan sisällä. Jos algoritmi yrittää merkitä syötteen kahteen erilliseen luokkaan, sitä kutsutaan binääriluokitukseksi. Valintaa useamman kuin kahden luokan välillä kutsutaan moniklassiseksi luokitukseksi.

Esimerkki : Sen määrittäminen, onko joku lainan laiminlyönti.

Vahvuudet : Luokituspuu toimii käytännössä erittäin hyvin

Heikkoudet : Rajoittamattomat yksittäiset puut ovat taipuvaisia ​​ylikuntoon.

Tässä on muutamia luokitusalgoritmeja

Naiviset Bayes-luokittelijat

Naivinen Bayesin malli (NBN) on helppo rakentaa ja erittäin hyödyllinen suurille tietojoukoille. Tämä menetelmä koostuu suorista asyklisistä kaavioista, joissa on yksi vanhempi ja useita lapsia. Se olettaa riippumattomuuden vanhemmastaan ​​erotettujen lapsisolmujen välillä.

Päätöspuita

Päätökset puut luokittelevat esiintymän lajittelemalla ne ominaisuuden arvon perusteella. Tässä menetelmässä kukin tila on ilmentymän ominaisuus. Sen tulisi olla luokiteltu, ja jokainen haara edustaa arvoa, jonka solmu voi ottaa. Se on laajalti käytetty luokittelutekniikka. Tässä menetelmässä luokittelu on puu, joka tunnetaan päätöksentekopuuna.

Sen avulla voit arvioida todelliset arvot (auton ostokustannukset, puheluiden määrä, kuukausittainen kokonaismyynti jne.).

Tuki vektorikoneelle

Tukivektorikone (SVM) on eräänlainen oppimisalgoritmi, joka kehitettiin vuonna 1990. Tämä menetelmä perustuu Vap Nikin julkaisemaan tilastollisen oppimisteorian tuloksiin.

SVM-koneet ovat myös läheisesti yhteydessä ytimen toimintoihin, mikä on keskeinen käsite suurimmalle osalle oppimistehtävistä. Ytimen kehystä ja SVM: ää käytetään useilla aloilla. Se sisältää multimediatietojen hakemisen, bioinformatiikan ja mallintunnistuksen.

Valvotut vs. valvomaton koneoppimistekniikat

Perustuen Ohjattu koneoppimistekniikka Valvomaton koneoppimistekniikka
Syöttötiedot Algoritmeja koulutetaan käyttämällä merkittyjä tietoja. Algoritmeja käytetään dataa vastaan, jota ei ole merkitty
Laskennallinen monimutkaisuus Ohjattu oppiminen on yksinkertaisempi menetelmä. Valvomaton oppiminen on laskennallisesti monimutkaista
Tarkkuus Erittäin tarkka ja luotettava menetelmä. Vähemmän tarkka ja luotettava menetelmä.

Haasteet valvotussa koneoppimisessa

Tässä on valvotun koneoppimisen kohtaamia haasteita:

  • Epäolennaiset syöttöominaisuudet, jotka ovat olemassa, voivat antaa epätarkkoja tuloksia
  • Tietojen valmistelu ja esikäsittely on aina haaste.
  • Tarkkuus kärsii, kun harjoitustiedoksi on syötetty mahdotonta, epätodennäköistä ja epätäydellisiä arvoja
  • Jos asianomaista asiantuntijaa ei ole käytettävissä, toinen lähestymistapa on "raakavoima". Se tarkoittaa, että sinun täytyy ajatella, että oikeat ominaisuudet (syöttömuuttujat) koneen kouluttamiseen. Se voi olla epätarkka.

Ohjatun oppimisen edut:

  • Ohjatun oppimisen avulla voit kerätä tietoja tai tuottaa datan tuotoksen aiemmasta kokemuksesta
  • Auttaa sinua optimoimaan suorituskykykriteerit kokemuksen avulla
  • Valvottu koneoppiminen auttaa sinua ratkaisemaan erilaisia ​​reaalimaailman laskentaongelmia.

Ohjatun oppimisen haitat

  • Päätösraja saattaa olla ylikuormitettu, jos harjoittelupaikkasi, jolla ei ole esimerkkejä, jotka haluat saada luokassa
  • Sinun on valittava paljon hyviä esimerkkejä kustakin luokasta luokittelijan koulutuksen aikana.
  • Suurtietojen luokittelu voi olla todellinen haaste.
  • Valvotun oppimisen harjoittelu vaatii paljon laskenta-aikaa.

Parhaita käytäntöjä valvotulle oppimiselle

  • Ennen kuin teet mitään muuta, sinun on päätettävä, minkälaisia ​​tietoja käytetään harjoitusryhmänä
  • Sinun on päätettävä opitun toiminnon ja oppimisalgoritmin rakenne.
  • Gathere vastaavat tulokset joko asiantuntijoilta tai mittauksista

Yhteenveto

  • Valvotussa oppimisessa koulutat konetta käyttämällä hyvin "merkittyjä" tietoja.
  • Haluat kouluttaa koneen, joka auttaa sinua ennustamaan, kuinka kauan kestää ajaa työpaikaltaasi kotiin - esimerkki valvotusta oppimisesta
  • Regressio ja luokittelu ovat kahta valvottua koneoppimistekniikkaa.
  • Ohjattu oppiminen on yksinkertaisempi menetelmä, kun taas valvomaton oppiminen on monimutkainen menetelmä.
  • Valvotun oppimisen suurin haaste on, että merkityksetön syöttöominaisuus, joka sisältää harjoitustiedot, voi antaa epätarkkoja tuloksia.
  • Valvotun oppimisen suurin etu on, että sen avulla voit kerätä tietoja tai tuottaa datan tuotoksen aiemmasta kokemuksesta.
  • Tämän mallin haittana on, että päätöksentekoraja saattaa olla liian suuri, jos harjoitusjoukollasi ei ole esimerkkejä, joita haluat saada luokassa.
  • Parhaana käytäntönä oppimisen valvonnassa on ensin päätettävä, minkä tyyppisiä tietoja tulisi käyttää koulutusjoukkona.