Mitä on valvottu koneoppiminen?
Ohjatussa oppimisessa koulutat konetta käyttämällä tietoja, jotka on hyvin "merkitty ". Se tarkoittaa, että joillekin tiedoille on jo merkitty oikea vastaus. Sitä voidaan verrata oppimiseen, joka tapahtuu esimiehen tai opettajan läsnä ollessa.
Valvottu oppimisalgoritmi oppii merkittyistä harjoitustiedoista, auttaa sinua ennustamaan odottamattomien tietojen tuloksia. Tarkan valvotun koneoppimisen onnistunut rakentaminen, skaalaus ja käyttöönotto Datatieteen malli vie aikaa ja teknistä asiantuntemusta korkeasti koulutettujen datatieteilijöiden tiimiltä. Lisäksi datatieteilijän on rakennettava malleja uudelleen varmistaakseen, että annetut näkemykset pysyvät paikkansa, kunnes sen tiedot muuttuvat.
Tässä opetusohjelmassa opit
- Mitä on valvottu koneoppiminen?
- Mikä on valvomaton oppiminen?
- Miksi ohjattu oppiminen?
- Miksi valvomaton oppiminen?
- Kuinka valvottu oppiminen toimii?
- Kuinka valvomaton oppiminen toimii?
- Valvottujen koneoppimistekniikoiden tyypit
- Valvomaton koneoppimistekniikoiden tyypit
- Valvottu vs. valvomaton oppiminen
Mikä on valvomaton oppiminen?
Valvomaton oppiminen on koneoppimistekniikkaa, jossa sinun ei tarvitse valvoa mallia. Sen sijaan sinun on annettava mallin toimia itsenäisesti tiedon löytämiseksi. Se käsittelee pääasiassa merkitsemättömiä tietoja.
Valvomattomat oppimisalgoritmit antavat sinun suorittaa monimutkaisempia prosessointitehtäviä valvottuun oppimiseen verrattuna. Vaikka valvomaton oppiminen voi olla arvaamattomampaa kuin muut luonnolliset syvälliset oppimismenetelmät ja vahvistavat oppimismenetelmät.
Miksi ohjattu oppiminen?
- Ohjatun oppimisen avulla voit kerätä tietoja tai tuottaa datan tuotoksen aiemmasta kokemuksesta.
- Auttaa sinua optimoimaan suorituskykykriteerit kokemuksen avulla
- Valvottu koneoppiminen auttaa sinua ratkaisemaan erilaisia reaalimaailman laskentaongelmia.
Miksi valvomaton oppiminen?
Tässä ovat tärkeimmät syyt valvomattoman oppimisen käyttöön:
- Valvomaton koneoppiminen löytää datasta kaikenlaisia tuntemattomia malleja.
- Valvomattomat menetelmät auttavat sinua löytämään ominaisuuksia, joista voi olla hyötyä luokittelussa.
- Se tapahtuu reaaliajassa, joten kaikki lähtötiedot on analysoitava ja merkittävä oppijoiden läsnä ollessa.
- Tunnistamattomia tietoja on helpompi hankkia tietokoneelta kuin leimattuja tietoja, jotka edellyttävät manuaalista puuttumista.
Kuinka valvottu oppiminen toimii?
Haluat esimerkiksi kouluttaa koneen auttamaan sinua ennustamaan, kuinka kauan kestää ajaa kotiin työpaikallasi. Täällä aloitat luomalla joukon merkittyjä tietoja. Nämä tiedot sisältävät
- Sääolosuhteet
- Päivän aika
- Lomat
Kaikki nämä yksityiskohdat ovat syöttösi. Lähtö on aika, joka kului ajamaan takaisin kotiin kyseisenä päivänä.
Tiedät vaistomaisesti, että jos ulkona sataa, kestää kauemmin ajaa kotiin. Mutta kone tarvitsee tietoja ja tilastoja.
Katsotaanpa nyt, kuinka voit kehittää tämän esimerkin valvotun oppimismallin, joka auttaa käyttäjää määrittämään työmatkan ajan. Ensimmäinen asia, jonka tarvitset luoda, on harjoitustietojoukko. Tämä harjoitusjoukko sisältää koko työmatka-ajan ja vastaavat tekijät, kuten sään, ajan jne. Tämän harjoitusjoukon perusteella koneesi saattaa nähdä, että sateen määrän ja kotiisi kulumisen välillä on suora yhteys.
Joten se varmistaa, että mitä enemmän sataa, sitä kauemmin aiot palata kotiisi. Se saattaa myös nähdä yhteyden poistuessasi olevan ajan ja tiellä olevan ajan välillä.
Mitä lähempänä olet klo 18, sitä pidempi aika kuluu kotiin pääsemiseen. Koneesi saattaa löytää joitain suhteita leimattuihin tietoihin.
Tämä on tietomallisi alku. Se alkaa vaikuttaa siihen, kuinka sade vaikuttaa ihmisten ajamiseen. Se alkaa myös nähdä, että enemmän ihmisiä matkustaa tiettynä kellonaikana.
Kuinka valvomaton oppiminen toimii?
Otetaanpa vauvan ja hänen perhekoiransa tapaus.
Hän tuntee ja tunnistaa tämän koiran. Muutama viikko myöhemmin perheenystävä tuo mukanaan koiran ja yrittää leikkiä vauvan kanssa.
Vauva ei ole nähnyt tätä koiraa aiemmin. Mutta se tunnistaa monet piirteet (2 korvat, silmät, kävely 4 jalalla) ovat kuin hänen lemmikkikoiransa. Hän tunnistaa uuden eläimen kuin koira. Tämä on valvomatonta oppimista, jossa sinua ei opeteta, mutta opit tiedoista (tässä tapauksessa koirasta). Jos tämä olisi ollut valvottua oppimista, perheen ystävä olisi kertonut vauvalle, että se on koira.
Valvottujen koneoppimistekniikoiden tyypit
Regressio:
Regressiotekniikka ennustaa yhden lähtöarvon harjoitustietojen avulla.
Esimerkki: Voit ennustaa talon hinnan regressiolla harjoitustiedoista. Syöttömuuttujat ovat sijainti, talon koko jne.
Luokittelu:
Luokittelu tarkoittaa tuotoksen ryhmittelyä luokan sisällä. Jos algoritmi yrittää merkitä syötteen kahteen erilliseen luokkaan, sitä kutsutaan binääriluokitukseksi. Valintaa useamman kuin kahden luokan välillä kutsutaan moniklassiseksi luokitukseksi.
Esimerkki : Sen määrittäminen, onko joku lainan laiminlyönti.
Vahvuudet : Lähdöillä on aina todennäköisyys tulkinta, ja algoritmi voidaan säännellä yliasennuksen välttämiseksi.
Heikkoudet : Logistinen regressio voi olla heikompaa, kun päätösrajoituksia on useita tai ei-lineaarisia. Tämä menetelmä ei ole joustava, joten se ei vangitse monimutkaisempia suhteita.
Valvomaton koneoppimistekniikoiden tyypit
Valvomattomat oppimisongelmat ryhmitettiin edelleen klusterointi- ja assosiaatio-ongelmiksi.
Ryhmittely
Klusterointi on tärkeä käsite valvomattoman oppimisen yhteydessä. Se käsittelee pääasiassa rakenteen tai mallin löytämistä luokittelemattomien tietojen kokoelmasta. Klusterointialgoritmit käsittelevät tietojasi ja löytävät luonnollisia klustereita (ryhmiä), jos niitä on tiedoissa. Voit myös muokata, kuinka monta klusteria algoritmiesi tulisi tunnistaa. Sen avulla voit säätää näiden ryhmien tarkkuutta.
Yhdistys
Yhdistämissääntöjen avulla voit luoda assosiaatioita suurten tietokantojen dataobjektien joukosta. Tämä valvomaton tekniikka on mielenkiintoisten suhteiden löytämistä muuttujien välillä suurissa tietokannoissa. Esimerkiksi uuden kodin ostavat ihmiset todennäköisesti ostavat uusia huonekaluja.
Muita esimerkkejä:
- Syöpäpotilaiden alaryhmä ryhmitelty niiden geeniekspressiomittausten perusteella
- Ostajaryhmät selaus- ja ostohistoriansa perusteella
- Elokuvaryhmä elokuvien katsojien antaman luokituksen perusteella
Valvottu vs. valvomaton oppiminen
Parametrit | Ohjattu koneoppimistekniikka | Valvomaton koneoppimistekniikka |
Prosessi | Valvotussa oppimismallissa annetaan panos- ja lähtömuuttujat. | Valvomaton oppimalli antaa vain syöttötiedot |
Syöttötiedot | Algoritmeja koulutetaan käyttämällä merkittyjä tietoja. | Algoritmeja käytetään dataa vastaan, jota ei ole merkitty |
Käytetyt algoritmit | Tuki vektorikoneelle, hermoverkolle, lineaariselle ja logistiselle regressiolle, satunnaisille metsille ja luokituspuille. | Valvomattomat algoritmit voidaan jakaa eri luokkiin: kuten klusterialgoritmit, K-keskiarvot, hierarkkinen klusterointi jne. |
Laskennallinen monimutkaisuus | Ohjattu oppiminen on yksinkertaisempi menetelmä. | Valvomaton oppiminen on laskennallisesti monimutkaista |
Tietojen käyttö | Ohjattu oppimismalli käyttää harjoitustietoja oppiakseen linkin panoksen ja tuotoksen välillä. | Valvomaton oppiminen ei käytä lähtötietoja. |
Tulosten tarkkuus | Erittäin tarkka ja luotettava menetelmä. | Vähemmän tarkka ja luotettava menetelmä. |
Reaaliaikainen oppiminen | Oppimismenetelmä tapahtuu offline-tilassa. | Oppimismenetelmä tapahtuu reaaliajassa. |
Luokkien lukumäärä | Luokkien lukumäärä on tiedossa. | Luokkien lukumäärä ei ole tiedossa. |
Tärkein haittapuoli | Suurtietojen luokittelu voi olla todellinen haaste valvotussa oppimisessa. | Et voi saada tarkkaa tietoa tietojen lajittelusta, ja valvomaton oppimisessa käytettävät tiedot on merkitty eikä tunneta. |
Yhteenveto
- Ohjatussa oppimisessa koulutat konetta käyttämällä tietoja, jotka on hyvin "merkitty".
- Valvomaton oppiminen on koneoppimistekniikkaa, jossa sinun ei tarvitse valvoa mallia.
- Ohjatun oppimisen avulla voit kerätä tietoja tai tuottaa datan tuotoksen aiemmasta kokemuksesta.
- Valvomaton koneoppiminen auttaa sinua löytämään kaikenlaisia tuntemattomia malleja tiedoista.
- Voit esimerkiksi määrittää paluuseen kulumisen perustuen sääolosuhteisiin, vuorokaudenaikaan ja lomaan.
- Esimerkiksi vauva voi tunnistaa muut koirat aikaisemman valvotun oppimisen perusteella.
- Regressio ja luokittelu ovat kahta valvottua koneoppimistekniikkaa.
- Klusterointi ja yhdistyminen ovat kahta valvomattoman oppimisen tyyppiä.
- Valvotussa oppimismallissa syöttö- ja lähtömuuttujat annetaan, kun taas valvomaton oppimismalli antaa vain syöttötiedot