Ero syvällisen oppimisen ja koneoppimisen välillä

Sisällysluettelo:

Anonim

Mikä on tekoäly?

AI (tekoäly) on tietojenkäsittelytieteen ala, jossa koneet ohjelmoidaan ja niille annetaan kognitiivinen kyky ajatella ja matkia toimia kuten ihmiset ja eläimet. Tekoälyn vertailuarvo on inhimillinen älykkyys perusteluissa, puheessa, oppimisessa, näyssä ja ongelmanratkaisussa, joka on kaukana tulevaisuudessa.

Tekoälyllä on kolme erilaista tasoa:

  1. Kapea tekoäly : Tekoälyn sanotaan olevan kapea, kun kone pystyy suorittamaan tietyn tehtävän paremmin kuin ihminen. Tekoälyn nykyinen tutkimus on täällä
  2. Yleinen tekoäly : Tekoäly saavuttaa yleisen tilan, kun se voi suorittaa minkä tahansa älyllisen tehtävän samalla tarkkuustasolla kuin ihminen
  3. Aktiivinen tekoäly : tekoäly on aktiivinen, kun se voi voittaa ihmisiä monissa tehtävissä

Varhaisissa tekoälyjärjestelmissä käytettiin mallien sovittamista ja asiantuntijajärjestelmiä.

Tekoälyjärjestelmän yleiskatsaus

Tässä opetusohjelmassa opit-

  • Mikä on tekoäly?
  • Mikä on ML?
  • Mikä on syväoppiminen?
  • Koneoppimisprosessi
  • Syvä oppimisprosessi
  • Automatisoi ominaisuuksien poiminta DL: n avulla
  • Ero koneoppimisen ja syvällisen oppimisen välillä
  • Milloin käyttää ML: ää tai DL: ää?

Mikä on ML?

ML (Machine Learning) on tekoälyn tyyppi, jossa tietokone on koulutettu automatisoimaan tehtäviä, jotka ovat tyhjentäviä tai mahdottomia ihmisille. Se on paras tapa analysoida, ymmärtää ja tunnistaa tietomallit tietokonealgoritmien tutkimisen perusteella. Koneoppiminen voi tehdä päätöksiä minimaalisella ihmisen puuttumisella.

Kun verrataan tekoälyä koneoppimiseen, koneoppiminen käyttää tietoja syöttääkseen algoritmin, joka ymmärtää syötteen ja lähdön välisen suhteen. Kun kone on oppinut, se voi ennustaa uuden datapisteen arvon tai luokan.

Mikä on syväoppiminen?

Syväoppiminen on tietokoneohjelmisto, joka jäljittelee aivojen neuronien verkostoa. Se on koneoppimisen osajoukko ja sitä kutsutaan syvälle oppimiseksi, koska se käyttää syviä hermoverkkoja. Kone käyttää eri tasoja oppiakseen tiedoista. Mallin syvyys esitetään mallin kerrosten lukumäärällä. Syvä oppiminen on tekoälyn uusi taso. Syvässä oppimisessa oppimisvaihe tapahtuu hermoverkon kautta. Neuroverkko on arkkitehtuuri, jossa kerrokset on pinottu päällekkäin

Koneoppimisprosessi

Kuvittele, että sinun on tarkoitus rakentaa ohjelma, joka tunnistaa objektit. Mallin kouluttamiseen käytetään luokitinta . Luokittelija yrittää tunnistaa objektin ominaisuuksien avulla luokan, johon se kuuluu.

Esimerkissä luokittelija koulutetaan havaitsemaan, onko kuva:

  • Polkupyörä
  • Vene
  • Auto
  • Kone

Neljä yllä olevaa kohdetta ovat luokka, jonka luokittelijan on tunnistettava. Luokittelijan rakentamiseksi sinulla on oltava joitakin tietoja syötteenä ja osoitettava sille tarra. Algoritmi ottaa nämä tiedot, löytää mallin ja luokittelee sen sitten vastaavaan luokkaan.

Tätä tehtävää kutsutaan valvotuksi oppimiseksi. Valvotussa oppimisessa algoritmiin syöttämäsi harjoitustiedot sisältävät tunnisteen.

Algoritmin kouluttaminen edellyttää muutaman tavallisen vaiheen noudattamista:

  • Kerää tiedot
  • Kouluta luokittelija
  • Tehdä ennustuksia

Ensimmäinen vaihe on välttämätön, oikean datan valitseminen tekee algoritmista onnistumisen tai epäonnistumisen. Tietoja, jotka valitset mallin kouluttamiseksi, kutsutaan ominaisuudeksi. Kohdeesimerkissä ominaisuudet ovat kuvien pikseleitä.

Jokainen kuva on rivi tiedoissa, kun taas jokainen pikseli on sarake. Jos kuvasi on 28x28-kokoinen, tietojoukko sisältää 784 saraketta (28x28). Alla olevassa kuvassa kukin kuva on muunnettu piirrosvektoriksi. Tarra kertoo tietokoneelle, mikä esine kuvassa on.

Koneoppimisprosessi

Tavoitteena on käyttää näitä harjoitustietoja objektityypin luokittelemiseen. Ensimmäinen vaihe on ominaisuussarakkeiden luominen. Sitten toiseen vaiheeseen kuuluu algoritmin valitseminen mallin kouluttamiseksi. Kun harjoitus on valmis, malli ennustaa, mikä kuva vastaa mitä esinettä.

Sen jälkeen mallin avulla on helppo ennustaa uusia kuvia. Kukin uusi kuva syötetään malliin, kone ennustaa luokan, johon se kuuluu. Esimerkiksi täysin uusi kuva ilman tarraa käy läpi mallin. Ihmisen kannalta on triviaalia visualisoida kuva autona. Kone käyttää aikaisempaa tietämystään ennustamaan myös kuvan olevan auto.

Syvä oppimisprosessi

Syvässä oppimisessa oppimisvaihe tapahtuu hermoverkon kautta. Neuroverkko on arkkitehtuuri, jossa kerrokset on pinottu päällekkäin.

Harkitse samaa kuvan esimerkkiä yllä. Koulutusjoukko syötettäisiin hermoverkkoon

Jokainen tulo menee hermosoluun ja kerrotaan painolla. Kertomisen tulos virtaa seuraavaan kerrokseen ja siitä tulee tulo. Tämä prosessi toistetaan jokaiselle verkon kerrokselle. Viimeinen kerros on nimeltään lähtökerros; se antaa todellisen arvon regressiotehtävälle ja kunkin luokan todennäköisyyden luokitustehtävälle. Neuroverkko käyttää matemaattista algoritmia kaikkien hermosolujen painojen päivittämiseen. Neuroverkko on täysin koulutettu, kun painojen arvo antaa lähelle todellisuutta. Esimerkiksi hyvin koulutettu hermoverkko tunnistaa kuvan kuvan tarkemmin kuin perinteinen hermoverkko.

Syvä oppimisprosessi

Automatisoi ominaisuuksien poiminta DL: n avulla

Tietojoukko voi sisältää tusinasta sataan ominaisuuksia. Järjestelmä oppii näiden ominaisuuksien merkityksellisyydestä. Kaikki ominaisuudet eivät kuitenkaan ole merkityksellisiä algoritmille. Keskeinen osa koneoppimista on löytää sopiva joukko ominaisuuksia, jotta järjestelmä oppii jotain.

Yksi tapa suorittaa tämä osa koneoppimisessa on käyttää ominaisuuksien purkamista. Ominaisuuden poiminta yhdistää olemassa olevat ominaisuudet ja luo entistä osuvamman joukon ominaisuuksia. Se voidaan tehdä PCA: lla, T-SNE: llä tai millä tahansa muulla dimensioiden vähentämisen algoritmeilla.

Esimerkiksi kuvankäsittelyssä lääkärin on purettava ominaisuus manuaalisesti kuvaan, kuten silmät, nenä, huulet ja niin edelleen. Nämä poimitut ominaisuudet syötetään luokitusmalliin.

Syvä oppiminen ratkaisee tämän ongelman, erityisesti konvoluutiohermoverkossa. Neuroverkon ensimmäinen kerros oppii pieniä yksityiskohtia kuvasta; Seuraavat kerrokset yhdistävät aikaisemman tiedon monimutkaisemmaksi. Konvoluutio-hermoverkossa ominaisuuden poiminta tapahtuu suodattimen avulla. Verkko käyttää suodatinta kuvaan nähdäkseen onko ottelu eli ominaisuuden muoto on identtinen kuvan osan kanssa. Jos vastaavuus löytyy, verkko käyttää tätä suodatinta. Ominaisuuden poiminta tapahtuu siis automaattisesti.

Perinteinen koneoppiminen vs syvällinen oppiminen

Ero koneoppimisen ja syvällisen oppimisen välillä

Alla on keskeinen ero syvällisen oppimisen ja koneoppimisen välillä

Koneoppiminen

Syvä oppiminen

Tietojen riippuvuudet

Erinomaiset suoritukset pienessä / keskisuuressa tietojoukossa

Erinomainen suorituskyky isolla tietojoukolla

Laitteiden riippuvuudet

Työskentele matalaluokan koneella.

Vaatii tehokkaan koneen, mieluiten GPU: lla: DL suorittaa merkittävän määrän matriisikertoja

Ominaisuuksien suunnittelu

Tarve ymmärtää tietoja edustavat ominaisuudet

Ei tarvitse ymmärtää parasta tietoa edustavaa ominaisuutta

Suoritusaika

Muutamasta minuutista tuntiin

Jopa viikkoja. Neuroverkon on laskettava merkittävä määrä painoja

Tulkittavuus

Joitakin algoritmeja on helppo tulkita (logistinen, päätöspuu), toisia on melkein mahdotonta (SVM, XGBoost)

Vaikea tai mahdoton

Milloin käyttää ML: ää tai DL: ää?

Seuraavassa taulukossa tiivistetään koneoppimisen ja syvällisen oppimisen ero esimerkkien avulla.

Koneoppiminen Syvä oppiminen
Harjoittelutiedot Pieni Suuri
Valitse ominaisuudet Joo Ei
Algoritmien lukumäärä Monet Harvat
Harjoitteluaika Lyhyt Pitkä

Koneoppimisen avulla algoritmin kouluttamiseen tarvitaan vähemmän tietoa kuin syvään oppimiseen. Syvä oppiminen vaatii kattavan ja monipuolisen tietojoukon taustarakenteen tunnistamiseksi. Lisäksi koneoppiminen tarjoaa nopeammin koulutetun mallin. Edistyneimmällä syvällisen oppimisen arkkitehtuurilla voi kestää päivästä viikkoon kouluttamiseen. Syvän oppimisen etu koneoppimiseen verrattuna on, että se on erittäin tarkka. Sinun ei tarvitse ymmärtää, mitkä ominaisuudet edustavat parhaiten tietoja; hermoverkko oppi valitsemaan kriittiset ominaisuudet. Koneoppimisessa sinun on valittava itse, mitkä ominaisuudet sisällytetään malliin.

Yhteenveto

Tekoäly antaa koneelle kognitiivisen kyvyn. Kun verrataan tekoälyä koneoppimiseen, varhaisissa tekoälyjärjestelmissä käytettiin mallien sovittamista ja asiantuntijajärjestelmiä.

Koneoppimisen idea on, että kone voi oppia ilman ihmisen puuttumista asiaan. Koneen on löydettävä tapa oppia ratkaisemaan tehtävä, kun tiedot annetaan.

Syvä oppiminen on läpimurto tekoälyn alalla. Kun tietoa on riittävästi harjoittelua varten, syvällä oppimisella saavutetaan vaikuttavia tuloksia, erityisesti kuvien tunnistamisessa ja tekstin kääntämisessä. Tärkein syy on, että ominaisuus puretaan automaattisesti verkon eri kerroksissa.