Mikä on tekoäly?
AI (tekoäly) on tietojenkäsittelytieteen ala, jossa koneet ohjelmoidaan ja niille annetaan kognitiivinen kyky ajatella ja matkia toimia kuten ihmiset ja eläimet. Tekoälyn vertailuarvo on inhimillinen älykkyys perusteluissa, puheessa, oppimisessa, näyssä ja ongelmanratkaisussa, joka on kaukana tulevaisuudessa.
Tekoälyllä on kolme erilaista tasoa:
- Kapea tekoäly : Tekoälyn sanotaan olevan kapea, kun kone pystyy suorittamaan tietyn tehtävän paremmin kuin ihminen. Tekoälyn nykyinen tutkimus on täällä
- Yleinen tekoäly : Tekoäly saavuttaa yleisen tilan, kun se voi suorittaa minkä tahansa älyllisen tehtävän samalla tarkkuustasolla kuin ihminen
- Aktiivinen tekoäly : tekoäly on aktiivinen, kun se voi voittaa ihmisiä monissa tehtävissä
Varhaisissa tekoälyjärjestelmissä käytettiin mallien sovittamista ja asiantuntijajärjestelmiä.

Tässä opetusohjelmassa opit-
- Mikä on tekoäly?
- Mikä on ML?
- Mikä on syväoppiminen?
- Koneoppimisprosessi
- Syvä oppimisprosessi
- Automatisoi ominaisuuksien poiminta DL: n avulla
- Ero koneoppimisen ja syvällisen oppimisen välillä
- Milloin käyttää ML: ää tai DL: ää?
Mikä on ML?
ML (Machine Learning) on tekoälyn tyyppi, jossa tietokone on koulutettu automatisoimaan tehtäviä, jotka ovat tyhjentäviä tai mahdottomia ihmisille. Se on paras tapa analysoida, ymmärtää ja tunnistaa tietomallit tietokonealgoritmien tutkimisen perusteella. Koneoppiminen voi tehdä päätöksiä minimaalisella ihmisen puuttumisella.
Kun verrataan tekoälyä koneoppimiseen, koneoppiminen käyttää tietoja syöttääkseen algoritmin, joka ymmärtää syötteen ja lähdön välisen suhteen. Kun kone on oppinut, se voi ennustaa uuden datapisteen arvon tai luokan.
Mikä on syväoppiminen?
Syväoppiminen on tietokoneohjelmisto, joka jäljittelee aivojen neuronien verkostoa. Se on koneoppimisen osajoukko ja sitä kutsutaan syvälle oppimiseksi, koska se käyttää syviä hermoverkkoja. Kone käyttää eri tasoja oppiakseen tiedoista. Mallin syvyys esitetään mallin kerrosten lukumäärällä. Syvä oppiminen on tekoälyn uusi taso. Syvässä oppimisessa oppimisvaihe tapahtuu hermoverkon kautta. Neuroverkko on arkkitehtuuri, jossa kerrokset on pinottu päällekkäin
Koneoppimisprosessi
Kuvittele, että sinun on tarkoitus rakentaa ohjelma, joka tunnistaa objektit. Mallin kouluttamiseen käytetään luokitinta . Luokittelija yrittää tunnistaa objektin ominaisuuksien avulla luokan, johon se kuuluu.
Esimerkissä luokittelija koulutetaan havaitsemaan, onko kuva:
- Polkupyörä
- Vene
- Auto
- Kone
Neljä yllä olevaa kohdetta ovat luokka, jonka luokittelijan on tunnistettava. Luokittelijan rakentamiseksi sinulla on oltava joitakin tietoja syötteenä ja osoitettava sille tarra. Algoritmi ottaa nämä tiedot, löytää mallin ja luokittelee sen sitten vastaavaan luokkaan.
Tätä tehtävää kutsutaan valvotuksi oppimiseksi. Valvotussa oppimisessa algoritmiin syöttämäsi harjoitustiedot sisältävät tunnisteen.
Algoritmin kouluttaminen edellyttää muutaman tavallisen vaiheen noudattamista:
- Kerää tiedot
- Kouluta luokittelija
- Tehdä ennustuksia
Ensimmäinen vaihe on välttämätön, oikean datan valitseminen tekee algoritmista onnistumisen tai epäonnistumisen. Tietoja, jotka valitset mallin kouluttamiseksi, kutsutaan ominaisuudeksi. Kohdeesimerkissä ominaisuudet ovat kuvien pikseleitä.
Jokainen kuva on rivi tiedoissa, kun taas jokainen pikseli on sarake. Jos kuvasi on 28x28-kokoinen, tietojoukko sisältää 784 saraketta (28x28). Alla olevassa kuvassa kukin kuva on muunnettu piirrosvektoriksi. Tarra kertoo tietokoneelle, mikä esine kuvassa on.

Tavoitteena on käyttää näitä harjoitustietoja objektityypin luokittelemiseen. Ensimmäinen vaihe on ominaisuussarakkeiden luominen. Sitten toiseen vaiheeseen kuuluu algoritmin valitseminen mallin kouluttamiseksi. Kun harjoitus on valmis, malli ennustaa, mikä kuva vastaa mitä esinettä.
Sen jälkeen mallin avulla on helppo ennustaa uusia kuvia. Kukin uusi kuva syötetään malliin, kone ennustaa luokan, johon se kuuluu. Esimerkiksi täysin uusi kuva ilman tarraa käy läpi mallin. Ihmisen kannalta on triviaalia visualisoida kuva autona. Kone käyttää aikaisempaa tietämystään ennustamaan myös kuvan olevan auto.
Syvä oppimisprosessi
Syvässä oppimisessa oppimisvaihe tapahtuu hermoverkon kautta. Neuroverkko on arkkitehtuuri, jossa kerrokset on pinottu päällekkäin.
Harkitse samaa kuvan esimerkkiä yllä. Koulutusjoukko syötettäisiin hermoverkkoon
Jokainen tulo menee hermosoluun ja kerrotaan painolla. Kertomisen tulos virtaa seuraavaan kerrokseen ja siitä tulee tulo. Tämä prosessi toistetaan jokaiselle verkon kerrokselle. Viimeinen kerros on nimeltään lähtökerros; se antaa todellisen arvon regressiotehtävälle ja kunkin luokan todennäköisyyden luokitustehtävälle. Neuroverkko käyttää matemaattista algoritmia kaikkien hermosolujen painojen päivittämiseen. Neuroverkko on täysin koulutettu, kun painojen arvo antaa lähelle todellisuutta. Esimerkiksi hyvin koulutettu hermoverkko tunnistaa kuvan kuvan tarkemmin kuin perinteinen hermoverkko.

Automatisoi ominaisuuksien poiminta DL: n avulla
Tietojoukko voi sisältää tusinasta sataan ominaisuuksia. Järjestelmä oppii näiden ominaisuuksien merkityksellisyydestä. Kaikki ominaisuudet eivät kuitenkaan ole merkityksellisiä algoritmille. Keskeinen osa koneoppimista on löytää sopiva joukko ominaisuuksia, jotta järjestelmä oppii jotain.
Yksi tapa suorittaa tämä osa koneoppimisessa on käyttää ominaisuuksien purkamista. Ominaisuuden poiminta yhdistää olemassa olevat ominaisuudet ja luo entistä osuvamman joukon ominaisuuksia. Se voidaan tehdä PCA: lla, T-SNE: llä tai millä tahansa muulla dimensioiden vähentämisen algoritmeilla.
Esimerkiksi kuvankäsittelyssä lääkärin on purettava ominaisuus manuaalisesti kuvaan, kuten silmät, nenä, huulet ja niin edelleen. Nämä poimitut ominaisuudet syötetään luokitusmalliin.
Syvä oppiminen ratkaisee tämän ongelman, erityisesti konvoluutiohermoverkossa. Neuroverkon ensimmäinen kerros oppii pieniä yksityiskohtia kuvasta; Seuraavat kerrokset yhdistävät aikaisemman tiedon monimutkaisemmaksi. Konvoluutio-hermoverkossa ominaisuuden poiminta tapahtuu suodattimen avulla. Verkko käyttää suodatinta kuvaan nähdäkseen onko ottelu eli ominaisuuden muoto on identtinen kuvan osan kanssa. Jos vastaavuus löytyy, verkko käyttää tätä suodatinta. Ominaisuuden poiminta tapahtuu siis automaattisesti.

Ero koneoppimisen ja syvällisen oppimisen välillä
Alla on keskeinen ero syvällisen oppimisen ja koneoppimisen välillä
Koneoppiminen |
Syvä oppiminen |
|
Tietojen riippuvuudet |
Erinomaiset suoritukset pienessä / keskisuuressa tietojoukossa |
Erinomainen suorituskyky isolla tietojoukolla |
Laitteiden riippuvuudet |
Työskentele matalaluokan koneella. |
Vaatii tehokkaan koneen, mieluiten GPU: lla: DL suorittaa merkittävän määrän matriisikertoja |
Ominaisuuksien suunnittelu |
Tarve ymmärtää tietoja edustavat ominaisuudet |
Ei tarvitse ymmärtää parasta tietoa edustavaa ominaisuutta |
Suoritusaika |
Muutamasta minuutista tuntiin |
Jopa viikkoja. Neuroverkon on laskettava merkittävä määrä painoja |
Tulkittavuus |
Joitakin algoritmeja on helppo tulkita (logistinen, päätöspuu), toisia on melkein mahdotonta (SVM, XGBoost) |
Vaikea tai mahdoton |
Milloin käyttää ML: ää tai DL: ää?
Seuraavassa taulukossa tiivistetään koneoppimisen ja syvällisen oppimisen ero esimerkkien avulla.
Koneoppiminen | Syvä oppiminen | |
Harjoittelutiedot | Pieni | Suuri |
Valitse ominaisuudet | Joo | Ei |
Algoritmien lukumäärä | Monet | Harvat |
Harjoitteluaika | Lyhyt | Pitkä |
Koneoppimisen avulla algoritmin kouluttamiseen tarvitaan vähemmän tietoa kuin syvään oppimiseen. Syvä oppiminen vaatii kattavan ja monipuolisen tietojoukon taustarakenteen tunnistamiseksi. Lisäksi koneoppiminen tarjoaa nopeammin koulutetun mallin. Edistyneimmällä syvällisen oppimisen arkkitehtuurilla voi kestää päivästä viikkoon kouluttamiseen. Syvän oppimisen etu koneoppimiseen verrattuna on, että se on erittäin tarkka. Sinun ei tarvitse ymmärtää, mitkä ominaisuudet edustavat parhaiten tietoja; hermoverkko oppi valitsemaan kriittiset ominaisuudet. Koneoppimisessa sinun on valittava itse, mitkä ominaisuudet sisällytetään malliin.
Yhteenveto
Tekoäly antaa koneelle kognitiivisen kyvyn. Kun verrataan tekoälyä koneoppimiseen, varhaisissa tekoälyjärjestelmissä käytettiin mallien sovittamista ja asiantuntijajärjestelmiä.
Koneoppimisen idea on, että kone voi oppia ilman ihmisen puuttumista asiaan. Koneen on löydettävä tapa oppia ratkaisemaan tehtävä, kun tiedot annetaan.
Syvä oppiminen on läpimurto tekoälyn alalla. Kun tietoa on riittävästi harjoittelua varten, syvällä oppimisella saavutetaan vaikuttavia tuloksia, erityisesti kuvien tunnistamisessa ja tekstin kääntämisessä. Tärkein syy on, että ominaisuus puretaan automaattisesti verkon eri kerroksissa.