Mikä on suuret tiedot? Johdanto, tyypit, ominaisuudet, esimerkki

Sisällysluettelo:

Anonim

Ennen kuin siirrymme Big Datan esittelyyn, sinun on ensin tiedettävä

Mikä on data?

Määrät, merkit tai symbolit, joille tietokone suorittaa toimintoja, jotka voidaan tallentaa ja välittää sähköisinä signaaleina ja tallentaa magneettisille, optisille tai mekaanisille tallennusvälineille.

Opitaan nyt Big Data -esittely

Mikä on Big Data?

Big Data on kokoelma tietoa, jonka volyymi on valtava, mutta joka kasvaa räjähdysmäisesti ajan myötä. Se on niin suurikokoinen ja monimutkainen data, ettei mikään perinteisistä tiedonhallintatyökaluista pysty tallentamaan tai käsittelemään sitä tehokkaasti. Suuret tiedot ovat myös tietoja, mutta niiden koko on valtava.

Tässä opetusohjelmassa opit,

  • Mikä on data?
  • Mikä on Big Data?
  • Esimerkkejä suurista tiedoista
  • Suurten tietojen tyypit
  • Isojen tietojen ominaisuudet
  • Big Data Processingin edut

Esimerkkejä suurista tiedoista

Seuraavassa on joitain Big Data -esimerkkejä -

New Yorkin pörssi tuottaa noin yhden teratavun uusia kaupallisia tietoja päivässä.

Sosiaalinen media

Tilastot osoittavat, että yli 500 teratavua uutta tietoa syötetään sosiaalisen median Facebook- tietokantoihin päivittäin. Nämä tiedot syntyvät pääasiassa valokuvien ja videoiden lataamisesta, viestien vaihdosta, kommenttien kirjoittamisesta jne.

Yksi suihkumoottori voi tuottaa yli 10 teratavua tietoa 30 minuutin lentoaikana. Monien tuhansien lentojen päivässä tietojen tuottaminen saavuttaa jopa useita petatavuja.

Suurten tietojen tyypit

Seuraavat ovat suurten tietojen tyypit:

  1. Jäsennelty
  2. Rakentamaton
  3. Puolirakenteinen

Jäsennelty

Kaikkia tietoja, joita voidaan tallentaa, käyttää ja käsitellä kiinteässä muodossa, kutsutaan "jäsennellyiksi" tiedoiksi. Ajanjaksolla tietojenkäsittelytieteen lahjakkuus on saavuttanut suurempaa menestystä kehittäessään tekniikoita tällaisen datan käsittelemiseksi (missä muoto on tiedossa etukäteen) ja myös arvon saamiseksi siitä. Nykyään kuitenkin ennakoimme ongelmia, kun tällaisen datan koko kasvaa valtavasti, tyypillisiä kokoja esiintyy useiden zettatavujen raivossa.

Tiedätkö? 10 21 tavua, jotka ovat yhtä zettatavua tai miljardi teratavua, muodostavat zettatavun .

Näitä lukuja tarkasteltaessa voidaan helposti ymmärtää, miksi nimi Big Data annetaan, ja kuvitella sen tallentamiseen ja käsittelyyn liittyvät haasteet.

Tiedätkö? Relaatiotietokantojen hallintajärjestelmään tallennettu data on yksi esimerkki 'jäsennellystä' datasta.

Esimerkkejä strukturoiduista tiedoista

Tietokannan työntekijä-taulukko on esimerkki strukturoidusta datasta

Henkilöstökortti Työntekijän nimi Sukupuoli Osasto Palkka_In_lacs
2365 Rajesh Kulkarni Uros Rahoittaa 650000
3398 Pratibha Joshi Nainen Järjestelmänvalvoja 650000
7465 Shushil Roy Uros Järjestelmänvalvoja 500000
7500 Shubhojit Das Uros Rahoittaa 500000
7699 Priya Sane Nainen Rahoittaa 550000

Rakentamaton

Kaikki tiedot, joiden muoto tai rakenne on tuntematon, luokitellaan strukturoimattomiksi tiedoiksi. Sen lisäksi, että koko on valtava, strukturoimaton data aiheuttaa useita haasteita sen prosessoinnissa arvon saamiseksi siitä. Tyypillinen esimerkki strukturoimattomasta tiedosta on heterogeeninen tietolähde, joka sisältää yksinkertaisten tekstitiedostojen, kuvien, videoiden yms. Yhdistelmän. Nykypäivän organisaatioilla on käytettävissään runsaasti tietoa, mutta valitettavasti he eivät tiedä, miten saada siitä arvoa, koska nämä tiedot ovat raakamuodossaan tai rakentamattomassa muodossa.

Esimerkkejä jäsentämättömistä tiedoista

Google-haun palauttama tulos

Puolirakenteinen

Puolirakenteinen data voi sisältää molemmat tietomuodot. Voimme nähdä puolirakenteisen datan muodoltaan strukturoituna, mutta sitä ei itse asiassa ole määritelty esim. Taulukon määritelmällä relaatio-DBMS: ssä. Esimerkki puolirakenteisista tiedoista on XML-tiedostossa esitetyt tiedot.

Esimerkkejä osarakenteisista tiedoista

XML-tiedostoon tallennetut henkilötiedot

Prashant RaoMale35Seema R.Female41Satish ManeMale29Subrato RoyMale26Jeremiah J.Male35

Tietojen kasvu vuosien varrella

Huomaa, että jäsentelemättömät verkkosovellustiedot koostuvat lokitiedostoista, tapahtumahistoriatiedostoista jne.

Isojen tietojen ominaisuudet

Suuria tietoja voidaan kuvata seuraavilla ominaisuuksilla:

  • Äänenvoimakkuus
  • Lajike
  • Nopeus
  • Vaihtelevuus

(i) Volume - Nimi Big Data itsessään liittyy valtavaan kokoon. Tietojen koko on erittäin tärkeä rooli määritettäessä tietojen arvoa. Myös se, voidaanko tiettyä dataa todella pitää suurena datana vai ei, riippuu datan määrästä. Siksi 'määrä' on yksi ominaisuus, joka on otettava huomioon käsiteltäessä suuria tietoja.

(ii) Lajike - Big Datan seuraava näkökohta on sen monimuotoisuus .

Lajike viittaa heterogeenisiin lähteisiin ja tietojen luonteeseen, sekä jäsenneltyinä että strukturoimattomina. Aikaisempina päivinä taulukot ja tietokannat olivat ainoat tietolähteet, joita suurin osa sovelluksista otti huomioon. Nykyään analyysisovelluksissa otetaan huomioon myös sähköpostin, valokuvien, videoiden, valvontalaitteiden, PDF-tiedostojen, äänen jne. Muodossa olevat tiedot. Tämä strukturoimattomien tietojen moninaisuus aiheuttaa tiettyjä ongelmia tietojen säilyttämisessä, louhinnassa ja analysoinnissa.

(iii) Nopeus - Termi "nopeus" viittaa tiedon tuottamisen nopeuteen. Kuinka nopeasti data luodaan ja käsitellään vaatimusten täyttämiseksi, määrittää datan todellisen potentiaalin.

Big Data Velocity käsittelee nopeutta, jolla data virtaa lähteistä, kuten liiketoimintaprosesseista, sovelluslokeista, verkostoista ja sosiaalisen median sivustoista, antureista, mobiililaitteista jne. Tietovirta on massiivista ja jatkuvaa.

(iv) Vaihtelevuus - Tämä viittaa epäjohdonmukaisuuteen, jonka tiedot voivat toisinaan osoittaa, mikä haittaa tietojen käsittelyä ja hallintaa tehokkaasti.

Big Data Processingin edut

Kyky käsitellä Big Dataa tuo mukanaan useita etuja, kuten

    • Yritykset voivat hyödyntää ulkopuolista älykkyyttä tehdessään päätöksiä

Pääsy sosiaalisiin tietoihin hakukoneista ja sivustoista, kuten facebook, twitter antavat organisaatioille mahdollisuuden hienosäätää liiketoimintastrategioitaan.

    • Parempi asiakaspalvelu

Perinteiset asiakaspalautusjärjestelmät korvataan uusilla Big Data -tekniikoilla suunnitelluilla järjestelmillä. Näissä uusissa järjestelmissä Big Data- ja luonnollisen kielenkäsittelytekniikoita käytetään lukemaan ja arvioimaan kuluttajien vastauksia.

    • Tuotteelle / palvelulle mahdollisesti aiheutuvan riskin varhainen tunnistaminen
    • Parempi toiminnan tehokkuus

Big Data -tekniikoita voidaan käyttää uusien alueiden välilasku- tai laskeutumisvyöhykkeen luomiseen, ennen kuin tunnistetaan, mitkä tiedot siirretään tietovarastoon. Lisäksi tällainen Big Data -tekniikoiden ja tietovaraston integrointi auttaa organisaatiota purkamaan harvoin käytettyjä tietoja.

Yhteenveto

  • Big Data -määrittely: Big Data määritellään suurikokoisiksi tiedoiksi. Bigdata on termi, jota käytetään kuvaamaan koko, joka on kooltaan valtava ja kuitenkin ajan myötä eksponentiaalisesti kasvava.
  • Big Data -analytiikan esimerkkejä ovat pörssit, sosiaalisen median sivustot, suihkumoottorit jne.
  • Suuret tiedot voivat olla 1) strukturoituja, 2) rakenteettomia, 3) puolirakenteisia
  • Äänenvoimakkuus, vaihtelu, nopeus ja vaihtelu ovat muutamia Big Data -ominaisuuksia
  • Parempi asiakaspalvelu, parempi toiminnan tehokkuus, parempi päätöksenteko ovat muutamia Bigdatan etuja