Tähtien ja lumihiutaleiden skeema tietovarastossa esimerkkien avulla

Sisällysluettelo:

Anonim

Mikä on moniulotteinen skeema?

Moniulotteinen skeema on erityisesti suunniteltu mallivarastojärjestelmien mallintamiseen. Kaaviot on suunniteltu vastaamaan analyyttiseen tarkoitukseen suunniteltujen suurten tietokantojen (OLAP) ainutlaatuisia tarpeita.

Tietovaraston mallin tyypit:

Seuraavassa on 3 päämallia moniulotteisia kaavioita, joista jokaisella on ainutlaatuiset edut.

  • Tähtiohjelma
  • Lumihiutaleohjelma
  • Galaxy Schema

Tässä opetusohjelmassa opit lisää

  • Mikä on tähtiohjelma?
  • Mikä on lumihiutaleohjelma?
  • Tähtiohjelma Vs-lumihiutaleohjelma: Tärkeimmät erot
  • Mikä on Galaxy-skeema?
  • Mikä on tähtijoukon malli?

Mikä on tähtiohjelma?

Tähtimalli tietovarastossa, jossa tähden keskellä voi olla yksi tietotaulukko ja useita siihen liittyviä mittataulukoita. Se tunnetaan tähtikaaviona, koska sen rakenne muistuttaa tähteä. Tähtimallin tietomalli on yksinkertaisin tyyppi Data Warehouse -mallia. Se tunnetaan myös nimellä Star Join Schema ja se on optimoitu suurten tietojoukkojen kyselyyn.

Seuraavassa Tähtimalli-esimerkissä tositaulukko on keskellä, joka sisältää avaimet jokaiseen ulottuvuustaulukkoon, kuten Jälleenmyyjän_ID, Mallin tunnus, Päivämäärän_ID, Tuotteen_ID, Haaran_ID ja muut määritteet, kuten Myytävät yksiköt ja tuotot.

Esimerkki Tähtikaavio-kaaviosta

Tähtimallin ominaisuudet:

  • Tähtikaavion jokainen ulottuvuus on esitetty vain yhden ulottuvuuden taulukossa.
  • Dimensiotaulukon tulisi sisältää joukko määritteitä.
  • Dimensiotaulukko liitetään tosiasiataulukkoon vieraalla avaimella
  • Mittataulukkoa ei ole liitetty toisiinsa
  • Tietotaulukko sisältäisi avaimen ja mittarin
  • Tähtimalli on helppo ymmärtää ja tarjoaa optimaalisen levynkäytön.
  • Mittataulukoita ei ole normalisoitu. Esimerkiksi yllä olevassa kuvassa Country_ID: llä ei ole Country-hakutaulukkoa, joka OLTP-mallilla olisi.
  • BI Tools tukee laajasti mallia

Mikä on lumihiutaleohjelma?

Lumihiutalemalli tietovarastossa on looginen taulukoiden järjestely moniulotteisessa tietokannassa siten, että ER-kaavio muistuttaa lumihiutaleen muotoa. Lumihiutalemalli on tähtimallin jatke, ja se lisää uusia ulottuvuuksia. Mittataulukot on normalisoitu, mikä jakaa tiedot lisätaulukoiksi.

Seuraavassa Snowflake Schema -esimerkissä maa normalisoidaan edelleen yksittäiseksi taulukoksi.

Esimerkki lumihiutaleohjelmasta

Lumihiutaleohjelman ominaisuudet:

  • Lumihiutalekaavion tärkein etu käyttää pienempää levytilaa.
  • Malli on helpompi toteuttaa ulottuvuus
  • Useiden taulukoiden takia kyselyn suorituskyky heikkenee
  • Ensisijainen haaste, jonka kohtaat käyttäessäsi lumihiutaleiden mallia, on se, että sinun on suoritettava enemmän ylläpitotoimia useampien hakutaulukkojen takia.

Tähtiohjelma Vs-lumihiutaleohjelma: Tärkeimmät erot

Seuraavassa on keskeinen ero tähtimallin ja lumihiutaleiden välillä:

Tähtiohjelma Lumihiutaleohjelma
Mitojen hierarkiat tallennetaan mittataulukkoon. Hierarkiat on jaettu erillisiin taulukoihin.
Se sisältää tietotaulukon, jota ympäröivät mittataulukot. Yksi tietotaulukko, jota ympäröi mittataulukko, jota puolestaan ​​ympäröi mittataulukko
Tähtikaaviossa vain yksi liitos luo suhde tositaulukon ja minkä tahansa mittataulukon välillä. Lumihiutaleiden malli vaatii monia liittymiä tietojen noutamiseksi.
Yksinkertainen DB-suunnittelu. Erittäin monimutkainen DB-suunnittelu.
Denormalisoitu tietorakenne ja kysely suoritetaan myös nopeammin. Normalisoitu tietorakenne.
Korkea tiedonsiirron taso Erittäin matalan tason tietojen redundanssi
Yhden ulottuvuuden taulukko sisältää koottuja tietoja. Tietojen jakaminen eri mittataulukoihin.
Kuutioiden käsittely on nopeampaa. Kuutioiden käsittely voi olla hidasta monimutkaisen liitoksen takia.
Tarjoaa tehokkaampia kyselyjä Star Join Query Optimization -sovelluksella. Pöydät voidaan yhdistää useilla ulottuvuuksilla. Lumihiutale-kaavaa edustaa keskitetty tietotaulukko, joka ei todennäköisesti liity useisiin ulottuvuuksiin.

Mikä on Galaxy Schema?

Galaxy Mallissa on kaksi tosiasia taulukon että osake dimensiotaulukoita niiden välillä. Sitä kutsutaan myös Fact Constellation Schemaksi. Kaaviota pidetään tähtikokoelmana, joten nimi on Galaxy Schema.

Esimerkki Galaxy Schemasta

Kuten yllä olevasta esimerkistä näet, on kaksi tosiasiataulukkoa

  1. Tulot
  2. Tuote.

Galaxy-skeemassa osakemittoja kutsutaan muunnetuiksi mittasuhteiksi.

Galaxy-skeeman ominaisuudet:

  • Tämän kaavan mitat on erotettu erillisiin ulottuvuuksiin hierarkian eri tasojen perusteella.
  • Esimerkiksi jos maantieteessä on neljä hierarkiatasoa, kuten alue, maa, osavaltio ja kaupunki, Galaxy-kaavalla tulisi olla neljä ulottuvuutta.
  • Lisäksi on mahdollista rakentaa tämän tyyppinen skeema jakamalla yhden tähden skeema useampiin Star-järjestelmiin.
  • Mitat ovat suuret tässä skeemassa, jota tarvitaan rakentamiseen hierarkiatasojen perusteella.
  • Tämä skeema on hyödyllinen yhdistettäessä tositaulukoita ymmärryksen parantamiseksi.

Mikä on tähtijoukon malli?

Lumihiutaleiden skeema sisältää täysin laajennetut hierarkiat. Tämä voi kuitenkin lisätä skeemalle monimutkaisuutta ja edellyttää ylimääräisiä liittymisiä. Toisaalta tähtikaavio sisältää täysin romahdetut hierarkiat, mikä voi johtaa redundanssiin. Joten, paras ratkaisu voi olla tasapaino näiden kahden skeeman välillä, mikä on Star Cluster Schema -suunnittelu.

Esimerkki Tähtijoukkorakenteesta

Päällekkäiset mitat löytyvät haarukoista hierarkioista. Haarukka tapahtuu, kun entiteetti toimii vanhempana kahdessa eri ulottuvuushierarkiassa. Haarukka-entiteetit tunnistetaan sitten luokitukseksi, jossa on yksi moniin-suhteita.

Yhteenveto:

  • Moniulotteinen skeema on erityisesti suunniteltu mallivarastojärjestelmien mallintamiseen
  • Tähtimalli on yksinkertaisin tyyppi Data Warehouse -mallia. Se tunnetaan tähtikaaviona, koska sen rakenne muistuttaa tähteä.
  • Lumihiutalemalli on tähtimallin jatke, ja se lisää uusia ulottuvuuksia. Sitä kutsutaan lumihiutaleeksi, koska sen kaavio muistuttaa lumihiutaletta.
  • Tähtikaaviossa vain yksi liitos määrittelee tosiasiataulukon ja minkä tahansa mittataulukon välisen suhteen.
  • Tähtimalli sisältää tietotaulukon, jota ympäröivät mittataulukot.
  • Lumihiutaleiden mallia ympäröi mittataulukko, jota puolestaan ​​ympäröi mittataulukko
  • Lumihiutaleiden malli vaatii monia liittymiä tietojen noutamiseksi.
  • Galaxy Schema sisältää kaksi tietotaulukkoa, jotka jakavat ulottuvuustaulukot. Sitä kutsutaan myös Fact Constellation Schemaksi.
  • Tähtiryhmäkaavio sisältää Tähti- ja Lumihiutale skeeman määritteet.