Kerroin R: Luokkamuuttuja & Jatkuvat muuttujat

Sisällysluettelo:

Anonim

Mikä on tekijä R: ssä?

Factor in R on muuttuja, jota käytetään tietojen luokittelemiseen ja tallentamiseen, ja jolla on rajoitettu määrä erilaisia ​​arvoja. Se tallentaa tiedot kokonaislukuarvojen vektorina. Kerroin R tunnetaan myös kategorisena muuttujana, joka tallentaa sekä merkkijono- että kokonaislukuarvot tasoiksi. Kerrointa käytetään enimmäkseen tilastollisessa mallinnuksessa ja tutkimuksellisissa R-analyyseissä.

Aineistossa voidaan erottaa kahden tyyppiset muuttujat: kategorinen ja jatkuva .

  • R: n kategoristen muuttujien kuvaavissa tilastoissa arvo on rajallinen ja perustuu yleensä tiettyyn rajalliseen ryhmään. Esimerkiksi kategorinen muuttuja R: ssä voi olla maat, vuosi, sukupuoli, ammatti.
  • Jatkuva muuttuja voi kuitenkin ottaa minkä tahansa arvon, kokonaisluvusta desimaaliin. Meillä voi olla esimerkiksi tulot, osakkeen hinta jne.

Kategoriset muuttujat

R-kategorian muuttujat tallennetaan tekijään. Tarkistetaan alla oleva koodi muunnettaessa merkkimuuttuja tekijämuuttujaksi R.Merkkejä ei tueta koneoppimisalgoritmissa, ja ainoa tapa on muuntaa merkkijono kokonaisluvuksi.

Syntaksi

factor(x = character(), levels, labels = levels, ordered = is.ordered(x))

Väitteet:

  • x : Kategoristen tietojen vektori R: ssä. Sen on oltava merkkijono tai kokonaisluku, ei desimaali.
  • Tasot : vektori mahdollisista arvoista, jotka x on ottanut. Tämä argumentti on valinnainen. Oletusarvo on vektorin x yksilöllinen luettelo alkioista.
  • Tunnisteet : Lisää tarra R-ryhmän kategorian x-tietoihin. Esimerkiksi yksi voi ottaa tunnisteen "mies", kun taas 0, etiketti "nainen".
  • järjestetty : Määritä, pitäisikö tasot järjestää kategorisissa tiedoissa R: ssä.

Esimerkki:

Luodaan tekijätietokehys.

# Create gender vectorgender_vector <- c("Male", "Female", "Female", "Male", "Male")class(gender_vector)# Convert gender_vector to a factorfactor_gender_vector <-factor(gender_vector)class(factor_gender_vector)

Tuotos:

## [1] "character"## [1] "factor"

On tärkeää muuttaa merkkijono tekijämuuttujaksi R: ssä, kun suoritamme koneoppimistehtävää.

R: n kategorinen muuttuja voidaan jakaa nimelliseen kategoriseen muuttujaan ja järjestysluokan kategoriseen muuttujaan .

Nimellinen kategorinen muuttuja

Kategoriallisella muuttujalla on useita arvoja, mutta järjestyksellä ei ole merkitystä. Esimerkiksi mies tai nainen. R: n kategorisilla muuttujilla ei ole järjestystä.

# Create a color vectorcolor_vector <- c('blue', 'red', 'green', 'white', 'black', 'yellow')# Convert the vector to factorfactor_color <- factor(color_vector)factor_color

Tuotos:

## [1] blue red green white black yellow## Levels: black blue green red white yellow

Factorcolorista emme voi sanoa mitään järjestystä.

Tavallinen kategorinen muuttuja

Tavallisilla kategorisilla muuttujilla on luonnollinen järjestys. Voimme määrittää järjestyksen alimmasta korkeimpaan järjestyksellä = TOSI ja korkeimmasta pienimpään järjestyksellä = EPÄTOSI.

Esimerkki:

Voimme käyttää yhteenvetoa laskemaan kunkin tekijän muuttujan arvot R: ssä.

# Create Ordinal categorical vectorday_vector <- c('evening', 'morning', 'afternoon', 'midday', 'midnight', 'evening')# Convert `day_vector` to a factor with ordered levelfactor_day <- factor(day_vector, order = TRUE, levels =c('morning', 'midday', 'afternoon', 'evening', 'midnight'))# Print the new variablefactor_day

Tuotos:

## [1] evening morning afternoon middaymidnight evening 

Esimerkki:

## Levels: morning < midday < afternoon < evening < midnight# Append the line to above code# Count the number of occurence of each levelsummary(factor_day)

Tuotos:

## morning midday afternoon evening midnight## 1 1 1 2 1

R määräsi tason "aamusta" keskiyöhön tasojen sulkeissa määritetyllä tavalla.

Jatkuvat muuttujat

Jatkuvan luokan muuttujat ovat oletusarvo R: ssä. Ne tallennetaan numeroina tai kokonaisina. Näemme sen alla olevasta aineistosta. mtcars on sisäänrakennettu tietojoukko. Se kerää tietoa erityyppisistä autoista. Voimme tuoda sen käyttämällä mtcar-autoja ja tarkistamalla muuttujan mpg luokan mailia per gallona. Se palauttaa numeerisen arvon, joka osoittaa jatkuvan muuttujan.

dataset <- mtcarsclass(dataset$mpg)

Tuotos

## [1] "numeric"