Rövid, 7 lépéses bemutató az R használatáról
- Telepítsük az R-t és az RStudio környezetet
- Indítsuk el ez utóbbi programot, ahol a következő képernyő fogad:
- Töltsük le az 1974-es Motor Trend US magazin által publikált gépjármű adatbázist CSV formátumban a munkakönyvtárunkba, majd olvassuk be R-ben df néven:
1 2 |
getwd() df <- read.csv2('mtcars.csv') |
- Nézzük meg, hogy mit is tartalmaz az adatállomány:
1 |
str(df) |
Aminek az eredménye az alábbi lista, amely bemutatja a 32 megfigyelésből álló adatbázis 11 oszlopának típusát és első néhány értékét:
1 2 3 4 5 6 7 8 9 10 11 12 |
'data.frame': 32 obs. of 11 variables: $ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ... $ cyl : num 6 6 4 6 8 6 8 4 4 6 ... $ disp: num 160 160 108 258 360 ... $ hp : num 110 110 93 110 175 105 245 62 95 123 ... $ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ... $ wt : num 2.62 2.88 2.32 3.21 3.44 ... $ qsec: num 16.5 17 18.6 19.4 17 ... $ vs : num 0 0 1 1 0 1 0 1 1 1 ... $ am : num 1 1 1 0 0 0 0 0 0 0 ... $ gear: num 4 4 4 3 3 3 3 4 4 4 ... $ carb: num 4 4 1 1 2 1 4 2 2 4 ... |
- Nézzük meg a sebességek számának (“gear”) eloszlását:
1 |
table(df$gear) |
Aminek eredménye az alábbi táblázat:
1 2 |
3 4 5 15 12 5 |
- Ugyanez grafikusan:
1 |
barplot(table(mtcars$gear)) |
A kép mentéséhez kattintsunk az export gombra a plot fölött.
- Mentsük le az eloszlástáblát Excel-kompatibilis CSV formátumban:
1 |
write.csv(table(mtcars$gear), 'eredmeny.csv', row.names = FALSE) |