Mi az R?

Az R egy szabad, nyílt forráskódú, így ingyenes használható, professzionális és folyamatos fejlesztés alatt álló statisztikai szoftvercsomag, amelyben hihetetlen gazdagságban állnak rendelkezésre a már kidolgozott eljárásokat tartalmazó függvények és munkakörnyezetek.

Licenc

A szoftver központi része nyílt forráskódú: ingyenesen, továbbá szabadon használható, terjeszthető és módosítható a GPL v2 licenc mellett. A Free Software Foundation által elismert program, a GNU része. Számos platformon ingyenesen elérhető a telepítésre kész változata (Windows, Macintosh, Linux), és általában a további R csomagok is hasonló licenc alatt kerülnek publikálásra. Ettől függetlenül elérhető természetesen terméktámogatás is elérhető a programhoz.

Rövid R történet

Az R program fejlesztése a SCHEME és az S nyelvek eredményeire építve, annak a funkcióinak az újraírásával, 1993-ban indult az Auckland-i Egyetemen Ross Ihaka és Robert Gentleman vezetésével. A program sikerét jól jelzi, hogy John Chambers, az S egykori ötletgazdája és eredeti fejlesztője is végül csatlakozott az R központi fejlesztőcsapatába (R Development Core Team).

Az R sikerét az ingyenes és szabadon használható volta mellett (vagy talán inkább az alapján) elsődlegesen a CRAN (Comprehensive R Archive Network) csomagtárolónak és a felhasználók által megosztható programkódoknak köszönheti. Mára a CRAN több mint 5000 R csomagot számlál, amelyek többnyire lefedik a kurrens statisztikai módszerek tárházát:

Az R csomagok száma verzószám szerint

Az R csomagok száma verziószámok szerint (forrás: r4stats.com)

Miért használjunk R-t?

Számos jó okot találhatunk sorolhatunk, hogy miért érdemes R-t használni:

  1. Ingyenes és szabadon használható: oktatásban, otthon és vállalati környezetben is. Miért fizetnénk több millió forintot azért, amit ingyen is elérhetünk?
  2. Platform-független: a program telepíthető Windows, Linux és Mac OS gépeken is, sőt már szerver-oldali megoldások is elérhetőek napjainkban, amely segítségével akár tableten is elérhető az R.
  3. Aktív R közösség: a több ezer R fejlesztő mellett kb. 2-3 millió ember és szervezet használja az R-t. Az [R-help] levelezőlista több mint 350 000 üzenete vagy a StackOverflow 55 000+ kérdése és az azokra adott pontos válasz jól jelzi az aktív közösség erejét.
  4. Számtalan “user contributed” csomag, amelyek egyszerű és gyors hozzáférést engednek a legbonyolultabb statisztikai eljárásokhoz is. A CRAN mellett több csomag elérhető az R-forge, Bioconductor és GitHub oldalakon is.

Miben más az R?

Az R alapvetően egy interaktív statisztikai/adatelemző környezet, ahol a felhasználók utasításokat adnak ki az R konzolnak a parancsok végrehajtására. Az eredmények szintén itt jelennek meg, noha természetesen van lehetőség Excel, HTML, kép és egyéb formátumokban való exportálásra is. De az R legnagyszerűbb tulajdonsága az aktív közösség és a számtalan szabadon elérhető algoritmus — amelyet napjainkra talán már semmilyen kereskedelmi terméktámogatás sem tud pótolni.

Fontosabb fogalmak:

  • CRAN: “The Comprehensive R Archive Network”. Az R telepítő állományok, azok forráskódja és több ezer ún. “user contributed” csomag tárolója. A magyar tükörszerver: http://cran.rapporter.net/
  • library: R csomag vagy könyvtár. Ezek a programok kiterjesztik az alap R funkcionalitását új függvényekkel, eljárásokkal és statisztikai módszerekkel.
  • RUG: “R User Group”, azaz R felhasználók csoportja. A világ számos pontján alakult hasonló kezdeményezés, amelyek célja, hogy a hasonló érdeklődésű emberek rendszeres időközönként összejárjanak, és rövid szakmai előadások után ismerkedhessenek. A magyar R csoport honlapja: http://www.meetup.com/Budapest-Users-of-R-Network

Kiejtés

Az R program neve valóban egy karakterből áll, amelynek kiejtése hazánkban általában megfelel a nagy “R” betűnek, míg egyéb nyelvterületen általában az angol kiejtés szerint ejtik: /ˈɑr/

Az R használata

A program telepítését követően azonnal használható, de hordozható (ún. “portable”)  változata is elérhető azok számára, akik nem rendelkeznek rendszergazdai jogosultságokkal számítógépükön. Az R használatának gyors áttekintéséhez és megismeréséhez készítettünk egy rövid demó anyagot.