R idősebbeknek és halandóknak

Sokan írtak nekünk mostanában hogy elveszve érzik magukat az R nyelv elsajátítása során. Sajnos hiány van a kezdők számára íródott és a könyvek/tutorialok és a “magasabb” szintű irodalom között. Ezen a legtöbben úgy lépnek túl hogy mire túljutnak a bevezető műveken már szert tesznek pár ismerősre, bekapcsolódnak a nyelv köré szerveződött közösség életébe és másoktól sajátítja el a szükséges ismereteket. Hazánkban sajnos ez nem megy olyan könnyen, ezért most pár tippet adunk arra miként induljon el a kedves olvasó.

Hogy mi merre miért, azt a R, de miért is használjam I. és II. posztokban már elmondtuk. Tegyük fel hogy Valószínűség, statisztika és nyelvben felsorolt művek közül valamelyiken, vagy hasonló mélységű anyagokon már sikeresen végigment az olvasó. A nagy kérdés az hogyan is néz ki a worflow, hogyan dolgozunk akkor az R-rel. Mielőtt a lényegre térek, egy kis filozófiai eszmefuttatás következik amit nyugodtan kihagyhatsz.
Bo Cowgill sokat idézett mondása összegzi legjobban az R-t: “The best thing about R is that it was developed by statisticians. The worst thing about R is that… it was developed by statisticians.” Mindenki fel tudja mondani a leckét, bizony nagy cégek is, mint pl. Google, Facebook stb. is használják az R-t, tehát komolyan kell venni. Ez igaz, de sokkal fontosabb kérdés hogy hogyan és mire használják. Mint számítógépes statisztikai nyelv bizonyos dolgokra van kihegyezve; spéci adatkezelés (pl. a vektor mint fő adatstruktúra), numerikus módszerek (igaz gyakran C/FORTRAN könyvtárakat wrapper-rel), grafika (vagy plotting). A statisztikai elemzésnek eszköze a programozási nyelv, a lényege annyi hogy a táblázatkezelőkkel vagy pl. az SPSS-sel ellenben sokkal rugalmasabb, jobban alakítható a problémához, gyorsabban frissül és a közösségnek köszönhetően remek támogatást is kapunk hozzá (ha jól tudunk kérdezni). A használati mód eredménye viszont hogy a munka “végterméke” gyakran ún. spagetti kód (Spaghetti code), ami annyit tesz hogy sokkal inkább ad hoc módon összedobott, egy-egy egyedi problémára koncentráló, nem optimalizált barkács mű. Szerintem ez nem baj, de ha komolyan akarjuk venni magunkat túl kell ezen lépnünk.
A kutatás, akár alkalmazott, akár elméleti, egyik lényeges eleme hogy megismételhető legyen. Habár gyakran egy egyedi problémát oldunk meg (pl. egyszerű regresszióval megtippelünk egy jövőbeli értéket), a tudományos vizsgálódás általános törvényszerűségeket, tendenciákat igyekszik felfedni és magyarázni. A kísérletek és mérések eredményei mögé szeretne látni a kutató, s mindezt szeretné kommunikálni (a nagyvilágnak, egy nagy impaktfaktorú periodikában, vagy a főnökei felé). Első körben az a legegyszerűbb ha ezekre koncentrálunk.
Workflow
  • ProjectTemplate – ez a kis könyvtár segít struktúrát adni adatelemzés projektjeidnek. Egy jó kutatás jól szervezett! Egy bevezető kurzuson, vagy egy intro könyvet feldolgozva még elmegy hogy egy könyvtárban legyenek az adataid és a kódod, de egy komoly elemzéshez ez már nem jó út. A ProjectTemplate leveszi a válladról annak terhét hogy magad tervezd meg a projekted könyvtárszerkezetét.
  • git és github – a verziókövetés is a projekt része, meg kell tanulni az alapokat. Persze ez csak mégy egy játékos amivel bonyolítod az életed, de érdemes rászánni az időt. A github akkor jön jól igazán ha másokkal dolgozol együtt egy feladaton.
  • Adatgondozás – külön feladat, de ahogy egyre komolyabb dolgokkal foglalkozz úgy válik egyre fontosabbá hogy jók legyenek az adataid és jól legyenek tárolva/feldolgozva. A blogon nem rég ajánlottuk a Natural Language Annotation for Machine Learning könyvet, más pedig tudtommal nincs a témában
Adatok
Igen, ha még nem volt elég, most még külön pontot is kap. Meg kell tanulnod hogyan tudsz dolgozni az adatokkal. Itt sincs sok lehetőség, Phil Spector Data Manipulation with R könyve igazítja el az érdeklődő gyerekeket. Van ezer meg egy tutorial, de azt kezdő nem nagyon értheti sajnos.
Prezentálás
  • Sweave – Ugye ismered a LaTeX-et? Ha nem, Dávid írásai itt és itt eligazítanak téged. A Sweave segít abban hogy a kódod és a készülő írásod (no meg prezentációd) “együtt legyen”, a kódrészletek és ábrák szépen jelenjenek meg a szövegben stb. stb. Ezt tényleg nem olvasni, hanem csinálni kell.
  • ggplot2 – Meg kell valahogy jeleníteni az adatainkat, erre tök jók az alap plot függvények, de lássuk be esztétikailag kihívásokkal küszködnek és nem elég flexibilisek. A ggplot2 segítségével szép és jó grafikonokat, ábrákat készíthetünűk. A ggplot2 a The Grammar of Graphics könyvön alapul, de először inkább talán érdemes a ggplot2: Elegant Graphics for Data Analysis-t elolvasni.
Programozás
  • SciViews – remek test framework-öt alkottak az R-hez
  • RUnit – kicsi, egyszerű unit test framework. Nekem különös kedvencem, mivel egy dologra koncentrál és azt el is végzi. Egy kis guglizással jó tutorialokat lehet találni. Maga a tesztelés nem áll távol a tudományos tevékenységtől, a filozófiailag járatosabb olvasóknak kvázi alkalmazott popperiánus falszifikációként jellemezhetem a folyamatot.
  • Software for data Analysis: Programming with R – sajnos nagyon kevés könyv teszi rendben az alapokat az R körül. Hogy lehet hogy az R funkcionális de, vannak benne objektumok, imperatív stílusú iteratív kontroll, S3/S4 object system és egyéb nyalánkságok. Ezek előbb vagy utóbb releváns kérdésekké válnak az R-t tanulók számára, ez a kötet képes egyedül kielégítően megválaszolni ezeket.

Az említett könyvek megvásárolhatóak a Számítógépes nyelvészet könyvespolcon.

Via: R idősebbeknek és halandóknak

159 Responses to R idősebbeknek és halandóknak

  1. Pingback: Buy cheap viagra online uk

  2. Pingback: cialis from india

  3. Pingback: cialis otc

  4. Pingback: cialis 10mg

  5. Pingback: cialis 20mg price

  6. Pingback: Viagra approved

  7. Pingback: Buy viagra on internet

  8. Pingback: buy generic cialis online

  9. Pingback: cheap cialis online

  10. Pingback: cialis 10mg

  11. Pingback: cialis coupon cvs

  12. Pingback: viagra 50mg

  13. Pingback: online pharmacy viagra

  14. Pingback: viagra for sale

  15. Pingback: cheap erectile dysfunction pills online

  16. Pingback: cheapest ed pills online

  17. Pingback: ed medications

  18. Pingback: online pharmacy

  19. Pingback: cialis online

  20. Pingback: levitra 10 mg

  21. Pingback: levitra 10 mg

  22. Pingback: vardenafil usa

  23. Pingback: online casinos for usa players

  24. Pingback: casino online games

  25. Pingback: buy cheap viagra

  26. Pingback: casino real money

  27. Pingback: best online casinos that payout

  28. Pingback: generic cialis 20mg

  29. Pingback: pay day loans

  30. Pingback: personal loan

  31. Pingback: instant loans

  32. Pingback: viagra cost

  33. Pingback: best real money online casinos

  34. Pingback: online casino real money usa

  35. Pingback: new cialis

  36. Pingback: play slot machines games online

  37. Pingback: play slot machines online for real money

  38. Pingback: CafeCasino

  39. Pingback: cialis to buy

  40. Pingback: cialis generic

  41. Pingback: generic for cialis

  42. Pingback: generic cialis

  43. Pingback: gambling casino

  44. Pingback: play for real online casino games

  45. Pingback: real money casino

  46. Pingback: best online casino real money

  47. Pingback: viagra online usa

  48. Pingback: viagra alternative

  49. Pingback: free viagra

  50. Pingback: generic cialis tadalafil

  51. Pingback: buy tadalafil

  52. Pingback: cialis online

  53. Pingback: cialis online reviews

  54. Pingback: slot machines

  55. Pingback: online casino gambling

  56. Pingback: tadalafil best price india

  57. Pingback: Viagra 25 mg without a doctor prescription

  58. Pingback: Viagra 130 mg for sale

  59. Pingback: where to buy Viagra 50 mg

  60. Pingback: where to buy Viagra 200 mg

  61. Pingback: cialis online

  62. Pingback: how to buy Viagra 50 mg

  63. Pingback: Cialis 20 mg without a doctor prescription

  64. Pingback: generic viagra cost

  65. Pingback: viagra cheap

  66. Pingback: canadian pharmacy viagra

  67. Pingback: viagra online

  68. Pingback: generic viagra cost

  69. Pingback: order amoxicillin 500mg

  70. Pingback: viagra history

  71. Pingback: generic cialis in uk

  72. Pingback: the most trusted viagra sites

  73. Pingback: shelf life of cialis

  74. Pingback: Premarin 0,625mg australia

  75. Pingback: cialis super active review

  76. Pingback: generic viagra suppliers

  77. Pingback: casodex pharmacy

  78. Pingback: catapres 100mcg prices

  79. Pingback: ceclor pharmacy

  80. Pingback: ceftin 125mg generic

  81. Pingback: celebrex cheap

  82. Pingback: celexa 20mg canada

  83. Pingback: cephalexin 500 mg united kingdom

  84. Pingback: cipro 500 mg australia

  85. Pingback: claritin 10mg generic

  86. Pingback: hollywood casino online

  87. Pingback: hollywood casino online

  88. Pingback: big fish casino online

  89. Pingback: online casino real money us

  90. Pingback: casino game

  91. Pingback: real money online casino

  92. Pingback: hollywood casino

  93. Pingback: best real casino online

  94. Pingback: online slots real money

  95. Pingback: doubleu casino

  96. Pingback: progressive car insurance quotes

  97. Pingback: car insurance usaa

  98. Pingback: cheapest place to buy viagra

  99. Pingback: automobile insurance quotes florida

  100. Pingback: car insurance quotes for young drivers

  101. Pingback: met life auto and home

  102. Pingback: usaa car insurance quotes

  103. Pingback: best car insurance quotes comparison site

  104. Pingback: car insurance quotes now

  105. Pingback: geico car insurance

  106. Pingback: safecar insurance

  107. Pingback: cash personal loans

  108. Pingback: payday loans loan

  109. Pingback: Real viagra without prescription

  110. Pingback: where can i buy viagra online

  111. Pingback: online payday loans in texas

  112. Pingback: 24 hour installment loans

  113. Pingback: no credit check quick loans

  114. Pingback: bad credit loans with no credit check

  115. Pingback: payday loans online

  116. Pingback: safe online personal loans

  117. Pingback: best cbd oil for pain reviews

  118. Pingback: best cbd oil for cancer treatment

  119. Pingback: where to buy cbd oil online

  120. Pingback: us viagra online

  121. Pingback: viagra no script

  122. Pingback: dosage of cbd oil for chronic pain

  123. Pingback: canadian online pharmacy generic viagra

  124. Pingback: can cbd oil help with pain?

  125. Pingback: cbd oil benefits and uses

  126. Pingback: viagra discount prices

  127. Pingback: cbd oil for dogs

  128. Pingback: ordering viagra from india

  129. Pingback: cannabidioloilsale.com

  130. Pingback: cannabis high in cbd lacey

  131. Pingback: viagra from canada

  132. Pingback: essays

  133. Pingback: real viagra pills

  134. Pingback: write essay for me

  135. Pingback: write an essay

  136. Pingback: homework for pre k

  137. Pingback: third grade homework

  138. Pingback: genuine viagra pills

  139. Pingback: buying essays online

  140. Pingback: is homework helpful

  141. Pingback: should schools have homework

  142. Pingback: write my paper

  143. Pingback: english essay writer

  144. Pingback: cleocin 150 mg cheap

  145. Pingback: australia viagra cost

  146. Pingback: Viagra original pfizer order

  147. Pingback: cheap clomid

  148. Pingback: order clonidine 0,1 mg

  149. Pingback: clozaril 100 mg online

  150. Pingback: Best prices on viagra

  151. Pingback: colchicine 0,5mg usa

  152. Pingback: buy cialis bangkok

  153. Pingback: symbicort inhaler no prescription

  154. Pingback: cost of combivent 50/20mcg

  155. Pingback: where to buy coreg

  156. Pingback: cialis online

  157. Pingback: compazine usa

  158. Pingback: coumadin uk

  159. Pingback: generic viagra made in india

Comments are closed.