Könyvismertető: Data Mining with Rattle and R

Egyre többen érdeklődnek a az adattudományi (data science) és gépi tanulási módszerek iránt. Az adatbányászat napjainkban nem annyira felkapott téma, ahogy sokan igyekeznek elkerülni a statisztika és számítógépes statisztika (computatuional statistics) kifejezéseket, de megnyugtatunk mindenkit, a sok buzzword tkp. ugyanazt a dolgot fedi. A megnövekedett érdeklődés és a tény hogy életünket egyre jobban átszövik az említett területek eredményei együtt járnak az igénnyel egy egyszerű, gyakorlatorientált bevezetőre. Williams könyve remekül használható akár a programozásban kevésbé jártas, a statisztika alapjait ismerő érdeklődőknek.

Ahogy a matematikához, úgy az adatbányászathoz sem vezet királyi út, viszont egy jó pedagógiai érzékkel rendelkező ember a megfelelő eszközökkel felvértezve csodákra képes. Amit egy könyvvel meg lehet tenni, azt Williams megtette, de nyilván kell egy lelkes, türelmes és eltökélt olvasó is, aki valamennyire jártas a számítógép használatban és a statisztikában. Jó hír hogy aki fél a programozástól, vagy egyszerűen csak nem szeret programozni, az megúszhatja a kódolást hála a Rattle grafikus felhasználói felületnek.
A kötet három részre van felosztva, Explorations, Building Models, Delivering Performance. A negyedik rész tkp. a függelék hasznos információkkal szolgál a használt eszközök telepítéséről és a példa adathalmazokról.
Az első részben, miképp neve is mutatja, megismerkedhetünk azzal hogy mi is az adatbányászat, majd az eszközökkel is találkozhatunk. Ezek után a legalapvetőbb dolgokkal ismerkedhetünk meg, pl. miképp olvashatjuk be eszközeinkkel a különböző adatfájlokat, milyen egyszerű módszerekkel “fedezhetjük fel” az adatokat akár grafikusan is és az adatok kitisztításával is foglalkozik egy-egy fejezet.
A második részben jön az igazi móka, a modell építés. A leíró és prediktív analízis, klaszterelemzés, asszociációs analízis részek kifejezetten jók, a döntés fa (decision trees) és random erdő (random forests) valamint a boosting (nem tudom magyarul hogy mondjuk) fejezetek is jók és szemléletesek, de talán egy kicsit nehezebbek és érződik hogy nehéz beszuszakolni egy ilyen témát a “lehetőleg mindenki értse” kategóriába. És itt érkezünk el a support vector machines részhez, itt bizony kicsit kilóg a lóláb, habár a lényeget mindenki “leveheti” belőle, ettől cirka 12 oldaltól senki se lesz a téma szakértője.
A harmadik rész szólna a komoly, gyakorlati munkáról. Az elő fejezet kifejezetten jó! Nagyon érthetően és olvasmányosan ismerkedhetünk meg az adatbányászati módszerek hatékonyságának (performancia) mérésével. A “deployment” fejezet inkább csak egy útmutató. Keresem a megfelelő magyarítását a kifejezésnek, de szerintem a hadrendbe állítás a legjobb, a lényeg hogy “felfedező munkánkat” valahogy a világ és/vagy az ügyfelek felé konzisztens, újra lefuttattatható formában kell közölni, ehhez itt kapunk egy kis segítséget ami kezdetnek meg is teszi, de én bevallom nem ezért a fejezetért szerettem meg ezt a könyvet.

Via: Könyvismertető: Data Mining with Rattle and R

29 Responses to Könyvismertető: Data Mining with Rattle and R

  1. Pingback: Buy cheap viagra

  2. Pingback: generic cialis india

  3. Pingback: viagra cialis

  4. Pingback: cialis discount

  5. Pingback: generic cialis canada

  6. Pingback: Buy pfizer viagra online

  7. Pingback: Free viagra samples

  8. Pingback: is cialis generic

  9. Pingback: cialis from india

  10. Pingback: generic cialis online

  11. Pingback: discount cialis

  12. Pingback: viagra 50mg

  13. Pingback: viagra 50mg

  14. Pingback: viagra 50mg

  15. Pingback: ed pills for sale

  16. Pingback: cheap erectile dysfunction pills online

  17. Pingback: erection pills

  18. Pingback: canadian pharmacy online

  19. Pingback: pharmacy online

  20. Pingback: Buy cialis online

  21. Pingback: cialis visa

  22. Pingback: levitra 20 mg

  23. Pingback: vardenafil pill

  24. Pingback: levitra dosage

  25. Pingback: best real casino online

  26. Pingback: real money online casinos usa

  27. Pingback: viagra prices

  28. Pingback: casino moons online casino

  29. Pingback: free slots online

Comments are closed.