Rapháború II.

Miről beszélnek a rapháború hősei? Sorozatunk első részéből kiderült, a lexikai diverzitásnak a népszerűséghez nem sok köze van, az átlagosat szeretik a népek. Egy kis kitérőt tettünk nagy kedvencünk Mr. Busta munkásságának elemzésével a szövegek vizualizációja felé, amikor rájöttünk, valahogy a szövegek tartalmát fel kellene fedezni és eltöprengtünk azon, hogyan haladjon tovább projektünk. Valami ilyesmire jutottunk, részletek a videó után.


Vizsgálódásaink során arra jutottunk hogy három irányban érdemes nézelődni:

  • mennyire tér el a hétköznapi nyelvtől (vagy éppen mennyire közelíti) egy előadó szövegvilága
  • milyen emóciók jelennek meg a szövegekben
  • milyen témák népszerűek

Az első kérdést Har politikai beszédeket elemző vizsgálatai nyomán merült fel, melyek kimutatták, hogy a magas ún. commonality tone-t (átlagos, hétköznapi beszédstílus) használó politikusok üzenetei sikeresebben érnek célba. Mi is azt találtuk, hogy az átlagos entrópiájú szövegek népszerűek, ezért érdemes lenne megvizsgálni ezek mennyiben térnek el az átlagos nyelvhasználattól (vagy éppen követik azt).

Gyanítjuk, hogy a kedvelt számok általában vidám, bulizós témákkal foglalkoznak. Ezért egyrészt LDA módszerrel vizsgáljuk milyen topikokba tartoznak ezek. A vizsgálatok egy későbbi fázisában szeretnénk megvizsgálni milyen emóciók jelennek meg az egyes szövegekben.

Munkának megkönnyítendő R-ben készítettünk egy kis alkalmazás, ami segít felfedezni az egyes topikokat, erről készült a fenti videó. Pár perc alatt elkészítheti mindenki a maga kis alkalmazását amallet és az LDAtools csomagokkal, érdemes kipróbálni mit tudnak!

Via: Kereső Világ