Szenvedés az ékezetekkel – személyes feljegyzés

Kitaláltam, hogy habár nem illik a megszokotthoz, csakazértis R-rel készítem el a jelentés ábráit, egyszerűen mert unalmas az Excelben rajzolgatni őket, túl szőrözős. Ráadásul itt kell hagynom a munkahelyemen a tudást és nem fogok emlékezni rá, így feljegyzem.

A probléma az, hogy habár egy R markdown dokumentumot, amíg csak szöveg van benne, szépen át tudok tenni Word-be a Knitr segítségével, mindez a képeknél nem működik. Ha grafikont rajzolok, a feliratok rosszul jelennek meg, például “é” helyett azt látom, hogy “ˇA©”. Márpedig így nem lesz olvasható az ábra, és csinálhatom meg mégis inkább Excellel. A markdown fájl jó, az R jó, mert ha csak az ablakra rakom ki, működik. Az ábrát a Knitr csinálja, tehát valószínűleg nála lesz a probléma.

A cirill karakterekre panaszkodtak sokan, így hosszú kutató munka, az R kódolásának, a forrás kódolásának, a locale átállításának kipróbálása után megtaláltam Yihui vonatkozó posztját, és a bug-reportokat is. Ezek egyrészt a pdf.options(encoding)  megfelelő beállítását hangsúlyozták, illetve egy külön beállítás létrehozását az ablakokra. Eddig ezekkel nem jutottam dűlőre.

Máshol a karakterkészletet hibáztatják, ugyanakkor nem gondolom, hogy itt is az lenne a probléma. Lehet, hogy azt a köztes utat választom majd, hogy elmentem az ábrákat én magam a png()  paranccsal, bár ez lehet, hogy meg fogja zavarni a Knitr munkáját. Holnap kiderül!


Ki is derült: nem tudom miért nem működött tegnap, de ma sikeresen vette az ékezeteket: egyrészt a knit2html()  függvénynek meg kell adni, hogy UTF-8-ban kódoljon ( encoding="UTF-8" ), az R az magyarra volt lokalizálva, a forráskód pedig szintén UTF-8. Ezt a konfigurációt egyébként kipróbáltam tegnap, de ma legalább működik.

Via: Szenvedés az ékezetekkel – személyes feljegyzés