4.5 Data z cizích formátů

4.5.1 Načítání dat z MS Excelu

Nejbezpečnější je načítat data z Excelu tak, že je vyexportujete do CSV souboru a načtete způsobem popsaným výše. Tak máte největší kontrolu nad tím, co se děje.

Data z Excelu je však v R možné načíst i přímo pomocí balíku readxl (umí načíst jak soubory.xls, tak .xlsx). Balík poskytuje dvě funkce: funkce excel_sheets() vypíše seznam listů, které Excelový soubor obsahuje; funkce read_excel() načte jeden list z Excelového souboru. Víc detailů viz dokumentace.

4.5.2 Data z jichých statistických programů

Někdy jsou data distribuovaná v nativním formátu některého statistického softwaru. K jejich načtení je možné použít zejména balíky haven a foregin.

Balík haven slouží k načítání souborů v nativních formátech programů SPSS, SAS a Stata (v některých případech i k jejich ukládání). K načítání dat poskytuje tyto funkce: read_dta() a read_stata() čtou soubory Stata DTA, read_por(), read_sav() a read_spss() čtou soubory SPSS POR a SAV a funkce read_sas() čte soubory SAS. Detaily viz dokumentace k balíku.

Balík foreign umí načítat mnoho dalších datových formátů (a do některých i zapisovat). Detaily viz dokumentace k balíku.

Pokud nějaký formát umí číst oba balíky, doporučuji jako první vyzkoušet balík haven.

Číst a ukládat data z a do formátu Gretlu snad umožňuje balík gretlReadWrite dostupný z GitHubu: https://github.com/dickoa/gretlReadWrite. Použití zcela bez záruky.

4.5.3 Připojení databází

Viz Spector: Data Manipulation with R, kap. 3.