
R este un software statistic care este utilizat pentru analiza datelor. Include un număr imens de proceduri statistice, cum ar fi testul t, testele chi-pătrat, modelele liniare standard, estimarea variabilelor instrumentale, regresiile polinomiale locale etc. Oferă, de asemenea, capacități grafice la nivel înalt. Există câteva asemănări minore între limbajele de programare R și C, dar acestea rulează în moduri diferite.
Avantajele R
- R este software gratuit. R este un proiect oficial GNU și distribuit sub licența publică generală Free Software Foundation (GPL).
- R este un pachet puternic de analiză a datelor, cu multe funcții statistice standard și de ultimă generație. Consultați Vizualizările de sarcini ale Comprehensive R Archive Network (CRAN) pentru a vă face o idee despre ce puteți face cu R.
- R este un limbaj de programare, astfel încât abilitățile sale pot fi extinse cu ușurință prin utilizarea funcțiilor definite de utilizator. O colecție largă de funcții și pachete contribuite de utilizator poate fi găsită în pachetele contribuite ale CRAN.
- R este utilizat pe scară largă în științe politice, statistici, econometrie, științe actuariale, sociologie, finanțe etc.
- R este disponibil pentru toate sistemele de operare majore (Windows, Mac OS, GNU-Linux).
- R este orientat pe obiecte. Practic orice (de exemplu, structuri de date complexe) poate fi stocat ca obiect R.
- R este un limbaj matricial.
- Sintaxa R este mult mai sistematică decât sintaxa Stata sau SAS.
- R poate fi instalat pe stick-ul USB.
Alternative la R
- S-PLUS este o versiune comercială a aceluiași limbaj de programare S în care R este o versiune gratuită.
- Gretl este un software gratuit pentru econometrie. Are o interfață grafică cu utilizatorul și este plăcut pentru începători.
- SPSS este un software proprietar care este adesea utilizat în sociologie, psihologie și marketing. Se știe că este ușor de utilizat.
- GNU PSPP este o alternativă de software liber la SPSS.
- SAS este un software proprietar care poate fi utilizat cu seturi de date foarte mari, cum ar fi datele recensământului.
- Stata este un software proprietar care este adesea utilizat în economie și epidemiologie.
- Julia este un limbaj de programare general, cu capacități similare cu MATLAB, R și Python (și viteza lui C) și poate apela biblioteci de la toate acestea.
- MATLAB este un software proprietar utilizat pe scară largă în științele matematice și inginerie.
- Octave este un software gratuit similar cu MATLAB. Sintaxa este aceeași, iar codul MATLAB poate fi utilizat în Octave.
- Python este un limbaj de programare general. Include câteva biblioteci specifice pentru analiza datelor, cum ar fi Pandas.
Începătorii pot arunca o privire la GNU PSPP sau Gretl. Utilizatorii intermediari pot încerca Stata. Utilizatorii avansați cărora le place programarea matricială pot prefera MATLAB sau Octave. Utilizatorii foarte avansați pot folosi C sau Fortran.
Vezi si: „R Relative to Statistical Package” de Patrick Burns
Stilul de programare R
- R este un limbaj de programare orientat pe obiecte. Aceasta înseamnă că practic totul poate fi stocat ca obiect R. Fiecare obiect are o clasă. Această clasă descrie ce conține obiectul și ce face fiecare funcție cu el. De exemplu,
plot(x)
produce ieșiri diferite în funcție de dacăx
este un obiect de regresie sau un vector. - Simbolul de atribuire este „
<-
”. Alternativ, simbolul clasic „=
” poate fi folosit.
Cele două afirmații următoare sunt echivalente:
> a <- 2
> a = 2
- Argumentele sunt transmise funcțiilor în paranteze rotunde ( ).
- Se pot combina cu ușurință funcții. De exemplu, puteți tasta direct
mean(rnorm(1000)^2)
- Simbolul „#” comentează la sfârșitul liniei:
# This is a comment
5 + 7 # This is also a comment
- Comenzile sunt în mod normal separate printr-o linie nouă. Dacă doriți să puneți mai multe declarații pe o linie, puteți utiliza delimitatorul „
;
„.
a <- 1:10 ; mean(a)
- Puteți avea, de asemenea, o declarație pe mai multe linii.
- R este sensibil la majuscule și minuscule: a și A sunt două obiecte diferite.
- În mod tradițional, sublinierile „
_
” nu sunt utilizate în nume. De multe ori este mai bine să folosiți puncte „.
„. Ar trebui să evitați utilizarea unei sublinieri ca primul caracter al unui nume de obiect.
(Traducere din Wikibooks)
Lasă un răspuns