Datele sunt atribuiri de valori pe bază de observații de evenimente și obiecte. Acestea pot fi clasificate după proprietățile lor de codificare și caracteristicile domeniilor și intervalelor lor.
Atunci când un set de date dat este de natură numerică, este necesar să distingem cu atenție natura reală a variabilei care este cuantificată. Testele statistice sunt, în general, specifice pentru tipul de date manipulate.
Date pe o scară nominală (sau categorică)
Identificarea naturii adevărate a numerelor aplicate atributelor care nu sunt „măsuri” este de obicei simplă și aparentă. Exemple în utilizarea de zi cu zi includ drum, mașină, casă, carte și numere de telefon. Un test simplu ar fi să ne întrebăm dacă reatribuirea numerelor din set ar modifica natura colecției. Dacă se schimbă plăcile unei mașini, de exemplu, rămâne aceeași mașină în realitate.
Date pe o scară ordinală
O scară ordinală este o scară cu ranguri. Aceste ranguri prin aceea că că sunt ordonate, ceea ce o face să fie o scală ordinală. Distanța [rang n] minus [rang n-1] nu este garantată să fie egală cu [rang n-1] minus [rang n-2], dar [rang n] va fi mai mare decât [rang n-1] în același mod în care [rang n-1] este mai mare decât [rang n-2] pentru toate n pentru care există [rang n], [rang n-1] și [rang n-2]. Rangurile unei scări ordinale pot fi reprezentate de un sistem cu numere sau nume și o ordine convenită.
Putem ilustra acest lucru cu un exemplu comun: scara Likert. Luați în considerare cinci răspunsuri posibile la o întrebare, poate Președintele nostru este un om grozav, cu răspunsuri la această scară
Răspuns: | Dezacord puternic | Dezacord | Nici acord nici dezacord | De acord | Foarte de acord |
---|---|---|---|---|---|
Cod: | 1 | 2 | 3 | 4 | 5 |
Aici răspunsurile sunt o scară clasificată reflectată în alegerea codului numeric. Cu toate acestea, nu există niciun sens în care distanța dintre Foarte de acord și De acord este aceeași ca între Dezacord puternic și Dezacord.
Datele clasificate numeric ar trebui să fie distinse de datele de măsurare.
Date de măsurare
Măsurătorile numerice există în două forme, Meristică și continuă, și se pot prezenta în trei tipuri de scară: interval, raport și circular.
Variabilele meriste sau discrete sunt în general numărate și pot lua doar valori discrete. În mod normal, acestea sunt reprezentate de numere naturale. Numărul de plante găsite în cadranul unui botanist ar fi un exemplu. (Rețineți că, dacă marginea cadranului cade parțial peste una sau mai multe plante, investigatorul poate alege să le includă ca jumătăți, dar datele vor fi în continuare meriste, deoarece dublarea totalului va elimina orice fracție).
Variabilele continue sunt acelea a căror precizie de măsurare este limitată doar de investigator și echipamentul acestuia. Lungimea unei frunze măsurată de un botanist cu o riglă va fi mai puțin precisă decât aceeași măsurare cu un micrometru. (Cel puțin, din punct de vedere noțional, frunza ar putea fi măsurată și mai precis utilizând un microscop cu o reticulă.)
Scala de interval: Variabilele măsurate pe o scală de intervale au valori în care diferențele sunt uniforme și semnificative, dar raporturile nu vor fi așa. Un exemplu des citat este cel al scării de grade Celsius. O diferență între 5° și 10° este echivalentă cu o diferență între 10° și 15°, dar raportul dintre 15° și 5° nu implică faptul că prima este de trei ori mai caldă decât cea din urmă.
Scala de raport: Variabilele de pe o scară de raport au un punct zero semnificativ. În conformitate cu exemplul de mai sus, s-ar putea cita scara de temperatură Kelvin. Deoarece există un zero absolut, este adevărat să spunem că 400° K este de două ori mai cald decât 200° K, deși nu ar fi chiar corect. Un exemplu mai bun de zi cu zi ar fi să spunem că un luptător de 180 kg la sumo este de trei ori mai greu decât soția sa de 60 kg.
Scala circulară: Când se măsoară datele anuale, timpul orar și alte câteva forme de date, se folosește o scară circulară. Se poate întâmpla ca nici diferențele și nici rapoartele acestor variabile să nu fie derivate sensibile și să fie utilizate metode speciale pentru astfel de date.
Lasă un răspuns