Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Scale de măsură în știința datelor: variabile absolute/nominale

Scale de măsură în știința datelor: variabile absolute/nominale

În ultimul capitol, am învățat verbiajul Python despre cum să facem operații aritmetice. În acesta, facem zoom și ne întrebăm: când are sens să folosim acele operațiuni? Răspunsul se dovedește a fi: nu întotdeauna.

Un alt mod de a formula această distincție este în termeni de sintaxă vs. semantică. Sintaxa se referă la regulile de combinare a diferitelor simboluri într-un limbaj de programare (sau alt limbaj). Semantica se referă la semnificația acelor simboluri. Acesta nu este ceva ce ne poate spune un limbaj de programare. Doar un om care înțelege la ce se referă toate aceste simboluri poate determina când o anumită combinație se referă de fapt la ceva semnificativ.

Fiecare variabilă (1) pe care o colectăm poate avea diverse valori, iar natura informațiilor pe care le conține poate fi descrisă prin propria scară de măsură.

Există patru astfel de scale de măsură (2) și fiecare determină ce tipuri de operațiuni sunt „legale” (adică, sensibile) cu acea variabilă.

Primul tip este cel mai simplu, deși are de fapt două nume diferite de uz comun: se numesc atât variabile absolute și variabile nominale. Aceste variabile reprezintă unul dintr-un set de opțiuni predefinite, unde nicio alegere nu este „mai înaltă” sau „mai mare” decât oricare alta.

Un exemplu ar fi o variabilă fave_color care deține valoarea culorii preferate a unui copil: valorile legale sunt „roșu”, „albastru”, „verde” sau „galben”. Știm că este absolută, printre altele, prin faptul că nu există o modalitate corectă de a ordona aceste valori. (Alfabetic, cel mai popular primul și ordonarea în funcție de succesiunea curcubeului sunt trei posibilități. S-ar putea să vă gândiți și la altele.)

Afilierea politică ar fi o altă variabilă absolută. Valorile sale (cum ar fi „democrat”, „republican” și „verde”) nu sunt într-o anumită ordine. (Deși s-ar putea să vă gândiți la spectrul politic tradițional de la stânga la dreapta, aceasta este doar o dimensiune a partidului politic și poate nici măcar cea mai importantă.) Alte exemple includ genul unui film, naționalitatea unui student și poziția unui jucător de fotbal.

Acum ați putea fi tentat să vă gândiți: „hmm… toate exemplele absolute de până acum sunt textuale, nu numerice. Poate că acest lucru cu scalele de măsură este doar un alt mod de a afirma tipul de variabilă?” Vai, nu. În primul rând, vom vedea variabilele text și în următoarea categorie. Pe de altă parte, chiar și datele care la suprafața lor par numerice pot fi de fapt absolute deghizate.

Luați în considerare numărul de concurs al unui atlet. Aș putea fi interesat să întreb, „ce număr de concurs a avut cei mai mari sportivi profesioniști care l-au ales?” #24 este un candidat bun: Willie Mays, Ken Griffey Jr. și Kobe Bryant au purtat cu toții acel număr pe tricou. Sau poate că #7 este câștigătorul, cu Mickey Mantle, John Elway și Cristiano Ronaldo. Oricum, tot ceea ce contează în această analiză este ce număr de concurs a ales un atlet, nu cât de mare este acest număr în comparație cu altele. Nimeni cu scaun la cap nu ar spune că Peyton Manning (# 18) a fost „de două ori mai mult decât jucătorul” Mia Hamm (# 9), pentru că numerele de concurs nu sunt deloc numere: sunt mai degrabă ca niște etichete.

Note

  • (1) Rețineți că utilizarea termenului de variabilă în acest capitol este diferită de modul în care l-am folosit în capitolul 3 și în capitolul 5. În acest capitol, o variabilă este în mod normal un aspect măsurabil al fiecărui obiect. în studiul nostru. Este posibil să recrutăm participanți la un experiment de cercetare și să le înregistrăm rasa, greutatea și cerealele preferate pentru micul dejun. Acestea ar fi cele trei variabile ale noastre. Fiecare dintre cele trei se vor constitui în multe valori, deoarece grupul nostru de participanți va avea multe curse, greutăți și cereale. În termeni de programare, acestea vor deveni în cele din urmă tipuri de date agregate.
  • (2) Potrivit psihologului Stanley Smith Stevens în 1946. Alți cercetători au dezvoltat scale de măsură înrudite, dar diferite.

Sursa: Stephen Davies, The Crystal Ball – Instruction Manual, Vol. 1: Introduction to Data Science, v. 1.1. Copyright © 2021 Stephen Davies. Licența CC BY-SA 4.0. Traducere și adaptare: Nicolae Sfetcu

© 2021 MultiMedia Publishing, Introducere în Știința Datelor, Volumul 1

Lucrul cu baze de date
Lucrul cu baze de date

Descoperă puterea bazelor de date cu acest ghid complet.

Nu a fost votat 18.24 lei36.52 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Etica Big Data în cercetare
Etica Big Data în cercetare

O explorare critică a provocărilor etice și a implicațiilor legale asociate Big Data.

Nu a fost votat 0.00 lei10.74 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Introducere în inteligența artificială
Introducere în inteligența artificială

Pășește în era digitală pregătit să înțelegi și să aplici conceptele care schimbă lumea!

Nu a fost votat 13.67 lei23.95 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *