Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Data mining » Regresia neliniară în mineritul datelor

Regresia neliniară în mineritul datelor

postat în: Data mining 0

Când funcția modelului nu este liniară în parametri, suma pătratelor trebuie redusă la minimum printr-o procedură iterativă. Acest lucru introduce multe complicații care sunt rezumate în Diferențele între cele mai mici pătrate liniare și neliniare

Calcule de putere și dimensiunea eșantionului

Nu există metode general agreate pentru a raporta numărul de observații față de numărul de variabile independente din model. O regulă generală sugerată de Good și Hardin este N = mn, unde N este dimensiunea eșantionului, n este numărul de variabile independente și m este numărul de observații necesare pentru a atinge precizia dorită dacă modelul a avut o singură variabilă independentă. De exemplu, un cercetător construiește un model de regresie liniară folosind un set de date care conține 1000 de pacienți (N ). Dacă cercetătorul decide că sunt necesare cinci observații pentru a defini cu precizie o linie dreaptă ( m ), atunci numărul maxim de variabile independente pe care modelul le poate suporta este 4, deoarece

log1000/log 5 = 4,29.

Alte Metode

Deși parametrii unui model de regresie sunt de obicei estimați folosind metoda celor mai mici pătrate, alte metode care au fost utilizate includ:

  • Metode bayesiene, de ex. Regresia liniară bayesiană
  • Regresia procentuală, pentru situațiile în care reducerea erorilor procentuale este considerată mai potrivită.
  • Cele mai mici abateri absolute, care este mai robustă în prezența valorilor aberante, ceea ce duce la regresie cuantilă
  • Regresia neparametrică, necesită un număr mare de observații și este intensivă din punct de vedere computațional
  • Învățare în măsurarea distanței, care este realizată prin căutarea unei valori semnificative a distanței într-un spațiu de intrare dat.

Software

Toate pachetele software statistice majore efectuează analize de regresie și inferență cu cele mai mici pătrate. Regresia liniară simplă și regresia multiplă folosind cele mai mici pătrate pot fi făcute în unele aplicații de foi de calcul și pe unele calculatoare. Deși multe pachete software statistice pot efectua diverse tipuri de regresie neparametrică și robustă, aceste metode sunt mai puțin standardizate; diferite pachete software implementează metode diferite, iar o metodă cu un nume dat poate fi implementată diferit în pachete diferite. Software-ul specializat de regresie a fost dezvoltat pentru utilizare în domenii precum analiza de sondaj și neuroimagistică.

Sursa: Drew Bentley, Business Intelligence and Analytics. © 2017 Library Press, Licență CC BY-SA 4.0. Traducere și adaptare: Nicolae Sfetcu

Introducere în Business Intelligence
Introducere în Business Intelligence

O resursă esențială pentru toți cei interesați de analiza datelor și de optimizarea proceselor de afaceri.

Nu a fost votat $2.99$5.37 Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat $0.00$2.35 Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Rețele de comunicații 5G
Rețele de comunicații 5G

Descoperă cum 5G transformă lumea și pregătește-te să fii parte din viitor.

Nu a fost votat $2.99$6.88 Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *