Erregresioa (estatistika)


KategoriakEstatistika

Estatistikan, erregresioa edo erregresio-analisia aldagai dependente batek aldagai independente batekin edo batzuekin duen erlazioaren parametroak zehaztu eta erlazio estatistiko horren ezaugarriak (horien artean, erlazioa zenbateraino den argia, doikuntzaren egokitasuna alegia) aztertzen dituzten teknika estatistikoen multzoa da, aldagai dependenteari eta independenteei buruz jaso diren datuetatik abiatuta. Adibidez, eguneko tenperatura maximoari eta denda bateko izozki-salmentei buruzko datuak jasota, tenperatura eta salmentak lotzen dituen erlazio estatistikoa zehazteko erabiltzen da erregresioa. Erlazio estatistiko hori behatutako tenperaturari aplikatuz, salmentaren aurresanak egin daitezke, eta horixe bera da erregresioaren helburu nagusia: aldagai dependenteari buruzko aurresanak egitea.

Erregresoreak

Erregresoreak erregresioan independentetzat hartzen diren aldagaiak dira. Erregresore kopuruaren arabera, erregresio mota hauek bereizten dira:

  •  erregresio bakuna edo sinplea, (ingelesez, simple regression) aldagai independente bakarra barnehartzen duena: Y=\beta_0+\beta_1X_1+\epsilon;
  • erregresio anizkoitza (ingelesez, multiple regression) aldagai independente anitz hartzen dituena: Y=\beta_0+\beta_1X_1+\beta_2X_2+\ldots+\beta_nX_n+\epsilon;
  • erregresio orokorra edo aldagai anitzekoa (ingelesez, general regression, multivariate regression), aldagai dependente anitz daudenean, erregresore berdinekin lotzen direnak.

Erregresioa erlazio-motaren arabera

Aldagai dependentearen eta erregresoreen artean aurrez ezartzen den eredu edo erlazioaren arabera, honako erregresio hauek bereizten dira:

  • erregresio lineala, aldagai dependentearen eta erregresoeen artean ezartzen den erlazioa lineala denean, Y=a+\beta_1X_1+\beta_2X_2+\ldots+\beta_nX_n+\epsilon erakoa alegia;
  • erregresio ez lineala, aldagai dependentearen eta erregresorren arteko erlazioa linealtzat hartzen ez denean;
  • ohartu behar da erlazio ez lineal batzuk lineal bihurtu daitezkeela, aldakuntza egokien bitartez; adibidez, honako erlazio hau linealtzat hartzen da, matematikoki polinomioa den arren, erregresoretzat aldagai independente bakarraren X, X^2, \ldots, X_n berreketak hartuz: Y=a+\beta_1X+\beta_2X^2+\ldots+\beta_nX^n+\epsilon
  • jasotako datuak esploratuta erlazio ez lineala egokiagoa dirudien arren, askotan eredu linealak hobesten dira sinpleagoak direlako; beste alde batetik, eredu ez linealetan ere, parametro gutxiago barnehartzen dituzten ereduak hobesten dira, parsimonia printzipioari jarraiki, hau da, sinpletasun hutsagatik (estatistikan, parametro gutxiko eredu batean askatasun-gradu kopurua handiagoa dela esaten da).

Erregresio-eredua: zorizkotasunaren tratamendua

Erregresioan aztertzen diren erlazioak ez dira matematikoak, estatistikoak baizik; hau da, zorizkotasuna, eta ondorioz errorea, onartu egiten dira. Orokorrean, baina ez beti, erregresio-ereduetan erregresoreak finkoak eta ezagunak direla suposatzen da, deterministak alegia; eta zorizkotzat (neurri batean) hartzen dena aldagai dependentea da, haren aldakortasuna aztergai dugun aldagaia hain zuzen. Adibidez, har ditzagun publizitate-gastua enpresa batean eta salmentak: publizitate-gastua ez da zorizkoa, enpresak erabaki eta guztiz kontrolatu egiten duelako; publizitate-gastu jakin baterako berriz, salmentak zorizkoak dira, handiagoak edo txikiagoak izan daitezke, gehitzen den \epsilon perturbazio aleatorio baten kausaz:

    \[Sal=\beta_0+\beta_1 \times Pub+\epsilon\]

Parametroen estimazioa

Har dezagun erregresio-eredu hau:

    \[Y=\beta_0+\beta_1 \times X_1+\beta_2 \times X_2+\ldots+\beta_n \times X_n+\epsilon\]

Erregresioaren helburua (y,x_1,x_2,\ldots,x_n) datuetatik \beta parametroak estimatzea da (\beta parametroen estimazioei \hat{beta} deitzen diegu), \hat{y} aurresanak egin ahal izateko (x_1,x_2,\ldots,x_n) datuak jasota:

    \[\hat{Y}=\hat{\beta_0}+\hat{\beta_1} \times X_1+\hat{\beta_2} \times X_2+\ldots+\hat{\beta_n} \times X_n\]

Hainbat metodo daude \beta parametroak estimatzeko, baina horietan arruntena karratu txikien irizpidea da, HKB=\sum(y_i-\hat{y}_i)^2 hondar karratuen batura txikien egiten duten parametroen balioak kalkulatzen dituena.

Ikus, gainera

 

791 hitz

Artikulu bat eskatu

Erabili ezazu galdetegi hau artikulu eskaera bat bidaltzeko. Lehenbailehen osatzen saiatuko gara.



Harpidetu zaitez

Gure azken edukien berri jaso nahi baduzu zure email helbidean, egin zaitez harpidedun hurrengo galdetegi hontan.