Estatistikan, erregresioa edo erregresio-analisia aldagai dependente batek aldagai independente batekin edo batzuekin duen erlazioaren parametroak zehaztu eta erlazio estatistiko horren ezaugarriak (horien artean, erlazioa zenbateraino den argia, doikuntzaren egokitasuna alegia) aztertzen dituzten teknika estatistikoen multzoa da, aldagai dependenteari eta independenteei buruz jaso diren datuetatik abiatuta. Adibidez, eguneko tenperatura maximoari eta denda bateko izozki-salmentei buruzko datuak jasota, tenperatura eta salmentak lotzen dituen erlazio estatistikoa zehazteko erabiltzen da erregresioa. Erlazio estatistiko hori behatutako tenperaturari aplikatuz, salmentaren aurresanak egin daitezke; eta horixe bera da erregresioaren helburu nagusia, alegia aldagai dependenteari buruzko aurresanak egitea, horretarako aldagai hori aldagai azaltzaileekin duen erlazioa estimatuz.
Erregresoreak
Erregresoreak erregresioan independentetzat hartzen diren aldagaiak dira. Erregresore kopuruaren arabera, erregresio mota hauek bereizten dira:
- erregresio bakuna edo sinplea, (ingelesez, simple regression) aldagai independente bakarra barnehartzen duena:
;
- erregresio anizkoitza (ingelesez, multiple regression) aldagai independente anitz hartzen dituena:
;
- erregresio orokorra edo aldagai anitzekoa (ingelesez, general regression, multivariate regression), aldagai dependente anitz daudenean, erregresore berdinekin lotzen direnak.
Erregresioa erlazio-motaren arabera
Aldagai dependentearen eta erregresoreen artean aurrez ezartzen den eredu edo erlazioaren arabera, honako erregresio hauek bereizten dira:
- erregresio lineala, aldagai dependentearen eta erregresoeen artean ezartzen den erlazioa lineala denean,
erakoa alegia;
- erregresio ez lineala, aldagai dependentearen eta erregresorren arteko erlazioa linealtzat hartzen ez denean;
- ohartu behar da erlazio ez lineal batzuk lineal bihurtu daitezkeela, aldakuntza egokien bitartez; adibidez, honako erlazio hau linealtzat hartzen da, matematikoki polinomioa den arren, erregresoretzat aldagai independente bakarraren
,
,
,
berreketak hartuz: 
- jasotako datuak esploratuta erlazio ez lineala egokiagoa dirudien arren, askotan eredu linealak hobesten dira sinpleagoak direlako; beste alde batetik, eredu ez linealetan ere, parametro gutxiago barnehartzen dituzten ereduak hobesten dira, parsimonia printzipioari jarraiki, hau da, sinpletasun hutsagatik (estatistikan, parametro gutxiko eredu batean askatasun-gradu kopurua handiagoa dela esaten da).
Erregresio-eredua: zorizkotasunaren tratamendua
Erregresioan aztertzen diren erlazioak ez dira matematikoak, estatistikoak baizik; hau da, zorizkotasuna, eta ondorioz errorea, onartu egiten dira. Orokorrean, baina ez beti, erregresio-ereduetan erregresoreak finkoak eta ezagunak direla suposatzen da, deterministak alegia; eta zorizkotzat (neurri batean) hartzen dena aldagai dependentea da, haren aldakortasuna aztergai dugun aldagaia hain zuzen. Adibidez, har ditzagun publizitate-gastua enpresa batean eta salmentak: publizitate-gastua ez da zorizkoa, enpresak erabaki eta guztiz kontrolatu egiten duelako; publizitate-gastu jakin baterako berriz, salmentak zorizkoak dira, handiagoak edo txikiagoak izan daitezke, gehitzen den
perturbazio aleatorio baten kausaz:
![Rendered by QuickLaTeX.com \[Sal=\beta_0+\beta_1 \times Pub+\epsilon\]](https://gizapedia.hirusta.io/wp-content/ql-cache/quicklatex.com-4bb28b31f6496e487c1b88b2dd957037_l3.png)
Parametroen estimazioa
Har dezagun erregresio-eredu hau:
![Rendered by QuickLaTeX.com \[Y=\beta_0+\beta_1 \times X_1+\beta_2 \times X_2+\ldots+\beta_n \times X_n+\epsilon\]](https://gizapedia.hirusta.io/wp-content/ql-cache/quicklatex.com-3a0ace91af4a1768b94bb2d17ab69aef_l3.png)
Erregresioaren helburua
datuetatik
parametroak estimatzea da (
parametroen estimazioei
deitzen diegu),
aurresanak egin ahal izateko
datuak jasota:
![Rendered by QuickLaTeX.com \[\hat{Y}=\hat{\beta_0}+\hat{\beta_1} \times X_1+\hat{\beta_2} \times X_2+\ldots+\hat{\beta_n} \times X_n\]](https://gizapedia.hirusta.io/wp-content/ql-cache/quicklatex.com-c5562336b3eecae294e6f7736331a788_l3.png)
Hainbat metodo daude
parametroak estimatzeko, baina horietan arruntena karratu txikienen irizpidea da,
hondar karratuen batura txikien egiten duten parametroen balioak kalkulatzen dituena.
Ikus, gainera
Loturiko artikuluak
ErregresoreakEstatistikan, eta erregresio ereduei buruz, erregresoreak aldagai azaltzaileak dira, azaldu nahi den aldagaia edo aldagai dependentea aurresateko erabiltzen direnak. Ikus, gainera Aldagai iragarleak, erregresoreak izendatzeko beste termino bat
Zehazpen errorea (zehaztapen errorea)Zehazpen errorea edo zehaztapen errorea erregresio-analisian eta loturiko teknika estatistikoetan erregresio-eredua ezartzean egiten diren erroreak dira, hala nola aldagai dependentearen eta independenteen arteko forma funtzionala egokia ez izatea…
Aldagai diskretuak eta aldagai jarraituakEstatistikan, aldagai estatistikoen artean aldagai diskretuak eta aldagai jarraituak (edo jarraiak) bereizten dira. Aldagai diskretuak balio isolatuak, banan-banan konta daitezkeenak, hartzen dituen aldagaiak dira, hala nola familiako anai…