Testu corpusa (hizkuntza, hizkuntzalaritza)


Hizkuntza corpusa, corpus linguistikoa, testu corpusa edo testuen corpusa hizkuntza jakin batean edo batzuetan idatzizko edo ahozko testuen bilduma bat da, gehienetan tamaina handikoa baina aldi berean, orokorrean edo gai jakin bati buruz hizkuntza edo gaiko terminologia lagin gisa modu egokian islatu edo ordezkatu egiten duena, eta horri buru ikerketak egiteko erabiltzen dena, gehienetan modu automatikoan, informatika erabiliz. Esan liteke corpusa hizkuntza baten datu gordinen bilduma bat dela. Testu corpus bat anitza (testu desberdinak bildu behar ditu), selektiboa (testuen aukeraketa baten emaitza izan behar da) eta orekatua (testu desberdinen tamaina desberdina izango da, noski, baina desberdintasun handirik gabe) izan behar da. Halaber, zehaztu behar da corpusa sinkronikoa (garai historiko jakin batekoa9 edo diakronikoa (garai historiko desberdinetako testuekin) den.

208 hitz

Artikulu bat eskatu

Erabili ezazu galdetegi hau artikulu eskaera bat bidaltzeko. Lehenbailehen osatzen saiatuko gara.



Harpidetu zaitez

Gure azken edukien berri jaso nahi baduzu zure email helbidean, egin zaitez harpidedun hurrengo galdetegi hontan.