Testu corpusa (hizkuntza, hizkuntzalaritza)


Testu corpusa edo testuen corpusa hizkuntza jakin batean edo batzuetan idatzizko edo ahozko testuen lagin bat da, gehienetan tamaina handikoa, orokorrean edo gai jakin bati buruz hizkuntza edo gaiko terminologia modu egokian islatu edo ordezkatu egiten duena, eta horri buru ikerketak egiteko erabiltzen dena, gehienetan modu automatikoan, informatika erabiliz. Esan liteke corpusa hizkuntza baten datu gordinen bilduma bat dela. Testu corpus bat anitza (testu desberdinak bildu behar ditu), selektiboa (testuen aukeraketa baten emaitza izan behar da) eta orekatua (testu desberdinen tamaina desberdina izango da, noski, baina desberdintasun handirik gabe) izan behar da. Halaber, zehaztu behar da corpusa sinkronikoa (garai historiko jakin batekoa9 edo diakronikoa (garai historiko desberdinetako testuekin) den.

202 hitz

Artikulu bat eskatu

Erabili ezazu galdetegi hau artikulu eskaera bat bidaltzeko. Lehenbailehen osatzen saiatuko gara.



Harpidetu zaitez

Gure azken edukien berri jaso nahi baduzu zure email helbidean, egin zaitez harpidedun hurrengo galdetegi hontan.