Saltatu nabigazioa

Corpusak

Euskararen Erreferentzia Corpusa euskaltzaindiaren logoa EEC, hizkuntza-, literatura- edo ikerketa-helburuetarako estandar edo erreferente gisa erabilia izan ahal izateko asmoarekin Euskaltzaindiak sortu duen Corpusa.

XX. mendeko Euskararen Corpus Estatistikoa Corpus estatistikoaren oinarria XX. mendeko euskal argitalpenen inbentario osoa da. Argitalpenek osatzen duten unibertsotik abiatuta, osotasun hori proportzionalki adieraziko duen lagina eskuratu da zozketa bidez, orotara jasotako 6.351 obra-zatik osatzen dutena.

Egungo Testuen Corpusa (ETC)
XXI. mendean argitaratutako testuak biltzen dituen 355 milioi hitzeko corpusa. Askotariko iturburuetatik hartu dira testuak: liburuak, prentsa idatzia, wikipedia, zientzia eta zuzenbidea, telebista...

Ereduzko Prosa Gaur (EPG) EPG izeneko corpusean ikus dezakegu nola erabiltzen diren euskara modernoan hitzak beren testuinguruan. Hitz bat aukeratuz gero, hitz hori biltzen duen esaldia bistaratuko zaizu, eta aplikazioak emango dizkizu xehetasun guztiak: nork erabiltzen duen, nondik hartua den, eta abar.

Lexikoaren Behatokia Komunikabideek argitaratzen duten edo aireratzeko idazten duten materialarekin eraikitako corpusa.

Euskal Klasikoen Corpusa (EKC) Corpus honek XVI. mendean hasi eta 1975. urtera arteko 496 liburu jasotzen ditu, eta denera 11,9 milioi testu hitzez osatuta dago. 

Zientzia eta Teknologiaren Corpusa (ZTC) Zientzia eta teknologiaren alorreko euskarazko testu-bilduma egituratu eta etiketatua da.

Consumer Corpus Linguistikoa Edozein hitz edo esamolde bilatu, eta, CONSUMER EROSKI aldizkariaren edukietan arakatu ondoren, bere baliokidea euskaraz erakusten du.

Goenkale corpusa

 1994 eta 2010 bitartean ETB1en emititu zen Goenkale telesailean erabilitako testuekin osatua dago.