UD Basque BDT
Language: Basque (code: eu
)
Family: Basque
This treebank has been part of Universal Dependencies since the UD v1.1 release.
The following people have contributed to making this treebank part of UD: Maria Jesus Aranzabe, Aitziber Atutxa, Kepa Bengoetxea, Arantza Diaz de Ilarraza, Iakes Goenaga, Koldo Gojenola, Larraitz Uria.
Repository: UD_Basque-BDT
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.2
License: CC BY-NC-SA 3.0
Genre: news
Questions, comments? General annotation questions (either Basque-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [koldo • gojenola (æt) ehu • eus]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | assigned by a program, not checked manually |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | annotated manually in non-UD style, automatically converted to UD |
Features | annotated manually in non-UD style, automatically converted to UD |
Relations | annotated manually in non-UD style, automatically converted to UD |
Description
The Basque UD treebank is based on a automatic conversion from part of the Basque Dependency Treebank (BDT), created at the University of of the Basque Country by the IXA NLP research group. The treebank consists of 8.993 sentences (121.443 tokens) and covers mainly literary and journalistic texts.
The Basque UD treebank is based on a automatic conversion from part of the Basque Dependency Treebank (BDT) (Aduriz et al., 2003), created at the University of of the Basque Country by the IXA NLP research group. The treebank consists of 5274 sentences (60563 tokens) and covers mainly literary and journalistic texts. The Basque language can be described as a morphologically rich, agglutinative language with a high capacity of generating inflected word-forms, with free constituent order of sentence elements. It can be considered a head-final language, as the syntactic head of phrases is located at the end of the last word of the phrase, in the form of a suffix. BDT is a pure dependency treebank from its original design, annotated in the CoNLL-X format, and it shares with UD a lexicalist hypothesis in syntax, where dependencies occur between whole individual wordforms. Under this lexicalist approach, each word shows several morphosyntactic associated features, corresponding to affixes (prefixes and suffixes) attached to the base forms, such as case (there are 14 morphological cases in Basque), number, definiteness or type of subordinate sentence (adversative, conditional, …). These suffixes usually appear as separated wordforms in non agglutinative languages. The last version of BDT contains 150,000 tokens forming 11,225 sentences, with 1.3% of non-projective arcs. BDT encodes 16 different POS and 28 dependencies. Although BDT was in accord with many UD guidelines, the process was not trivial, converting around 80% of the tokens (121.443 tokens). The set of remaining sentences correspond to either special cases not accounted by the conversion rules or other types of less frequent phenomena which have not been dealt with at the moment.
Acknowledgments
The conversion of the original treebank has been performed by Aitziber Atutxa, Iakes Goenaga and Koldo Gojenola at University of the Basque Country (EHU/UPV). In contrast, the conversion of the UD treebank v1.2 to v2.0 has been performed by Dan Zeman. We thank everyone who has collaborate in the transformation of the Basque Dependency Treebank.
Sentences were randomized and divided in 60-20-20 splits for the train, dev and test files, repectively.
Statistics of UD Basque BDT
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SYM – VERB – X
Features
Animacy – Aspect – Case – Definite – Degree – Gender – Gender[dat] – Gender[erg] – Mood – Number – Number[abs] – Number[dat] – Number[erg] – NumType – Person – Person[abs] – Person[dat] – Person[erg] – Polarity – Polite – Polite[abs] – Polite[dat] – Polite[erg] – PronType – VerbForm – Voice
Relations
acl – advcl – advmod – amod – appos – aux – case – cc – ccomp – compound – conj – cop – csubj – dep – det – discourse – fixed – flat – iobj – mark – nmod – nsubj – nummod – obj – obl – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 8993 sentences and 121443 tokens.
- This corpus contains 19438 tokens (16%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 693 types of words that contain both letters and punctuation. Examples: PSE-EEk, II.a, PSE-EEko, bat-batean, II., Euskaltel-Euskadi, I.a, II.ak, PSE-EE, bete-betean, denboraldi-aurrea, denboraldi-aurreko, parte-hartzea, behin-behineko, denboraldi-aurrean, elektrizitate-lineari, poliki-poliki, PSE-EEren, Yong-Kooren, buru-belarri, cm-ko, Calcio-n, Donibane-Lohizuneko, Francine-k, Jazztel-Costa, Lutxana-Deustu, PSE-EEri, Uda-udazken, Yong-Koo, aitzin-multzoan, bizi-bizi, gorri-berdeak, kili-kolo, lur-nahaste, pertsona-komunztadura-markek, pixkanaka-pixkanaka, potentzial-diferentzia, soil-soilik, transformazio-zentroari, zehatz-mehatz, zelai-erdian, zer-nolako, 30.eko, A., AEK-ko, Asegarce-Altiren, Biztanle-kopuruak, CD-ROMetan, Dae-jung, Dole-k
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SYM, VERB, X
- This corpus does not use the following tags: SCONJ
- This corpus contains 5 word types tagged as particles (PART): bai, baietz, ez, ezetz, omen
- This corpus contains 26 lemmas tagged as pronouns (PRON): beraiek, deus, edonor, elkar, eurak, ezer, ezertxo, geu, gu, heu, hi, inor, neu, ni, nor, norbait, norbera, nornahi, nortzuk, zenbaitzuk, zer_edo_zer, zerbait, zertxobait, zeu, zu, zuek
- This corpus contains 61 lemmas tagged as determiners (DET): anitz, asko, askotxo, aunitz, batere, batzuk, bera, berak, berauek, berbera, bertze, beste, den-dena, dena, dezente, dozenaka, edozein, edozer, ehundaka, ehunka, ezein, franko, gehiago, gehiegi, gehiegitxo, gehien, gehientsu, gehitxo, gehixeago, guti, gutiz-gehien, gutxi, gutxiago, gutxien, guzi, guzti, haiek, hainbat, hainbertze, hainbeste, hau, hauek, hogeitaka, hori, horiek, horrenbeste, hura, larregi, milaka, milioika, nahiko, nahikoa, oro, pixka_bat, ugari, ze, zein, zeintzuk, zenbait, zenbat, zer
- This corpus contains 13 lemmas tagged as auxiliaries (AUX): *edin, *edun, *ezan, ari, ari_izan, egon, geratu, ibili, izan, onartu, sartu, sortu, ukan
- Out of the above, 11 lemmas occurred sometimes as AUX and sometimes as VERB: *edin, *edun, ari_izan, egon, geratu, ibili, izan, onartu, sartu, sortu, ukan
- There are 2 (de)verbal forms:
- Inf
- AUX: izan, izaten, egoten, egon, geratzen, izaki
- VERB: egiten, ematen, egin, erabiltzen, ikus, ikusten, izan, izaten, agertzen, esaten
- Part
- ADV: Desesperatuki
- AUX: izan, izango, egon, egongo, ibili, geratu, izanik, izanen, izanda, izandako
- VERB: egin, izan, esan, eman, izango, hartu, hasi, jokatu, joan, irabazi
Nominal Features
- Fem
- AUX: dinat, dun, naun, din, ditun, zion, ditin, gintunan, zaidan, zezaken
- VERB: dun, dinat, niken, baditinagu, baditinat, bazaukan, dakinat, din, dinagu, naun
- Masc
- AUX: duk, diat, nian, dik, nauk, zagok, zegoan, zegok
- VERB: duk, zekiat, dik, ditik, dituk, gaudek, zeramatzaan, zeramatzak, zian
- Anim
- ADP: arteko, arabera, artean, inguru, aurrean, aurka, bezala, buruz, gisa, kontra
- NOUN: lagun, jokalariak, ordezkariak, jokalariek, agintariek, hilaren, ministroak, epaileak, arduradunak, gizona
- PROPN: Manek, Maneren, Putinek, Tirapu
- Inan
- ADJ: ergatibodunak, harrotsu, hesidunetan, istilutsua, kotoitsua, latza, molduradunei, osasuntsuena, sabeldunak
- ADP: gabe, inguruan, bezala, arabera, artean, aurrean, barruan, gora, arte, aurka
- NOUN: taldeak, urteko, urte, ondorioz, partidua, aukera, taldea, aurretik, garaipena, igandean
- PROPN: EAJk, EAk, EAJko, EAJri, ELAk, EAri, EAren, ELAko, Bilbaoko, EA
- SYM: m, m., km
- Plur
- ADJ: nagusiak, handiak, onak, berriak, Batuetako, onenak, ezberdinak, bereziak, desberdinak, ezagunak
- ADP: artean, arteko, arabera, inguruan, aurrean, bidez, aurka, bezala, buruz, aurkako
- ADV: egungoak, goranzkoak, samarretan
- AUX: dutenak, direnak, dituztenak, zirenak, dutenek, daitezkeenak, direnek, dutenen, zeudenak, zituztenak
- DET: batzuk, guztiak, horiek, hauek, beren, gehienak, batzuek, guztiek, hauetan, haien
- NOUN: gauzak, urteetan, arazoak, egunetan, hauteskundeak, jokalariak, eskubideen, egunotan, jokalariek, urteotan
- PRON: geu, geure, zenbaitzuk, Geuregan, Geuri
- PROPN: EEBBetako, EEBBek, EEBBetan, EEBBak, EEBBetara, Filipinetako, Moluketan, Bahamak, Bahametako, EEBBen
- SYM: kv
- VERB: eginak, atxilotuak, dituztenak, dutenak, eginez, gonbidatuak, ikasiak, jarriak, zaurituak, armatuak
- VERB-Part: eginak, atxilotuak, eginez, gonbidatuak, ikasiak, jarriak, zaurituak, armatuak, armatuen, baztertuak
- Sing
- ADJ: handia, ona, bakarra, nagusia, zaila, berria, onena, garrantzitsua, osoa, berezia
- ADP: arabera, aurka, kontra, inguruan, aurrean, aurkako, zehar, arte, buruz, kontrako
- ADV: samarra, adinakoa, atzokoa, atzokoan, atzokoaren, aurtengoa, aurtengoak, aurtengora, gaurkoa, kontrakoa
- AUX: duena, dena, zuena, izateaz, dutena, zena, izateagatik, dituena, duenak, izateak
- AUX-Part: izana, izanagatik, izandakoa, izandakoak, sortua
- DET: bere, hori, hau, horretan, honetan, horrek, bera, berak, haren, horren
- NOUN: partidua, taldea, taldeak, ostean, gobernuak, aurretik, aukera, garaipena, herrian, igandean
- NUM: 21na
- PRON: neure, norberak, neu, norberaren, Neuk, Zeu, Zeuk, heure, zeure
- PROPN: Europako, Espainiako, Frantziako, Israelgo, Nafarroako, Jugoslaviako, Miarritzek, EAJk, Osasunak, Realak
- SYM: cm-ko, kg, m, m., KV, cm, km
- VERB: izana, egina, hasia, litekeena, egiteak, azpimarratzekoa, dagokionean, irekia, bateratua, esana
- VERB-Part: izana, egina, hasia, irekia, bateratua, esana, galdua, gertatutakoa, izanak, orekatua
- Abl
- ADJ: onetik, Batutik, berritik, finkorik, gaztetatik, handirik, nagusitik, Garaitik, Nazionaletik, Zuritik
- ADP: aurretik, aldetik, gainetik, ondotik, atzetik, eskutik, azpitik, aitzinetik, barrutik, goitik
- ADV: handik, hortik, hemendik, aspalditik, Aspaldidanik, bihartik, gaurtik, gertutik, lehenagotik, oraindik
- AUX: izatetik, dutenenetatik
- DET: bestetik, horretatik, honetatik, beretik, hartatik, haietatik, horietatik, askotatik, batzuetatik, berarengandik
- NOUN: aurretik, hasieratik, etxetik, urtetik, zalantzarik, arazorik, dudarik, goitik, egunetik, herritik
- PROPN: Espainiatik, Bermeotik, EBtik, Egiptotik, Europatik, Gomatik, Herritik, Iruñetik, Kosovotik, Oriorengandik
- VERB: izatetik, egitetik, ginenekotik, mintzatutik, normalizatutik, zaurituetatik
- VERB-Part: mintzatutik, normalizatutik, zaurituetatik
- Abs
- ADJ: handia, ona, bakarra, nagusia, zaila, berria, onena, garrantzitsua, nagusi, osoa
- ADP: arte, aurka, gisa, gain, esker, alde, kanpo, inguru, esku, barru
- ADV: samarra, gaurko, adinakoa, atzokoa, aurtengoa, betirako, biharko, egungoak, gaurkoa, goranzkoak
- AUX: izatea, duena, dena, dutenak, zuena, izateko, direnak, dituztenak, dutena, zena
- AUX-Part: izana, izan, izandakoa, sortua
- DET: hori, hau, batzuk, zer, guztiak, gehiago, bera, asko, horiek, hauek
- NOUN: behar, nahi, uste, ezin, urte, partidua, aukera, taldea, garaipena, lana
- NUM: bana, 16na, 21na, 31na, bedera
- PRON: zerbait, ezer, inor, norbait, elkar, zertxobait, edonor, neu, deus, ezertxo
- PROPN: EH, Alaves, Reala, Athletic, Bizkaia, Frantzia, Zaragoza, EEBBak, ETA, Errusia
- SYM: kg, kv, m, m., cm, km
- VERB: izatea, egitea, egotea, ematea, sartzea, egiteko, lortzea, hartzea, irabaztea, emateko
- VERB-Part: izana, egina, hasia, izan, irekia, bateratua, egin, eginak, esana, galdua
- All
- ADJ: hobera, laburrera, politikora, Zurira, gorenera, onera, osora, publikora, Batuetara, Nagusira
- ADP: aurrera, batera, aldera, gainera, ingurura, kanpora, behera, erdira, antzera, alderat
- ADV: aurtengora
- AUX: izatera, egotera
- DET: horretara, gutxira, honetara, bera, guztietara, zertara, batzuetara, bestera, hartara, guztira
- NOUN: behera, segundora, aurrera, etxera, herrira, kalera, urtera, atzera, kanpora, mailara
- PRON: norbaitengana
- PROPN: Sydneyra, Argentinara, Donostiara, Gasteizera, Iruñera, Madrilera, Oronozera, EEBBetara, Europara, Frantziara
- VERB: egitera, ematera, irabaztera, hartzera, ikustera, jokatzera, deklaratzera, bizitzera, hastera, izatera
- VERB-Part: gonbidatuetara, aginduetara, armatura, itxietara, jakinetara
- Ben
- ADJ: Akziodunentzat, bahamatarrentzat, baionesentzat, bakarrarentzat, berriarentzat, berrientzat, britainiarrentzat, frantziarrarentzat, handirentzat, hungariarrarentzat
- AUX: denarentzat, duenarentzat, nauenarentzat, zuenarentzat
- DET: gehienentzat, guztientzat, harentzat, guztiontzat, horientzat, Zerendako, askorentzat, batzuentzat, berarentzat, beretzat
- NOUN: emakumeentzat, ertzainentzat, gorritxoentzat, jokalarientzat, Estatuarentzat, Greziarrentzat, Hegoaldekoentzat, Munduarentzat, Txirrindularitzarentzat, Zuzenbidearentzat
- PRON: norbaitentzat
- PROPN: Alavesentzat, Eibarrentzat, Udalbiltzarentzat, Andreasentzat, Astillerorentzat, Athleticentzat, Barakentzat, Batistutarentzat, Bretainiarentzat, Echevarrieta-rentzat
- Cau
- ADJ: bikoitzagatik, eskasagatik, espainiarragatik, handiagatik, handiengatik, hutsagatik, ikusgarriarengatik, militarragatik, normal-normalengatik, politikoengatik
- AUX: izateagatik, dutenagatik, gintuenagatik, izanagatik, zitzaionagatik
- AUX-Part: izanagatik
- DET: horregatik, beragatik, honengatik, Horrexegatik, batzuengatik, berarengatik, berberagatik, guztiagatik, hargatik, honegatik
- NOUN: arazoengatik, delituengatik, finantzaketagatik, gorrotoarengatik, hilketagatik, kasuengatik, Bartzelonakoengatik, Euriagatik, adierazpenengatik, arrazoiengatik
- PRON: zerbaitengatik
- PROPN: Batistutarengatik
- VERB: aurkitzearren, azaltzearren, ekartzearren, emateagatik, formalizatzearren, hitzegitearren, hondatzearren, irudikatzearren, kontatzearren, lortzearren
- VERB-Part: izanagatik
- Com
- ADJ: handiarekin, onenekin, osoarekin, bakarrarekin, handiekin, ingelesarekin, koadroarekin, nagusiarekin, ohiarekin, onarekin
- AUX: dituztenekin, dudanarekin, duzunarekin, egotearekin, zenarekin, zizkiotenekin
- DET: horrekin, honekin, batzuekin, horiekin, berarekin, gehiagorekin, hauekin, harekin, gutxiagorekin, haiekin
- NOUN: taldearekin, urterekin, punturekin, taldekideekin, aldearekin, lagunekin, selekzioarekin, erabakiarekin, kideekin, laguntzarekin
- NUM: banarekin
- PRON: elkarrekin, Norbaitekin, elgarrekin, ezerekin
- PROPN: Israelekin, Osasunarekin, Alavesekin, Alkortarekin, Arafatekin, Bartzelonarekin, EAJrekin, ETArekin, Eugirekin, Ibarretxerekin
- VERB: aldentzearekin, erasoekin, handi-handituekin, igarotzearekin, irabaztearekin, kualifikatuarekin
- VERB-Part: erasoekin, handi-handituekin, kualifikatuarekin
- Dat
- ADJ: ohiari, Batuari, politikoari, zaleei, bakoitzari, baltseroari, demokratikoari, fisikoari, onari, politikoei
- ADV: beti, Berriki, estetikoki, nahi, orai, supituki
- AUX: denari, izateari, duenari, dugunari, zenari, zituenei
- DET: horri, honi, hari, guztiei, horiei, hauei, batzuei, askori, berari, besteei
- NOUN: mahai, gobernuari, zelai, Jaurlaritzari, denboraldiari, buruari, palestinarrei, jokalariei, taldeari, aurrekontuei
- PRON: elkarri, elgarri, norbaiti, Geuri, inori
- PROPN: ETAri, Realari, Athletici, Aznarri, EAJri, Jerusalemi, Ibarretxeri, EAri, Kontxari, Lizasori
- VERB: aztertzeari, dagokionari, dituztenei, prefabrikatuari, zimurtuari, zirenei, Eztabaidatzeari, afiliatuei, antolatzeari, aritzeari
- VERB-Part: prefabrikatuari, zimurtuari, afiliatuei, elbarrituei, eroritakoei, eztabaidatutakoei, kaltetutakoei, zaurituei
- Erg
- ADJ: bakoitzak, Gorenak, ohiak, nagusiak, gazteak, berriak, estatubatuarrak, sozialistak, zibilak, Batuek
- ADV: aurtengoak
- AUX: dutenek, duenak, izateak, direnek, daudenek, denak, diotenek, dituztenek, dudanak, garenok
- AUX-Part: izandakoak
- DET: horrek, berak, honek, horiek, batzuek, guztiek, hauek, hark, askok, gehienek
- NOUN: taldeak, gobernuak, presidenteak, ministroak, poliziak, lehendakariak, entrenatzaileak, jokalariek, agintariek, kideek
- PRON: inork, norbaitek, norberak, Neuk, Nornahik, Zeuk, ezerk, zerbaitek
- PROPN: Miarritzek, EAJk, Osasunak, Realak, Athleticek, Alavesek, EHk, Lotinak, PPk, ETAk
- VERB: egiteak, izanak, izateak, armatuak, begiratzeak, ezabatzeak, ikusteak, inplikatuek, irabazteak, ixteak
- VERB-Part: izanak, armatuak, inplikatuek, moderatuek, Abokatuek, aritutakoek, atxilotutakoek, defendituak, desplazatuak, eginikoak
- Ess
- ADJ: ezinbestekotzat, garrantzitsutzat, nagusitzat, basatitzat, egokitzat, historikotzat, normaltzat, positibotzat, Batutzat, Naturaltzat
- NOUN: erreformistatzat, oinarritzat, aitzakiatzat, amaieratzat, arriskutzat, aurrebaldintzatzat, babeslekutzat, dialektotzat, egiletzat, erreferentziatzat
- PROPN: Hegoameriketako, Koreetako
- VERB-Part: amaitutzat, desagertutzat, erabakitzat, galdutzat, jaiotakotzat, lortutzat
- Gen
- ADJ: berriaren, bakoitzaren, zaleen, handien, nazionalaren, politikoaren, ohiaren, Batuen, atzerritarren, palestinarraren
- ADP: arabera, bezalakoen, gorakoen
- ADV: gainerakoen, atzokoaren, hemen
- AUX: duenaren, dutenen, dagoenaren, daiteekenaren, daitekeenaren, daudenen, denaren, direnen, dituztenen, dutenaren
- DET: bere, horren, haren, honen, horien, beren, haien, guztien, hauen, batzuen
- NOUN: eskubideen, taldearen, gobernuaren, euskararen, abuztuaren, irailaren, hilaren, abertzaleen, epailearen, herriaren
- PRON: elkarren, norbere, norberaren, neure, norbaiten, inoren, geure, heure, zeure
- PROPN: ETAren, Rojoren, Athleticen, Alavesen, Houdaren, Valentziaren, EHren, Goreren, Osasunaren, PPren
- VERB: sustatzearen, esandakoaren, armatuen, daudenen, egitearen, entzundakoaren, gertatutakoaren, izanaren, Bateratzearen, Gutxituen
- VERB-Part: esandakoaren, armatuen, entzundakoaren, gertatutakoaren, izanaren, Gutxituen, Irekien, Jakinaren, afiliatuen, atxilotutakoen
- Ine
- ADJ: osoan, nagusian, zabalean, Batuetan, bakoitzean, onean, onenean, nagusietan, batuan, betean
- ADP: artean, aurrean, inguruan, barruan, gainean, atzean, erdian, bitartean, aldean, ondoan
- ADV: orain, sekulan, han, Aspaldian, ASPALDIAN, aurrerantzean, bertan, bezain, nonbaiten, atzokoan
- AUX: izaten, egoten, geratzen, direnetan, naizenetan
- DET: horretan, honetan, berean, hartan, hauetan, batzuetan, horietan, guztian, guztietan, haietan
- NOUN: ostean, igandean, herrian, taldean, urtean, moduan, egunetan, etxean, lanean, urteetan
- PRON: Geuregan
- PROPN: Gasteizen, Sydneyn, Mendizorrotzan, Madrilen, Mamesen, Nafarroan, Alemanian, Bilbon, Donostian, Europan
- VERB: egiten, sartzen, jokatzen, ematen, aztertzen, ikertzen, ikusten, hartzen, sortzen, bilatzen
- VERB-Part: amaitutakoan, entzundakoan, Afizionatuetan, Irekian, aurreratuenetan, bilduetan, gertatutakoan, gutxituetan, idatzian, ihesian
- Ins
- ADJ: handiz, onez, osoz, biziz, estreinakoz, azkenekoz, kulturalaz, naturalez, olinpiarrez, sozialaz
- ADP: bidez, bitartez, aldeaz, partez
- AUX: izateaz, dagoenez, izanez
- AUX-Part: izanez
- DET: horretaz, horrez, Honetaz, hauez, horiez, batzuez, guztiaz, hainbatez, honez, horrezaz
- NOUN: ondorioz, aldiz, ustez, legez, asmoz, euskaraz, urtez, aburuz, iritziz, orduz
- PRON: ezertaz, inortaz
- PROPN: Cardosoz, Redondoz, Bidasoaz, Brivez, Leoz, Serjent-Iurtez, Txetxeniaz
- VERB: eginez, erabiliz, esanez, utziz, eraginez, izanez, emanez, errespetatuz, idatziz, irabaziz
- VERB-Part: eginez, erabiliz, esanez, utziz, eraginez, izanez, emanez, errespetatuz, idatziz, irabaziz
- Lat
- ADJ: Baturantz
- ADV: gorantz
- DET: besterantz
- NOUN: beherantz, Beherantza, barnerantz, helmugarantz, iparralderantz, mahaigainerantz, txokorantz, zeruertzerantz
- PROPN: Ingalaterrarantz
- Loc
- ADJ: handiko, Batuetako, Nazionaleko, bakoitzeko, zibileko, goreneko, Batuko, osoko, bakarreko, Demokratikoko
- ADP: arteko, aurkako, aldeko, kontrako, buruzko, inguruko, gabeko, aurreko, kanpoko, gaineko
- ADV: atzoko, egungo, iazko, hango, gaurko, aurtengo, antzinako, hurrengo, biharko, oraingo
- AUX: izateko, izandako, delako, zuelako, egoteko, duteneko, zuteneko
- AUX-Part: izandako
- DET: horretako, bereko, honetako, horietako, hauetako, askotako, haietako, besteko, horretarako, guztietako
- NOUN: taldeko, munduko, herriko, urteko, mailako, aurreko, goizeko, ligako, batasuneko, arratsaldeko
- NUM: 36nako
- PRON: elkarrekiko, zerbaitetarako
- PROPN: Europako, Espainiako, Frantziako, Israelgo, Nafarroako, EEBBetako, Jugoslaviako, Errusiako, Gasteizko, Italiako
- SYM: cm-ko
- VERB: egiteko, egindako, jokatzeko, lortzeko, irabazteko, emateko, hartzeko, izandako, eginiko, sartzeko
- VERB-Part: egindako, izandako, eginiko, lortutako, aurkeztutako, jokatutako, sortutako, aipatutako, emandako, hartutako
- Par
- ADJ: handirik, halakorik, onik, horrelakorik, berezirik, faboritorik, larririk, politikorik, ziurrenik, garbirik
- ADV: seguruenik
- AUX: izanik, duenik
- AUX-Part: izanik
- DET: besterik, askorik, gehiegirik, nahikorik
- NOUN: aukerarik, arazorik, aldaketarik, asmorik, garaipenik, arriskurik, lekurik, unerik, zerikusirik, erantzunik
- PROPN: Emilionerik, NOBrik
- VERB: osaturik, jokatzerik, erretiratzerik, harturik, izanik, utzirik, ezkutaturik, ikusirik, arrestaturik, ateratzerik
- VERB-Part: osaturik, harturik, izanik, utzirik, ezkutaturik, ikusirik, arrestaturik, beterik, harriturik, hilik
- Def
- ADJ: handia, ona, bakarra, nagusia, zaila, berria, onena, garrantzitsua, nagusiak, osoa
- ADP: arabera, artean, aurka, arteko, inguruan, kontra, aurrean, aurkako, buruz, zehar
- ADV: samarra, adinakoa, atzokoa, atzokoan, atzokoaren, aurtengoa, aurtengoak, aurtengora, egungoak, gaurkoa
- AUX: duena, dena, dutenak, zuena, direnak, izateaz, dituztenak, dutena, zena, zirenak
- AUX-Part: izana, izanagatik, izandakoa, izandakoak, sortua
- DET: hori, hau, horretan, batzuk, guztiak, honetan, horiek, horrek, bera, hauek
- NOUN: taldeak, partidua, taldea, ostean, gobernuak, aurretik, aukera, garaipena, herrian, igandean
- PRON: neure, norberak, neu, norberaren, geu, geure, zenbaitzuk, Geuregan, Geuri, Neuk
- PROPN: Europako, Espainiako, Frantziako, Israelgo, Nafarroako, EEBBetako, Jugoslaviako, Miarritzek, EAJk, Osasunak
- SYM: cm-ko, kg, kv, m, m., cm, km
- VERB: izana, egina, hasia, litekeena, egiteak, azpimarratzekoa, dagokionean, irekia, izanak, armatuak
- VERB-Part: izana, egina, hasia, irekia, izanak, armatuak, bateratua, eginak, esana, galdua
- Ind
- ADJ: nagusi, bizi, handirik, handiz, zuzen, ziur, berri, indartsu, sendo, ageri
- ADP: gabe, gabeko, kontra, aurka, artean, ezean, bezala, gain, gisan, kanpo
- ADV: seguruenik, gaurko, betirako, biharko, lehenbiziko, samar
- AUX: izateko, izanik, duenik, dutenen, egoteko, izan, izanez
- AUX-Part: izanik, izan, izanez
- DET: zer, gehiago, asko, ugari, horretarako, gutxi, beste, gehiegi, zein, askok
- NOUN: behar, nahi, uste, ezin, urte, ondorioz, aldiz, espero, lagun, ahal
- NUM: bana, 16na, 21na, 31na, banarekin, bedera
- PRON: zerbait, ezer, inork, inor, elkarrekin, norbait, elkar, elkarri, norbaitek, zertxobait
- PROPN: Briverekiko, EEBBetarako, Eurokoparako, Klodenekiko, Madrilen, OLBKren, Txetxeniarako, Vueltarako
- VERB: egiteko, emateko, izateko, eginez, erabiliz, lortzeko, irabazteko, jokatzeko, izan, jakiteko
- VERB-Part: eginez, erabiliz, izan, esanez, osaturik, utziz, eraginez, izanez, emanez, errespetatuz
Degree and Polarity
- Abs
- ADJ: azkarregi, handiegia, estuegiak, berantegi, garestiegi, Urrutiegi, alaiegia, altuegia, bigunegia, handiegi
- ADV: goizegi, urrunegi
- Cmp
- ADJ: handiagoa, azkarrago, errazago, indartsuago, sendoago, txikiagoa, txikiagoan, altuago, argiagoa, ezkorrago
- ADV: beranduago, geroago, gorago, lasaiago, atzerago, aurrerago, goizago, gusturago, maizago, mantsoago
- NOUN: nahiago, gehiago, beherago, haratago, Barrualderago, Errondagoa, atzerago, gehiagotan, lehenago, luzaroagoan
- VERB-Part: atsekabetuago, bermatuagoa, bideratuagoa, irekiagoa, orekatuagoa
- Sup
- ADJ: onena, garrantzitsuena, handiena, onenak, indartsuena, onenean, azkarrena, garrantzitsuenak, onenetakoa, egokiena
- ADP: arteko, artean, pare, zain
- ADV: ondoen, seguruenik, Goren, Ondoren, berrikien, larrien
- NOUN: onenetakoa, aktiboenetakoa, argienetakoa, bakarrenetakoa, eraginkorrenetakoa, oinarrizkoenetakoa
- VERB-Part: orekatuenak, Txalotuena, aurreratuenak, erabiliena, ezagutuenetakoa, zabalduena, zabalduenetakoa
- Neg
- PART: ez, ezetz
- Pos
- AUX: bada, bazuen, badira, badirela, baditu, badu, badute, baliteke, balituzkete, baziren
- PART: bai, baietz
- VERB: badu, baliteke, badago, badaude, bada, badakigu, badirudi, badaki, badakit, badira
Verbal Features
- Imp
- AUX-Inf: izaten, egoten, geratzen
- VERB-Inf: egiten, ematen, erabiltzen, ikusten, izaten, agertzen, esaten, hartzen, gertatzen, jarraitzen
- Perf
- AUX-Part: izan, ibili, geratu, egon
- VERB-Inf: merezita
- VERB-Part: egin, izan, esan, eman, joan, lortu, hasi, hil, irabazi, azaldu
- Prog
- AUX: da, dira, dela, zen, dago, den, zegoen, du, direla, daude
- VERB: da, du, dago, dute, dira, daude, dugu, dela, dut, zegoen
- Prosp
- AUX-Part: izango, egongo, izanen, ibiliko, egonen
- VERB-Part: izango, egingo, jokatuko, hartuko, egongo, emango, hasiko, aurkeztuko, joango, saiatuko
- Cnd
- AUX: litzateke, balitz, luke, nuke, balu, lirateke, litzaidake, lukeela, lukete, lioke
- VERB: nuke, luke, balitz, niken, Badakit, bagina, bailitzan, balego, banitu, bazekikeen
- Imp
- AUX: ezazu, itzazu, zaitez, ezan, ezazue, iezaiezu, Zaude, iezaidazu, iezaion, iezaiozu
- VERB: egizu, hago, Demagun, Hoa, emaidazu, zaude, zaudezte, zoaz, zoazte
- Ind
- AUX: da, zuen, zen, du, dira, dute, zuten, ziren, ditu, zituen
- VERB: da, du, dago, dute, dira, daude, dugu, dela, dut, zegoen
- Pot
- AUX: daiteke, dezake, daitezke, daitekeela, daitezkeen, liteke, daitekeen, dezakeen, dezakete, ditzakete
- VERB: baliteke, litekeena, lekarkioke, liteke
- Sub
- AUX: dadin, dezagun, dezan, dezala, dadila, daitezen, dezaten, ditzan, zezaten, daitezela
- VERB: dagokionean, zioen, dabiltzen, dagola, dauden, nindoala, zegoela, zihoazen
- Cau
- VERB: adierazi, jakinarazi, adierazten, ohartarazi, jakinaraziko, geldiarazi, gogorarazi, galarazi, gogorarazten, oroitarazi
Pronouns, Determiners, Quantifiers
- Int
- ADV: nola, zergatik, non, noiz, nondik, zelan, nora, zertan, noraino, nolaz
- PRON: nork, nor, noren, nori, nortzuren
- Prs
- PRON: gure, nire, nik, euren, guk, ni, zure, gu, beraiek, niri
- Card
- NUM: bat, bi, hiru, batean, baten, batek, lau, batez, bost, sei
- Ord
- NUM: azken, lehen, bigarren, hirugarren, lehenengo, laugarren, bosgarren, seigarren, II.a, lehena
- 1
- ADP: artean, inguruan, aldetik, begira, bezala, atzeko, barneko, buruan, zai, zain
- NOUN: geurea, nireak
- PRON: neure, neu, geu, geure, Geuregan, Geuri, Neuk
- 2
- ADP: artean, barneko, gain, gisara, inguruan
- PRON: Zeu, Zeuk, heure, zeure
- 3
- ADP: arteko, aitzinean, artean, esku, kontra
- PRON: zenbaitzuk
- Infm
- AUX: duk, dinat, dun, naun, diat, din, ditun, nian, zion, dik
- PRON: heure
- VERB: dun, dinat, duk, niken, zekiat, baditinagu, baditinat, bazaukan, dakinat, dik
Other Features
- Gender[dat]
- Masc
- AUX: diat, nian, zaik
- VERB: diagu
- Masc
- Gender[erg]
- Fem
- AUX: ezan, dun, dunala, iezaion, nazan
- VERB: daukanan
- Masc
- AUX: duan, duk
- VERB: Badakik, baduala, duk
- Fem
- Number[abs]
- Plur
- AUX: dira, ziren, ditu, zituen, dituzte, zituzten, diren, direla, gara, ditugu
- VERB: dira, daude, ditu, dauden, zeuden, ziren, dituzte, ditugu, datozen, zituen
- Sing
- AUX: da, zuen, zen, du, dute, zuten, den, dela, zion, duen
- VERB: da, du, dago, dute, dugu, dela, dut, zegoen, zuen, dio
- Plur
- Number[dat]
- Plur
- AUX: zien, die, diete, zieten, zigun, digu, zaie, digute, zaigu, zitzaien
- VERB: dagokienez, die, zaie, deritze, zaigu, dagokie, dagokienei, dagokigunez, dagozkie, dagozkien
- Sing
- AUX: zion, dio, zioten, diote, zaio, zitzaion, zait, zidan, diogu, dit
- VERB: dagokionez, dio, dagokion, zaio, zait, dagokio, dagokionean, diot, diogu, dagokionari
- Plur
- Number[erg]
- Plur
- AUX: dute, zuten, dituzte, dugu, zituzten, duten, zioten, ditugu, diote, genuen
- VERB: dute, dugu, zuten, duten, dituzte, ditugu, genuen, dutela, diote, badakigu
- Sing
- AUX: zuen, du, ditu, zituen, zion, duen, dut, duela, dio, zuenez
- VERB: du, dut, ditu, zuen, dio, duela, duen, dauka, dirudi, badu
- Plur
- Person[abs]
- 1
- AUX: naiz, gara, nintzen, ginen, nago, garela, naizela, nau, gaude, naiteke
- VERB: nago, gaude, naiz, gara, goaz, nengoen, geunden, nagoela, nenbilen, noa
- 2
- AUX: zara, haiz, zaitez, zinen, zaitu, zarela, zaitut, zarete, zintudan, Zaude
- VERB: zaude, zoaz, hago, zatoz, Hoa, bazabiltza, zaitugunok, zaitut, zara, zarete
- 3
- AUX: da, zuen, zen, du, dira, dute, zuten, ziren, ditu, zituen
- VERB: da, du, dago, dute, dira, daude, dugu, dela, dut, zegoen
- 1
- Person[dat]
- 1
- AUX: zait, zidan, zigun, digu, dit, zitzaidan, digute, litzaidake, zaigu, didate
- VERB: zait, zaigu, dabilkidalarik, dagokidan, dagokigunez, digute, emaidazu, zauzkigu, zitzaigun, zitzaizkidan
- 2
- AUX: zaizu, dizu, dizute, dizuet, zaizkizun, diat, dizut, genizuen, zaizkizu, bazaizu
- VERB: dagokizun, datorkizuna, diagu, diotsu, dizuet
- 3
- AUX: zion, dio, zioten, diote, zaio, zien, die, zitzaion, diete, zieten
- VERB: dagokionez, dagokienez, dio, dagokion, zaio, dagokio, dagokionean, diot, die, diogu
- 1
- Person[erg]
- 1
- AUX: dugu, dut, nuen, ditugu, genuen, ditut, diogu, dugun, ditugun, dezagun
- VERB: dugu, dut, ditugu, genuen, dakit, nuen, badakigu, diot, badakit, daukagu
- 2
- AUX: duzu, dituzu, duzue, ezazu, itzazu, zenuen, baduzu, dezakezu, dituzun, duzun
- VERB: duzu, badakizu, dakizu, diozu, baduzu, daramazu, dituzu, dituzue, duzue, egizu
- 3
- AUX: zuen, du, dute, zuten, ditu, zituen, zion, dituzte, duen, zituzten
- VERB: du, dute, ditu, zuen, dio, duela, duen, zuten, dauka, duten
- 1
- Polite[abs]
- Infm
- AUX: haiz, haiteke, haudala, hinduan, hintzen
- VERB: hago, Hoa
- Infm
- Polite[dat]
- Infm
- AUX: diat, nian, zaik
- VERB: diagu
- Infm
- Polite[erg]
- Infm
- AUX: ezan, huan, duan, duk, dun, dunala, iezaion, nazan
- VERB: Badakik, baduala, baheukan, daukanan, duk
- Infm
Syntax
Auxiliary Verbs and Copula
- This corpus uses 13 lemmas as copulas (cop). Examples: izan, egon, ukan, ibili, geratu, apropos, ari_izan, aurkari, gizon, onartu, sartu, sortu, txiki.
- This corpus uses 19 lemmas as auxiliaries (aux). Examples: *edun, izan, egin, *edin, *ezan, ari, ukan, baldin, ohi, egon, omen, jakin, eskertu, gelditu, geu, guzti, ibili, joan, oso.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN (332)
- VERB--NOUN-Abs (436)
- VERB--NOUN-Erg (376)
- VERB--NOUN-Gen (2)
- VERB--NOUN-Loc (1)
- VERB--NOUN-Par (44)
- VERB--PRON (57)
- VERB--PRON-Abs (13)
- VERB--PRON-Erg (11)
- VERB-Inf--NOUN (160)
- VERB-Inf--NOUN-Abs (202)
- VERB-Inf--NOUN-Erg (228)
- VERB-Inf--NOUN-Gen (2)
- VERB-Inf--NOUN-Gen-ADP(_) (1)
- VERB-Inf--NOUN-Par (7)
- VERB-Inf--PRON (22)
- VERB-Inf--PRON-Abs (3)
- VERB-Inf--PRON-Erg (9)
- VERB-Part--NOUN (627)
- VERB-Part--NOUN-ADP(_) (1)
- VERB-Part--NOUN-ADP(inguru) (1)
- VERB-Part--NOUN-Abs (873)
- VERB-Part--NOUN-Dat (2)
- VERB-Part--NOUN-Erg (1120)
- VERB-Part--NOUN-Gen (3)
- VERB-Part--NOUN-Gen-ADP(_) (1)
- VERB-Part--NOUN-Ine (1)
- VERB-Part--NOUN-Ine-ADP(inguru) (5)
- VERB-Part--NOUN-Loc (6)
- VERB-Part--NOUN-Par (25)
- VERB-Part--PRON (80)
- VERB-Part--PRON-Abs (11)
- VERB-Part--PRON-Cau (1)
- VERB-Part--PRON-Erg (13)
- obj
- VERB--NOUN (562)
- VERB--NOUN-ADP(arte) (1)
- VERB--NOUN-ADP(erdi) (1)
- VERB--NOUN-Abl (1)
- VERB--NOUN-Abs (1484)
- VERB--NOUN-All (1)
- VERB--NOUN-Erg (10)
- VERB--NOUN-Gen (6)
- VERB--NOUN-Par (111)
- VERB--PRON (3)
- VERB--PRON-Abs (22)
- VERB-Inf--NOUN (214)
- VERB-Inf--NOUN-ADP(inguru) (1)
- VERB-Inf--NOUN-Abs (491)
- VERB-Inf--NOUN-Erg (3)
- VERB-Inf--NOUN-Gen (4)
- VERB-Inf--NOUN-Gen-ADP(antzeko) (1)
- VERB-Inf--NOUN-Par (22)
- VERB-Inf--PRON (2)
- VERB-Inf--PRON-Abs (12)
- VERB-Part--NOUN (966)
- VERB-Part--NOUN-ADP(antzeko) (1)
- VERB-Part--NOUN-ADP(inguru) (2)
- VERB-Part--NOUN-Abl-ADP(gabe) (1)
- VERB-Part--NOUN-Abs (2442)
- VERB-Part--NOUN-All (2)
- VERB-Part--NOUN-Erg (13)
- VERB-Part--NOUN-Gen (1)
- VERB-Part--NOUN-Ins (1)
- VERB-Part--NOUN-Loc (4)
- VERB-Part--NOUN-Loc-ADP(inguru) (1)
- VERB-Part--NOUN-Par (141)
- VERB-Part--PRON-Abs (38)
- iobj
- VERB--NOUN (43)
- VERB--NOUN-Dat (137)
- VERB--PRON (6)
- VERB--PRON-Dat (3)
- VERB-Inf--NOUN (20)
- VERB-Inf--NOUN-Dat (58)
- VERB-Inf--NOUN-Par (1)
- VERB-Inf--PRON (5)
- VERB-Part--NOUN (79)
- VERB-Part--NOUN-Dat (329)
- VERB-Part--NOUN-Erg (1)
- VERB-Part--PRON (9)
- VERB-Part--PRON-Dat (7)
Relations Overview
- This corpus does not use relation subtypes.
- The following 7 relation types are not used in this corpus at all: expl, dislocated, clf, list, orphan, goeswith, reparandum