UD Estonian EDT
Language: Estonian (code: et
)
Family: Uralic, Finnic
This treebank has been part of Universal Dependencies since the UD v1.2 release.
The following people have contributed to making this treebank part of UD: Kadri Muischnek, Kaili Müürisep, Tiina Puolakainen, Andriela Rääbis.
Repository: UD_Estonian-EDT
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.2
License: CC BY-NC-SA 4.0
Genre: fiction, news, nonfiction
Questions, comments? General annotation questions (either Estonian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [kadri • muischnek (æt) ut • ee, kaili • muurisep (æt) ut • ee]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
Annotation | Source |
---|---|
Lemmas | annotated manually in non-UD style, automatically converted to UD |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | annotated manually in non-UD style, automatically converted to UD |
Features | annotated manually in non-UD style, automatically converted to UD |
Relations | annotated manually in non-UD style, automatically converted to UD |
Description
UD Estonian is a converted version of the Estonian Dependency Treebank (EDT), originally annotated in the Constraint Grammar (CG) annotation scheme, and consisting of genres of fiction, newspaper texts and scientific texts. The treebank contains 30,723 trees, 434,245 tokens.
The Estonian UD v2.3 treebank is based on the Estonian Dependency Treebank (EDT), created at the University of Tartu. The treebank has been automatically converted and then manually reviewed and reannotated.
The treebank covers 3 different genres, namely newspaper texts, fiction and scientific texts:
- fiction (67,744 tokens, 5,522 sentences)
- newspapers (263,279 tokens, 18,411 sentences)
- scientific texts (94,022 tokens, 5,483 sentences)
- Also, the subpart of Estonian part of HamleDT 3.0 treebank has been reannotated and included in the treebank; it contains 9,200 tokens in 1277 sentences.
Acknowledgments
We wish to thank all who have contributed to the original EDT annotation effort, especially Eleri Aedmaa, Riin Kirt and Dage Särg.
We also thank developers of udapi and ud annotatrix tools.
This work was financed by the National Programme for Estonian Language Technology and Estonian Ministery of Education and Research (grant 20-56 IUT20-56 “Computational models for Estonian”).
Statistics of UD Estonian EDT
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Abbr – AdpType – Case – Connegative – Degree – Foreign – Hyph – Mood – Number – NumForm – NumType – Person – Polarity – Poss – PronType – Reflex – Tense – VerbForm – Voice
Relations
acl – acl:relcl – advcl – advmod – amod – appos – aux – case – cc – cc:preconj – ccomp – compound – compound:prt – conj – cop – csubj – csubj:cop – dep – det – discourse – fixed – flat – flat:foreign – goeswith – list – mark – nmod – nsubj – nsubj:cop – nummod – obj – obl – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 30723 sentences and 434245 tokens.
- This corpus contains 66877 tokens (15%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 2591 types of words that contain both letters and punctuation. Examples: a., al., ω-3-rasvhapete, e., jt., võib-olla, aeg-ajalt, n., s.t, %-l, n-ö, s., enam-vähem, nn., m., L., südame-veresoonkonna, v., ω-3-rasvhapetega, d., %-ni, &, J., Kr., ω-6-rasvhapete, H., c., km/h, Esto-TV, Ida-Euroopa, ω-3-, ω-3-rasvhappeid, ω-rasvhapete, Põhja-Kaukaasia, USA-s, detrusor'i, k., kesk-, vt., P., e-posti, maa-ala, v.a., ω-linoleenhappe, Lääne-Euroopa, R., Shakespeare'i, b., g/kg/min, ja/või
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus does not use the following tags: PART
- This corpus contains 65 lemmas tagged as pronouns (PRON): ei-tea-mitmes, ei_keegi, ei_miski, esimene, iga, iga_sugune, iga_üks, ise, ise_enese, keegi, kes, kolmas, kumb, kumbki, kõik, mi-mina, milleks, milline, mina, minema, mingi, mingi_sugune, minu-mina, minu_sugune, mis, mis_sugune, miski, mitme_sugune, mitu, muu, mõlema, mõni, neljas, nemad, nii_paljuke, nii_sugune, oma, oma_enese, oma_sugune, oma_taoline, palju, sama, sama_sugune, see, see_sama, see_samune, see_sugune, selline, sihuke, sina, sinu_sugune, säärane, teie_sugune, teine, teine_teise, teineteise, teist_sugune, tema, tema_sugune, too, too_sama, üks, üks_teise, üks_teist, ükski
- This corpus contains 55 lemmas tagged as determiners (DET): Iga_üks, Oma, esimene, iga, iga_sugu, iga_sugune, keegi, kogu, kolmas, kumb, kumbki, kõik, meie_sugune, milline, mingi, mingi_sugune, minu_sugune, mis, mis_sugune, miski, mitme_sugune, mitmene, mitmes, mitu, muist, muu, mõlema, mõne_sugune, mõni, mõningane, mõningas, nihuke, nii_sugune, palju, sama, sama_sugune, see, see-ja-see, see_sama, see_sugune, selline, sihuke, siuke, säärane, taoline, teine, teist_sugune, tema_sugune, tema_taoline, terve, too, too_sama, üks, üks_teise, ükski
- Out of the above, 38 lemmas occurred sometimes as PRON and sometimes as DET: esimene, iga, iga_sugune, keegi, kolmas, kumb, kumbki, kõik, milline, mingi, mingi_sugune, minu_sugune, mis, mis_sugune, miski, mitme_sugune, mitu, muu, mõlema, mõni, nii_sugune, palju, sama, sama_sugune, see, see_sama, see_sugune, selline, sihuke, säärane, teine, teist_sugune, tema_sugune, too, too_sama, üks, üks_teise, ükski
- This corpus contains 21 lemmas tagged as auxiliaries (AUX): ei, hakka, jääma, nägema, näima, ole, olema, paistma, pida, pidama, pruukima, saa, saama, tahtma, tohti, tohtima, tulema, tunduma, või, võima, ära
- Out of the above, 13 lemmas occurred sometimes as AUX and sometimes as VERB: jääma, nägema, näima, olema, paistma, pidama, pruukima, saama, tahtma, tohtima, tulema, tunduma, võima
- There are 5 (de)verbal forms:
- Conv
- AUX: olles
- VERB: võrreldes, arvates, kasutades, öeldes, vaadates, arvestades, võttes, minnes, tehes, pidades
- Fin
- AUX: on, oli, pole, võib, ole, olid, oleks, peaks, olen, saab
- VERB: on, tuleb, ütles, sai, tuli, jääb, saab, läks, jäi, ütleb
- Inf
- AUX: olla, tunduda, hakata, paista, pidada, saada
- VERB: teha, saada, teada, võtta, näha, öelda, kasutada, minna, panna, leida
- Part
- ADJ: erinevate, teatud, seotud, tehtud, antud, tuntud, möödunud, erinevad, erinevaid, ülejäänud
- ADV: märgatavamalt, väidetavasti
- AUX: olnud, pidanud, saanud, võinud, tohtinud, paistnud, saand, saanudki, tohtinudki
- NOUN: hõivatute, hõivatud, uuritavat, hõivatuist, uuritavad, Eeltoodu, hõivatutest, nähtu, surnu, uuritavatel
- PROPN: Ühinenud, Avatud, Relvastatud, Hukkunud, Iseseisva, Sõltuvas, Ühendatud
- VERB: saanud, jäänud, jõudnud, seotud, teinud, tulnud, muutunud, tehtud, näinud, kasvanud
- Sup
- ADJ: polüküllastumata, küllastumata, mehitamata, saamata, teadmata, tulemata, alustamata, lõpetamata, etteteatamata, juhtimata
- AUX: olema, saama, Olemata, olemas, olemast
- VERB: olemas, minema, hakkama, tegema, saama, võtma, maksma, käima, vaatama, tulema
Nominal Features
- Plur
- ADJ: erinevate, uusi, suured, uute, erinevad, erinevaid, suurte, suuremad, uued, suuri
- ADJ-Part: erinevate, erinevad, erinevaid, erinevates, erinevatel, vastavad, kuuluvate, olevad, olevate, huvitavaid
- AUX-Fin: on, olid, võivad, oleme, peavad, olete, võiksid, peaksid, oleksid, saavad
- DET: kõik, need, nende, teiste, neid, mõned, kõigi, kõiki, teised, neist
- NOUN: sissetulekute, inimesed, sõnul, aastatel, inimeste, inimesi, andmete, mehed, aastate, ettevõtete
- NOUN-Part: hõivatute, hõivatud, hõivatuist, uuritavad, hõivatutest, uuritavatel, osalenute, vastanuist, kinnipeetavate, olemasolevaid
- NUM: pooled, tuhandeid, miljoneid, kümneid, miljardeid, tuhanded, sadu, sajad, kümnete, miljonite
- PRON: nad, nende, meie, kes, me, mis, neid, need, meil, mida
- PROPN: Nõukogude, Mõõdukad, Põhjamaade, Ühendriikide, Ametiühingute, Arstide, Baltimaade, Bekajd, Jagomägede, Mõõdukate
- VERB-Fin: on, saavad, said, hakkavad, jäävad, tulevad, teevad, annavad, jäid, kuuluvad
- Sing
- ADJ: suur, hea, võimalik, suurem, uue, suure, raske, oluline, esimene, viimase
- ADJ-Part: huvitav, erinev, vastava, vastav, erineva, erinevat, käesoleva, olev, meeldiv, oleva
- ADV: laiemalt, optimaalsemalt, otstarbekamalt, täis
- AUX-Fin: on, oli, võib, olen, saab, peab, olin, pidi, võis, ongi
- CCONJ: või
- DET: see, selle, üks, iga, seda, sel, ühe, sama, samal, mitu
- NOUN: aasta, aastal, aastat, raha, osa, krooni, korda, ajal, mõju, töö
- NOUN-Part: uuritavat, Eeltoodu, nähtu, surnu, allakirjutanu, juhtunu, toimunu, toimunut, uuritav, uuritava
- NUM: kaks, üks, kolm, 000, kahe, 1, ühe, miljonit, 2, viis
- PRON: ta, see, oma, mis, ma, seda, tema, kes, selle, mida
- PROPN: eesti, Eestis, Euroopa, Tartu, Tallinna, Peeter, Maa, Jan, Vene, Venemaa
- PROPN-Part: Iseseisva, Sõltuvas
- SYM: %, %-lt, %-le, %-ni, A-ga, A-ks, B-ga, C5-ga, Hg-ni, K-ga
- VERB-Fin: on, tuleb, ütles, sai, tuli, jääb, saab, läks, jäi, ütleb
- X: pruritus, Sorry, acid, basic, block, brief, fin, fungi, health, of
- Abe
- ADJ-Sup: polüküllastumata, küllastumata, mehitamata, saamata, teadmata, tulemata, alustamata, lõpetamata, etteteatamata, juhtimata
- AUX-Sup: Olemata
- NOUN: tasuta, abita, tööta, traadita, heakskiiduta, järelevalveta, vastuseta, Piirideta, eelarvamusteta, elaniketa
- PRON: minuta, selleta, milleta, selletagi, sinuta
- PROPN: Lufthansata, Visnapuuta
- VERB-Sup: rääkimata, saamata, teadmata, tegemata, hoolimata, sõltumata, kasutamata, tulemata, arvestamata, mõtlemata
- Abl
- ADJ: esimeselt, vasakult, puhtalt, teiselt, vahetumalt, 2008., Kaugelt, Vaimsetelt, Vanematelt, Vormikohastelt
- ADJ-Part: asuvalt, kasvavalt, lebavalt, olevalt, piirnevalt, saadavatelt, tiirlevatelt, valitsevatelt, vastujuhtuvatelt
- ADV: laiemalt, optimaalsemalt, otstarbekamalt
- DET: ühelt, teistelt, kõigilt, mitmelt, samalt, sellelt, Igasuguselt, igalt, minusuguselt, mitmetelt
- NOUN: töölt, maalt, seisukohalt, välismaalt, riigilt, inimestelt, katuselt, lavalt, põrandalt, kohalt
- NUM: ühelt, 100, miljonilt, 11, 1245, 3,7, 30-lt, 33-lt, 35, 58
- PRON: ühelt, teiselt, temalt, neilt, minult, omalt, millelt, teistelt, endalt, kellelt
- PROPN: Venemaalt, Prantsusmaalt, Saksamaalt, Landerilt, Maalt, Janilt, Kuubalt, Marsilt, Päikeselt, A.K-lt
- SYM: %-lt
- Add
- ADJ: uude, esimesse, laia, kohalikku, suurde, kummalisse, pikka, riiklikku, tagumisse, 16.
- DET: teise, mõnda, ühte, kumba, kumbagi, mitmesse
- NOUN: kätte, koju, tuppa, meelde, silma, selga, kööki, pähe, ellu, toime
- NUM: kahte, nelja, viide, ühte, -45,8, 1996, 45, 8-9, kolme, kuude
- PRON: teise, ühte, ühtegi
- PROPN: Tallinna, Liitu, ELi, Soome, Berliini, Hansapanka, Kadriorgu, Rootsi, Shveitsi, EL-i
- Ade
- ADJ: viimasel, järgmisel, eelmisel, esimesel, teisel, viimastel, suurel, 1999., varasematel, 16.
- ADJ-Part: erinevatel, käesoleval, tuleval, vaadeldaval, erineval, algavatel, järgnevatel, peetaval, vaadeldavatel, elaval
- DET: sel, samal, igal, ühel, sellel, mingil, sellisel, kõigil, mõnel, mõlemal
- NOUN: aastal, ajal, sõnul, juhul, aastatel, alusel, hommikul, päeval, õhtul, hetkel
- NOUN-Part: uuritavatel, ravituil, uuritaval, Allakirjutanul, juhtunul, jõudnutel, liitunutel, nähtul, olnutel, ravitutel
- NUM: kahel, kolmel, paaril, ühel, neljal, 10, kaheksal, kolmandikul, pooltel, 15
- PRON: mul, tal, meil, neil, kellel, sul, millel, kel, omal, teil
- PROPN: Venemaal, Saksamaal, Inglismaal, Iirimaal, Prantsusmaal, Hiiumaal, Toompeal, Eestil, Harjumaal, MMil
- All
- ADJ: uuele, suurele, suuremale, uutele, avalikule, praegusele, rasvhappelisele, endisele, strateegilistele, viimasele
- ADJ-Part: olevale, toimuvale, armastavatele, asuvale, elavale, erinevatele, kuuldavale, kättesaadavatele, kõikehõlmavale, näivale
- DET: sellele, kõigile, ühele, teistele, igale, samale, mõnele, kõikidele, teisele, mingile
- NOUN: tööle, lastele, inimesele, inimestele, tööhõivele, teele, ebavõrdsusele, riigile, küsimusele, põrandale
- NOUN-Part: tulnule, allakirjutanule, deporteeritutele, edasijõudnutele, eelnenule, elavale, elavatele, kannatanutele, käinutele, lahkunuile
- NUM: kahele, ühele, neljale, paarile, kolmele, kuuele, kümnele, 10, 12, 3243
- PRON: talle, endale, mulle, neile, sellele, meile, kellele, sulle, millele, teile
- PROPN: Eestile, Postimehele, Venemaale, Maale, Tõnule, Saksamaale, Inglismaale, Janile, Hiinale, Kerdile
- SYM: %-le, i-le
- VERB-Sup: minema
- Com
- ADJ: viimasega, 80ndatega, II-ga, Viimastega, abstraktsega, auklikuga, dekoratiivsega, dementsetega, eelmisega, eestikeelsetega
- ADJ-Part: toimuvaga
- DET: kõigiga
- NOUN: aastaga, osaajaga, käega, arhitektuuriga, nimega, punktiga, tööga, häälega, tõenäosusega, ω-3-rasvhapetega
- NOUN-Part: Eelnevaga, ennustatuga, koondatavaga, olemasolevaga, soovitatuga, tooduga
- NUM: ühega, 0,78, 17.99ga, 3.51,1-ga, 49,38ga, 54,68ga, kaheksa, miljoniga, nulliga, viiega
- PRON: sellega, millega, temaga, kellega, nendega, minuga, endaga, meiega, omaga, kellegagi
- PROPN: Liiduga, Sposatoga, Joogaga, NATOga, Savisaarega, Leeduga, Venemaaga, Allikuga, Eestiga, Euroopaga
- SYM: A-ga, B-ga, C5-ga, K-ga, i-ga
- Ela
- ADJ: keskmisest, suurest, esimesest, tavalisest, senisest, vanast, 1., uuest, endisest, mustast
- ADJ-Part: toimuvast, erinevatest, loodetust, eelnevast, mõjutavatest, olevast, toimuvatest, ümbritsevast, asuvast, erinevast
- AUX-Sup: olemast
- DET: sellest, neist, ühest, teistest, teisest, kõigist, mõnest, mitmest, samast, kõikidest
- NOUN: aastast, ajast, aastatest, elust, peast, algusest, küljest, tervisest, uksest, üldlipiididest
- NOUN-Part: hõivatuist, hõivatutest, vastanuist, eeltoodust, toodust, uurituist, uuritutest, vastanutest, Eelöeldust, alustanust
- NUM: kahest, kolmest, ühest, kuuest, neljast, 10, kümnest, sajast, viiest, üheksast
- PRON: sellest, neist, millest, endast, temast, kellest, nendest, meist, paljudest, minust
- PROPN: Eestist, Soomest, Tallinnast, Hiinast, Tartust, Moskvast, Itaaliast, Päikesest, Suurbritanniast, USAst
- SYM: %
- VERB-Sup: avaldamast, kommenteerimast, laulmast, registreerimast, tegemast, tulemast, tunnistamast, ennustamast, kaagutamast, kadumast
- Ess
- ADJ: esimesena, järgmisena, mõõdetuna, vaadatuna, võetuna, stabiilsena, 17aastasena, hinnatuna, koosnevana, lummatuna
- ADJ-Part: mõõdetuna, vaadatuna, võetuna, hinnatuna, koosnevana, lummatuna, Ajendatuna, Kaasuvana, aetuna, avatuna
- DET: ühena
- NOUN: reeglina, tulemusena, tervikuna, mõjurina, põhjusena, ainsana, näitajana, tegurina, mõjuritena, osana
- NOUN-Part: Ajendatuna, Kannatanuna, armununa, elavana, jaotatuna, juhatatuna, jõudnuna, kadunutena, kantuna, poolsurnuna
- NUM: nullina, ühena
- PRON: iseendana, Teisena, esimesena, kellena, sellisena, iseendina, millena, säärasena, ühena
- PROPN: Accordina, Ehatähena, Koidutähena, Liibanonina, Liliana
- Gen
- ADJ: uue, suure, viimase, erinevate, suurema, esimese, keskmise, uute, hea, suurte
- ADJ-Part: erinevate, vastava, erineva, käesoleva, oleva, asuva, kuuluvate, huvitava, olevate, sõltuva
- ADP: Läbi
- CCONJ: või
- DET: selle, ühe, nende, teiste, iga, mõne, kõigi, sellise, teise, sama
- NOUN: aasta, sissetulekute, riigi, töö, inimese, maailma, ebavõrdsuse, inimeste, aja, andmete
- NOUN-Part: hõivatute, osalenute, kinnipeetavate, surnu, uuritava, Eeltoodu, hukkunute, juhtunu, käinute, manipuleeritavuse
- NUM: kahe, ühe, miljoni, kolme, viie, poole, kümne, nelja, paari, 000
- PRON: oma, tema, nende, selle, mille, meie, minu, ta, kelle, enda
- PROPN: eesti, Euroopa, Tartu, Tallinna, Maa, Vene, Liidu, Soome, Venemaa, saksa
- PROPN-Part: Iseseisva
- SYM: %
- X: fungi, outcome, siecle'i
- Ill
- ADJ: endisesse, asuvasse, erinevatesse, suuremasse, uutesse, väikestesse, jahedasse, lähimasse, millisesse, pimedasse
- ADJ-Part: asuvasse, erinevatesse, nõustavasse, olemasolevatesse, põlevasse, ilmuvasse, loodavasse, marssivatesse, moodustuvatesse, mustavasse
- AUX-Sup: olema, saama
- DET: sellesse, neisse, samasse, igasse, mingisse, teistesse, nendesse, kellessegi, kõigisse, mingisugusesse
- NOUN: arvesse, haiglasse, masinatesse, voodisse, kohtusse, ehitistesse, autosse, taskusse, politseisse, sajandisse
- NUM: kümnetesse, esikaheksasse, miljarditesse, seitsmesse
- PRON: sellesse, endasse, temasse, millesse, kellesse, kellessegi, neisse, üksteisesse, millessegi, mitmetesse
- PROPN: Eestisse, Euroopasse, Tartusse, NATOsse, Tallinnasse, Moskvasse, Ameerikasse, Hiinasse, Helsingisse, Indiasse
- VERB-Sup: hakkama, tegema, minema, saama, võtma, maksma, käima, vaatama, tulema, andma
- Ine
- ADJ: esimeses, suures, erinevates, teises, käesolevas, viimases, uues, kolmandas, multiskalaarses, heas
- ADJ-Part: erinevates, käesolevas, asuvas, järgnevas, erinevas, muutuvas, põhinevas, iseseisvas, olevas, vaadeldavas
- AUX-Sup: olemas
- DET: selles, ühes, igas, teises, mõnes, teistes, neis, samas, mingis, kõigis
- NOUN: maailmas, mõttes, alguses, riigis, elus, aastas, keeles, lõpus, kodus, nädalas
- NOUN-Part: juhtunus, loodus, segatus
- NUM: ühes, kolmes, kahes, 10, 30, neljas, 12, 17, 40, 644-s
- PRON: selles, milles, neis, paljudes, endas, temas, paljuski, omas, minus, teises
- PROPN: Eestis, Tallinnas, Tartus, Euroopas, USAs, Hiinas, Soomes, Liidus, Rootsis, Moskvas
- PROPN-Part: Sõltuvas
- VERB-Sup: olemas, tulemas, valimas, tegemas, vaatamas, kasvamas, kujunemas, muutumas, tantsimas, esinemas
- Nom
- ADJ: suur, võimalik, suurem, hea, oluline, esimene, raske, uus, väike, viimane
- ADJ-Part: erinevad, huvitav, erinev, vastav, olev, meeldiv, põhinev, asuv, elav, vastavad
- ADV: täis
- DET: see, kõik, üks, need, iga, mitu, selline, mõni, mõned, mingi
- NOUN: mees, inimesed, inimene, osa, aeg, asi, naine, riik, osakaal, mõju
- NOUN-Part: hõivatud, uuritavad, allakirjutanu, Eeltoodu, nähtu, Surnu, Vastsündinu, loodu, ravitud, sõbrad-tuttavad
- NUM: kaks, üks, kolm, 1, 000, viis, neli, 2, paar, kümme
- PRON: ta, see, mis, ma, kes, nad, me, sa, need, ise
- PROPN: Peeter, Jan, Eesti, Tsee, Jüri, Tõnu, Mart, Ott, The, Jooga
- SYM: %, %-le, %-ni
- X: pruritus, Sorry, acid, basic, block, brief, fin, health, of, tšh
- Par
- ADJ: uusi, esimest, suurt, erinevaid, uut, head, suuri, suuremat, viimast, pikka
- ADJ-Part: erinevaid, erinevat, huvitavaid, toimuvat, vastavat, täiendavaid, täiendavat, vajaminevat, huvitavat, sobivat
- DET: seda, mingit, neid, kõiki, sellist, mingeid, selliseid, sama, mitmeid, teisi
- NOUN: aastat, korda, krooni, aega, raha, tegemist, tööd, aru, inimesi, inimest
- NOUN-Part: uuritavat, olemasolevaid, toimunut, juhtunut, kinnipeetavat, süüdistatavaid, edasijõudnuid, eeltoodut, elusolevat, hõivatuid
- NUM: miljonit, kahte, kolme, miljardit, tuhat, ühtegi, üht, nelja, tuhandeid, ühte
- PRON: seda, mida, midagi, neid, end, teda, mind, ennast, meid, keda
- PROPN: Eestit, Siiditeed, Liitu, Maad, Tallinna, Venemaad, Teist, Jani, Kristust, USAd
- SYM: %
- Ter
- ADJ: praeguseni, 1990ndateni, Homseni, mustjaspruunini, neljandani, segmentaarseteni, seitsmekümnendateni, äärmuslikeni, üheksakümnendateni
- NOUN: lõpuni, aastani, õhtuni, kroonini, dollarini, protsendini, päevani, detsembrini, keskpaigani, novembrini
- NUM: 17,1, 2,5, 2,8, 22,8, 29, 3, 3.30ni, 39,6, 40, 46,4
- PRON: selleni, meieni, milleni, minuni, teieni, paljudeni, temani
- PROPN: Keilani, Alaskani, Andreseni, Galileini, Inglismaani, Lapimaani, Liiduni, Marioni, Marjuni, Mihhailini
- SYM: Hg-ni
- Tra
- ADJ: selgeks, kindlaks, oluliseks, heaks, paremaks, esimeseks, puhtaks, suuremaks, tänaseks, nüüdseks
- ADJ-Part: sobivaks, iseseisvaks, juhtivaks, kättesaadavaks, määravaks, vähendavaks, rahuldavaks, soovitavaks, õnnestunuks, algavaks
- DET: üheks, selleks, igaks, mõneks, mitmeks, teiseks, esimeseks, samaks, Nendeks, Seks
- NOUN: lisaks, põhjuseks, aluseks, aastaks, eesmärgiks, ajaks, kasuks, lõpuks, õnneks, ülesandeks
- NOUN-Part: viibinuks, väljavalituteks
- NUM: kaheks, üheks, 99, kolmeks, neljaks, viieks, paariks, kuueks, pooleks, 000
- PRON: selleks, omaks, samaks, milleks, nendeks, selliseks, iseendaks, kelleks, kõigeks, paljudeks
- PROPN: Arpanetiks, Atriumiks, Cabernet'-veiniks, Chappaquaks, Entente'iks, Franckiks, Francoks, Freewomaniks, Hitleriks, Indiaks
- SYM: A-ks
- VERB-Sup: leidmaks, kirjeldamaks, vältimaks, näitamaks, rõhutamaks, selgitamaks, Andmaks, Jõudmaks, Kavandamaks, Saavutamaks
Degree and Polarity
- Cmp
- ADJ: suurem, suurema, parem, väiksem, suuremad, kõrgem, suuremat, lihtsam, kõrgema, parema
- ADJ-Part: adutavamaid, eelistatavamad, hinnatavam, konverteeritavam, nauditavam, nähtavam, soovitatavam
- ADV: laiemalt, optimaalsemalt, otstarbekamalt
- Pos
- ADJ: suur, hea, võimalik, uue, suure, eri, raske, oluline, valmis, viimase
- ADJ-Part: erinevate, teatud, seotud, tehtud, antud, möödunud, tuntud, erinevad, erinevaid, ülejäänud
- ADJ-Sup: polüküllastumata, küllastumata, mehitamata, teadmata, tulemata, alustamata, lõpetamata, saamata, etteteatamata, juhtimata
- Sup
- ADJ: parim, suurim, suurima, parimaks, kõrgeim, parima, parimad, suurimaks, tuntuim, suurimad
- Neg
- ADV: mitte, ega, ei
- AUX: ei, pole, polnud, poleks, ära, polegi, ärge, polnudki, polekski, polevat
- AUX-Fin: pole, polnud, poleks, ära, polegi, ärge, polnudki, polekski, polevat, ärgem
- CCONJ: ega
- VERB-Fin: pole, polnud, polegi, poleks, polnudki, NäE, kasutata, olevat, osta, palutud
Verbal Features
- Cnd
- AUX-Fin: oleks, peaks, võiks, poleks, võiksid, peaksid, saaks, oleksid, tohiks, olnuks
- VERB-Fin: tuleks, oleks, tahaks, saaks, annaks, läheks, tasuks, suudaks, tahaksin, teeks
- Imp
- AUX-Fin: olgu, ära, ole, ärge, olgem, ärgem, ärgu, Olge, saa, Ärme
- VERB-Fin: vaata, vt, tule, mine, kuule, näe, pane, võta, olgu, tee
- Ind
- AUX-Fin: on, oli, pole, võib, ole, olid, olen, saab, peab, saa
- VERB-Fin: on, tuleb, ütles, sai, tuli, jääb, saab, läks, jäi, ütleb
- Qot
- AUX-Fin: olevat, pidavat, polevat, võivat, olevatki, saavat
- VERB-Fin: olevat, tulevat, elustavat, hindavat, meeldivat, muutuvat, troonivat, tõusvat, viitavat, ajavat
- Imp
- AUX-Fin: oli, olid, pidi, olin, sai, said, sain, tohtinud
- VERB-Fin: liigutas, viskus, tõukas, liikus, tatsas, prantsatas, sõidutas, tilkus, liikusid, valas
- Past
- ADJ-Part: teatud, seotud, tehtud, antud, tuntud, möödunud, ülejäänud, nimetatud, loodud, jäänud
- AUX-Fin: oli, olid, polnud, olnud, olin, võis, pidi, sai, saanud, oligi
- AUX-Part: olnud, pidanud, saanud, võinud, tohtinud, paistnud, saand, saanudki, tohtinudki
- NOUN-Part: hõivatute, hõivatud, hõivatuist, Eeltoodu, hõivatutest, nähtu, surnu, allakirjutanu, osalenute, vastanuist
- PROPN-Part: Ühinenud, Avatud, Relvastatud, Hukkunud, Ühendatud
- VERB-Fin: ütles, sai, tuli, läks, jäi, oli, tegi, hakkas, võttis, andis
- VERB-Part: saanud, jäänud, jõudnud, seotud, teinud, tulnud, muutunud, tehtud, näinud, kasvanud
- Pres
- ADJ-Part: erinevate, erinevad, erinevaid, huvitav, erinev, vastava, vastav, erineva, erinevat, erinevates
- ADJ-Sup: tasumata
- AUX-Fin: on, pole, võib, ole, oleks, peaks, olen, saab, peab, saa
- NOUN-Part: uuritavat, uuritavad, uuritavatel, kinnipeetavate, olemasolevaid, uuritav, uuritava, uuritaval, kinnipeetavat, sõbrad-tuttavad
- PROPN-Part: Iseseisva, Sõltuvas
- VERB-Fin: on, tuleb, jääb, saab, ütleb, läheb, pole, hakkab, teeb, annab
- VERB-Part: toretsevat
- Act
- ADJ-Part: erinevate, möödunud, erinevad, erinevaid, ülejäänud, jäänud, toimunud, saanud, ilmunud, erinev
- ADJ-Sup: polüküllastumata, küllastumata, mehitamata, saamata, teadmata, tulemata, alustamata, lõpetamata, etteteatamata, juhtimata
- ADV-Part: väidetavasti
- AUX-Fin: on, oli, pole, võib, ole, olid, oleks, peaks, olen, saab
- AUX-Part: olnud, pidanud, saanud, võinud, tohtinud, paistnud, saand, saanudki, tohtinudki
- AUX-Sup: olema, saama, Olemata, olemas, olemast
- NOUN-Part: uuritavat, uuritavad, surnu, uuritavatel, allakirjutanu, osalenute, vastanuist, juhtunu, kinnipeetavate, olemasolevaid
- PROPN-Part: Ühinenud, Hukkunud, Iseseisva, Sõltuvas
- VERB-Fin: on, tuleb, ütles, sai, tuli, jääb, saab, läks, jäi, ütleb
- VERB-Part: saanud, jäänud, jõudnud, teinud, tulnud, muutunud, näinud, kasvanud, läinud, leidnud
- VERB-Sup: olemas, minema, hakkama, tegema, saama, võtma, maksma, käima, vaatama, tulema
- Pass
- ADJ-Part: teatud, seotud, tehtud, antud, tuntud, nimetatud, loodud, huvitav, saadud, suunatud
- AUX-Fin: ollakse, võidakse, oldi, olda, võidi, oldud, ollaksegi
- NOUN-Part: hõivatute, hõivatud, hõivatuist, Eeltoodu, hõivatutest, nähtu, ravituil, eeltoodust, etnofutu, loodu
- PROPN-Part: Avatud, Relvastatud, Ühendatud
- VERB-Fin: kasutatakse, peetakse, tehti, tehakse, hakati, leiti, nimetatakse, võeti, antakse, peeti
- VERB-Part: seotud, tehtud, toodud, antud, võetud, leitud, kirjeldatud, kasutatud, loodud, tingitud
- VERB-Sup: alustatama, arutletama, avatama, kirjutatama, lastama, saadetama, suletama, toodama
Pronouns, Determiners, Quantifiers
- Dem
- ADJ: selline, sama, säärane, samasugune, seesama, sellised, sellist, selliseid, niisugune, seesuguseid
- DET: see, selle, need, seda, sel, sama, nende, samal, teiste, selline
- NOUN: selle
- PRON: see, seda, selle, nende, sellest, need, neid, selleks, sellega, sellele
- PROPN: teise
- Ind
- ADJ: mingisuguseks, mingisugust
- DET: üks, ühe, mingi, mitu, mingit, mõne, mõni, mõned, ühel, üheks
- NUM: ühe
- PRON: midagi, keegi, paljud, muud, üks, muu, paljude, kedagi, kellelegi, paljudel
- Int
- ADJ: millised
- DET: milline
- PRON: kes
- Int,Rel
- ADJ: missugune, Missugust, milline, missugused, mitmendal, mitmendat
- ADV: kus
- DET: mis, millise, millist, missugune, missugused, kumb, millised, missugust, Milliseid, kumba
- PRON: mis, kes, mida, mille, kelle, millest, millega, kellel, milles, keda
- Prs
- ADJ: oma
- ADV: oma
- DET: Oma, nende
- NOUN: oma, Kõneleja
- PRON: ta, oma, ma, tema, nad, meie, me, sa, nende, minu
- PROPN: Meie
- Rcp
- DET: üksteise
- PRON: teineteist, teineteise, teineteisest, üksteist, üksteisest, teineteisele, üksteise, üksteisele, iseenda, üksteisega
- Rel
- ADJ: milline, millised, millist, kumb, millise, milliseid, millises, millisesse, milliste, milliseks
- ADV: kus
- DET: millise, millised, milliseid, millist, milline, kumma, kummas, millises, millisest
- PRON: mis, kes, mida, mille, milline, millised, kelle, kellel, keda, kellele
- Tot
- ADJ: kogu-
- DET: kogu, kõik, iga, igal, kõigi, kõiki, igas, mõlemad, kõigil, kõikide
- NOUN: Kõik, eas, ea, eani
- PRON: kõik, kõike, kõigile, mõlemad, kõiki, kõigil, igal, kõigele, kõigi, mõlema
- Card
- ADJ: Teine
- NOUN: IL-5, IL-3, IL-4
- NUM: kaks, 1, üks, 2, 000, kolm, 10, kahe, 3, ühe
- PROPN: GP-2, Sputnik-1, ZIL-130, 8, Kolme, MiG-29
- SYM: %, %-lt, %-le, %-ni
- Ord
- ADJ: esimene, esimest, 1., esimese, teine, 2000., 2., teise, 1997., 1999.
- NUM: kolmandat, 2000.-2001., I, Teine, esimest, kolmas, sajas, teise
- PROPN: Teist, Teise, Kolmanda, ADV, M, Esimene, Esimese, Neljanda, Neljandal, Teisel
- X: C
- Yes
- ADJ: oma
- ADV: oma
- DET: Oma
- NOUN: oma
- PRON: oma, omal, omad, omaks, omast, omaenda, omaga, omalt, omas, omadega
- Yes
- DET: üksteise
- PRON: ise, end, endale, enda, ennast, endast, endal, iseenda, enese, endaga
- 1
- AUX-Fin: olen, oleme, olin, pean, peame, olime, võime, saame, peaksime, oleksin
- PRON: ma, meie, me, minu, mul, mind, mina, meil, mulle, mu
- PROPN: Meie
- VERB-Fin: arvan, sain, mõtlesin, tean, ütlesin, nägin, tegin, mäletan, vaatan, läksin
- 2
- AUX-Fin: oled, olete, olid, ära, võid, ole, pead, ärge, võite, peate
- PRON: sa, te, teie, sinu, sul, sulle, sind, sina, su, teid
- VERB-Fin: vaata, tule, tahad, mine, tead, lähed, kuule, saad, näe, pane
- 3
- AUX-Fin: on, oli, võib, olid, saab, peab, võivad, ongi, pidi, võis
- DET: nende
- NOUN: Kõneleja
- PRON: ta, tema, nad, nende, talle, tal, teda, neid, neil, neile
- VERB-Fin: on, tuleb, ütles, sai, tuli, jääb, saab, läks, jäi, ütleb
Other Features
- Abbr
- Yes
- ADJ: nn, nn., van, I, %-se, %-st, 80'ndate, nim, nim., II-ga
- ADV: jne, jt., jt, s.t, sh, nt, n-ö, st, jm, jms
- CCONJ: &, e
- NOUN: a., a, USB, p, VD, g, km, cm, m, kr
- NUM: milj., milj
- PROPN: USA, AS, A., LRE, NATO, EL, N., de, HA, CDU
- SYM: =, *, §, 'i, sulev@ekspress.ee, C18:2n-6, C18:3n-3, anne@ekspress.ee, s., °C
- VERB-Fin: vt, vt., vrd
- X: al., of, in, to, D66, I, XXY, a, b, es
- Yes
- AdpType
- Post
- ADP: eest, kohta, vahel, järgi, jooksul, vastu, korral, puhul, all, pärast
- Prep
- ADP: üle, pärast, enne, koos, ilma, läbi, mööda, kuni, peale, alates
- Post
- Connegative
- Yes
- AUX: ole, saa, olnud, ei, tohi, pea, tohiks, saanud, oleks, peaks
- AUX-Fin: ole, saa, olnud, tohi, pea, tohiks, saanud, oleks, peaks, või
- VERB-Fin: tea, saa, taha, ole, suuda, oska, saanud, suutnud, tule, pruugi
- Yes
- Foreign
- Yes
- ADJ: druzhnõi
- ADV: nahui, so, u
- CCONJ: versus
- NOUN: camera, live, obscura
- PROPN: Holy, Night, O, Big, Dream, Earth, Sex, Song, Study
- X: tõ, ?????, Proopusk, in, jesh, la, stupai, á, ??????????, ?????????????
- Yes
- Hyph
- Yes
- ADJ: täis-, pika-, väike-, eesti-, keskeri-, 4-, Monomikro-, administratiiv-, ekstra-, era-
- ADP: siin-
- ADV: sisse-, Elektro-, jae-, mehe-, sinna-, vara-
- NOUN: teadus-, kesk-, haigus-, alg-, kodu-, laade-, majandus-, uurimis-, andme-, haridus-
- NUM: ω-3-, 1-, 2-, 10-, 3-, 5-, 6-, 7-, ω-6-, 128-
- PROPN: Kesk-, Haridus-, Kuurort-, Liha-, Lõuna-, Ida-, Julgeoleku-, Lähis-, Saare-, Agnese-
- PUNCT: --, ---
- SYM: A-, B-
- VERB-Fin: karjus-
- Yes
- NumForm
- Digit
- ADJ: 1., 2000., 2., 1997., 1999., 3., 1996., 1998., 1992., 1995.
- NUM: 1, 2, 000, 10, 3, 4, 5, 20, 15, 6
- PROPN: 8
- SYM: %, %-lt, %-le, %-ni
- Letter
- ADJ: esimene, esimest, esimese, teine, teise, esimesel, esimesed, esimeses, teisel, kolmas
- DET: üks
- NOUN: Esimese, paarid, poolt
- NUM: kaks, üks, kolm, kahe, miljonit, ühe, viis, miljoni, neli, kolme
- PRON: kolmandal
- PROPN: Teist, Teise, Kolmanda, Esimene, Esimese, Kolme, Neljanda, Neljandal, Teisel
- Roman
- ADJ: II, I, III, XI, XX, VI, IV, MDCXXXII, V, XIX
- NUM: I
- PROPN: ADV, M, CX, XM
- X: C
- Digit
Syntax
Auxiliary Verbs and Copula
- This corpus uses 2 lemmas as copulas (cop). Examples: olema, ole.
- This corpus uses 21 lemmas as auxiliaries (aux). Examples: olema, ei, võima, pidama, saama, tohtima, tunduma, ole, ära, näima, paistma, saa, pida, või, hakka, jääma, näiksema, pruukima, tahtma, tohti, tulema.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Conv--NOUN-Nom (1)
- VERB-Fin--NOUN (50)
- VERB-Fin--NOUN-All (1)
- VERB-Fin--NOUN-Ela (5)
- VERB-Fin--NOUN-Gen (14)
- VERB-Fin--NOUN-Gen-ADP(ringis) (1)
- VERB-Fin--NOUN-Gen-ADP(üle) (2)
- VERB-Fin--NOUN-Ine (2)
- VERB-Fin--NOUN-Nom (11312)
- VERB-Fin--NOUN-Par (1067)
- VERB-Fin--NOUN-Par-ADP(kuni) (1)
- VERB-Fin--PRON-Nom (5735)
- VERB-Fin--PRON-Par (133)
- VERB-Inf--NOUN (4)
- VERB-Inf--NOUN-Gen (3)
- VERB-Inf--NOUN-Nom (522)
- VERB-Inf--NOUN-Par (50)
- VERB-Inf--PRON-Nom (270)
- VERB-Inf--PRON-Par (15)
- VERB-Part--NOUN (3)
- VERB-Part--NOUN-Gen (7)
- VERB-Part--NOUN-Ine (1)
- VERB-Part--NOUN-Nom (1395)
- VERB-Part--NOUN-Par (111)
- VERB-Part--PRON-Nom (692)
- VERB-Part--PRON-Par (23)
- VERB-Sup--NOUN (2)
- VERB-Sup--NOUN-Gen (1)
- VERB-Sup--NOUN-Ine (1)
- VERB-Sup--NOUN-Nom (311)
- VERB-Sup--NOUN-Par (17)
- VERB-Sup--PRON-Nom (172)
- VERB-Sup--PRON-Par (5)
- obj
- VERB-Conv--NOUN (1)
- VERB-Conv--NOUN-Add (1)
- VERB-Conv--NOUN-Gen (47)
- VERB-Conv--NOUN-Nom (11)
- VERB-Conv--NOUN-Par (405)
- VERB-Conv--PRON-Gen (1)
- VERB-Conv--PRON-Nom (2)
- VERB-Conv--PRON-Par (32)
- VERB-Fin--NOUN (33)
- VERB-Fin--NOUN-Add (7)
- VERB-Fin--NOUN-Ela (2)
- VERB-Fin--NOUN-Gen (2179)
- VERB-Fin--NOUN-Gen-ADP(üle) (2)
- VERB-Fin--NOUN-Nom (1301)
- VERB-Fin--NOUN-Par (6050)
- VERB-Fin--NOUN-Par-ADP(kuni) (2)
- VERB-Fin--PRON-Gen (185)
- VERB-Fin--PRON-Nom (195)
- VERB-Fin--PRON-Par (1471)
- VERB-Inf--NOUN (2)
- VERB-Inf--NOUN-Add (2)
- VERB-Inf--NOUN-Ela (1)
- VERB-Inf--NOUN-Gen (298)
- VERB-Inf--NOUN-Nom (624)
- VERB-Inf--NOUN-Par (2495)
- VERB-Inf--NOUN-Par-ADP(kuni) (1)
- VERB-Inf--PRON-Add (1)
- VERB-Inf--PRON-Gen (24)
- VERB-Inf--PRON-Nom (59)
- VERB-Inf--PRON-Par (620)
- VERB-Part--NOUN (6)
- VERB-Part--NOUN-Add (2)
- VERB-Part--NOUN-Gen (310)
- VERB-Part--NOUN-Gen-ADP(üle) (1)
- VERB-Part--NOUN-Ill (1)
- VERB-Part--NOUN-Nom (730)
- VERB-Part--NOUN-Par (902)
- VERB-Part--NOUN-Par-ADP(kuni) (1)
- VERB-Part--PRON-Gen (28)
- VERB-Part--PRON-Nom (169)
- VERB-Part--PRON-Par (213)
- VERB-Sup--NOUN (2)
- VERB-Sup--NOUN-Gen (111)
- VERB-Sup--NOUN-Gen-ADP(alla) (1)
- VERB-Sup--NOUN-Ine (1)
- VERB-Sup--NOUN-Nom (31)
- VERB-Sup--NOUN-Par (786)
- VERB-Sup--PRON-Gen (7)
- VERB-Sup--PRON-Nom (2)
- VERB-Sup--PRON-Par (136)
Verbs with Reflexive Core Objects
- This corpus contains 191 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: tundma end, liigutama end, pidama ennast, ajama end, nimetama ennast, tundma ennast, hoidma end, nimetama end, registreerima end, seadma ennast, tasuma ennast, tegema ennast, tunnistama end, kuulutama end, laskma end, leidma end, liigutama ennast, lohutama end, pakkuma ennast, panema end, petma ennast, pidama end, seadma end, täiendama end, väitma end, võtma end, õigustama ennast, esitlema end, kaitsma end, keerama ennast, kohendama end, näitama end, paigutama ennast, pesema ennast, pidav end, pildistama end, pooma ennast, pressima end, registreerima ennast, samastama end, segama ennast, suruma end, suruma ennast, sättima end, sättima ennast, süstima end, tapma ennast, tuletama ennast, tutvustama end, tõestama ennast
- Out of those, 3 lemmas occurred more than once, but never without a reflexive dependent. Examples: pooma, samastama, välistav
Relations Overview
- This corpus uses 6 relation subtypes: acl:relcl, cc:preconj, compound:prt, csubj:cop, flat:foreign, nsubj:cop
- The following 5 relation types are not used in this corpus at all: iobj, expl, dislocated, clf, reparandum