UD Slovenian SST
Language: Slovenian (code: sl
)
Family: Indo-European, Slavic
This treebank has been part of Universal Dependencies since the UD v1.3 release.
The following people have contributed to making this treebank part of UD: Kaja Dobrovoljc, Joakim Nivre.
Repository: UD_Slovenian-SST
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.2
License: CC BY-NC-SA 4.0
Genre: spoken
Questions, comments? General annotation questions (either Slovenian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [kaja • dobrovoljc (æt) gmail • com]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually, natively in UD style |
UPOS | annotated manually, natively in UD style |
XPOS | annotated manually |
Features | annotated manually, natively in UD style |
Relations | annotated manually, natively in UD style |
Description
The Spoken Slovenian UD Treebank (SST) is the first syntactically annotated corpus of spoken Slovenian, based on a sample of the reference GOS corpus, a collection of transcribed audio recordings of monologic, dialogic and multi-party spontaneous speech in different everyday situations.
The Spoken Slovenian UD Treebank (SST) is the first syntactically annotated corpus of spoken Slovenian. The manual annotations have been performed on a representative sample of the reference Gos corpus of spoken Slovenian (Zwitter Vitez et al. 2013), a collection of transcribed audio recordings of monologic, dialogic and multi-party spontaneous speech in different everyday situations. The treebank is representative of speakers (sex, age, region, education), communication channels (TV, radio, telephone, personal contact) and communication settings (TV and radio shows, lectures, meetings, consultations, services, conversations between friends etc.).
The spelling, tokenization and segmentation principles follow the transcription guidelines of the reference corpus (Verdonik et al. 2013) with the syntactic trees spanning over individual utterances (semantically, syntactically and acoustically delimited units, roughly corresponding to written sentences). The morphological and syntactic analysis in the SST treebank has been performed on top of normalized transcriptions that reduce the number of token types due to regional, colloquial and other pronunciation variation. However, information on pronunciation-based transcription and tokenization has been included as part of the MISC column.
The SST treebank includes manual annotations of lemmas, part-of-speech categories, morphological features and dependency relations in accordance with the Universal Dependencies annotation scheme. In addition to language-specific extensions, in line with the written Slovenian UD Treebank, the SST treebank also includes new speech-specific extensions to accommodate the structural and pragmatic particularities of spoken language syntax, such as disfluencies, fillers, parentheticals, general extenders etc. More information on the treebank construction and annotation is given in Dobrovoljc and Nivre (2016).
The current version of the SST treebank includes 3,188 utterances (sentences) or 29,488 tokens, produced by 606 speakers in 287 different speech events. As opposed to previous releases with unequal genre distributions, sentence-level randomization and different train-dev-test splits (UDv1 to UDv2.1), the SST UDv2.2 data has been randomized on text-level and split into testing (10,015) and training (19,473) subsets, in accordance with the CONLL-ST 2018 requirements. The original order of the utterances can be restored by sentence IDs.
Acknowledgments
Kaja Dobrovoljc (treebank construction and annotation) Joakim Nivre (guidelines consulting)
Statistics of UD Slovenian SST
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB – X
Features
Animacy – Aspect – Case – Definite – Degree – Foreign – Gender – Gender[psor] – Mood – Number – Number[psor] – NumForm – NumType – Person – Polarity – Poss – PronType – Tense – Variant – VerbForm
Relations
acl – advcl – advmod – amod – appos – aux – case – cc – cc:preconj – ccomp – conj – conj:extend – cop – csubj – det – discourse – discourse:filler – dislocated – expl – fixed – flat – flat:foreign – flat:name – goeswith – iobj – mark – nmod – nsubj – nummod – obj – obl – orphan – parataxis – parataxis:discourse – parataxis:restart – punct – reparandum – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 3188 sentences and 29488 tokens.
- All tokens in this corpus are followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 13 types of words that contain both letters and punctuation. Examples: [gap], [name:personal], [pause], [speaker:laughter], [name:surname], [audience:laughter], [:voice], [all:laughter], [incident], [name:address], [name:organisation], [name:place], macdonald's
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB, X
- This corpus does not use the following tags: SYM
- This corpus contains 46 word types tagged as particles (PART): alora, arki, baje, baš, bržkone, celo, da, domala, edino, evo, i, itak, ja, kajne, kajneda, le, ma, menda, morda, naj, najbrž, najsibo, ne, niti, no, pač, prav, pravzaprav, predvsem, ravno, samo, seveda, sicer, skoraj, skorajda, sploh, tipo, tudi, valjda, več, vsaj, zgolj, zlasti, še, šele, že
- This corpus contains 18 lemmas tagged as pronouns (PRON): jaz, kaj, kar, karkoli, kdo, kdor, kdorkoli, marsikaj, nekdo, nihče, nobeden, on, se, ti, vame, zame, zase, što
- This corpus contains 52 lemmas tagged as determiners (DET): dosti, dovolj, enak, isti, kak, kakršen, kakršenkoli, kakšen, kateri, katerikoli, koliko, kolikšen, malce, malo, manj, mnog, moj, najin, največ, naš, nek, nekaj, nekateri, nikakršen, nič, njegov, njen, njihov, noben, oba, obadva, ogromno, oni, ovi, par, pol, preveč, svoj, ta, tak, takle, takšen, tale, tisti, toliko, tvoj, vaš, veliko, ves, več, vsak, četrt
- This corpus contains 1 lemmas tagged as auxiliaries (AUX): biti
- Out of the above, 1 lemmas occurred sometimes as AUX and sometimes as VERB: biti
- There are 5 (de)verbal forms:
- Conv
- ADV: rekoč
- Fin
- AUX: je, so, sem, bi, bo, smo, ni, si, bomo, ste
- VERB: je, vem, veš, mislim, ni, recimo, ima, so, bo, pravi
- Inf
- AUX: biti
- VERB: biti, narediti, reči, iti, videti, delati, imeti, priti, kupiti, pomagati
- Part
- ADJ: vnet, preverjeno, znan, odprta, pozdravljeni, rečeno, imenovana, imenovani, narejeno, ostali
- AUX: bila, bil, bilo, bili, bile
- VERB: bilo, bil, imela, rekel, imeli, šla, bila, imel, rekla, rekli
- Sup
- VERB: delat, jest, ponavljat, žegnat, gledat, izpeljat, naročit, osvajat, peljat, preverjat
Nominal Features
- Fem
- ADJ: drugo, druga, lepa, rdeča, same, druge, glavna, sama, dobra, tretjo
- ADJ-Part: odprta, postavljena, zagrožena, dani, določena, določeni, fiksirana, imenovana, imenovani, izdelano
- AUX-Part: bila, bile
- DET: ta, te, to, tej, take, naša, neke, neko, teh, moja
- NOUN: strani, stvari, hvala, minut, stopinj, gospa, stran, razmere, stvar, veze
- NUM: eno, ena, dve, ene, tri, štiri, dveh, eni, treh, štirih
- PRON: jo, ona, jih, ji, je, njej, njo, midve, me, nje
- PROPN: slovenija, sloveniji, slovenije, božjah, karavanke, bistrica, evropi, jugoslaviji, orsa, viktorije
- VERB-Part: imela, šla, bila, rekla, videla, dala, naredila, delala, izdala, mogla
- Masc
- ADJ: dober, prvi, drugi, lep, sam, stari, mali, sami, cel, pravi
- ADJ-Part: vnet, znan, pozdravljeni, ostali, prepričan, pripravljen, pripravljeni, spočit, znani, delujoč
- AUX-Part: bil, bili, bila
- DET: ta, tisti, tem, vsi, tega, kakšen, ti, oni, vsak, teh
- NOUN: dan, redu, čas, evrov, koncu, gospod, ljudi, način, dni, del
- NUM: dva, en, enega, tri, eden, eni, štirje, enim, štiri, trije
- PRON: ga, mi, jih, kdo, vi, on, jim, mu, oni, njega
- PROPN: jones, tom, david, healy, iraku, jezus, herman, paranoid, petty, quincy
- VERB-Part: bil, rekel, imeli, imel, rekli, šel, dobil, videl, videli, mogel
- Neut
- ADJ: dobro, glavnem, zanimivo, drugega, mogoče, drugo, hudega, jasno, podobno, pomembno
- ADJ-Part: preverjeno, rečeno, narejeno, ostalo, prikazano, določeno, dovoljeno, imenovana, izrečeno, izrisano
- AUX-Part: bilo, bila
- DET: to, vse, nič, tem, tega, nekaj, tisto, tole, temu, tako
- NOUN: bistvu, jutro, leto, leta, vprašanje, letih, ime, mestu, let, leti
- NUM: eno, tri, ena, dve, enim, tremi, štirih, štirim
- PRON: kaj, kar, česa, čim, jih, karkoli, ga, marsikaj, čem, čemer
- PROPN: pohorja, celja, jezerskim, laškega, madžarskem, pohorje, posočju, velenju
- VERB-Part: bilo, šlo, prišlo, zgodilo, dalo, ostalo, moglo, moralo, potegnilo, ratalo
- Anim
- NOUN: cimra, gospoda, otroka, sina, atija, babeka, dedca, duha, ekonomista, eksponenta
- PROPN: arturja, boruca, giordanota, miklavža, petra, planinška, poljanška, sinclairja
- Inan
- NOUN: dan, način, petek, denar, izraz, teden, primer, čas, konec, mesec
- PROPN: paranoid, rodik, triglav, erasmus, etnoblog, frutiq, ikš, lech, maribor, piran
- Dual
- ADJ: blagovni, blagovnih, cela, drugih, grozna, mali, napisana, predvidena, spodnji, sprejeta
- ADJ-Part: napisana, predvidena, sprejeta, upognjena
- AUX-Fin: sta, sva, bova, bosta, nisva
- AUX-Part: bila
- DET: obe, oba, obeh, moja, obadva, ona, onih, takšni, ti
- NOUN: dni, elementa, milijona, akterja, bivola, brata, datuma, disciplinah, dneva, dogodka
- NUM: dva, dve, dveh
- PRON: midve, onadva, vidva, midva, nama, vidve, njima, vaju
- PROPN: američanki, italijanki, štajer
- VERB-Fin: sta, gledava, imava, dajva, greva, imata, morata, sva, vesta, bosta
- VERB-Part: šla, bila, prišla, imela, našla, brala, dobila, dogovarjala, dosegla, izmislila
- Plur
- ADJ: sami, zadnjih, same, dobri, druge, drugih, ljudske, psihološki, tujih, bogatejši
- ADJ-Part: ostali, ostalih, pozdravljeni, pripravljeni, znani, dogovorjeni, določene, imenovana, izplačane, izrisane
- AUX-Fin: so, smo, bomo, ste, boste, bodo, nismo, niso, bojo, bodite
- AUX-Part: bili, bila, bile
- DET: te, teh, vsi, take, ti, tistih, vse, naših, vseh, kakšne
- NOUN: evrov, ljudi, stvari, dni, minut, stopinj, letih, let, razmere, leti
- NUM: tri, tisoč, dvajset, pet, petnajst, štiri, sto, šest, deset, petdeset
- PRON: jih, mi, nas, vi, vam, jim, vas, oni, nam, nami
- PROPN: božjah, karavanke, ledinah, triestini, zrečah, alpe, američanov, beatlese, benetke, božje
- VERB-Fin: recimo, so, imamo, imajo, imate, gremo, vemo, smo, greste, moramo
- VERB-Part: imeli, rekli, videli, dali, dobili, šli, bili, delali, naredili, prišli
- Sing
- ADJ: dobro, drugo, prvi, dober, drugi, zanimivo, druga, drugega, glavnem, lep
- ADJ-Part: vnet, preverjeno, znan, odprta, rečeno, imenovani, narejeno, ostalo, postavljena, prepričan
- AUX-Fin: je, sem, bo, ni, si, bom, boš, nisem, nisi, biti
- AUX-Part: bil, bila, bilo
- DET: to, ta, vse, tem, tega, nič, tisto, nekaj, tole, tisti
- NOUN: bistvu, dan, redu, strani, jutro, leto, čas, koncu, gospod, hvala
- NUM: eno, en, ena, enega, ene, eden, enim, eni, enemu
- PRON: kaj, jaz, ti, mi, ga, jo, kar, kdo, on, ona
- PROPN: slovenija, sloveniji, jones, slovenije, tom, david, healy, iraku, jezus, bistrica
- VERB-Fin: je, vem, veš, mislim, ni, ima, bo, pravi, gre, imaš
- VERB-Part: bilo, bil, rekel, imela, šla, bila, imel, rekla, šel, šlo
- Acc
- ADJ: dobro, drugo, celo, dober, prvi, drugi, cel, lep, prvo, druge
- ADJ-Part: zagotovljeno, dogovorjen, določene, določeno, izdelano, izolirano, izplačane, nagubano, napisana, napisano
- ADP: za, na, v, po, čez, med, skozi, skoz, nad, pod
- DET: to, vse, ta, te, nič, nekaj, tisto, neko, tole, kakšen
- NOUN: dan, jutro, leto, način, petek, denar, izraz, teden, primer, stran
- NUM: eno, dva, en, tri, dvajset, sto, tisoč, dve, enega, štiri
- PRON: kaj, ga, jih, jo, me, kar, nas, te, vas, mene
- PROPN: paranoid, ameriko, rodik, triglav, albanijo, ano, arturja, avstralijo, beatlese, benetke
- Dat
- ADJ: drugemu, državni, javnim, krompirjevi, krompirjevim, levi, meteorološki, meteorološkim, neumnemu, novim
- ADP: k, proti, h, kljub, navkljub
- DET: temu, tem, vsakemu, mojemu, nobenemu, onemu, svojemu, svojim, tej, vsem
- NOUN: bogu, očetu, analizam, bližnjici, borcu, familijam, gospodu, gostom, hiši, izobraževanju
- NUM: enemu, štirim
- PRON: mi, si, ti, vam, meni, jim, mu, ji, nam, njemu
- PROPN: robertu, savianu, turnšku
- Gen
- ADJ: drugega, drugih, hudega, novega, druge, slovenske, drobnih, finančnih, iraških, logarske
- ADJ-Part: gorečega, imenovanega, ostalih, pogojenih, preiskovanih, pripetih, prisiljenih, prodanih, rezerviranega, zadolžene
- ADP: od, do, iz, brez, z, zaradi, s, poleg, preko, blizu
- DET: tega, teh, tistih, naše, neke, te, nobene, nobenega, takega, takšnega
- NOUN: evrov, leta, dni, ljudi, minut, stopinj, časa, let, veze, stvari
- NUM: ene, enega, osmih, petih, sedmih, dvajsetih, dvanajstih, enih, osemdesetih, treh
- PRON: jih, ga, mene, česa, je, me, nas, nje, te, tebe
- PROPN: slovenije, pohorja, viktorije, iraka, mure, afrike, američanov, borna, camorre, celja
- Ins
- ADJ: drugo, tretjo, vremenskimi, kratkim, pravim, aktivnim, belo, bivšim, debelim, dobrimi
- ADJ-Part: sesekljanimi
- ADP: z, s, pred, med, nad, pod, za
- DET: tem, katerimi, neko, tisto, njihovo, onim, temi, tistim, kakšnimi, katerim
- NOUN: leti, copati, pinceto, pojavi, stresom, avtom, bajto, besedami, dnevi, gospodom
- NUM: enim, eno, dvanajstimi, enaindvajsetimi, petdesetimi, sedemnajstimi, tremi, štirinajstimi
- PRON: nami, mano, njimi, sabo, vami, njo, čim, njim, seboj, tabo
- PROPN: [name:personal], [name:surname], andersonom, avstrijo, bennyjem, bojanom, dimitrijem, dimom, istrabenzom, jezerskim
- Loc
- ADJ: glavnem, zadnjih, drugi, prvi, spletni, laični, majhni, beli, bolniški, delovnih
- ADJ-Part: dani, določenem, določeni, imenovani, omenjenem, ostalih, združenih, znanem
- ADP: v, na, pri, po, o, ob
- DET: tem, tej, teh, tistem, naših, katerih, naši, nekem, neki, vsakem
- NOUN: bistvu, redu, strani, koncu, letih, mestu, primeru, nadaljevanju, začetku, trenutku
- NUM: dveh, eni, štirih, desetih, devetnajstih, enajstih, petih, treh
- PRON: nas, njej, meni, njih, njem, sebi, vas, čem, čemer
- PROPN: sloveniji, božjah, iraku, evropi, jugoslaviji, gazi, ledinah, ljubljani, zrečah, aktualu
- Nom
- ADJ: druga, lepa, rdeča, sam, stari, zanimivo, dober, mali, drugi, prvi
- ADJ-Part: vnet, preverjeno, znan, odprta, pozdravljeni, rečeno, imenovana, ostali, ostalo, postavljena
- DET: to, ta, vse, nič, tisti, vsi, ti, te, nekaj, tisto
- NOUN: gospod, hvala, gospa, oče, problem, vprašanje, čas, človek, del, a
- NUM: ena, en, dva, tisoč, tri, šest, devet, eden, pet, dve
- PRON: jaz, kaj, ti, mi, kdo, vi, on, ona, kar, oni
- PROPN: slovenija, jones, tom, david, healy, jezus, karavanke, bistrica, herman, orsa
- Def
- ADJ: drugi, mali, stari, pravi, zalivski, boljši, edini, morski, naslednji, celi
- ADJ-Part: delujoči, imenovani, nariti, pozdravljeni, vladajoči
- Ind
- ADJ: dober, lep, sam, cel, velik, vnet, slab, znan, drug, moder
- ADJ-Part: vnet, znan, prepričan, pripravljen, spočit, delujoč, dodan, dogovorjen, izračunan, izvrševan
Degree and Polarity
- Cmp
- ADJ: mlajši, bogatejši, boljše, boljši, manjše, manjši, večja, večji, večje, boljša
- ADV: bolj, prej, rajši, kasneje, večkrat, bolje, boljše, ceneje, dlje, konkretneje
- Pos
- ADJ: dobro, dober, zanimivo, glavnem, lep, lepa, mali, rdeča, sam, stari
- ADJ-Part: vnet, preverjeno, znan, odprta, pozdravljeni, rečeno, imenovana, imenovani, narejeno, ostali
- ADV: tako, zdaj, a, pol, kako, lahko, tam, kar, potem, res
- Sup
- ADJ: največja, največji, najbogatejši, najboljša, najboljše, najdebelejši, najlažje, najljubše, najnovejšo, največje
- ADV: najprej, najbolj, najmanj, najrajši, najboljše
- Neg
- AUX-Fin: ni, nisem, nismo, niso, nisi, niste, nisva
- PART: ne
- VERB-Fin: ni, nima, nimam, nisem, nimajo, niso, noče, nimamo, nimate, nimaš
- Pos
- AUX-Fin: je, so, sem, bo, smo, si, bomo, ste, bom, sta
- VERB-Fin: je, ima, so, bo, imamo, imaš, imajo, imate, sem, imam
- Bound
- PRON: zanjo, vanj, zame, zanj, zase, zate
- Short
- PRON: se, mi, ga, jih, si, ti, jo, me, jim, mu
Verbal Features
- Imp
- AUX-Part: bil, bilo
- VERB-Fin: vem, veš, mislim, ima, imamo, imaš, imajo, zdi, imate, imam
- VERB-Inf: delati, imeti, jesti, pisati, gnati, govoriti, hoditi, prositi, barvati, brati
- VERB-Part: imela, imeli, imel, mogel, delal, delali, mislil, delala, mogla, poznal
- VERB-Sup: delat, jest, ponavljat, gledat, osvajat, peljat, preverjat, sekirat, čakat, štet
- Perf
- VERB-Fin: recimo, daj, da, pride, daš, povej, reče, poglejte, prideš, dobijo
- VERB-Inf: narediti, reči, priti, kupiti, povedati, vprašati, pogledati, spraviti, stisniti, dati
- VERB-Part: rekel, rekla, rekli, dobil, dala, dali, dobili, prišla, prišlo, povedal
- VERB-Sup: izpeljat, naročit, vrnit
- Cnd
- AUX-Fin: bi
- VERB-Fin: bi
- Imp
- AUX-Fin: bodite, bodi
- VERB-Fin: recimo, daj, glej, čakaj, povej, glejte, poglejte, gremo, dajmo, požri
- Ind
- AUX-Fin: je, so, sem, bo, smo, ni, si, bomo, ste, bom
- VERB-Fin: je, vem, veš, mislim, ni, ima, so, bo, pravi, imamo
- Fut
- AUX-Fin: bo, bomo, bom, boš, boste, bodo, bova, bosta, bojo
- VERB-Fin: bo, bom, boš, bodo, bomo, bojo, bosta, bova
- Pres
- AUX-Fin: je, so, sem, smo, ni, si, ste, sta, nisem, nismo
- VERB-Fin: je, vem, veš, mislim, ni, ima, so, pravi, imamo, gre
Pronouns, Determiners, Quantifiers
- Dem
- DET: to, ta, tem, tega, te, tisto, teh, tisti, tole, take
- Ind
- DET: malo, nekaj, več, dosti, toliko, veliko, pol, manj, preveč, neko
- PRON: nekdo, nekoga, nekomu, marsikaj
- Int
- DET: koliko, kakšen, kakšna, kakšne, kakšni, kateri, kako, kakšno, katere, katerih
- PRON: kaj, kdo, česa, koga, čim, komu, čem, čemu, što
- Neg
- DET: nič, noben, nobene, nobenega, nobena, nikakršne, ničesar, nobenem, nobenemu, nobeni
- PRON: nihče, nobeden
- Prs
- ADJ: sirovo, andrejevo, belvijevega, bertrandova, blaževi, bučkino, centrovi, dolinarjeva, gobovo, heglovem
- DET: naša, naše, moja, naš, naši, svoje, moje, naših, moj, mojega
- PRON: se, jaz, mi, ti, ga, jih, si, jo, nas, vi
- Rel
- DET: kakršnakoli, kakršne, kakršni, kateremkoli
- PRON: kar, karkoli, kdor, kdorkoli, čemer, česar
- Tot
- DET: vse, vsi, vsak, vsako, vseh, vsa, obe, vsakega, vsakem, vsakemu
- Card
- NUM: eno, dva, en, ena, tri, tisoč, dvajset, dve, pet, enega
- Mult
- ADJ: dvojni, dvojno, trojni
- Ord
- ADJ: prvi, prvo, prva, tretjo, prvega, devetindvajseti, peta, tretja, tretji, trideseti
- Sets
- NUM: dvoje
- Yes
- ADJ: sirovo, andrejevo, belvijevega, bertrandova, blaževi, bučkino, centrovi, dolinarjeva, gobovo, heglovem
- DET: naša, naše, moja, naš, naši, moje, naših, moj, mojega, tvoja
- 1
- AUX-Fin: sem, smo, bomo, bom, nisem, nismo, sva, bova, nisva
- DET: naša, naše, moja, naš, naši, moje, naših, moj, mojega, mojo
- PRON: jaz, mi, nas, me, meni, mene, nam, nami, mano, midve
- VERB-Fin: vem, mislim, recimo, imamo, sem, imam, gremo, bom, moram, prosim
- 2
- AUX-Fin: si, ste, boš, boste, nisi, bodite, niste, bodi
- DET: tvoja, vaš, vaša, vaše, vašo, tvoj, tvoje, tvoji, tvojo, vašega
- PRON: ti, vi, vam, te, vas, vami, tebe, tebi, vidva, tabo
- VERB-Fin: veš, imaš, daj, imate, si, glej, čakaj, daš, greš, moraš
- 3
- AUX-Fin: je, so, bo, ni, sta, bodo, niso, bosta, bojo, biti
- DET: njegova, njeni, njihove, njihovega, njihovo, njegove, njegovo, njen, njene, njeno
- PRON: ga, jih, jo, on, ona, jim, mu, ji, oni, njega
- VERB-Fin: je, ni, ima, so, bo, pravi, gre, imajo, zdi, da
- Fem
- DET: njeni, njen, njene, njeno
- Masc
- DET: njegova, njegove, njegovo
- Dual
- DET: najino
- Plur
- DET: naša, naše, naš, naši, naših, našega, našo, vaš, vaša, vaše
- Sing
- DET: moja, moje, moj, mojega, tvoja, mojo, mojemu, njegova, njeni, tvoj
Other Features
- Foreign
- Yes
- X: green, of, grass, home, non, stop, beautiful, day, fa, gung
- Yes
- NumForm
- Word
- NUM: eno, dva, en, ena, tri, tisoč, dvajset, dve, pet, enega
- Word
Syntax
Auxiliary Verbs and Copula
- This corpus uses 2 lemmas as copulas (cop). Examples: biti, _.
- This corpus uses 2 lemmas as auxiliaries (aux). Examples: biti, _.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Fin--NOUN-Gen (35)
- VERB-Fin--NOUN-Nom (263)
- VERB-Fin--NOUN-Nom-ADP(kakor) (1)
- VERB-Fin--PRON-Gen (4)
- VERB-Fin--PRON-Nom (215)
- VERB-Part--NOUN-Gen (15)
- VERB-Part--NOUN-Nom (100)
- VERB-Part--PRON-Gen (7)
- VERB-Part--PRON-Nom (138)
- obj
- VERB-Fin--NOUN-Acc (254)
- VERB-Fin--NOUN-Acc-ADP(preko) (1)
- VERB-Fin--NOUN-Dat (5)
- VERB-Fin--NOUN-Gen (51)
- VERB-Fin--NOUN-Gen-ADP(preko) (1)
- VERB-Fin--NOUN-Gen-ADP(čez) (1)
- VERB-Fin--NOUN-Nom (4)
- VERB-Fin--PRON-Acc (155)
- VERB-Fin--PRON-Dat (76)
- VERB-Fin--PRON-Gen (17)
- VERB-Fin--PRON-Nom (1)
- VERB-Inf--NOUN-Acc (45)
- VERB-Inf--NOUN-Gen (10)
- VERB-Inf--NOUN-Nom (2)
- VERB-Inf--PRON-Acc (17)
- VERB-Inf--PRON-Dat (2)
- VERB-Inf--PRON-Gen (3)
- VERB-Part--NOUN-Acc (217)
- VERB-Part--NOUN-Acc-ADP(navkljub) (1)
- VERB-Part--NOUN-Gen (37)
- VERB-Part--PRON-Acc (83)
- VERB-Part--PRON-Dat (35)
- VERB-Part--PRON-Gen (10)
- VERB-Sup--NOUN-Acc (7)
- iobj
- VERB-Fin--NOUN-Dat (3)
- VERB-Fin--PRON-Acc (1)
- VERB-Fin--PRON-Dat (39)
- VERB-Inf--NOUN-Acc (1)
- VERB-Inf--PRON-Acc (1)
- VERB-Inf--PRON-Dat (3)
- VERB-Part--NOUN-Acc (1)
- VERB-Part--NOUN-Dat (3)
- VERB-Part--PRON-Acc (5)
- VERB-Part--PRON-Dat (35)
Relations Overview
- This corpus uses 7 relation subtypes: cc:preconj, conj:extend, discourse:filler, flat:foreign, flat:name, parataxis:discourse, parataxis:restart
- The following 4 relation types are not used in this corpus at all: clf, compound, list, dep