UD Slovenian SSJ
Language: Slovenian (code: sl
)
Family: Indo-European, Slavic
This treebank has been part of Universal Dependencies since the UD v1.2 release.
The following people have contributed to making this treebank part of UD: Kaja Dobrovoljc, Tomaž Erjavec, Simon Krek.
Repository: UD_Slovenian-SSJ
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.2
License: CC BY-NC-SA 4.0
Genre: news, nonfiction, fiction
Questions, comments? General annotation questions (either Slovenian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [kaja • dobrovoljc (æt) gmail • com; tomaz • erjavec (æt) ijs • si; simon • krek (æt) ijs • si]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually in non-UD style, automatically converted to UD |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | annotated manually |
Features | annotated manually in non-UD style, automatically converted to UD |
Relations | annotated manually in non-UD style, automatically converted to UD |
Description
The Slovenian UD Treebank is a rule-based conversion of the ssj500k treebank, the largest collection of manually syntactically annotated data in Slovenian, originally annotated in the JOS annotation scheme.
The Slovenian SSJ UD Treebank (Dobrovoljc et al. 2017) is based on the ssj500k treebank (Krek et al. 2015), a balanced collection of sampled texts from the FidaPLUS reference corpus of written Slovene (Arhar and Gorjanc 2007). The original ssj500k corpus has been manually segmented, tokenized, lemmatized and morphosyntactically tagged within JOS project, in which the annotation guidelines have also been developed (Erjavec et al. 2010). Additionally, approximately one half of the ssj500k treebank has been manually annotated for dependency relations, according to the JOS syntactic annotation scheme. The syntactically annotated part of the ssj500k corpus (known as ssj200k), consisting of 11,411 annotated sentences and 235,864 tokens, has been used as the basis for conversion to the Slovenian UD Treebank.
The conversion from ssj200k to the Slovenian SSJ UD Treebank was completely automatic, based on a large set of rules for both morphosyntactic and syntactic layer, which include different lexical, morphological and dependency features. Due to the specifics of the original JOS syntactic annotation scheme, not all dependency relations from the original ssj200k treebank could be converted automatically, resulting in a smaller UD treebank size. The current version of the Slovenian UD Treebank thus contains 8,000 sentences with 140,670 tokens taken from various text types, e.g. fiction, non-fiction and periodicals, dating from 1990-2000. The original JOS annotations are included as part of the POSTAG (JOS morphosyntactic tags) and MISC (JOS dependency heads and labels) columns in the CONLLU format.
The corpus is linearly split into training (80%), development (10%) and test (10%) data.
Acknowledgments
We wish to thank all of the contributors to the original ssj500k training corpus: Kristina Bizjak, Živa Blaževič, Klara Canzutti, Lea Cibrič, Kaja Dobrovoljc, Tadeja Dušej, Tomaž Erjavec, Ivana Fekeža, Nanika Holz, Urška Kamenšek, Simon Krek, Andreja Košir, Robert Kuret, Nina Ledinek, Andrej Lovšin, Boštjan Marhold, Nina Mikulin, Barbara Modrijan, Sara Može, Tanja Novak, Lea Peršič, Tanja Radovič, Simona Šinkovec, Urška Vranjek, Jerneja Umer, Petra Žalodec.
Statistics of UD Slovenian SSJ
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB – X
Features
Abbr – Animacy – Aspect – Case – Definite – Degree – Foreign – Gender – Gender[psor] – Mood – Number – Number[psor] – NumForm – NumType – Person – Polarity – Poss – PronType – Reflex – Tense – Variant – VerbForm
Relations
acl – advcl – advmod – amod – appos – aux – case – cc – cc:preconj – ccomp – conj – cop – csubj – dep – det – discourse – expl – fixed – flat – flat:foreign – flat:name – iobj – mark – nmod – nsubj – nummod – obj – obl – parataxis – punct – root – xcomp
Tokenization and Word Segmentation
- This corpus contains 8000 sentences and 140670 tokens.
- This corpus contains 20488 tokens (15%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 57 types of words that contain both letters and punctuation. Examples: dr., oz., i., t., d., sv., P., M., j., o., R., K., A., B., H., V., š., II., L., npr., F., G., O'Neal, S., TAM-u, Z., mag., n., prof., salomon.si, 200-tem, AMD-jevimi, BTC-ju, BUS-a, C., E., IV., IX., Konoplja.org, Mt., O'Briana, ROM-u, SFOR-ju, SVIZ-ove, XI., XIV., angl., http://dnka.com/, itd., ml.
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB, X
- This corpus does not use the following tags: SYM
- This corpus contains 51 word types tagged as particles (PART): Ja, Kajpada, Ma, bojda, bržkone, bržčas, celo, da, domala, edino, kajne, kajpak, koli, kvečjemu, le, menda, morda, morebiti, naj, najbrž, ne, nej, nemara, nikar, niti, no, pač, prav, pravzaprav, predvsem, ravno, sam, samo, samó, seveda, sicer, skoraj, skorajda, sploh, tud, tudi, več, vsaj, vsej, vsekakor, zgolj, zlasti, češ, še, šele, že
- This corpus contains 31 lemmas tagged as pronouns (PRON): jaz, jest, kaj, kar, karkoli, kdo, kdor, kdorkoli, malokdo, marsikaj, marsikdo, nadme, name, nase, nekaj, nekdo, nihče, nič, nobeden, obme, on, pome, se, skozme, teu, ti, vame, vase, vsakdo, zame, zase
- This corpus contains 65 lemmas tagged as determiners (DET): dosti, dovolj, enak, isti, kak, kakršen, kakršenkoli, kakšen, kateri, katerikoli, koliko, kolikšen, malo, malokateri, manj, marsikateri, mnog, mnogo, moj, najin, največ, naš, nek, nekaj, nekak, nekakšen, nekateri, neki, nešteto, nikakršen, njegov, njen, njihov, njun, noben, oba, oboj, ogromno, oni, par, pol, premnog, prenekateri, preveč, svoj, ta, tak, takšen, tale, tisti, tolik, toliko, tolikšen, tvoj, vajin, vaš, veliko, ves, več, vsak, vsakršen, četrt, čigar, čigav, čimveč
- Out of the above, 1 lemmas occurred sometimes as PRON and sometimes as DET: nekaj
- This corpus contains 1 lemmas tagged as auxiliaries (AUX): biti
- Out of the above, 1 lemmas occurred sometimes as AUX and sometimes as VERB: biti
- There are 5 (de)verbal forms:
- Conv
- ADV: rekoč, sodeč, Molče, hote, nehote, neupoštevaje, nevede, sklicujoč, stoje, upoštevaje
- Fin
- AUX: je, so, bi, bo, ni, sem, bodo, sta, smo, niso
- VERB: je, ima, ni, gre, so, bo, imajo, mora, pomeni, zdi
- Inf
- AUX: biti
- VERB: videti, slišati, biti, pomagati, razumeti, imeti, reči, narediti, vedeti, dobiti
- Part
- ADJ: znani, prepričan, znano, določene, pripravljeni, zaposlenih, prepričani, zaposleni, pripravljen, sprejet
- AUX: bil, bila, bilo, bili, bile
- VERB: bilo, bila, imel, moral, povedal, imela, imeli, morali, bil, morala
- Sup
- VERB: delat, organizirat, spat, gledat, iskat, krpat, mižat, odpotovat, osvobodit, pogledat
Nominal Features
- Fem
- ADJ: druge, drugi, nove, novo, prva, sama, velika, veliko, druga, drugo
- ADJ-Part: določene, namenjena, povezane, prepričana, pripravljena, ustanovljena, znana, določeno, imenovana, končani
- AUX-Part: bila, bile, bili
- DET: svojo, te, svoje, ta, to, vse, svoji, tej, vseh, njegove
- NOUN: strani, države, pomoč, oči, možnosti, poti, pot, stvari, skupine, vode
- NUM: ena, eno, tri, dve, štiri, eni, dveh, ene, dvema, treh
- PRON: jo, jih, ji, njej, njo, ona, je, nje, jim, nanjo
- PROPN: Slovenije, Sloveniji, Slovenija, EU, Ljubljani, ZDA, Evropi, Slovenijo, LJUBLJANA, Ljubljana
- VERB-Part: bila, imela, morala, začela, prišla, rekla, pokazala, vedela, dobila, sprejela
- Masc
- ADJ: sam, prvi, drugi, slovenski, drugih, pravi, sami, novi, velik, državni
- ADJ-Part: prepričan, znani, pripravljeni, zaposlenih, prepričani, zaposleni, pripravljen, sprejet, minuli, povezani
- AUX-Part: bil, bili, bila
- DET: ta, tem, vsi, vsak, svoj, katerem, vse, njegov, tega, ves
- NOUN: dan, čas, ljudi, del, tolarjev, dni, način, času, časa, otrok
- NUM: dva, eden, en, dveh, enega, enem, tri, trije, štirih, štiri
- PRON: ga, jih, mu, kdo, jim, njim, njih, njem, nihče, njimi
- PROPN: Mariboru, Slovenci, Maribor, Jože, Drnovšek, Gregor, Janez, Milan, New, Slovencev
- VERB-Part: imel, moral, povedal, imeli, bil, morali, dejal, začeli, postal, rekel
- Neut
- ADJ: mogoče, pomembno, jasno, potrebno, težko, novo, drugim, novega, prihodnje, drugo
- ADJ-Part: znano, povezano, določeno, minulega, odprto, opravljeno, prepovedano, preteklih, skrita, skrito
- AUX-Part: bilo, bila
- DET: to, tem, tega, vse, svoje, temu, njegovo, tisto, katerem, vsega
- NOUN: leta, let, leto, letih, življenje, dela, delo, mesto, mestu, vprašanje
- NUM: eno, štirih, dve, treh, tri, štiri, dveh, tremi, dvema, dvoje
- PRON: kaj, kar, nekaj, nič, ga, jih, čemer, česar, česa, čimer
- PROPN: Celje, Kosova, Kosovu, Koroškem, Slovenskem, Dolenjskem, Gorenjskem, Hrvaškem, Celju, Japonskem
- VERB-Part: bilo, zgodilo, uspelo, prišlo, zdelo, šlo, začelo, ostalo, pomenilo, dalo
- Anim
- NOUN: otroka, predsednika, človeka, duha, moža, prijatelja, boga, bolnika, nasprotnika, sina
- PROPN: Andreja, Billyja, Henrika, Boja, Damijana, Filipa, Francija, Hočevarja, Janeza, Johna
- Inan
- NOUN: dan, čas, način, primer, denar, del, sistem, svet, teden, konec
- PROPN: Dunaj, Irak, Nato, Windows, Bruselj, JBX, Jeruzalem, Virtual, ATI, Afganistan
- Dual
- ADJ: desnima, drugačna, najboljša, nemških, obsojena, predstavljena, slovenska, soodvisni, srečna, trebušni
- ADJ-Part: obsojena, predstavljena, Preostalih, identificirana, izoblikovana, ljubečih, mišljena, nagrajena, nameščeni, obrnjeni
- AUX-Fin: sta, sva, bosta, nista, nisva, bova
- AUX-Part: bila, bili
- DET: oba, obeh, obe, obema, svoja, njuni, ta, KATERIH, Moja, Njegova
- NOUN: letoma, leti, strani, meseca, otroka, primerih, starša, letih, partnerja, policista
- NUM: dva, dveh, dve, dvema
- PRON: ju, nama, jima, njima, naju, njiju, midva, vaju, zanju, onadva
- PROPN: Belokranjca, Egipčana, Francoza, Litijana
- VERB-Fin: imata, sta, omogočata, prideta, hočeta, imava, menita, morata, obtožujeta, postaneta
- VERB-Part: imela, morala, bila, odšla, hotela, srečala, začela, nastopila, pogovarjala, povedala
- Plur
- ADJ: druge, drugih, različnih, nove, zadnjih, novih, slovenskih, sami, drugi, drugimi
- ADJ-Part: določene, zaposlenih, prepričani, pripravljeni, zaposleni, določenih, povezani, znani, navdušeni, povezane
- AUX-Fin: so, bodo, smo, niso, bomo, boste, ste, nismo, niste, bodite
- AUX-Part: bili, bile, bila
- DET: vse, vseh, vsi, te, teh, katerih, svoje, svojih, nekatere, ti
- NOUN: let, letih, ljudi, tolarjev, dni, milijonov, oči, odstotkov, podatkov, leti
- NUM: tri, tisoč, štiri, štirih, pet, sto, deset, treh, šest, sedem
- PRON: jih, nas, nam, vam, jim, vas, njih, njimi, vi, nami
- PROPN: ZDA, Slovenci, Slovencev, Francozi, Nemcev, Nemci, Slovence, Američani, Atenah, Brežice
- VERB-Fin: so, imajo, moramo, morajo, imamo, moremo, smemo, imate, nimajo, želijo
- VERB-Part: imeli, morali, začeli, dobili, odločili, predstavili, bili, pripravili, prišli, postali
- Sing
- ADJ: mogoče, prvi, sam, drugi, novo, veliko, drugo, novega, pomembno, drugega
- ADJ-Part: prepričan, znano, pripravljen, sprejet, določeno, povezano, minuli, izbrani, namenjena, prepričana
- AUX-Fin: je, bo, ni, sem, nisem, bom, si, nisi, Bodi, as
- AUX-Part: bil, bila, bilo
- DET: to, tem, ta, tega, vse, svojo, svoje, katerem, vsak, svoj
- NOUN: leta, dan, leto, čas, življenje, strani, del, delu, način, dela
- NUM: eno, eden, ena, en, enega, enem, eni, ene, enim, dvoje
- PRON: ga, jo, mu, kaj, mi, kar, ji, me, kdo, nekaj
- PROPN: Slovenije, Sloveniji, Slovenija, EU, Ljubljani, Evropi, Mariboru, Slovenijo, LJUBLJANA, Ljubljana
- VERB-Fin: je, ima, ni, gre, bo, mora, pomeni, zdi, pravi, more
- VERB-Part: bilo, bila, imel, moral, povedal, bil, dejal, zgodilo, imela, morala
- Acc
- ADJ: druge, novo, nove, veliko, drugo, prihodnje, prvo, dobro, prvi, različne
- ADJ-Part: določene, minuli, določeno, odrasle, ostale, pripravljene, dodano, imenovano, izbrana, izbrani
- ADP: za, na, v, skozi, čez, po, med, pod, zoper, ob
- DET: to, vse, svoje, svojo, svoj, ta, te, vsak, ves, njegovo
- NOUN: leto, dan, življenje, čas, delo, način, pomoč, mesto, primer, vlogo
- NUM: eno, tri, štiri, tisoč, dve, dva, deset, sto, en, pet
- PRON: ga, jih, jo, kaj, me, kar, nas, nekaj, vas, ju
- PROPN: Slovenijo, EU, Ljubljano, Dunaj, Francijo, Irak, Koroško, Slovence, Andreja, Billyja
- Dat
- ADJ: drugim, državnemu, novim, drugemu, ponižnemu, velikemu, velikim, zbranim, današnjemu, delovni
- ADJ-Part: zbranim, Zmletemu, določenemu, grozeči, imenovanemu, izbrani, izbranim, izzvanim, markirani, nagrbljenemu
- ADP: k, proti, kljub, h, navkljub, blizu, nasproti
- DET: temu, vsem, vsemu, svojim, tej, svoji, tistim, nekaterim, svojemu, tistemu
- NOUN: ljudem, členu, človeku, bolnikom, delu, hiši, koncu, moškim, otroku, vladi
- NUM: eni, trem, enemu, štirim, Petim, petdesetim
- PRON: si, mu, mi, ji, nam, vam, jim, njemu, ti, meni
- PROPN: Srbom, Bosku, Diegu, Janezu, Jatu, Ljubljani, Sloveniji, Vatanenu, Adriaticu, Alici
- Gen
- ADJ: novega, drugih, novih, drugega, slovenskih, različnih, slovenske, evropske, prvega, nove
- ADJ-Part: zaposlenih, določenih, znanih, določenega, imenovanih, imenovanega, minulega, odraslih, omenjenega, omenjenih
- ADP: iz, od, do, zaradi, brez, z, poleg, s, glede, konec
- DET: tega, te, vseh, teh, svoje, svojega, svojih, vsega, njegove, katerih
- NOUN: leta, let, tolarjev, dela, časa, ljudi, milijonov, sveta, dni, življenja
- NUM: dveh, ene, enega, treh, štirih, petih, desetih, osmih, sedmih, tridesetih
- PRON: jih, ga, nas, njega, sebe, je, njih, nje, česar, me
- PROPN: Slovenije, EU, Ljubljane, Evrope, Slovencev, Kosova, Hrvaške, Amerike, Dolenjske, Jugoslavije
- Ins
- ADJ: drugim, drugimi, različnimi, kratkim, veliko, drugo, novimi, novo, prvim, posebnimi
- ADJ-Part: znanimi, imenovanimi, sproščenim, Združenimi, bolečo, cvetočo, delujočimi, določenim, doživeto, etabliranim
- ADP: z, s, med, pred, pod, za, nad
- DET: tem, svojo, katerimi, svojim, katero, katerim, svojimi, njenim, vsemi, njegovimi
- NOUN: leti, pomočjo, letom, delom, časom, imenom, ljudmi, vodstvom, vojno, glasom
- NUM: dvema, tremi, petimi, desetimi, enim, eno, šestimi, sedmimi, sto, štirimi
- PRON: njim, njimi, seboj, njo, nami, sabo, njima, čimer, mano, menoj
- PROPN: Davidom, Marjanom, Slovenijo, Freddijem, Hrvaško, Hughesom, Jugoslavijo, Miranom, Morosino, Sampsonom
- Loc
- ADJ: drugi, zadnjih, drugih, drugem, prvem, prvi, različnih, veliki, glavnem, zadnjem
- ADJ-Part: končani, imenovanem, omenjenem, opravljenem, preteklih, določeni, določenih, končanem, odprtem, SPEČEM
- ADP: v, na, po, o, pri, ob
- DET: tem, katerem, svoji, katerih, tej, vseh, kateri, svojem, njegovem, teh
- NOUN: letih, času, delu, strani, svetu, mestu, koncu, primeru, letu, področju
- NUM: dveh, enem, štirih, treh, eni, petih, šestih, osmih, desetih, tridesetih
- PRON: njem, njej, njih, nas, sebi, čemer, meni, čem, ničemer, vas
- PROPN: Sloveniji, Ljubljani, Mariboru, Evropi, ZDA, Ameriki, Jugoslaviji, Britaniji, EU, Franciji
- Nom
- ADJ: mogoče, sam, prvi, velika, drugi, prva, sama, slovenska, jasno, pomembno
- ADJ-Part: prepričan, znani, pripravljeni, prepričani, zaposleni, znano, pripravljen, sprejet, povezani, povezano
- DET: to, ta, vsi, vse, vsak, njegova, te, tisti, ti, njegov
- NOUN: predsednik, človek, del, zakon, ljudje, otrok, vprašanje, vlada, država, čas
- NUM: eden, ena, dva, trije, pet, en, tri, šest, tisoč, sto
- PRON: kar, kdo, kaj, jaz, nič, nihče, nekaj, nekdo, ona, vi
- PROPN: Slovenija, LJUBLJANA, Ljubljana, Slovenci, Maribor, Jasna, Jože, Drnovšek, Gregor, Janez
- Def
- ADJ: pravi, državni, novi, slovenski, drugi, veliki, glavni, največji, edini, zadnji
- ADJ-Part: minuli, izbrani, znani, omenjeni, spoštovani, imenovani, izpodbijani, navedeni, odprti, plačani
- Ind
- ADJ: sam, velik, nov, drug, pomemben, prepričan, dober, podoben, pripravljen, sprejet
- ADJ-Part: prepričan, pripravljen, sprejet, zasnovan, presenečen, sestavljen, zaposlen, namenjen, oblečen, opremljen
Degree and Polarity
- Cmp
- ADJ: boljše, večji, večje, večja, boljši, močnejši, večjih, boljša, daljši, starejši
- ADV: bolj, prej, večkrat, bolje, pozneje, raje, kasneje, dlje, hitreje, laže
- Pos
- ADJ: mogoče, sam, novo, nove, različnih, veliko, slovenski, velika, veliki, novega
- ADJ-Part: znani, prepričan, znano, določene, pripravljeni, zaposlenih, prepričani, zaposleni, pripravljen, sprejet
- ADV: lahko, tako, zelo, kako, vedno, potem, kar, zdaj, treba, ali
- Sup
- ADJ: največji, najboljši, največja, največjih, najboljša, najboljših, najpomembnejši, največje, najprimernejše, največjo
- ADV: najbolj, najprej, najmanj, najbolje, najpogosteje, največkrat, najverjetneje, Najhuje, najdlje, najkasneje
- Neg
- AUX-Fin: ni, niso, nisem, nismo, niste, nista, nisva, nisi
- PART: ne
- VERB-Fin: ni, nima, nimajo, nimam, noče, nimamo, nimate, nisem, nismo, niso
- Pos
- AUX-Fin: je, so, bo, sem, bodo, sta, smo, bomo, boste, ste
- VERB-Fin: je, ima, so, bo, imajo, imamo, imate, imam, hoče, sem
- Bound
- PRON: zanj, zame, zase, nanjo, zanjo, vanjo, nanj, vanj, zanje, name
- Short
- PRON: se, ga, jih, si, jo, mu, mi, ji, me, jim
Verbal Features
- Imp
- VERB-Fin: ima, imajo, mora, zdi, moramo, morajo, more, velja, želi, deluje
- VERB-Inf: imeti, vedeti, govoriti, delati, zdraviti, živeti, igrati, paziti, pričakovati, sodelovati
- VERB-Part: imel, moral, imela, imeli, morali, morala, hotel, mogel, zdelo, vedela
- VERB-Sup: delat, spat, gledat, iskat, krpat, mižat, prest, prosit, smučat, snemat
- Perf
- VERB-Fin: pride, postane, začne, dobijo, nastane, da, zgodi, ostane, pove, dobi
- VERB-Inf: reči, narediti, dobiti, najti, povedati, spremeniti, sprejeti, plačati, izogniti, ohraniti
- VERB-Part: povedal, dejal, zgodilo, začeli, začela, postal, rekel, uspelo, dobil, prišel
- VERB-Sup: odpotovat, osvobodit, pogledat, zajebat
- Cnd
- AUX-Fin: bi, b
- VERB-Fin: bi
- Imp
- AUX-Fin: bodite, Bodi
- VERB-Fin: dodajte, Ugotovimo, dajte, pazite, denimo, poglejmo, pojdite, poskusite, povej, pozabite
- Ind
- AUX-Fin: je, so, bo, ni, sem, bodo, sta, smo, niso, bomo
- VERB-Fin: je, ima, ni, gre, so, bo, imajo, mora, pomeni, zdi
- Fut
- AUX-Fin: bo, bodo, bomo, boste, bom, bosta, bova, bojo, boš
- VERB-Fin: bo, bodo, boste, bom
- Pres
- AUX-Fin: je, so, ni, sem, sta, smo, niso, ste, nisem, sva
- VERB-Fin: je, ima, ni, gre, so, imajo, mora, pomeni, zdi, moramo
Pronouns, Determiners, Quantifiers
- Dem
- DET: to, tem, ta, tega, te, toliko, teh, temu, tej, tisti
- Ind
- DET: nekaj, več, veliko, manj, dovolj, malo, pol, preveč, največ, nekatere
- PRON: nekaj, nekdo, marsikaj, nekoga, marsikoga, nečesa, Marsikdo, malokdo, marsičem, neki
- Int
- DET: katerem, katerih, kateri, katero, katere, koliko, katerega, kakšno, katerimi, katerim
- PRON: kaj, kdo, česa, komu, čem, koga, kom, kej, kva
- Neg
- DET: nobenega, nobene, noben, nobenih, nobena, nikakršne, nobenim, Nikakršnih, Nobeno, nikakršen
- PRON: nič, nihče, nikogar, ničesar, nikomur, ničemer, nobeden, ničemur, nč
- Prs
- DET: svoje, svojo, svoj, svojega, njegov, svoji, njegovo, svojih, njegove, naše
- PRON: se, ga, jih, si, jo, mu, mi, ji, nas, nam
- Rel
- DET: kakršen, kakršnokoli, kakršna, kakršnih, kakršno, kakršni, kakršenkoli, kakršne, kakršnega, kakršnegakoli
- PRON: kar, čemer, česar, čimer, kdor, karkoli, kogar, komerkoli, čemerkoli
- Tot
- DET: vse, vseh, vsi, vsak, vsem, ves, vsako, oba, obeh, vsega
- PRON: vsakdo, vsakogar, vsakomur
- Card
- NUM: eno, tri, dva, dveh, eden, ena, tisoč, štiri, dve, štirih
- Mult
- ADJ: dvojnega, dvojnim, dvojno, trojnim
- Ord
- ADJ: prvi, prva, prvo, prve, prvem, prvih, prvega, tretji, tretje, prvim
- NUM: 1., 20., 18., 9., 14., 17., 19., 6., 3., 10.
- Sets
- NUM: dvoje, tisočerih, troje
- Yes
- ADJ: človekovih, človekove, Vallaressovi, vodikov, človekova, Cankarjevem, Darwinove, Gregorčičevi, Kristusovega, Levovo
- DET: svoje, svojo, svoj, svojega, njegov, svoji, njegovo, svojih, njegove, naše
- Yes
- DET: svoje, svojo, svoj, svojega, svoji, svojih, svojim, svojem, svoja, svojimi
- PRON: se, si, sebi, seboj, sebe, zase, sabo, nase, vase
- 1
- AUX-Fin: sem, smo, bomo, nisem, bom, sva, nismo, nisva, bova
- DET: naše, naših, naš, naša, moj, moje, naši, našo, moja, moji
- PRON: mi, nas, nam, me, jaz, meni, zame, nama, nami, mene
- VERB-Fin: moramo, mislim, imamo, moremo, smemo, vem, imam, moram, vemo, morem
- 2
- AUX-Fin: boste, ste, si, niste, bodite, nisi, sta, Bodi, as, bosta
- DET: vaš, vaša, vaše, vašo, tvoje, vašega, vaši, tvoj, vaših, tvoja
- PRON: vam, vas, ti, vi, te, tebe, tebi, vaju, vami, nate
- VERB-Fin: imate, morate, želite, dodajte, veš, potrebujete, boste, moraš, si, ste
- 3
- AUX-Fin: je, so, bo, ni, bodo, sta, niso, bosta, nista, bojo
- DET: njegov, njegovo, njegove, njegova, njeno, njen, njihove, njegovem, njegovi, njene
- PRON: ga, jih, jo, mu, ji, jim, njim, njih, njem, njimi
- VERB-Fin: je, ima, ni, gre, so, bo, imajo, mora, pomeni, zdi
- Fem
- DET: njeno, njen, njene, njena, njeni, njenih, njenim, njenega, njenem, njenemu
- Masc
- DET: njegov, njegovo, njegove, njegova, njegovem, njegovi, njegovih, njegovega, njegovim, njegovimi
- Neut
- DET: njegov
- Dual
- DET: njun, njuna, njuno, njuni, najin, najinih, vajino, Najine, najina, najinega
- Plur
- DET: naše, naših, njihove, naš, naša, njihovo, njihov, njihova, njihovih, naši
- Sing
- DET: njegov, njegovo, njegove, njegova, njeno, njen, njegovem, njegovi, njene, njegovih
Other Features
- Abbr
- Yes
- X: dr., oz., t., d., sv., P., i., M., j., o.
- Yes
- Foreign
- Yes
- X: de, of, the, bin, El, Les, Party, TO, TRAVEL, WRITING
- Yes
- NumForm
- Digit
- NUM: 10, 15, 2000, 50, 1., 3, 30, 20, 20., 6
- Roman
- NUM: I., II, II., VI, I, III, IV., IX., V, V.
- Word
- NUM: eno, tri, dva, dveh, eden, ena, tisoč, štiri, dve, štirih
- Digit
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: biti.
- This corpus uses 9 lemmas as auxiliaries (aux). Examples: biti, bga, dab, dam, gauš, kse, neb, seu, tlelevš.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Fin--NOUN-Gen (157)
- VERB-Fin--NOUN-Gen-ADP(do) (1)
- VERB-Fin--NOUN-Gen-ADP(okoli) (1)
- VERB-Fin--NOUN-Nom (1787)
- VERB-Fin--PRON-Gen (14)
- VERB-Fin--PRON-Nom (149)
- VERB-Inf--NOUN-Gen (2)
- VERB-Inf--NOUN-Nom (41)
- VERB-Inf--PRON-Nom (2)
- VERB-Part--NOUN-Gen (111)
- VERB-Part--NOUN-Gen-ADP(do) (1)
- VERB-Part--NOUN-Nom (1870)
- VERB-Part--PRON-Acc (4)
- VERB-Part--PRON-Gen (13)
- VERB-Part--PRON-Nom (146)
- obj
- VERB-Fin--NOUN-Acc (1540)
- VERB-Fin--NOUN-Dat (79)
- VERB-Fin--NOUN-Gen (310)
- VERB-Fin--PRON-Acc (459)
- VERB-Fin--PRON-Dat (140)
- VERB-Fin--PRON-Gen (29)
- VERB-Fin--PRON-Nom (2)
- VERB-Inf--NOUN-Acc (431)
- VERB-Inf--NOUN-Dat (29)
- VERB-Inf--NOUN-Gen (146)
- VERB-Inf--NOUN-Nom (1)
- VERB-Inf--PRON-Acc (109)
- VERB-Inf--PRON-Dat (24)
- VERB-Inf--PRON-Gen (28)
- VERB-Part--NOUN-Acc (1809)
- VERB-Part--NOUN-Dat (83)
- VERB-Part--NOUN-Gen (344)
- VERB-Part--NOUN-Ins (1)
- VERB-Part--PRON-Acc (611)
- VERB-Part--PRON-Dat (190)
- VERB-Part--PRON-Gen (42)
- VERB-Sup--NOUN-Acc (4)
- VERB-Sup--PRON-Acc (1)
- iobj
- VERB-Fin--NOUN-Acc (11)
- VERB-Fin--NOUN-Dat (81)
- VERB-Fin--NOUN-Gen (1)
- VERB-Fin--NOUN-Loc (2)
- VERB-Fin--PRON-Acc (14)
- VERB-Fin--PRON-Dat (91)
- VERB-Inf--NOUN-Acc (5)
- VERB-Inf--NOUN-Dat (28)
- VERB-Inf--NOUN-Gen (1)
- VERB-Inf--PRON-Acc (5)
- VERB-Inf--PRON-Dat (23)
- VERB-Inf--PRON-Gen (1)
- VERB-Part--NOUN-Acc (14)
- VERB-Part--NOUN-Dat (97)
- VERB-Part--PRON-Acc (23)
- VERB-Part--PRON-Dat (151)
- VERB-Sup--PRON-Acc (1)
Verbs with Reflexive Core Objects
- This corpus contains 24 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: prositi zase, doživeti svojo, iskati svojo, karikirati sebe, kaznovati sebe, narediti svoje, obdržati zase, označevati sebe, poskrbeti zase, postaviti zase, povedati svojega, povzročiti sebi, presenetiti sebe, reči svoje, spodbuditi sebe, spremeniti sebe, spreminjati sebe, ubiti sebe, upati zase, utemeljevati sebe, videti sebe, zanikovati sebe, zatopljen vase, živeti zase
Relations Overview
- This corpus uses 3 relation subtypes: cc:preconj, flat:foreign, flat:name
- The following 8 relation types are not used in this corpus at all: vocative, dislocated, clf, compound, list, orphan, goeswith, reparandum