UD Serbian SET
Language: Serbian (code: sr
)
Family: Indo-European, Slavic
This treebank has been part of Universal Dependencies since the UD v2.1 release.
The following people have contributed to making this treebank part of UD: Tanja Samardžić, Nikola Ljubešić.
Repository: UD_Serbian-SET
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.2
License: CC BY-SA 4.0
Genre: news
Questions, comments? General annotation questions (either Serbian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [tanja • samardzic (æt) uzh • ch]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually, natively in UD style |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | not available |
Features | annotated manually in non-UD style, automatically converted to UD |
Relations | annotated manually, natively in UD style |
Description
The Serbian UD treebank is based on the SETimes-SR corpus.
Acknowledgments
Statistics of UD Serbian SET
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB
Features
Animacy – Case – Definite – Degree – Gender – Mood – Number – NumType – Person – Poss – PronType – Reflex – Tense – VerbForm
Relations
acl – advcl – advmod – amod – appos – aux – case – cc – ccomp – compound – conj – cop – csubj – dep – det – det:numgov – discourse – fixed – flat – goeswith – iobj – list – mark – nmod – nsubj – nummod – nummod:gov – obj – obl – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 3891 sentences and 86754 tokens.
- This corpus contains 10469 tokens (12%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 178 types of words that contain both letters and punctuation. Examples: UN-a, NATO-u, NATO-a, OEBS-a, KFOR-a, UNMIK-a, MMF-a, OHR-a, BDP-a, EULEKS-a, PDV-a, Pop-Lazić, Bukumirić-Katić, MMF-om, UNESKO-a, tzv., Burgas-Aleksandropolis, Cro-a-Porter, KFOR-u, Saks-Koburg, UNODC-a, V., 15-članom, 25-metarskim, 55-člane, CHP-a, EULEKS-om, EXIT-u, Fashion.hr, HAK-PAR, HDZ-u, Ki-Muna, Kostić-Mandić, Kozaku-Markulis, MKSJ-a, MKSJ-u, NATO-om, OEBS-ODIHR, Pop-Lazićke, SDS-a, SETimes-a, SFOR-a, Zalata-Dravica, di-džejevi, eko-aktiviste, grčko-rimskom, stend-baj, zemlja-vazduh, Žan-Klod, 11-godišnja
Morphology
Tags
- This corpus uses 13 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB
- This corpus does not use the following tags: DET, INTJ, SYM, X
- This corpus contains 14 word types tagged as particles (PART): Neka, Zar, bilo, evo, god, i, kako, li, ne, ni, niti, sve, tako, što
- This corpus contains 45 lemmas tagged as pronouns (PRON): biti, dva, ikakav, ja, kakav, ko, koji, kom, mi, moj, naš, neka, neki, neko, nečiji, nešto, nijedan, nikakav, niko, ništa, njegov, njen, njihov, oba, on, onaj, oni, ovaj, ovakav, sav, sebe, svaki, svako, svačiji, sve, svoj, taj, takav, takođe, tvoj, vaš, vi, čiji, šta, što
- This corpus contains 0 lemmas tagged as determiners (DET):
- This corpus contains 5 lemmas tagged as auxiliaries (AUX): biti, hajde, hteti, vršiti, će
- Out of the above, 3 lemmas occurred sometimes as AUX and sometimes as VERB: biti, hteti, vršiti
- There are 2 (de)verbal forms:
- Inf
- AUX: biti
- VERB: imati, nastaviti, ostati, pomoći, početi, moći, morati, dobiti, doneti, raditi
- Part
- ADJ: održan, održana, otvorena, održano, otvoren, postignut, završen, zadužen, održanom, osuđen
- ADV: uključujući, ukazujući, dodajući, govoreći, rekavši, obećavajući, opisujući, tražeći, tvrdeći, ističući
- AUX: bio, bila, bilo, bili, bile
- VERB: rekao, izjavio, trebalo, rekla, dodao, mogla, saopštila, sastao, pozvao, dobila
Nominal Features
- Fem
- ADJ: prošle, srpske, Crne, evropske, političke, demokratske, jugoistočne, međunarodne, Crna, nove
- ADJ-Part: održana, otvorena, završena, korišćena, postavljena, usmerena, završene, izrečena, objavljena, optužena
- AUX-Part: bila, bile
- NOUN: godine, zemlje, vlada, godina, zemalja, stranke, vlade, zemlja, nedelje, vlasti
- NUM: dve, jedna, druge, prva, obe, drugim, druga, jedne, drugih, devedesetih
- PRON: koja, koje, ove, svoje, koju, ona, svoju, te, ta, kojoj
- PROPN: Srbije, Srbija, Srbiji, Makedonija, Turska, Turske, Makedoniji, Bugarska, Hrvatska, Evrope
- VERB-Part: rekla, mogla, saopštila, dobila, postala, osvojila, povećala, objavila, imala, potpisala
- Masc
- ADJ: novi, inostranih, bivši, glavni, novog, mnogi, unutrašnjih, srpski, međunarodni, turski
- ADJ-Part: održan, otvoren, postignut, završen, zadužen, osuđen, izloženi, napravljen, održani, održanom
- AUX-Part: bio, bili
- NOUN: evra, predsednik, ministar, poslova, miliona, ponedeljak, premijer, ljudi, utorak, dana
- NUM: jedan, drugi, prvi, jednog, drugih, drugim, jednom, prvog, prvom, jednim
- PRON: koji, on, oni, taj, svoj, ga, neki, svog, tog, koje
- PROPN: EU, BiH, UN, Beogradu, NATO, UN-a, SETimes, NATO-u, Balkanu, EBRD
- VERB-Part: rekao, izjavio, dodao, sastao, pozvao, ukazao, izrazio, dobio, saopštio, istakao
- Neut
- ADJ: potrebno, ljudskih, ljudska, moguće, održano, Crnog, važno, radna, radnih, svetskom
- ADJ-Part: održano, povređeno, objavljenom, razgovarano, uhapšeno, zaključeno, otkriveno, otvorena, planirano, pronađeno
- AUX-Part: bilo, bila
- NOUN: prava, članstvo, pitanja, mesto, pitanje, vreme, saopštenju, međuvremenu, pitanju, rešenje
- NUM: drugo, jedno, prvo, druga, drugih, treće, drugim, Prve, Sedamnaesto, drugom
- PRON: to, što, toga, tome, koja, koje, sve, šta, ono, svoje
- PROPN: Kosova, Kosovo, Kosovu, Skoplju, Sarajevu, Belene, Skoplja, Kosovom, Vetvendosje, Akropolja
- VERB-Part: trebalo, moglo, došlo, pokazalo, omogućilo, postalo, dobilo, okupilo, prisustvovalo, saopštilo
- Anim
- ADJ: bivšeg, novog, američkog, generalnog, kosovskog, najboljeg, sledećeg, visokog, Sejdijevog, Zlatnog
- ADJ-Part: plaćenog, predloženog
- NOUN: predsednika, kandidata, ministra, premijera, komesara, savetnika, sekretara, Svedoka, generala, glumca
- NUM: jednog, prvog
- PRON: svog, njegovog, svakog, koji, nekoga, nikoga, tog
- PROPN: Đinđića, Gruevskog, Krasnićija, Morinu, Nikolu, Rena, Zorana, Abdela, Acu, Ahtisarija
- Inan
- ADJ: ekonomski, novi, veliki, međunarodni, politički, važan, Ahtisarijev, direktan, glavni, ključni
- ADJ-Part: adresiran, kategorizovan, očekivani, predloženi, preopterećeni
- NOUN: ponedeljak, utorak, petak, četvrtak, napredak, proces, sporazum, način, razvoj, prijem
- NUM: jedan, prvi, drugi, deveti, treći
- PRON: svoj, taj, koji, njihov, ovaj, kakav, svaki, njegov, takav, neki
- PROPN: EU, NATO, SETimes, BiH, Balkan, Kipar, Hag, Zagreb, Beograd, Boru
- Plur
- ADJ: inostranih, mnogi, unutrašnjih, političkih, novih, nove, kiparskih, političke, međunarodnim, ekonomske
- ADJ-Part: izloženi, održani, završene, osumnjičenih, otvorena, podignute, povezane, počinjeni, smanjeni, zaštićeni
- AUX: su, će, bi, smo, nisu, budu, bili, bile, ćemo, neće
- AUX-Part: bili, bile, bila
- NOUN: evra, poslova, godina, zemalja, ljudi, miliona, prava, vlasti, zemlje, dana
- NUM: drugim, drugih, drugi, druge, prvih, devedesetih, prve, druga, dveju, prvim
- PRON: koji, koje, oni, svoje, kojima, neki, sve, svojih, mi, koja
- PROPN: Srbi, Srba, Albanci, Grka, Albanaca, Turaka, Grci, Crnogorci, Srbima, kg
- VERB: kažu, mogu, imaju, moraju, koriste, žele, nalaze, potpisali, čine, pokušavaju
- VERB-Part: potpisali, postigli, imali, rekli, mogli, dobili, složili, počeli, doneli, mogle
- Sing
- ADJ: prošle, novi, bivši, novog, Crne, srpske, glavni, srpski, evropske, jugoistočne
- ADJ-Part: održan, održana, održano, otvoren, otvorena, postignut, završen, zadužen, održanom, osuđen
- AUX: je, će, bi, nije, bude, bio, bilo, bila, neće, sam
- AUX-Part: bio, bilo, bila
- NOUN: godine, predsednik, ministar, zemlje, vlada, ponedeljak, premijer, zemlja, vlade, nedelje
- NUM: jedan, prvi, drugi, jedna, prva, jednog, jednom, druga, drugo, jedne
- PRON: se, koji, to, on, koja, ove, toga, taj, koju, ona
- PROPN: EU, BiH, Kosova, Srbije, Kosovo, Kosovu, Srbija, UN, Srbiji, Makedonija
- VERB: rekao, kaže, izjavio, trebalo, ima, mora, može, rekla, treba, navodi
- VERB-Part: rekao, izjavio, trebalo, rekla, dodao, mogla, saopštila, sastao, pozvao, dobila
- Acc
- ADJ: novu, nove, ekonomske, ratne, političku, ekonomski, novi, veliku, lokalne, političke
- ADJ-Part: usmerenu, dodatu, adresiran, grupisana, izazvanu, izrečenu, kategorizovan, obavljene, opremljene, osmišljenu
- ADP: za, u, na, po, kroz, uz, pod, pred, među, o
- NOUN: ponedeljak, sredu, utorak, podršku, petak, četvrtak, nedelju, članstvo, pomoć, nezavisnost
- NUM: jedan, prvi, drugi, dve, jednu, druge, drugo, prvu, drugu, druga
- PRON: se, svoje, koju, to, koje, svoj, ga, svoju, sve, taj
- PROPN: Kosovo, EU, NATO, Srbiju, Tursku, SETimes, BiH, Bugarsku, Albaniju, Balkan
- Dat
- ADJ: evropskoj, bivšem, konačnom, kosovskom, međunarodnim, demokratskim, ekonomskom, evropskim, kosovskim, stranim
- ADJ-Part: održanom, povećanim
- ADP: ka, uprkos, prema, nasuprot
- NOUN: novinarima, zemlji, građanima, premijeru, članstvu, institucijama, grupi, reformama, savetu, uniji
- NUM: drugim, jednoj, trećim, drugima, jednom, prvoj, trećem, trećoj
- PRON: im, joj, mu, tome, nam, kojima, onima, toj, mi, tom
- PROPN: NATO-u, Beogradu, Srbiji, Evropi, Turskoj, Briselu, Bugarskoj, Hrvatskoj, Makedoniji, Rusiji
- Gen
- ADJ: prošle, inostranih, Crne, novog, srpske, unutrašnjih, političkih, novih, evropske, jugoistočne
- ADJ-Part: osumnjičenih, otpuštenih, prodate, zasnovane, aktivirane, izabranih, izloženih, obezbeđene, održanog, optuženih
- ADP: od, iz, do, protiv, posle, zbog, tokom, između, sa, pre
- NOUN: godine, evra, poslova, zemlje, miliona, godina, zemalja, vlade, nedelje, stranke
- NUM: drugih, jednog, jedne, druge, prvih, devedesetih, dveju, prvog, dve, prve
- PRON: ove, toga, tog, ovog, svojih, svog, te, tih, svih, njegovog
- PROPN: Kosova, Srbije, Turske, Evrope, UN-a, Makedonije, Hrvatske, Bugarske, NATO-a, Beograda
- Ins
- ADJ: međunarodnim, srpskim, velikim, Crnom, kosovskim, ličnim, novim, političkim, Haškim, krivičnim
- ADJ-Part: nanesenom, održanim, posvećenom, prihvaćenim, pronađenim, razvijenim, zaštićenim
- ADP: sa, među, pod, s, za, nad, pred, na
- NOUN: obzirom, predsednikom, kolegom, premijerom, sporazumom, nazivom, zemljama, predstavnicima, sudom, ciljem
- NUM: drugim, jednim, drugom, jednom, drugima, prvim, 40-im, obe, trećim, trima
- PRON: kojim, kojima, kojom, čime, tim, svojim, time, njima, sobom, nekim
- PROPN: Srbijom, Grčkom, Kosovom, Makedonijom, Beogradom, Fatmirom, Sejdiuom, Turskom, Bosnom, Hercegovinom
- Loc
- ADJ: Crnoj, novom, jugoistočnoj, političkoj, svetskom, objavljenom, velikoj, makedonskom, međunarodnim, bivšoj
- ADJ-Part: objavljenom, održanom, objavljenoj, održanoj, iskorišćenim, izvedenoj, podeljenom, pogođenim, posvećenom, prinuđenoj
- ADP: u, na, o, prema, po, pri, Pema, Uprkos
- NOUN: zemlji, regionu, pogledu, izveštaju, međuvremenu, saopštenju, godini, rečima, pitanju, putu
- NUM: drugim, jednom, prvom, prvoj, drugoj, drugom, prvim, trećem, jednoj, obe
- PRON: tom, kojem, kojoj, svom, tome, kojima, ovom, svojoj, kome, toj
- PROPN: Kosovu, Srbiji, Beogradu, Makedoniji, Evropi, Balkanu, Bugarskoj, Albaniji, Bosni, Hercegovini
- Nom
- ADJ: novi, bivši, mnogi, srpski, glavni, kosovski, turski, Crna, međunarodni, srpska
- ADJ-Part: održan, održana, otvorena, održano, otvoren, postignut, završen, zadužen, osuđen, povređeno
- NOUN: predsednik, ministar, vlada, premijer, zemlja, deo, direktor, policija, vlasti, šef
- NUM: jedan, dve, drugi, prvi, jedna, prva, druga, obe, jedno, drugo
- PRON: koji, on, koja, to, koje, što, oni, ona, neki, ta
- PROPN: EU, BiH, Srbija, Kosovo, UN, Makedonija, Turska, Bugarska, Hrvatska, Rusija
- Voc
- NOUN: Gospodine, predsedniče
- Def
- ADJ: prošle, novi, inostranih, bivši, srpske, novog, evropske, Crne, glavni, nove
- ADJ-Part: održana, otvorena, održano, održanom, povređeno, izloženi, objavljenom, održani, razgovarano, uhapšeno
- Ind
- ADJ: važan, održan, otvoren, poznat, postignut, završen, dobar, zadužen, osuđen, pozitivan
- ADJ-Part: održan, otvoren, postignut, završen, zadužen, osuđen, napravljen, uspostavljen, usredsređen, objavljen
Degree and Polarity
- Cmp
- ADJ: veći, veće, bolji, bolje, bolju, dalji, veću, širem, bolja, dalju
- ADV: više, dalje, kasnije, manje, ranije, bolje, gore, snažnije, aktivnije, brže
- Pos
- ADJ: prošle, novi, inostranih, bivši, srpske, novog, evropske, Crne, glavni, nove
- ADJ-Part: održan, održana, otvorena, održano, otvoren, postignut, završen, zadužen, održanom, osuđen
- ADV: takođe, međutim, kada, još, odsto, samo, sada, nekoliko, oko, uvek
- Sup
- ADJ: najveći, najvećih, najbolji, najveća, najveće, najviši, najbolju, najnovije, najnovijem, najvećim
- ADV: najmanje, najviše, najčešće, najbolje, najgore, najperfektnije, najteže, najverovatnije
Verbal Features
- Imp
- AUX: Hajde
- VERB: Zauzmi, dozvolite, obećajmo, ponasajte, recimo
- Fut
- AUX: biće, Bićemo
- VERB: biće, doneće, imaće, moraće, predstavljaće, dobiće, otvoriće, zavisiće, Ostvarićemo, Preduzećemo
- Past
- AUX: bi, bih, bismo
- VERB: dogodi
- Pres
- AUX: je, su, će, nije, bude, smo, neće, nisu, sam, budu
- VERB: kaže, ima, mora, može, treba, navodi, mogu, kažu, očekuje, postoji
Pronouns, Determiners, Quantifiers
- Dem
- PRON: to, ove, toga, taj, tom, te, ta, tog, tome, ovog
- Ind
- PRON: koji, koje, koja, što, sve, koju, kojima, neki, kojem, kojim
- Int
- PRON: Šta, Kakvo, Kakav, Kakve, Koji, kojoj
- Prs
- PRON: on, ona, oni, ga, mi, ih, im, njega, njih, joj
- Card
- NUM: tri, dva, jedan, pet, 20, dve, četiri, šest, 50, deset
- Mult
- NUM: obe, troje, 1998-1999., dvoje, 4.7.2011., oba, dve, 11.9., 19.11.2011., 29.9.2011.
- Ord
- NUM: 2007., drugi, 2004., 21., 1., 2008., 9., 12., 28., prvi
- Yes
- ADJ: nevladine, Ešdaunova, Ahtisarijev, nevladinih, vladinih, Burkajev, vladini, Đinđićeve, Erdoganove, Majkrosoftovih
- PRON: njegova, njegov, njegovog, njen, njihov, njegove, naše, naša, njegovu, njenog
- Yes
- PRON: se, svoje, svoj, svoju, svog, svojih, svom, svojim, svojoj, sebe
- 1
- AUX: smo, sam, ćemo, bih, nisam, nismo, ću, bismo, nećemo, neću
- PRON: mi, ja, naše, nam, nas, naša, naš, moj, našeg, naših
- VERB: imamo, mislim, moramo, možemo, vidimo, želimo, nadam, nadamo, verujem, imam
- 2
- AUX: ste, Hajde, jeste, ćete
- PRON: vaše, vam, vaša, vašem, vi, tvojim, vama, vas
- VERB: očekujete, možete, tražite, želite, Zauzmi, dobijete, dozvolite, imate, izaberete, morate
- 3
- AUX: je, su, će, bi, nije, bude, neće, nisu, biće, budu
- PRON: on, što, ona, oni, ga, njegova, ih, njegov, šta, im
- VERB: kaže, ima, mora, može, treba, navodi, kažu, očekuje, mogu, postoji
Other Features
Syntax
Auxiliary Verbs and Copula
- This corpus uses 3 lemmas as copulas (cop). Examples: biti, biće, period.
- This corpus uses 7 lemmas as auxiliaries (aux). Examples: biti, hteti, sebe, biće, na, neka, će.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN-Acc (21)
- VERB--NOUN-Dat (1)
- VERB--NOUN-Gen (64)
- VERB--NOUN-Gen-ADP(od) (5)
- VERB--NOUN-Nom (1217)
- VERB--PRON-Acc (5)
- VERB--PRON-Gen (1)
- VERB--PRON-Gen-ADP(od) (1)
- VERB--PRON-Nom (422)
- VERB-Inf--NOUN-Acc (4)
- VERB-Inf--NOUN-Gen (1)
- VERB-Inf--NOUN-Gen-ADP(od) (1)
- VERB-Inf--NOUN-Nom (168)
- VERB-Inf--PRON-Acc (3)
- VERB-Inf--PRON-Nom (65)
- VERB-Part--NOUN-Acc (2)
- VERB-Part--NOUN-Acc-ADP(na) (1)
- VERB-Part--NOUN-Gen (62)
- VERB-Part--NOUN-Gen-ADP(od) (8)
- VERB-Part--NOUN-Gen-ADP(preko) (1)
- VERB-Part--NOUN-Nom (1358)
- VERB-Part--PRON-Acc (2)
- VERB-Part--PRON-Gen (1)
- VERB-Part--PRON-Gen-ADP(od) (1)
- VERB-Part--PRON-Nom (445)
- obj
- VERB--NOUN-Acc (1095)
- VERB--NOUN-Acc-ADP(za) (1)
- VERB--NOUN-Dat (2)
- VERB--NOUN-Gen (77)
- VERB--NOUN-Gen-ADP(do) (1)
- VERB--NOUN-Gen-ADP(od) (6)
- VERB--NOUN-Gen-ADP(preko) (1)
- VERB--NOUN-Ins (2)
- VERB--NOUN-Nom (30)
- VERB--PRON-Acc (121)
- VERB--PRON-Acc-ADP(u) (1)
- VERB--PRON-Gen (2)
- VERB--PRON-Nom (22)
- VERB-Inf--NOUN-Acc (201)
- VERB-Inf--NOUN-Gen (13)
- VERB-Inf--NOUN-Nom (3)
- VERB-Inf--PRON-Acc (23)
- VERB-Inf--PRON-Nom (3)
- VERB-Part--NOUN-Acc (912)
- VERB-Part--NOUN-Acc-ADP(na) (1)
- VERB-Part--NOUN-Acc-ADP(u) (1)
- VERB-Part--NOUN-Gen (80)
- VERB-Part--NOUN-Gen-ADP(od) (2)
- VERB-Part--NOUN-Ins (1)
- VERB-Part--NOUN-Nom (29)
- VERB-Part--PRON-Acc (111)
- VERB-Part--PRON-Dat (1)
- VERB-Part--PRON-Gen (1)
- VERB-Part--PRON-Nom (35)
- iobj
- VERB--NOUN-Dat (1)
Verbs with Reflexive Core Objects
- This corpus contains 3 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: opisivati sebe, smatrati sebe, učiniti sebe
Relations Overview
- This corpus uses 2 relation subtypes: det:numgov, nummod:gov
- The following 4 relation types are not used in this corpus at all: expl, dislocated, clf, reparandum