home edit page issue tracker

This page pertains to UD version 2.

UD Croatian SET

Language: Croatian (code: hr)
Family: Indo-European, Slavic

This treebank has been part of Universal Dependencies since the UD v1.1 release.

The following people have contributed to making this treebank part of UD: Željko Agić, Nikola Ljubešić, Daniel Zeman.

Repository: UD_Croatian-SET
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.2

License: CC BY-SA 4.0

Genre: news, web, wiki

Questions, comments? General annotation questions (either Croatian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [zeljko • agic (æt) gmail • com]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.

Annotation	Source
Lemmas	annotated manually in non-UD style, automatically converted to UD
UPOS	annotated manually in non-UD style, automatically converted to UD
XPOS	annotated manually
Features	annotated manually in non-UD style, automatically converted to UD
Relations	annotated manually, natively in UD style

Description

The Croatian UD treebank is based on the SETimes-HR corpus.

The sentences are partially parallel with the smaller Serbian UD treebank, which comes from the Serbian edition of SETimes. For the CoNLL 2018 shared task in parsing (and for UD release 2.2), the Croatian corpus was re-split so that corresponding sentences are in the same section (train/dev/test) in Croatian and Serbian. The re-split had to be done on the Croatian side because the Serbian corpus is smaller and most of it correspond to what used to be training data in Croatian.

For the time being, sentence ids have not been changed although they contain references to train/dev/test. Therefore it is now possible that e.g. sentence id “train-s2852” occurs in the development data, not in training data. This may be changed in future releases.

Also note that the following description of data split and sources refers to the old data split. Thus, sentences 0001-3557 of the “training set” have ids “train-s1” to “train-s3557” but some of them are now in the dev file and some in the test file.

Training set.

Contains 7,689 sentences (169,283 tokens) from three sources:

Sentences 0001-3557: Newspaper text from the Southeast European Times news website, obtained from the SETimes parallel corpus. This part of the treebank is built on top of the SETimes.HR dependency treebank of Croatian;
Sentences 3558-5792: Text from various Croatian web sources.
Sentences 5793-7689: Croatian news web sources.

Development set.

Contains 600 sentences (14,533 tokens) from two sources:

001-200: newspaper text from the Croatian SETimes,
201-600: Croatian news web sources.

Test set.

Contains 600 sentences (13,228 tokens) from three sources:

sentences 001-100: newspaper text,
sentences 101-200: Wikipedia,
sentences 201-297: web sources, and
sentences 298-600: Croatian news web sources.

Details

Sentence and word segmentation was manually checked. The treebank does not include multiword tokens. No language-specific features and relations were used. The POS tags and features were converted from Multext East v4 and manually checked. The syntactic annotation was done manually.

Acknowledgments

When using the Croatian UD treebank, please cite the following paper:

Željko Agić and Nikola Ljubešić. 2015. Universal Dependencies for Croatian (that work for Serbian, too).. In Proc. BSNLP, pp. 1–8 (bib).

See file LICENSE.txt for further licensing information.

Statistics of UD Croatian SET

POS Tags

ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X

Features

Animacy – Case – Definite – Degree – Gender – Gender[psor] – Mood – Number – Number[psor] – NumType – Person – Polarity – Poss – PronType – Reflex – Tense – VerbForm – Voice

Relations

acl – advcl – advmod – advmod:emph – amod – appos – aux – aux:pass – case – cc – ccomp – compound – conj – cop – csubj – csubj:pass – dep – det – discourse – dislocated – expl – expl:pv – fixed – flat – flat:foreign – goeswith – iobj – list – mark – nmod – nsubj – nsubj:pass – nummod – obj – obl – orphan – parataxis – punct – root – vocative – xcomp

Tokenization and Word Segmentation

This corpus contains 8889 sentences and 197044 tokens.

This corpus contains 23092 tokens (12%) that are not followed by a space.

This corpus does not contain words with spaces.

This corpus contains 627 types of words that contain both letters and punctuation. Examples: UN-a, NATO-u, NATO-a, dr., OESS-a, EBRD-a, MMF-a, KFOR-a, tzv., BDP-a, UNMIK-a, prof., EU-a, HDZ-a, SAD-u, SAD-a, SDP-a, g., npr., Pop-Lazić, tj., Index.hr, sl., sv., ICTY-em, Izbori.net, Lukić-Nagy, OHR-a, r., web-stranica, Bukumirić-Katić, EP-a, MMF-om, Moody's, PDV-a, UN-ova, UNESCO-a, e-mail, engl., sc., EULEX-a, HAMAG-a, ICTY-a, KBC-u, NLO-ima, UN-ovog, on-line, st., Alpe-Adria, CiO-a

Morphology

Nominal Features

Gender

Fem
- ADJ: prošle, hrvatske, nove, europske, druge, prva, novu, nova, političke, srpske
- ADJ-Part: održana, otvorena, povećana, smještene, uspostavljena, objavljena, provedena, završena, integrirane, izrečena
- AUX-Part: bila, bile
- DET: koje, koja, ove, koju, kojoj, svoje, svoju, sve, te, ta
- NOUN: godine, godina, zemlje, kuna, zemalja, stranke, vlada, država, strane, vlasti
- NUM: dvije, jedna, jednu, dviju, jedne, obje, jednoj, jednom, obiju, objema
- PRON: ona, joj, neke, je, ju, neku, nekim, one, nje, njom
- PROPN: EU, BiH, Hrvatskoj, Srbije, Hrvatska, Srbija, Hrvatske, Europe, Srbiji, Makedonija
- VERB-Part: mogla, trebala, izjavila, dobila, priopćila, rekla, postala, kazala, imala, objavila

Masc
- ADJ: novi, prvi, drugi, vanjskih, glavni, hrvatski, najveći, novog, bivši, prošlog
- ADJ-Part: održan, otvoren, rođen, namijenjen, objavljen, postignut, uhićen, nazvan, osuđen, povećan
- ADV: najviše
- AUX-Fin: Ivan, autor
- AUX-Part: bio, bili
- DET: koji, svi, svoj, taj, koje, ovaj, ovog, kojem, kojim, sve
- NOUN: milijuna, eura, ljudi, dana, predsjednik, način, poslova, dio, ministar, posto
- NUM: jedan, jednog, jednom, dva, jednim, jedni, oba, dvaju, dvama, obaju
- PRON: ga, mu, on, neki, oni, tko, nitko, njega, njemu, netko
- PROPN: SETimes, UN-a, Windows, NATO-u, Beogradu, NATO-a, Zagrebu, Zagreb, Balkanu, EU
- VERB-Part: izjavio, rekao, kazao, mogli, dodao, mogao, dobili, trebao, trebali, imali

Neut
- ADJ: potrebno, moguće, važno, dobro, drugo, internetskog, prvo, ljudskih, pravo, radno
- ADJ-Part: održano, objavljenom, objavljeno, omogućeno, predviđeno, pronađeno, utvrđeno, učinjeno, provedeno, uhićeno
- AUX-Part: bilo, bila
- DET: to, toga, koje, tome, ovo, koja, svoje, time, tim, tom
- NOUN: vrijeme, mjesto, prava, pitanje, mjesta, pitanja, rješenje, ulaganja, članstvo, području
- NUM: jedno, dva, jednog, jednom, Dvoje, Oba, jednoga
- PRON: što, sve, ništa, nešto, ono, čime, čega, čemu, svega, neka
- PROPN: Kosova, Kosovo, Kosovu, Sarajevu, Skoplju, Kosovom, Skoplja, Skoplje, Sarajevo, Vetvendosje
- VERB-Part: moglo, trebalo, došlo, pokazalo, dogodilo, omogućilo, dovelo, ostalo, počelo, prošlo

Animacy

Anim
- ADJ: najboljeg, novog, bivšeg, drugog, drugoga, popularnog, britanskog, brži, dugogodišnjeg, gangsterskog
- ADJ-Part: nagrađivani, nominiranog, organizirani, podređenog
- DET: kojeg, svojeg, njegova, svog, svoga, kojega, svakog, onoga, mog, našeg
- NOUN: predsjednika, kandidata, ministra, premijera, čovjeka, izvođača, sina, povjerenika, boga, ravnatelja
- NUM: jednog
- PRON: tko, nitko, nekoga, netko, koga, nekog, nikoga, nikome, svatko
- PROPN: Đinđića, Boga, Erdogana, Antu, Borisa, Burkaya, Gruevskog, Ivanova, Krasniqia, Krista

Inan
- ADJ: prvi, novi, veći, drugi, isti, velik, veliki, manji, najbolji, najveći
- ADJ-Part: baziran, iskazan, isticani, ljubljeni, nazvan, obavljeni, odgođeni, održani, oročen, otisnuti
- DET: svoj, koji, taj, ovaj, svaki, njihov, naš, njegov, takav, kakav
- NOUN: način, ponedjeljak, petak, utorak, četvrtak, rad, posao, sustav, život, razvoj
- NUM: jedan, dva, pedeseti, trideset
- PRON: što, čime, ništa, nešto, neki, čega, čemu, ovakav, čim, nečemu
- PROPN: SETimes, NATO, Windows, Balkan, Haag, Zagreb, Cipar, EU, Internet, Beograd

Number

Plur
- ADJ: vanjskih, novih, drugih, mnogi, nove, unutarnjih, drugim, drugi, političkih, ostalih
- ADJ-Part: smještene, izabrani, izloženi, usmjerene, korištene, podijeljeni, integrirane, održani, otkriveni, podignute
- ADV: najviše
- AUX-Fin: su, smo, će, bi, nisu, ćete, ćemo, ste, biste, bismo
- AUX-Part: bili, bile, bila
- DET: koji, koje, kojima, sve, svi, svoje, svih, koja, svim, tih
- NOUN: milijuna, godina, eura, ljudi, kuna, zemalja, poslova, dana, zemlje, prava
- NUM: tri, dva, dvije, dviju, pet, deset, šest, četiri, sedam, devet
- PRON: ih, im, njih, mi, nam, vam, nas, neki, oni, neke
- PROPN: Srbi, Srba, Albanaca, Albanci, Grka, Turaka, kg, Grci, Hrvata, Hrvati
- VERB-Fin: mogu, možete, imaju, moraju, postoje, kažu, žele, možemo, rade, nalaze
- VERB-Part: mogli, dobili, trebali, imali, uspjeli, potpisali, mogle, morali, odlučili, postigli

Sing
- ADJ: prvi, novi, glavni, prošle, drugi, novog, prošlog, bivši, potrebno, europske
- ADJ-Part: održana, održan, otvorena, povećana, objavljenom, održano, otvoren, rođen, namijenjen, objavljen
- AUX-Fin: je, će, bi, nije, sam, neće, bude, jest, bih, nisam
- AUX-Part: bio, bilo, bila
- DET: to, koji, koja, toga, koje, ove, koju, svoj, tome, taj
- NOUN: godine, predsjednik, vrijeme, način, dio, ministar, posto, ponedjeljak, tjedna, vlada
- NUM: jedan, jedna, jednog, jednom, jednu, jedno, jedne, jednim, jednoj, dva
- PRON: ga, mu, on, sve, ona, mi, joj, ono, ja, je
- PROPN: EU, BiH, Kosova, Hrvatskoj, Srbije, SETimes, Hrvatska, Kosovo, Srbija, Hrvatske
- VERB-Fin: može, ima, kaže, treba, nema, mora, postoji, radi, očekuje, navodi
- VERB-Part: izjavio, rekao, kazao, dodao, mogla, moglo, mogao, trebala, trebao, istaknuo

Case

Acc
- ADJ: prvi, novi, novu, nove, veliku, druge, ratne, brojne, drugi, političke
- ADJ-Part: usmjerene, usmjerenu, dodanu, ispunjene, iznesene, izrečeno, optuženog, organizirani, oročene, oročenu
- ADP: za, na, u, uz, kroz, po, pred, pod, među, nad
- AUX-Fin: za
- DET: to, koje, svoje, koju, svoj, sve, svoju, koji, taj, tu
- NOUN: način, vrijeme, ponedjeljak, srijedu, godinu, petak, utorak, mjesto, pomoć, potporu
- NUM: jedan, jednu, dvije, dva, jednog, jedno, tri, oba, obje, četiri
- PRON: se, što, ga, ih, nas, sve, je, nešto, ništa, vas
- PROPN: SETimes, EU, Kosovo, Hrvatsku, BiH, Srbiju, NATO, Tursku, Bugarsku, Europu

Dat
- ADJ: drugima, europskoj, međunarodnim, drugim, gospodarskom, bivšem, državnim, europskim, hrvatskim, mnogima
- ADJ-Part: održanom, otežanim, podijeljenom, potpisanim, povećanim, priznatim, provedenim, ubijenom, uključenim, unesrećenome
- ADP: unatoč, ka, usprkos, k, nasuprot
- DET: kojima, tome, svim, onima, svojim, svima, kojoj, svojoj, kojemu, kojem
- NOUN: novinarima, zemlji, djeci, građanima, javnosti, integraciji, premijeru, uniji, članstvu, internetu
- NUM: jednoj, trima, Dvjema, objema, četirima
- PRON: im, mu, nam, vam, mi, joj, si, ti, nikome, nama
- PROPN: EU, NATO-u, Beogradu, Srbiji, Hrvatskoj, Europi, Kosovu, Turskoj, Bugarskoj, HDZ-u

Gen
- ADJ: vanjskih, novih, prošle, drugih, prošlog, novog, europske, unutarnjih, političkih, hrvatske
- ADJ-Part: organizirane, financiranog, ispitanih, izabranih, iznesenih, nadređenih, najizoliranijih, namijenjenih, obnovljenih, odobrenog
- ADP: od, iz, do, nakon, zbog, prije, protiv, tijekom, bez, između
- ADV: najviše
- DET: toga, ove, svih, ovog, tih, svojih, te, tog, kojih, svoje
- NOUN: godine, milijuna, eura, godina, kuna, dana, zemalja, poslova, posto, ljudi
- NUM: dviju, jednog, jedne, triju, dvaju, obiju, četiriju, obaju, desetaka, jednoga
- PRON: njih, čega, njega, nekog, ih, nekih, svega, nas, sebe, neke
- PROPN: EU, Kosova, Srbije, BiH, Hrvatske, UN-a, Europe, Turske, NATO-a, Crne
- SYM: %

Ins
- ADJ: drugim, ostalim, velikim, novim, političkim, brojnim, međunarodnim, samim, većim, najvećim
- ADJ-Part: nadređenima, predviđenim, zaštićenim, Navedenim, Provedenom, dokazanom, kvalificiranim, najavljenim, najizoliranijom, nanesenom
- ADP: s, sa, među, pod, za, pred, nad, Preda, umjesto
- DET: kojim, kojima, tim, time, svojim, kojom, svojom, svim, takvim, ovom
- NOUN: obzirom, ljudima, zemljama, predsjednikom, nazivom, početkom, putem, godinama, sporazumom, kolegom
- NUM: jednim, jednom
- PRON: čime, njima, sobom, njim, njom, nama, nekim, njime, čim, kim
- PROPN: Srbijom, Crnom, Gorom, Grčkom, Kosovom, EU, Hrvatskom, ICTY-em, Makedonijom, Beogradom

Loc
- ADJ: prvom, novom, drugom, drugim, prvoj, međunarodnim, hrvatskom, svjetskom, velikoj, bivšoj
- ADJ-Part: objavljenom, održanoj, održanom, pogođenim, danom, objavljenoj, postavljenoj, danim, danoj, dostavljenom
- ADP: u, na, o, prema, po, pri, Nasuprot, ka, naspram, pred
- DET: kojoj, kojem, tome, tom, kojima, ovom, svojoj, ovoj, svojim, toj
- NOUN: godini, zemlji, svijetu, području, mjestu, slučaju, odnosu, izvješću, priopćenju, regiji
- NUM: jednom, jednoj, dvama, obje, objema, jednome, oba, četirima
- PRON: njemu, sebi, čemu, nekim, njima, svemu, nama, nekom, nekoj, nekima
- PROPN: Hrvatskoj, Kosovu, Srbiji, EU, Europi, Beogradu, BiH, Makedoniji, NATO-u, Zagrebu

Nom
- ADJ: drugi, novi, glavni, prvi, hrvatski, bivši, potrebno, mnogi, moguće, najveći
- ADJ-Part: održana, otvorena, održan, povećana, održano, rođen, otvoren, namijenjen, objavljen, postignut
- AUX-Fin: Ivan, autor
- DET: koji, to, koja, koje, svi, ta, ovo, ovaj, sve, taj
- NOUN: predsjednik, ministar, vlada, dio, premijer, zemlja, ljudi, broj, većina, zemlje
- NUM: jedan, jedna, dvije, jedno, jedni, dva, obje, oba, deseci, Dvoje
- PRON: što, on, mi, neki, ona, oni, tko, ono, sve, ja
- PROPN: Hrvatska, Srbija, Kosovo, Makedonija, Bugarska, Turska, Windows, EU, Rusija, Albanija

Voc
- ADJ: Nespretni, Uzoriti, dobri, dragi, izviješteno, mala, prvi, svemogući
- ADJ-Part: izviješteno
- DET: moj, moja
- NOUN: gospodine, G., akademiče, braćo, budale, gospodo, gradonačelniče, kurvo, mediji, ministre
- PRON: ti
- PROPN: Bože, Isuse, Radoviću

Definite

Def
- ADJ: novi, hrvatske, hrvatski, moguće, nove, novih, potrebno, najveći, sami, hrvatskog
- ADJ-Part: održana, omogućeno, otvorena, povećana, smještene, objavljena, osnovana, predviđeno, pronađeno, uvršteni
- ADV: najviše
- DET: svi, sve, svih, svim, sva, svima, svu, svoj, svega, svime

Ind
- ADJ: velik, sam, dobar, novi, prvi, gospodarski, značajan, čitav, poznat, rođen
- ADJ-Part: rođen, namijenjen, objavljen, nazvan, osuđen, predstavljen, uhićen, najavljen, napisan, napravljen
- DET: sav

Degree and Polarity

Degree

Cmp
- ADJ: veći, manji, veće, veća, veću, većeg, bolje, bolji, niže, većim
- ADJ-Part: rašireniji, složenija, složenijem
- ADV: više, dalje, kasnije, bolje, ranije, manje, brže, češće, lakše, dulje

Pos
- ADJ: novi, vanjskih, glavni, novih, nove, prošle, hrvatski, novog, hrvatske, moguće
- ADJ-Part: održana, otvorena, održan, povećana, objavljenom, održano, otvoren, rođen, namijenjen, objavljen
- ADV: samo, još, također, već, međutim, posto, oko, danas, kada, ipak

Sup
- ADJ: najveći, najbolji, najveća, najveće, najvećih, najbolje, najboljeg, najvažnije, najvećim, najviši
- ADJ-Part: najizoliranijih, najcjenjenijih, najistaknutiji, najistaknutijih, najizoliranijom, najprodavanije, najtraženijih, najčuvanijih
- ADV: uključujući, najviše, najbolje, najčešće, ističući, dodajući, govoreći, najmanje, ukazujući, najvjerojatnije

Polarity

Neg
- ADP: osim
- AUX-Fin: nije, neće, nisu, nisam, nismo, nećemo, neću, niste
- CCONJ: ni, niti
- NOUN: godine, investicije, isporuka, kvartalu, ljudi, mlijeka, rada, rasponu, regiji, svijeta
- PART: ne, ni, niti
- PROPN: Department, Grka, Yalcinkaya

Pos
- PART: da

Verbal Features

Mood

Cnd
- AUX-Fin: bi, biste, bih, bismo

Imp
- AUX-Fin: budite
- VERB-Fin: kliknite, recimo, izbjegavajte, koristite, potražite, pročitajte, čuvajte, daj, odaberite, otiđite

Ind
- AUX-Fin: je, su, će, nije, smo, sam, neće, nisu, ćete, ćemo
- VERB-Fin: može, ima, kaže, treba, mogu, nema, mora, postoji, možete, imaju

Tense

Imp
- AUX-Fin: bijaše

Past
- ADV-Conv: dodavši, rekavši, Izrazivši, Upucavši, darovavši, došavši, iskusivši, ispričavši, istaknuvši, nadmašivši
- AUX-Fin: bi, biste, bih, bismo
- AUX-Part: bio, bilo, bila, bili, bile
- VERB-Fin: može, dogodi, hoće, iznosi, osigura, pobuni
- VERB-Part: izjavio, rekao, kazao, mogli, dodao, mogla, moglo, mogao, trebala, dobili

Pres
- ADV-Conv: zahvaljujući, uključujući, govoreći, Budući, koristeći, sudeći, tražeći, Komentirajući, baveći, dodajući
- AUX-Fin: je, su, će, nije, smo, sam, neće, nisu, ćete, ćemo
- VERB-Fin: može, ima, kaže, treba, mogu, nema, mora, postoji, možete, imaju

Voice

Act
- AUX-Part: bio, bilo, bila, bili, bile
- VERB-Part: izjavio, rekao, kazao, mogli, dodao, mogla, moglo, mogao, trebala, dobili

Pass
- ADJ-Part: održana, otvorena, održano, otvoren, postignut, povećana, ubijen, pronađeno, provedena, uhićen

Pronouns, Determiners, Quantifiers

PronType

Dem
- ADV: sada, tako, tada, onda, tu, ovdje, toliko, stoga, tamo, ondje
- DET: to, ove, toga, tome, taj, te, ovog, tom, ovaj, ovo
- PRON: ovakav, ovakve, ovakvih, ovakvim, ovakva, ovakvi, ovakvo, ovakvom, onakve, onakvi

Ind
- ADV: više, vrlo, manje, malo, mnogo, najviše, najmanje, dosta, ponekad, nekada
- DET: nekoliko, nekakav, nekakve, nekakvim
- PRON: neki, neke, nešto, nekim, neka, nekog, netko, nekih, neku, nekoga

Int
- DET: Koji, Kakav, Kakva, Kakvi, Kakvu, Koje

Int,Rel
- ADV: kada, kad, kako, gdje, koliko, zašto, odakle
- DET: koji, koje, koja, kojima, koju, kojoj, kojem, kojim, kojeg, kojih
- PRON: što, tko, čime, čega, čemu, koga, čim, kim, kome, kime

Neg
- ADV: nikako, nigdje, ikad
- DET: nikakve, nikakvu, nikakvih, nikakvi, Nikakva, nikakav, nikakvo
- PRON: ništa, nitko, nikome, nikoga, ničeg, NIKOG

Prs
- DET: svoje, svoj, svoju, svojim, njegova, svojih, njegov, naše, svojoj, njihov
- PRON: se, ih, mi, ga, im, mu, on, njih, nam, vam

Tot
- ADV: uvijek, svakako, svuda
- DET: sve, svi, svih, svim, svaki, svaka, sva, svakog, svake, svakom
- PRON: sve, svega, svatko, svemu

NumType

Card
- ADV: više, vrlo, manje, koliko, malo, mnogo, najviše, toliko, najmanje, dosta
- DET: nekoliko, tolikoj
- NUM: tri, dva, jedan, 20, pet, 10, četiri, dvije, 15, 2

Mult
- NUM: desetak, oba, obje, stotinjak, obiju, dvadesetak, tridesetak, dvoje, 17:00, 3:00
- SYM: 50%, 20%, 30%, 9%, 13%, 14%, 16%, 40%, 45%, 60%

Ord
- ADJ: 1., 2004., 2009., 2008., prvi, 2007., 2., 2005., 2006., 2010.

Poss

Yes
- ADJ: nevladinih, nevladine, UN-ova, vladinih, Appleovih, Ashdownov, Božju, UN-ovog, vladini, Appleov
- DET: svoje, svoj, svoju, svojim, njegova, svojih, njegov, naše, svojoj, njihov

Reflex

Yes
- DET: svoje, svoj, svoju, svojim, svojih, svojoj, svojeg, svog, svom, svojem
- PRON: se, sebe, sebi, si, sobom

Person

1
- AUX-Fin: smo, sam, ćemo, bih, bismo, nismo, nisam, ću, nećemo, neću
- DET: naše, naš, naša, naših, našim, moj, moja, našeg, naši, našu
- PRON: mi, nam, nas, ja, me, nama, mene, meni, mnom
- VERB-Fin: možemo, mislim, imamo, moramo, želimo, mogu, vjerujem, nadamo, znam, imam

2
- AUX-Fin: ćete, ste, biste, niste, Jeste, bi, nećete, si, ćeš, budite
- DET: vaš, vaša, vaše, vašem, vašim, vašeg, Tvoji, tvoja, tvoje, tvojim
- PRON: vam, vas, ti, vi, vama, te, tebe, tebi
- VERB-Fin: možete, želite, kliknite, imate, morate, nemojte, koristite, nemate, očekujete, tražite

3
- AUX-Fin: je, su, će, bi, nije, neće, nisu, bude, jest, budu
- DET: njegova, njegov, njihov, njihova, njegove, njihove, njegovu, njihovu, njezina, njihovo
- PRON: ih, ga, im, mu, on, njih, ona, ništa, joj, oni
- VERB-Fin: može, ima, kaže, treba, mogu, nema, mora, postoji, imaju, radi

Gender[psor]

Fem
- DET: njezina, njezine, njezin, njen, njezinu, njezinih, njezino, njene, njena, njezinim

Masc,Neut
- DET: njegova, njegov, njegove, njegovu, njegovim, njegovoj, njegovog, njegovih, njegovo, njegovom

Number[psor]

Plur
- DET: naše, njihov, njihova, naš, njihove, naša, njihovu, naših, našim, njihovo

Sing
- DET: njegova, njegov, njegove, njegovu, njezina, moj, njegovim, njezine, moja, njegovoj

Other Features

Syntax

Auxiliary Verbs and Copula

This corpus uses 13 lemmas as copulas (cop). Examples: biti, sebe, Ivan, autor, bilo, bivati, budeti, davati, gladovati, smjeti, težiti, za, željeti.

This corpus uses 23 lemmas as auxiliaries (aux). Examples: biti, htjeti, sebe, li, neka, on, u, od, taj, za, Dimitar, bilo, državni, isto, iz, na, o, ploviti, prav, protiv, s, svaki, svečan.
This corpus uses 9 lemmas as passive auxiliaries (aux:pass). Examples: biti, sebe, htjeti, dozvoliti, ja, na, po, također, u.

Core Arguments, Oblique Arguments and Adjuncts

Here we consider only relations between verbs (parent) and nouns or pronouns (child).

nsubj
- VERB-Fin--NOUN (7)
- VERB-Fin--NOUN-Acc (26)
- VERB-Fin--NOUN-Acc-ADP(od) (1)
- VERB-Fin--NOUN-Dat (2)
- VERB-Fin--NOUN-Gen (115)
- VERB-Fin--NOUN-Gen-ADP(do) (3)
- VERB-Fin--NOUN-Gen-ADP(od) (13)
- VERB-Fin--NOUN-Nom (2489)
- VERB-Fin--NOUN-Voc (1)
- VERB-Fin--PRON-Acc (2)
- VERB-Fin--PRON-Gen (5)
- VERB-Fin--PRON-Gen-ADP(od) (1)
- VERB-Fin--PRON-Nom (348)
- VERB-Inf--NOUN-Acc (8)
- VERB-Inf--NOUN-Gen (13)
- VERB-Inf--NOUN-Gen-ADP(od) (2)
- VERB-Inf--NOUN-Nom (427)
- VERB-Inf--PRON-Acc (1)
- VERB-Inf--PRON-Nom (55)
- VERB-Part--NOUN (7)
- VERB-Part--NOUN-Acc (11)
- VERB-Part--NOUN-Acc-ADP(na) (1)
- VERB-Part--NOUN-Gen (77)
- VERB-Part--NOUN-Gen-ADP(između) (1)
- VERB-Part--NOUN-Gen-ADP(od) (20)
- VERB-Part--NOUN-Gen-ADP(oko) (1)
- VERB-Part--NOUN-Nom (2193)
- VERB-Part--NOUN-Nom-ADP(nevladin) (1)
- VERB-Part--PRON-Acc (2)
- VERB-Part--PRON-Dat (1)
- VERB-Part--PRON-Gen (5)
- VERB-Part--PRON-Gen-ADP(od) (1)
- VERB-Part--PRON-Nom (204)

obj
- VERB-Fin--NOUN (5)
- VERB-Fin--NOUN-Acc (1881)
- VERB-Fin--NOUN-Acc-ADP(na) (3)
- VERB-Fin--NOUN-Acc-ADP(od) (2)
- VERB-Fin--NOUN-Acc-ADP(velik) (1)
- VERB-Fin--NOUN-Dat (118)
- VERB-Fin--NOUN-Gen (216)
- VERB-Fin--NOUN-Gen-ADP(od) (11)
- VERB-Fin--NOUN-Gen-ADP(po) (1)
- VERB-Fin--NOUN-Gen-ADP(preko) (1)
- VERB-Fin--NOUN-Ins (31)
- VERB-Fin--NOUN-Loc (7)
- VERB-Fin--NOUN-Nom (45)
- VERB-Fin--PRON-Acc (507)
- VERB-Fin--PRON-Acc-ADP(na) (2)
- VERB-Fin--PRON-Acc-ADP(za) (3)
- VERB-Fin--PRON-Dat (75)
- VERB-Fin--PRON-Gen (2)
- VERB-Fin--PRON-Gen-ADP(od) (1)
- VERB-Fin--PRON-Ins (3)
- VERB-Fin--PRON-Loc (1)
- VERB-Fin--PRON-Nom (11)
- VERB-Inf--NOUN (1)
- VERB-Inf--NOUN-Acc (1236)
- VERB-Inf--NOUN-Dat (42)
- VERB-Inf--NOUN-Gen (98)
- VERB-Inf--NOUN-Gen-ADP(do) (2)
- VERB-Inf--NOUN-Gen-ADP(između) (1)
- VERB-Inf--NOUN-Gen-ADP(od) (2)
- VERB-Inf--NOUN-Gen-ADP(oko) (1)
- VERB-Inf--NOUN-Ins (15)
- VERB-Inf--NOUN-Loc (1)
- VERB-Inf--NOUN-Loc-ADP(u) (1)
- VERB-Inf--NOUN-Nom (23)
- VERB-Inf--PRON-Acc (175)
- VERB-Inf--PRON-Dat (20)
- VERB-Inf--PRON-Ins (2)
- VERB-Inf--PRON-Nom (2)
- VERB-Part--NOUN (1)
- VERB-Part--NOUN-Acc (1784)
- VERB-Part--NOUN-Acc-ADP(na) (1)
- VERB-Part--NOUN-Acc-ADP(po) (1)
- VERB-Part--NOUN-Acc-ADP(za) (1)
- VERB-Part--NOUN-Dat (111)
- VERB-Part--NOUN-Gen (163)
- VERB-Part--NOUN-Gen-ADP(do) (1)
- VERB-Part--NOUN-Gen-ADP(od) (6)
- VERB-Part--NOUN-Ins (25)
- VERB-Part--NOUN-Loc (14)
- VERB-Part--NOUN-Loc-ADP(o) (1)
- VERB-Part--NOUN-Nom (40)
- VERB-Part--PRON-Acc (316)
- VERB-Part--PRON-Acc-ADP(na) (1)
- VERB-Part--PRON-Acc-ADP(za) (3)
- VERB-Part--PRON-Dat (36)
- VERB-Part--PRON-Gen (2)
- VERB-Part--PRON-Ins (1)
- VERB-Part--PRON-Loc (1)
- VERB-Part--PRON-Nom (3)

iobj
- VERB-Fin--NOUN-Acc (3)
- VERB-Fin--NOUN-Dat (78)
- VERB-Fin--NOUN-Gen (5)
- VERB-Fin--NOUN-Ins (18)
- VERB-Fin--NOUN-Loc (6)
- VERB-Fin--PRON-Dat (107)
- VERB-Fin--PRON-Ins (1)
- VERB-Fin--PRON-Nom (1)
- VERB-Inf--NOUN-Dat (59)
- VERB-Inf--NOUN-Gen (1)
- VERB-Inf--NOUN-Ins (15)
- VERB-Inf--NOUN-Loc (2)
- VERB-Inf--PRON-Acc (2)
- VERB-Inf--PRON-Dat (44)
- VERB-Inf--PRON-Loc (1)
- VERB-Part--NOUN-Acc (1)
- VERB-Part--NOUN-Dat (92)
- VERB-Part--NOUN-Gen (3)
- VERB-Part--NOUN-Ins (14)
- VERB-Part--NOUN-Ins-ADP(sa) (1)
- VERB-Part--NOUN-Loc (5)
- VERB-Part--PRON-Acc (1)
- VERB-Part--PRON-Dat (65)
- VERB-Part--PRON-Gen (1)
- VERB-Part--PRON-Ins (1)

Reflexive Verbs

This corpus contains 680 lemmas that occur at least once with an expl:pv child. Examples: moći se, nalaziti se, očekivati se, navoditi se, nadati se, raditi se, sastati se, odnositi se, dogoditi se, smatrati se, činiti se, trebati se, baviti se, slagati se, složiti se, koristiti se, naći se, protiviti se, morati se, suočavati se, održavati se, boriti se, osjećati se, nastaviti se, provoditi se, održati se, odvijati se, pojaviti se, pridružiti se, isticati se, pokazati se, pozivati se, sastojati se, sučeljavati se, vratiti se, žaliti se, promijeniti se, ticati se, vidjeti se, mijenjati se, povećati se, priključiti se, tražiti se, zvati se, bojati se, dodavati se, nastavljati se, okupiti se, procjenjivati se, vjerovati se

Verbs with Reflexive Core Objects

This corpus contains 260 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: baviti se, nalaziti se, vratiti se, kretati se, moći se, nadati se, pojaviti se, boriti se, odlučiti se, trebati se, činiti se, dogoditi se, odnositi se, osjećati se, pridružiti se, priključiti se, vraćati se, zalagati se, događati se, grijati se, okladiti se, očitovati se, pokazati se, pripremati se, raditi se, sastati se, sastojati se, uvjeriti se, dizati se, morati se, naći se, obratiti se, okupljati se, pitati se, probuditi se, razvijati se, služiti se, suočiti se, temeljiti se, upoznati se, širiti se, aktivirati se, brinuti se, fokusirati se, gaditi se, izjasniti se, javiti se, mijenjati se, odlučivati se, odreći se

Out of those, 13 lemmas occurred more than once, but never without a reflexive dependent. Examples: boriti, zalagati, grijati, okladiti, probuditi, fokusirati, gaditi, izjasniti, oslanjati, požaliti, pridruživati, spojiti, zaduživati

Relations Overview

This corpus uses 6 relation subtypes: advmod:emph, aux:pass, csubj:pass, expl:pv, flat:foreign, nsubj:pass
The following 2 relation types are not used in this corpus at all: clf, reparandum