UD Croatian SET
Language: Croatian (code: hr
)
Family: Indo-European, Slavic
This treebank has been part of Universal Dependencies since the UD v1.1 release.
The following people have contributed to making this treebank part of UD: Željko Agić, Nikola Ljubešić, Daniel Zeman.
Repository: UD_Croatian-SET
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.2
License: CC BY-SA 4.0
Genre: news, web, wiki
Questions, comments? General annotation questions (either Croatian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [zeljko • agic (æt) gmail • com]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually in non-UD style, automatically converted to UD |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | annotated manually |
Features | annotated manually in non-UD style, automatically converted to UD |
Relations | annotated manually, natively in UD style |
Description
The Croatian UD treebank is based on the SETimes-HR corpus.
The sentences are partially parallel with the smaller Serbian UD treebank, which comes from the Serbian edition of SETimes. For the CoNLL 2018 shared task in parsing (and for UD release 2.2), the Croatian corpus was re-split so that corresponding sentences are in the same section (train/dev/test) in Croatian and Serbian. The re-split had to be done on the Croatian side because the Serbian corpus is smaller and most of it correspond to what used to be training data in Croatian.
For the time being, sentence ids have not been changed although they contain references to train/dev/test. Therefore it is now possible that e.g. sentence id “train-s2852” occurs in the development data, not in training data. This may be changed in future releases.
Also note that the following description of data split and sources refers to the old data split. Thus, sentences 0001-3557 of the “training set” have ids “train-s1” to “train-s3557” but some of them are now in the dev file and some in the test file.
Training set.
Contains 7,689 sentences (169,283 tokens) from three sources:
- Sentences 0001-3557: Newspaper text from the Southeast European Times news website, obtained from the SETimes parallel corpus. This part of the treebank is built on top of the SETimes.HR dependency treebank of Croatian;
- Sentences 3558-5792: Text from various Croatian web sources.
- Sentences 5793-7689: Croatian news web sources.
Development set.
Contains 600 sentences (14,533 tokens) from two sources:
- 001-200: newspaper text from the Croatian SETimes,
- 201-600: Croatian news web sources.
Test set.
Contains 600 sentences (13,228 tokens) from three sources:
- sentences 001-100: newspaper text,
- sentences 101-200: Wikipedia,
- sentences 201-297: web sources, and
- sentences 298-600: Croatian news web sources.
Details
Sentence and word segmentation was manually checked. The treebank does not include multiword tokens. No language-specific features and relations were used. The POS tags and features were converted from Multext East v4 and manually checked. The syntactic annotation was done manually.
Acknowledgments
When using the Croatian UD treebank, please cite the following paper:
- Željko Agić and Nikola Ljubešić. 2015. Universal Dependencies for Croatian (that work for Serbian, too).. In Proc. BSNLP, pp. 1–8 (bib).
See file LICENSE.txt for further licensing information.
Statistics of UD Croatian SET
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Animacy – Case – Definite – Degree – Gender – Gender[psor] – Mood – Number – Number[psor] – NumType – Person – Polarity – Poss – PronType – Reflex – Tense – VerbForm – Voice
Relations
acl – advcl – advmod – advmod:emph – amod – appos – aux – aux:pass – case – cc – ccomp – compound – conj – cop – csubj – csubj:pass – dep – det – discourse – dislocated – expl – expl:pv – fixed – flat – flat:foreign – goeswith – iobj – list – mark – nmod – nsubj – nsubj:pass – nummod – obj – obl – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 8889 sentences and 197044 tokens.
- This corpus contains 23092 tokens (12%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 627 types of words that contain both letters and punctuation. Examples: UN-a, NATO-u, NATO-a, dr., OESS-a, EBRD-a, MMF-a, KFOR-a, tzv., BDP-a, UNMIK-a, prof., EU-a, HDZ-a, SAD-u, SAD-a, SDP-a, g., npr., Pop-Lazić, tj., Index.hr, sl., sv., ICTY-em, Izbori.net, Lukić-Nagy, OHR-a, r., web-stranica, Bukumirić-Katić, EP-a, MMF-om, Moody's, PDV-a, UN-ova, UNESCO-a, e-mail, engl., sc., EULEX-a, HAMAG-a, ICTY-a, KBC-u, NLO-ima, UN-ovog, on-line, st., Alpe-Adria, CiO-a
Morphology
Tags
- This corpus uses 17 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus contains 31 word types tagged as particles (PART): Eto, ali, ama, bar, baš, bilo, da, dakle, evo, god, i, jedva, kako, li, ma, naime, ne, neka, nešto, ni, niti, ono, pak, samo, sve, tako, to, ustvari, više, zar, što
- This corpus contains 31 lemmas tagged as pronouns (PRON): ikakav, itko, ičiji, išta, ja, kakav-takav, mi, neki, netko, nečiji, nešto, nikoji, nitko, ništa, on, onakav, oni, ovakav, pokoji, sebe, svatko, svačiji, svašta, sve, ti, tko, tolik, vi, šta, što, štošta
- This corpus contains 23 lemmas tagged as determiners (DET): kakav, koji, koliki, moj, naš, nekakav, nekoliko, nikakav, njegov, njen, njezin, njihov, onaj, ovaj, sav, svaki, svoj, taj, takav, toliko, tvoj, vaš, čiji
- This corpus contains 17 lemmas tagged as auxiliaries (AUX): Ivan, autor, banka, bilo, biti, bivati, budeti, davati, gladovati, htjeti, moći, nakostriješiti, smjeti, susretati, težiti, za, željeti
- Out of the above, 9 lemmas occurred sometimes as AUX and sometimes as VERB: bivati, budeti, davati, htjeti, moći, smjeti, susretati, težiti, željeti
- There are 4 (de)verbal forms:
- Conv
- ADV: zahvaljujući, uključujući, govoreći, Budući, dodavši, koristeći, sudeći, tražeći, Komentirajući, baveći
- Fin
- AUX: je, su, će, bi, nije, smo, sam, neće, nisu, ćete
- VERB: može, ima, kaže, treba, mogu, nema, mora, postoji, možete, imaju
- Inf
- AUX: biti, bit
- VERB: imati, pomoći, raditi, pronaći, vidjeti, reći, nastaviti, dobiti, doći, morati
- Part
- ADJ: održana, otvorena, održan, povećana, objavljenom, održano, otvoren, rođen, namijenjen, objavljen
- AUX: bio, bilo, bila, bili, bile
- VERB: izjavio, rekao, kazao, mogli, dodao, mogla, moglo, mogao, trebala, dobili
Nominal Features
- Fem
- ADJ: prošle, hrvatske, nove, europske, druge, prva, novu, nova, političke, srpske
- ADJ-Part: održana, otvorena, povećana, smještene, uspostavljena, objavljena, provedena, završena, integrirane, izrečena
- AUX-Part: bila, bile
- DET: koje, koja, ove, koju, kojoj, svoje, svoju, sve, te, ta
- NOUN: godine, godina, zemlje, kuna, zemalja, stranke, vlada, država, strane, vlasti
- NUM: dvije, jedna, jednu, dviju, jedne, obje, jednoj, jednom, obiju, objema
- PRON: ona, joj, neke, je, ju, neku, nekim, one, nje, njom
- PROPN: EU, BiH, Hrvatskoj, Srbije, Hrvatska, Srbija, Hrvatske, Europe, Srbiji, Makedonija
- VERB-Part: mogla, trebala, izjavila, dobila, priopćila, rekla, postala, kazala, imala, objavila
- Masc
- ADJ: novi, prvi, drugi, vanjskih, glavni, hrvatski, najveći, novog, bivši, prošlog
- ADJ-Part: održan, otvoren, rođen, namijenjen, objavljen, postignut, uhićen, nazvan, osuđen, povećan
- ADV: najviše
- AUX-Fin: Ivan, autor
- AUX-Part: bio, bili
- DET: koji, svi, svoj, taj, koje, ovaj, ovog, kojem, kojim, sve
- NOUN: milijuna, eura, ljudi, dana, predsjednik, način, poslova, dio, ministar, posto
- NUM: jedan, jednog, jednom, dva, jednim, jedni, oba, dvaju, dvama, obaju
- PRON: ga, mu, on, neki, oni, tko, nitko, njega, njemu, netko
- PROPN: SETimes, UN-a, Windows, NATO-u, Beogradu, NATO-a, Zagrebu, Zagreb, Balkanu, EU
- VERB-Part: izjavio, rekao, kazao, mogli, dodao, mogao, dobili, trebao, trebali, imali
- Neut
- ADJ: potrebno, moguće, važno, dobro, drugo, internetskog, prvo, ljudskih, pravo, radno
- ADJ-Part: održano, objavljenom, objavljeno, omogućeno, predviđeno, pronađeno, utvrđeno, učinjeno, provedeno, uhićeno
- AUX-Part: bilo, bila
- DET: to, toga, koje, tome, ovo, koja, svoje, time, tim, tom
- NOUN: vrijeme, mjesto, prava, pitanje, mjesta, pitanja, rješenje, ulaganja, članstvo, području
- NUM: jedno, dva, jednog, jednom, Dvoje, Oba, jednoga
- PRON: što, sve, ništa, nešto, ono, čime, čega, čemu, svega, neka
- PROPN: Kosova, Kosovo, Kosovu, Sarajevu, Skoplju, Kosovom, Skoplja, Skoplje, Sarajevo, Vetvendosje
- VERB-Part: moglo, trebalo, došlo, pokazalo, dogodilo, omogućilo, dovelo, ostalo, počelo, prošlo
- Anim
- ADJ: najboljeg, novog, bivšeg, drugog, drugoga, popularnog, britanskog, brži, dugogodišnjeg, gangsterskog
- ADJ-Part: nagrađivani, nominiranog, organizirani, podređenog
- DET: kojeg, svojeg, njegova, svog, svoga, kojega, svakog, onoga, mog, našeg
- NOUN: predsjednika, kandidata, ministra, premijera, čovjeka, izvođača, sina, povjerenika, boga, ravnatelja
- NUM: jednog
- PRON: tko, nitko, nekoga, netko, koga, nekog, nikoga, nikome, svatko
- PROPN: Đinđića, Boga, Erdogana, Antu, Borisa, Burkaya, Gruevskog, Ivanova, Krasniqia, Krista
- Inan
- ADJ: prvi, novi, veći, drugi, isti, velik, veliki, manji, najbolji, najveći
- ADJ-Part: baziran, iskazan, isticani, ljubljeni, nazvan, obavljeni, odgođeni, održani, oročen, otisnuti
- DET: svoj, koji, taj, ovaj, svaki, njihov, naš, njegov, takav, kakav
- NOUN: način, ponedjeljak, petak, utorak, četvrtak, rad, posao, sustav, život, razvoj
- NUM: jedan, dva, pedeseti, trideset
- PRON: što, čime, ništa, nešto, neki, čega, čemu, ovakav, čim, nečemu
- PROPN: SETimes, NATO, Windows, Balkan, Haag, Zagreb, Cipar, EU, Internet, Beograd
- Plur
- ADJ: vanjskih, novih, drugih, mnogi, nove, unutarnjih, drugim, drugi, političkih, ostalih
- ADJ-Part: smještene, izabrani, izloženi, usmjerene, korištene, podijeljeni, integrirane, održani, otkriveni, podignute
- ADV: najviše
- AUX-Fin: su, smo, će, bi, nisu, ćete, ćemo, ste, biste, bismo
- AUX-Part: bili, bile, bila
- DET: koji, koje, kojima, sve, svi, svoje, svih, koja, svim, tih
- NOUN: milijuna, godina, eura, ljudi, kuna, zemalja, poslova, dana, zemlje, prava
- NUM: tri, dva, dvije, dviju, pet, deset, šest, četiri, sedam, devet
- PRON: ih, im, njih, mi, nam, vam, nas, neki, oni, neke
- PROPN: Srbi, Srba, Albanaca, Albanci, Grka, Turaka, kg, Grci, Hrvata, Hrvati
- VERB-Fin: mogu, možete, imaju, moraju, postoje, kažu, žele, možemo, rade, nalaze
- VERB-Part: mogli, dobili, trebali, imali, uspjeli, potpisali, mogle, morali, odlučili, postigli
- Sing
- ADJ: prvi, novi, glavni, prošle, drugi, novog, prošlog, bivši, potrebno, europske
- ADJ-Part: održana, održan, otvorena, povećana, objavljenom, održano, otvoren, rođen, namijenjen, objavljen
- AUX-Fin: je, će, bi, nije, sam, neće, bude, jest, bih, nisam
- AUX-Part: bio, bilo, bila
- DET: to, koji, koja, toga, koje, ove, koju, svoj, tome, taj
- NOUN: godine, predsjednik, vrijeme, način, dio, ministar, posto, ponedjeljak, tjedna, vlada
- NUM: jedan, jedna, jednog, jednom, jednu, jedno, jedne, jednim, jednoj, dva
- PRON: ga, mu, on, sve, ona, mi, joj, ono, ja, je
- PROPN: EU, BiH, Kosova, Hrvatskoj, Srbije, SETimes, Hrvatska, Kosovo, Srbija, Hrvatske
- VERB-Fin: može, ima, kaže, treba, nema, mora, postoji, radi, očekuje, navodi
- VERB-Part: izjavio, rekao, kazao, dodao, mogla, moglo, mogao, trebala, trebao, istaknuo
- Acc
- ADJ: prvi, novi, novu, nove, veliku, druge, ratne, brojne, drugi, političke
- ADJ-Part: usmjerene, usmjerenu, dodanu, ispunjene, iznesene, izrečeno, optuženog, organizirani, oročene, oročenu
- ADP: za, na, u, uz, kroz, po, pred, pod, među, nad
- AUX-Fin: za
- DET: to, koje, svoje, koju, svoj, sve, svoju, koji, taj, tu
- NOUN: način, vrijeme, ponedjeljak, srijedu, godinu, petak, utorak, mjesto, pomoć, potporu
- NUM: jedan, jednu, dvije, dva, jednog, jedno, tri, oba, obje, četiri
- PRON: se, što, ga, ih, nas, sve, je, nešto, ništa, vas
- PROPN: SETimes, EU, Kosovo, Hrvatsku, BiH, Srbiju, NATO, Tursku, Bugarsku, Europu
- Dat
- ADJ: drugima, europskoj, međunarodnim, drugim, gospodarskom, bivšem, državnim, europskim, hrvatskim, mnogima
- ADJ-Part: održanom, otežanim, podijeljenom, potpisanim, povećanim, priznatim, provedenim, ubijenom, uključenim, unesrećenome
- ADP: unatoč, ka, usprkos, k, nasuprot
- DET: kojima, tome, svim, onima, svojim, svima, kojoj, svojoj, kojemu, kojem
- NOUN: novinarima, zemlji, djeci, građanima, javnosti, integraciji, premijeru, uniji, članstvu, internetu
- NUM: jednoj, trima, Dvjema, objema, četirima
- PRON: im, mu, nam, vam, mi, joj, si, ti, nikome, nama
- PROPN: EU, NATO-u, Beogradu, Srbiji, Hrvatskoj, Europi, Kosovu, Turskoj, Bugarskoj, HDZ-u
- Gen
- ADJ: vanjskih, novih, prošle, drugih, prošlog, novog, europske, unutarnjih, političkih, hrvatske
- ADJ-Part: organizirane, financiranog, ispitanih, izabranih, iznesenih, nadređenih, najizoliranijih, namijenjenih, obnovljenih, odobrenog
- ADP: od, iz, do, nakon, zbog, prije, protiv, tijekom, bez, između
- ADV: najviše
- DET: toga, ove, svih, ovog, tih, svojih, te, tog, kojih, svoje
- NOUN: godine, milijuna, eura, godina, kuna, dana, zemalja, poslova, posto, ljudi
- NUM: dviju, jednog, jedne, triju, dvaju, obiju, četiriju, obaju, desetaka, jednoga
- PRON: njih, čega, njega, nekog, ih, nekih, svega, nas, sebe, neke
- PROPN: EU, Kosova, Srbije, BiH, Hrvatske, UN-a, Europe, Turske, NATO-a, Crne
- SYM: %
- Ins
- ADJ: drugim, ostalim, velikim, novim, političkim, brojnim, međunarodnim, samim, većim, najvećim
- ADJ-Part: nadređenima, predviđenim, zaštićenim, Navedenim, Provedenom, dokazanom, kvalificiranim, najavljenim, najizoliranijom, nanesenom
- ADP: s, sa, među, pod, za, pred, nad, Preda, umjesto
- DET: kojim, kojima, tim, time, svojim, kojom, svojom, svim, takvim, ovom
- NOUN: obzirom, ljudima, zemljama, predsjednikom, nazivom, početkom, putem, godinama, sporazumom, kolegom
- NUM: jednim, jednom
- PRON: čime, njima, sobom, njim, njom, nama, nekim, njime, čim, kim
- PROPN: Srbijom, Crnom, Gorom, Grčkom, Kosovom, EU, Hrvatskom, ICTY-em, Makedonijom, Beogradom
- Loc
- ADJ: prvom, novom, drugom, drugim, prvoj, međunarodnim, hrvatskom, svjetskom, velikoj, bivšoj
- ADJ-Part: objavljenom, održanoj, održanom, pogođenim, danom, objavljenoj, postavljenoj, danim, danoj, dostavljenom
- ADP: u, na, o, prema, po, pri, Nasuprot, ka, naspram, pred
- DET: kojoj, kojem, tome, tom, kojima, ovom, svojoj, ovoj, svojim, toj
- NOUN: godini, zemlji, svijetu, području, mjestu, slučaju, odnosu, izvješću, priopćenju, regiji
- NUM: jednom, jednoj, dvama, obje, objema, jednome, oba, četirima
- PRON: njemu, sebi, čemu, nekim, njima, svemu, nama, nekom, nekoj, nekima
- PROPN: Hrvatskoj, Kosovu, Srbiji, EU, Europi, Beogradu, BiH, Makedoniji, NATO-u, Zagrebu
- Nom
- ADJ: drugi, novi, glavni, prvi, hrvatski, bivši, potrebno, mnogi, moguće, najveći
- ADJ-Part: održana, otvorena, održan, povećana, održano, rođen, otvoren, namijenjen, objavljen, postignut
- AUX-Fin: Ivan, autor
- DET: koji, to, koja, koje, svi, ta, ovo, ovaj, sve, taj
- NOUN: predsjednik, ministar, vlada, dio, premijer, zemlja, ljudi, broj, većina, zemlje
- NUM: jedan, jedna, dvije, jedno, jedni, dva, obje, oba, deseci, Dvoje
- PRON: što, on, mi, neki, ona, oni, tko, ono, sve, ja
- PROPN: Hrvatska, Srbija, Kosovo, Makedonija, Bugarska, Turska, Windows, EU, Rusija, Albanija
- Voc
- ADJ: Nespretni, Uzoriti, dobri, dragi, izviješteno, mala, prvi, svemogući
- ADJ-Part: izviješteno
- DET: moj, moja
- NOUN: gospodine, G., akademiče, braćo, budale, gospodo, gradonačelniče, kurvo, mediji, ministre
- PRON: ti
- PROPN: Bože, Isuse, Radoviću
- Def
- ADJ: novi, hrvatske, hrvatski, moguće, nove, novih, potrebno, najveći, sami, hrvatskog
- ADJ-Part: održana, omogućeno, otvorena, povećana, smještene, objavljena, osnovana, predviđeno, pronađeno, uvršteni
- ADV: najviše
- DET: svi, sve, svih, svim, sva, svima, svu, svoj, svega, svime
- Ind
- ADJ: velik, sam, dobar, novi, prvi, gospodarski, značajan, čitav, poznat, rođen
- ADJ-Part: rođen, namijenjen, objavljen, nazvan, osuđen, predstavljen, uhićen, najavljen, napisan, napravljen
- DET: sav
Degree and Polarity
- Cmp
- ADJ: veći, manji, veće, veća, veću, većeg, bolje, bolji, niže, većim
- ADJ-Part: rašireniji, složenija, složenijem
- ADV: više, dalje, kasnije, bolje, ranije, manje, brže, češće, lakše, dulje
- Pos
- ADJ: novi, vanjskih, glavni, novih, nove, prošle, hrvatski, novog, hrvatske, moguće
- ADJ-Part: održana, otvorena, održan, povećana, objavljenom, održano, otvoren, rođen, namijenjen, objavljen
- ADV: samo, još, također, već, međutim, posto, oko, danas, kada, ipak
- Sup
- ADJ: najveći, najbolji, najveća, najveće, najvećih, najbolje, najboljeg, najvažnije, najvećim, najviši
- ADJ-Part: najizoliranijih, najcjenjenijih, najistaknutiji, najistaknutijih, najizoliranijom, najprodavanije, najtraženijih, najčuvanijih
- ADV: uključujući, najviše, najbolje, najčešće, ističući, dodajući, govoreći, najmanje, ukazujući, najvjerojatnije
- Neg
- ADP: osim
- AUX-Fin: nije, neće, nisu, nisam, nismo, nećemo, neću, niste
- CCONJ: ni, niti
- NOUN: godine, investicije, isporuka, kvartalu, ljudi, mlijeka, rada, rasponu, regiji, svijeta
- PART: ne, ni, niti
- PROPN: Department, Grka, Yalcinkaya
- Pos
- PART: da
Verbal Features
- Cnd
- AUX-Fin: bi, biste, bih, bismo
- Imp
- AUX-Fin: budite
- VERB-Fin: kliknite, recimo, izbjegavajte, koristite, potražite, pročitajte, čuvajte, daj, odaberite, otiđite
- Ind
- AUX-Fin: je, su, će, nije, smo, sam, neće, nisu, ćete, ćemo
- VERB-Fin: može, ima, kaže, treba, mogu, nema, mora, postoji, možete, imaju
- Imp
- AUX-Fin: bijaše
- Past
- ADV-Conv: dodavši, rekavši, Izrazivši, Upucavši, darovavši, došavši, iskusivši, ispričavši, istaknuvši, nadmašivši
- AUX-Fin: bi, biste, bih, bismo
- AUX-Part: bio, bilo, bila, bili, bile
- VERB-Fin: može, dogodi, hoće, iznosi, osigura, pobuni
- VERB-Part: izjavio, rekao, kazao, mogli, dodao, mogla, moglo, mogao, trebala, dobili
- Pres
- ADV-Conv: zahvaljujući, uključujući, govoreći, Budući, koristeći, sudeći, tražeći, Komentirajući, baveći, dodajući
- AUX-Fin: je, su, će, nije, smo, sam, neće, nisu, ćete, ćemo
- VERB-Fin: može, ima, kaže, treba, mogu, nema, mora, postoji, možete, imaju
- Act
- AUX-Part: bio, bilo, bila, bili, bile
- VERB-Part: izjavio, rekao, kazao, mogli, dodao, mogla, moglo, mogao, trebala, dobili
- Pass
- ADJ-Part: održana, otvorena, održano, otvoren, postignut, povećana, ubijen, pronađeno, provedena, uhićen
Pronouns, Determiners, Quantifiers
- Dem
- ADV: sada, tako, tada, onda, tu, ovdje, toliko, stoga, tamo, ondje
- DET: to, ove, toga, tome, taj, te, ovog, tom, ovaj, ovo
- PRON: ovakav, ovakve, ovakvih, ovakvim, ovakva, ovakvi, ovakvo, ovakvom, onakve, onakvi
- Ind
- ADV: više, vrlo, manje, malo, mnogo, najviše, najmanje, dosta, ponekad, nekada
- DET: nekoliko, nekakav, nekakve, nekakvim
- PRON: neki, neke, nešto, nekim, neka, nekog, netko, nekih, neku, nekoga
- Int
- DET: Koji, Kakav, Kakva, Kakvi, Kakvu, Koje
- Int,Rel
- ADV: kada, kad, kako, gdje, koliko, zašto, odakle
- DET: koji, koje, koja, kojima, koju, kojoj, kojem, kojim, kojeg, kojih
- PRON: što, tko, čime, čega, čemu, koga, čim, kim, kome, kime
- Neg
- ADV: nikako, nigdje, ikad
- DET: nikakve, nikakvu, nikakvih, nikakvi, Nikakva, nikakav, nikakvo
- PRON: ništa, nitko, nikome, nikoga, ničeg, NIKOG
- Prs
- DET: svoje, svoj, svoju, svojim, njegova, svojih, njegov, naše, svojoj, njihov
- PRON: se, ih, mi, ga, im, mu, on, njih, nam, vam
- Tot
- ADV: uvijek, svakako, svuda
- DET: sve, svi, svih, svim, svaki, svaka, sva, svakog, svake, svakom
- PRON: sve, svega, svatko, svemu
- Card
- ADV: više, vrlo, manje, koliko, malo, mnogo, najviše, toliko, najmanje, dosta
- DET: nekoliko, tolikoj
- NUM: tri, dva, jedan, 20, pet, 10, četiri, dvije, 15, 2
- Mult
- NUM: desetak, oba, obje, stotinjak, obiju, dvadesetak, tridesetak, dvoje, 17:00, 3:00
- SYM: 50%, 20%, 30%, 9%, 13%, 14%, 16%, 40%, 45%, 60%
- Ord
- ADJ: 1., 2004., 2009., 2008., prvi, 2007., 2., 2005., 2006., 2010.
- Yes
- ADJ: nevladinih, nevladine, UN-ova, vladinih, Appleovih, Ashdownov, Božju, UN-ovog, vladini, Appleov
- DET: svoje, svoj, svoju, svojim, njegova, svojih, njegov, naše, svojoj, njihov
- Yes
- DET: svoje, svoj, svoju, svojim, svojih, svojoj, svojeg, svog, svom, svojem
- PRON: se, sebe, sebi, si, sobom
- 1
- AUX-Fin: smo, sam, ćemo, bih, bismo, nismo, nisam, ću, nećemo, neću
- DET: naše, naš, naša, naših, našim, moj, moja, našeg, naši, našu
- PRON: mi, nam, nas, ja, me, nama, mene, meni, mnom
- VERB-Fin: možemo, mislim, imamo, moramo, želimo, mogu, vjerujem, nadamo, znam, imam
- 2
- AUX-Fin: ćete, ste, biste, niste, Jeste, bi, nećete, si, ćeš, budite
- DET: vaš, vaša, vaše, vašem, vašim, vašeg, Tvoji, tvoja, tvoje, tvojim
- PRON: vam, vas, ti, vi, vama, te, tebe, tebi
- VERB-Fin: možete, želite, kliknite, imate, morate, nemojte, koristite, nemate, očekujete, tražite
- 3
- AUX-Fin: je, su, će, bi, nije, neće, nisu, bude, jest, budu
- DET: njegova, njegov, njihov, njihova, njegove, njihove, njegovu, njihovu, njezina, njihovo
- PRON: ih, ga, im, mu, on, njih, ona, ništa, joj, oni
- VERB-Fin: može, ima, kaže, treba, mogu, nema, mora, postoji, imaju, radi
- Fem
- DET: njezina, njezine, njezin, njen, njezinu, njezinih, njezino, njene, njena, njezinim
- Masc,Neut
- DET: njegova, njegov, njegove, njegovu, njegovim, njegovoj, njegovog, njegovih, njegovo, njegovom
- Plur
- DET: naše, njihov, njihova, naš, njihove, naša, njihovu, naših, našim, njihovo
- Sing
- DET: njegova, njegov, njegove, njegovu, njezina, moj, njegovim, njezine, moja, njegovoj
Other Features
Syntax
Auxiliary Verbs and Copula
- This corpus uses 13 lemmas as copulas (cop). Examples: biti, sebe, Ivan, autor, bilo, bivati, budeti, davati, gladovati, smjeti, težiti, za, željeti.
- This corpus uses 23 lemmas as auxiliaries (aux). Examples: biti, htjeti, sebe, li, neka, on, u, od, taj, za, Dimitar, bilo, državni, isto, iz, na, o, ploviti, prav, protiv, s, svaki, svečan.
- This corpus uses 9 lemmas as passive auxiliaries (aux:pass). Examples: biti, sebe, htjeti, dozvoliti, ja, na, po, također, u.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Fin--NOUN (7)
- VERB-Fin--NOUN-Acc (26)
- VERB-Fin--NOUN-Acc-ADP(od) (1)
- VERB-Fin--NOUN-Dat (2)
- VERB-Fin--NOUN-Gen (115)
- VERB-Fin--NOUN-Gen-ADP(do) (3)
- VERB-Fin--NOUN-Gen-ADP(od) (13)
- VERB-Fin--NOUN-Nom (2489)
- VERB-Fin--NOUN-Voc (1)
- VERB-Fin--PRON-Acc (2)
- VERB-Fin--PRON-Gen (5)
- VERB-Fin--PRON-Gen-ADP(od) (1)
- VERB-Fin--PRON-Nom (348)
- VERB-Inf--NOUN-Acc (8)
- VERB-Inf--NOUN-Gen (13)
- VERB-Inf--NOUN-Gen-ADP(od) (2)
- VERB-Inf--NOUN-Nom (427)
- VERB-Inf--PRON-Acc (1)
- VERB-Inf--PRON-Nom (55)
- VERB-Part--NOUN (7)
- VERB-Part--NOUN-Acc (11)
- VERB-Part--NOUN-Acc-ADP(na) (1)
- VERB-Part--NOUN-Gen (77)
- VERB-Part--NOUN-Gen-ADP(između) (1)
- VERB-Part--NOUN-Gen-ADP(od) (20)
- VERB-Part--NOUN-Gen-ADP(oko) (1)
- VERB-Part--NOUN-Nom (2193)
- VERB-Part--NOUN-Nom-ADP(nevladin) (1)
- VERB-Part--PRON-Acc (2)
- VERB-Part--PRON-Dat (1)
- VERB-Part--PRON-Gen (5)
- VERB-Part--PRON-Gen-ADP(od) (1)
- VERB-Part--PRON-Nom (204)
- obj
- VERB-Fin--NOUN (5)
- VERB-Fin--NOUN-Acc (1881)
- VERB-Fin--NOUN-Acc-ADP(na) (3)
- VERB-Fin--NOUN-Acc-ADP(od) (2)
- VERB-Fin--NOUN-Acc-ADP(velik) (1)
- VERB-Fin--NOUN-Dat (118)
- VERB-Fin--NOUN-Gen (216)
- VERB-Fin--NOUN-Gen-ADP(od) (11)
- VERB-Fin--NOUN-Gen-ADP(po) (1)
- VERB-Fin--NOUN-Gen-ADP(preko) (1)
- VERB-Fin--NOUN-Ins (31)
- VERB-Fin--NOUN-Loc (7)
- VERB-Fin--NOUN-Nom (45)
- VERB-Fin--PRON-Acc (507)
- VERB-Fin--PRON-Acc-ADP(na) (2)
- VERB-Fin--PRON-Acc-ADP(za) (3)
- VERB-Fin--PRON-Dat (75)
- VERB-Fin--PRON-Gen (2)
- VERB-Fin--PRON-Gen-ADP(od) (1)
- VERB-Fin--PRON-Ins (3)
- VERB-Fin--PRON-Loc (1)
- VERB-Fin--PRON-Nom (11)
- VERB-Inf--NOUN (1)
- VERB-Inf--NOUN-Acc (1236)
- VERB-Inf--NOUN-Dat (42)
- VERB-Inf--NOUN-Gen (98)
- VERB-Inf--NOUN-Gen-ADP(do) (2)
- VERB-Inf--NOUN-Gen-ADP(između) (1)
- VERB-Inf--NOUN-Gen-ADP(od) (2)
- VERB-Inf--NOUN-Gen-ADP(oko) (1)
- VERB-Inf--NOUN-Ins (15)
- VERB-Inf--NOUN-Loc (1)
- VERB-Inf--NOUN-Loc-ADP(u) (1)
- VERB-Inf--NOUN-Nom (23)
- VERB-Inf--PRON-Acc (175)
- VERB-Inf--PRON-Dat (20)
- VERB-Inf--PRON-Ins (2)
- VERB-Inf--PRON-Nom (2)
- VERB-Part--NOUN (1)
- VERB-Part--NOUN-Acc (1784)
- VERB-Part--NOUN-Acc-ADP(na) (1)
- VERB-Part--NOUN-Acc-ADP(po) (1)
- VERB-Part--NOUN-Acc-ADP(za) (1)
- VERB-Part--NOUN-Dat (111)
- VERB-Part--NOUN-Gen (163)
- VERB-Part--NOUN-Gen-ADP(do) (1)
- VERB-Part--NOUN-Gen-ADP(od) (6)
- VERB-Part--NOUN-Ins (25)
- VERB-Part--NOUN-Loc (14)
- VERB-Part--NOUN-Loc-ADP(o) (1)
- VERB-Part--NOUN-Nom (40)
- VERB-Part--PRON-Acc (316)
- VERB-Part--PRON-Acc-ADP(na) (1)
- VERB-Part--PRON-Acc-ADP(za) (3)
- VERB-Part--PRON-Dat (36)
- VERB-Part--PRON-Gen (2)
- VERB-Part--PRON-Ins (1)
- VERB-Part--PRON-Loc (1)
- VERB-Part--PRON-Nom (3)
- iobj
- VERB-Fin--NOUN-Acc (3)
- VERB-Fin--NOUN-Dat (78)
- VERB-Fin--NOUN-Gen (5)
- VERB-Fin--NOUN-Ins (18)
- VERB-Fin--NOUN-Loc (6)
- VERB-Fin--PRON-Dat (107)
- VERB-Fin--PRON-Ins (1)
- VERB-Fin--PRON-Nom (1)
- VERB-Inf--NOUN-Dat (59)
- VERB-Inf--NOUN-Gen (1)
- VERB-Inf--NOUN-Ins (15)
- VERB-Inf--NOUN-Loc (2)
- VERB-Inf--PRON-Acc (2)
- VERB-Inf--PRON-Dat (44)
- VERB-Inf--PRON-Loc (1)
- VERB-Part--NOUN-Acc (1)
- VERB-Part--NOUN-Dat (92)
- VERB-Part--NOUN-Gen (3)
- VERB-Part--NOUN-Ins (14)
- VERB-Part--NOUN-Ins-ADP(sa) (1)
- VERB-Part--NOUN-Loc (5)
- VERB-Part--PRON-Acc (1)
- VERB-Part--PRON-Dat (65)
- VERB-Part--PRON-Gen (1)
- VERB-Part--PRON-Ins (1)
Reflexive Verbs
- This corpus contains 680 lemmas that occur at least once with an expl:pv child. Examples: moći se, nalaziti se, očekivati se, navoditi se, nadati se, raditi se, sastati se, odnositi se, dogoditi se, smatrati se, činiti se, trebati se, baviti se, slagati se, složiti se, koristiti se, naći se, protiviti se, morati se, suočavati se, održavati se, boriti se, osjećati se, nastaviti se, provoditi se, održati se, odvijati se, pojaviti se, pridružiti se, isticati se, pokazati se, pozivati se, sastojati se, sučeljavati se, vratiti se, žaliti se, promijeniti se, ticati se, vidjeti se, mijenjati se, povećati se, priključiti se, tražiti se, zvati se, bojati se, dodavati se, nastavljati se, okupiti se, procjenjivati se, vjerovati se
Verbs with Reflexive Core Objects
- This corpus contains 260 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: baviti se, nalaziti se, vratiti se, kretati se, moći se, nadati se, pojaviti se, boriti se, odlučiti se, trebati se, činiti se, dogoditi se, odnositi se, osjećati se, pridružiti se, priključiti se, vraćati se, zalagati se, događati se, grijati se, okladiti se, očitovati se, pokazati se, pripremati se, raditi se, sastati se, sastojati se, uvjeriti se, dizati se, morati se, naći se, obratiti se, okupljati se, pitati se, probuditi se, razvijati se, služiti se, suočiti se, temeljiti se, upoznati se, širiti se, aktivirati se, brinuti se, fokusirati se, gaditi se, izjasniti se, javiti se, mijenjati se, odlučivati se, odreći se
- Out of those, 13 lemmas occurred more than once, but never without a reflexive dependent. Examples: boriti, zalagati, grijati, okladiti, probuditi, fokusirati, gaditi, izjasniti, oslanjati, požaliti, pridruživati, spojiti, zaduživati
Relations Overview
- This corpus uses 6 relation subtypes: advmod:emph, aux:pass, csubj:pass, expl:pv, flat:foreign, nsubj:pass
- The following 2 relation types are not used in this corpus at all: clf, reparandum