UD Czech FicTree
Language: Czech (code: cs
)
Family: Indo-European, Slavic
This treebank has been part of Universal Dependencies since the UD v2.1 release.
The following people have contributed to making this treebank part of UD: Tomáš Jelínek, Daniel Zeman.
Repository: UD_Czech-FicTree
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.2
License: CC BY-NC-SA 4.0
Genre: fiction
Questions, comments? General annotation questions (either Czech-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [tomas • jelinek (æt) ff • cuni • cz, zeman (æt) ufal • mff • cuni • cz]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually in non-UD style, automatically converted to UD |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | annotated manually |
Features | annotated manually in non-UD style, automatically converted to UD |
Relations | annotated manually in non-UD style, automatically converted to UD |
Description
FicTree is a treebank of Czech fiction, automatically converted into the UD format. The treebank was built at Charles University in Prague.
The treebank consists of 12,760 sentences (166,432 tokens). The texts come from eight literary works published in the Czech Republic between 1991 and 2007. The text data was manually annotated according to the Prague Dependency Treebank guidelines, then converted into the UD format. To comply with agreements concluded with the copyright holders, the texts are shuffled into random chunks of maximum 100 words. The treebank is licensed under the terms of [CC BY-NC-SA 3.0] (http://creativecommons.org/licenses/by-nc-sa/3.0/).
Acknowledgments
We wish to thank the participants in the annotation effort, including Milena Hnátková, Tomáš Jelínek, Ivana Klímová, Alena Kropíková, Hana Skoumalová and Olga Zitová; as well as Dan Zeman for the data conversion.
References
- Tomáš Jelínek. 2017. FicTree: a Manually Annotated Treebank of Czech Fiction. In: J. Hlaváčová (Ed.): ITAT 2017 Proceedings, pp. 181–185. http://ceur-ws.org/Vol-1885/181.pdf
Statistics of UD Czech FicTree
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB – X
Features
Abbr – AdpType – Animacy – Aspect – Case – ConjType – Degree – Gender – Gender[psor] – Hyph – Mood – NameType – Number – Number[psor] – NumForm – NumType – NumValue – Person – Polarity – Poss – PrepCase – PronType – Reflex – Style – Tense – Variant – VerbForm – Voice
Relations
acl – advcl – advmod – advmod:emph – amod – appos – aux – aux:pass – case – cc – ccomp – compound – conj – cop – csubj – csubj:pass – dep – det – det:numgov – det:nummod – discourse – expl:pass – expl:pv – fixed – flat – iobj – mark – nmod – nsubj – nsubj:pass – nummod – nummod:gov – obj – obl – obl:agent – obl:arg – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 12760 sentences, 166432 tokens and 167056 syntactic words.
- This corpus contains 31659 tokens (19%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 11 types of words that contain both letters and punctuation. Examples: Ha-vel, O-po-nu, pr-chá, A-ano, Cutter's, D-dobře, J-já, Ji-jistě, Za-pla-tit, bytí-na-zemi, t-tento
- This corpus contains 624 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 22 types of multi-word tokens. Examples: aby, abych, kdyby, kdybych, abys, abychom, ses, sis, abyste, kdybyste, kdybys, Tys, kdybychom, cos, oč, Dostalas, Nač, Slyšelas, Vždyťs, dovolils, pustils, zač.
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB, X
- This corpus does not use the following tags: SYM
- This corpus contains 124 word types tagged as particles (PART): A-ano, Což, Dobře, Díky, Fakt, Jestlipak, Ji-jistě, Neee, Nejenomže, Náhodou, Pardon, Pozor, Príma, ahoj, ale, alespoň, ani, ano, asi, aspoň, ať, až, ba, bezesporu, beztak, bohužel, budiž, bůhví, celkem, co, copak, div, dobrá, dokonce, doopravdy, dozajista, hned, i, jasně, jednoduše, jen, jenom, ještě, jistě, již, jo, kdepak, kdoví, když, klidně, koneckonců, konečně, kupodivu, kéž, leda, možná, nakonec, naneštěstí, naopak, například, natož, ne, nejen, nejenže, nejspíš, nepochybně, nesporně, nicméně, nikoli, nikoliv, no, opravdu, ostatně, ovšem, patrně, pochopitelně, prakticky, pravděpodobně, prej, prostě, právě, prý, přece, přeci, především, přesně, přímo, rozhodně, samozřejmě, sbohem, skoro, skutečně, snad, sotva, spíš, spíše, stejně, tak, takříkajíc, teda, tedy, teprve, to, totiž, třeba, určitě, už, viď, viďte, vlastně, vážně, však, vůbec, vždyť, zajisté, zas, zase, zejména, zkrátka, zrovna, zvláště, zvlášť, zřejmě, že
- This corpus contains 32 lemmas tagged as pronouns (PRON): být, bůhvíco, co, cokoli, copak, cosi, což, cože, jenž, já, kdeco, kdekdo, kdo, kdokoli, kdopak, kdosi, leccos, ledaco, my, málokdo, nic, nikdo, něco, někdo, on, samy, samý, se, ty, veškerý, von, všecek
- This corpus contains 53 lemmas tagged as determiners (DET): bůhvíkolik, hodně, jaký, jakýkoli, jakýpak, jakýs, jakýsi, jeho, jenž, každý, kdekterý, kdovíjaký, kolik, které, který, lecjaký, leckterý, mnoho, moc, my, málo, méně, můj, nijaký, nějaký, několik, některý, něčí, onen, pražádný, svůj, sám, takový, takovýhle, takovýto, takýs, tamhleten, tamten, ten, tenhle, tenhleten, tento, tentýž, to, tolik, tvůj, týž, víc, více, všechen, všelijaký, čí, žádný
- Out of the above, 2 lemmas occurred sometimes as PRON and sometimes as DET: jenž, my
- This corpus contains 4 lemmas tagged as auxiliaries (AUX): být, bývat, jít, stát
- Out of the above, 4 lemmas occurred sometimes as AUX and sometimes as VERB: být, bývat, jít, stát
- There are 4 (de)verbal forms:
- Conv
- AUX: jsouc
- VERB: chtěje, hledajíc, netuše, Divě, Jda, Nechtíc, Opíraje, Pronášejíc, Třesouc, domnívajíc
- Fin
- AUX: jsem, by, je, bych, jsme, bude, jsou, jste, jsi, není
- VERB: je, má, mám, může, nevím, jsi, musí, není, mají, musím
- Inf
- AUX: být, nebýt, stát
- VERB: dělat, mít, říct, vidět, být, jít, udělat, žít, stát, dát
- Part
- ADJ: přesvědčen, řečeno, oblečena, uspořádány, následující, rozhodující, třesoucí, napsáno, nastávající, obklopen
- AUX: byl, byla, bylo, byly, byli, nebyl, nebylo, nebyla, býval, bývala
- VERB: řekl, měl, bylo, měla, řekla, mohl, chtěl, byl, byla, chtěla
Nominal Features
- Fem
- ADJ: celou, poslední, první, ráda, celá, další, malá, hlavní, velké, malou
- ADJ-Part: oblečena, uspořádány, hořící, klečící, povznášející, rozhodující, sedící, stojící, tající, truchlící
- AUX-Conv: jsouc
- AUX-Part: byla, byly, nebyla, bývala
- DET: která, jeho, té, které, tu, ta, své, svou, kterou, její
- NOUN: chvíli, oči, dívka, ruce, dveře, paní, děti, Kůra, práce, žena
- NUM: dvě, jedna, jednu, jedné, tři, obě, jednou, dvou, čtyři, obou
- PRON: ji, jí, ní, ona, je, ni, nich, níž, ně, jich
- PROPN: Valentýna, Alžběta, Veronika, Alice, Praze, Prahy, Čáslavi, Janičku, Magda, Máša
- VERB-Conv: hledajíc, Nechtíc, Pronášejíc, Třesouc, domnívajíc, lechtajíc, nedbajíc, nespouštějíc, netroufajíc, nevšímajíc
- VERB-Part: měla, řekla, byla, chtěla, mohla, vzala, přišla, začala, dala, neměla
- Masc
- ADJ: celý, rád, další, první, malý, druhý, starý, jediný, ostatní, mladý
- ADJ-Part: přesvědčen, obklopen, poslán, pozván, dopřán, hledajících, milován, milujících, nastávající, natočen
- AUX-Part: byl, byli, nebyl, byly, býval, nebyly, nebyli, bývali
- DET: který, ten, jeho, sám, každý, můj, svého, všichni, kteří, svůj
- NOUN: život, den, člověk, plod, profesor, mistr, čas, muž, lidé, mladík
- NUM: jeden, dva, jednoho, oba, tři, čtyři, jedním, dvěma, tisíc, dvou
- PRON: ho, mu, kdo, je, on, nikdo, něj, někdo, ním, jim
- PROPN: Láďa, Leoš, Eduard, Havel, Flajšman, Havlena, Filip, Honza, K, Němci
- VERB-Conv: chtěje, netuše, Divě, Jda, Opíraje, doufajíce, drže, dívaje, klouzaje, kroutě
- VERB-Part: řekl, měl, mohl, chtěl, byl, viděl, začal, přišel, vzal, zeptal
- Neut
- ADJ: jiného, jasné, možné, jiná, malé, celé, první, druhé, lepší, těžké
- ADJ-Part: řečeno, napsáno, zakázáno, ztraceno, Rozhodující, blížícího, bušícím, dovoleno, míněno, namířeno
- AUX-Part: bylo, nebylo, byla, bývalo, nebyla, nebývalo, šlo
- DET: to, všechno, tom, tím, toho, tomu, tohle, které, jeho, své
- NOUN: dítě, let, slova, září, místo, tělo, srdce, okna, štěstí, léta
- NUM: jedno, dvě, jednom, tři, jednoho, obě, jedním, půl, čtyř, čtyři
- PRON: je, ho, všecko, ně, něj, něm, co, jež, mu, ono
- PROPN: Československu, Německa, zoo, Československa, C, Japonska, Německu, Ruska, Angeles, Gobi
- VERB-Conv: říkajíc
- VERB-Part: bylo, stalo, zdálo, napadlo, nebylo, mělo, začalo, šlo, mohlo, podařilo
- Anim
- ADJ: rád, mladý, ostatní, starý, malý, rádi, bohatý, druhý, první, další
- ADJ-Part: přesvědčen, obklopen, pozván, hledajících, milován, milujících, nastávající, nucen, oblečen, obtížen
- AUX-Part: byl, byli, nebyl, býval, nebyli, bývali
- DET: který, sám, ten, všichni, kteří, můj, svého, každý, ti, toho
- NOUN: člověk, profesor, mistr, muž, lidé, mladík, otec, primář, lidí, pán
- NUM: jeden, dva, oba, jednoho, čtyři, tři, dvěma, jedním, jednomu, tří
- PRON: mu, ho, kdo, on, nikdo, někdo, jim, ním, něj, je
- PROPN: Láďa, Leoš, Eduard, Havel, Flajšman, Havlena, Filip, Honza, K, Němci
- VERB-Conv: chtěje, netuše, Jda, Opíraje, doufajíce, drže, dívaje, kroutě, nadýmaje, nedbaje
- VERB-Part: řekl, měl, chtěl, mohl, viděl, byl, vzal, zeptal, měli, přišel
- Inan
- ADJ: celý, další, první, druhý, malý, jediný, nový, plný, dobrý, velký
- ADJ-Part: dopřán, natočen, následující, následujícím, ochmýřeny, poslán, prosvítající, rostoucím, táhnoucím, uspořádány
- AUX-Part: byl, byly, nebyl, nebyly, býval
- DET: ten, který, jeho, svůj, které, každý, tom, svého, nějaký, její
- NOUN: život, den, plod, čas, života, životě, dne, pohled, domu, dům
- NUM: dva, jeden, jednoho, tři, čtyři, tisíc, dvou, jedním, dvěma, jednom
- PRON: co, ho, je, čím, něm, něj, čem, nich, ním, jich
- PROPN: Poděbradech, Poděbrad, Amadeus, Kolína, Kolíně, Mánes, Neurol, Náchoda, Náchodě, Sudety
- VERB-Conv: klouzaje
- VERB-Part: byl, stál, nebyl, mohl, měl, ozval, začal, zdál, byly, ujel
- Dual
- ADJ: holýma, Moravskýma, velkýma, otevřenýma, složenýma, černýma, andělskýma, bystrýma, dětskýma, inteligentníma
- DET: svýma, jejich, jeho, mýma
- NOUN: očima, nohama, rukama, nožičkama, ručičkama, ušima
- NUM: oběma
- Plur
- ADJ: další, ostatní, celé, jiná, rádi, jiné, malé, velké, bílé, staré
- ADJ-Part: uspořádány, hledajících, milujících, ochmýřeny, odpovídající, prosvítající, třesoucí, ubíhající, umístěny, visících
- AUX-Fin: jsme, jsou, jste, byste, bychom, budou, nejsou, budeme, budete, bývají
- AUX-Part: byly, byli, byla, nebyly, nebyli, bývali, nebyla
- DET: které, jeho, ty, všichni, všechny, kteří, těch, svých, své, všech
- NOUN: oči, let, dveře, děti, lidé, slova, ruce, lidí, dveří, vlasy
- NUM: dva, dvě, tři, oba, čtyři, dvou, obě, dvěma, pár, pěti
- PRON: je, nás, nám, nich, jim, vás, vám, vy, my, nimi
- PROPN: Němci, Poděbradech, Poděbrad, vánoce, Sudety, USA, Čechách, Američani, Čech, Čechy
- VERB-Conv: doufajíce, očekávajíce, provádějíce, ubezpečujíce
- VERB-Fin: mají, jsou, víte, máte, máme, nevíte, chcete, musíme, můžeme, můžete
- VERB-Part: měli, byli, mohli, byly, chtěli, šli, museli, neměli, seděli, začali
- Sing
- ADJ: celý, první, rád, jiného, poslední, další, celou, malý, druhý, hlavní
- ADJ-Part: přesvědčen, řečeno, oblečena, rozhodující, napsáno, nastávající, následující, obklopen, poslán, povznášející
- AUX-Conv: jsouc
- AUX-Fin: jsem, je, bych, bude, jsi, není, bys, budu, budeš, nebude
- AUX-Part: byl, byla, bylo, nebyl, nebylo, nebyla, býval, bývala, bývalo, nebývalo
- DET: to, jeho, který, ten, tom, všechno, která, toho, tím, té
- NOUN: chvíli, život, dítě, den, člověk, plod, dívka, profesor, mistr, paní
- NUM: jeden, pár, jednoho, jedna, jednu, jedné, deset, jedno, dvacet, jedním
- PRON: mi, mě, ho, já, mu, ji, jí, ní, ti, mně
- PROPN: Láďa, Leoš, Valentýna, Eduard, Havel, Alžběta, Flajšman, Veronika, Havlena, Filip
- VERB-Conv: chtěje, hledajíc, netuše, Divě, Jda, Nechtíc, Opíraje, Pronášejíc, Třesouc, domnívajíc
- VERB-Fin: je, má, mám, může, nevím, jsi, není, musí, musím, vím
- VERB-Part: řekl, měl, bylo, měla, řekla, mohl, chtěl, byl, byla, chtěla
- Acc
- ADJ: celý, další, celou, první, celé, vlastní, malou, poslední, druhý, malé
- ADJ-Part: následující, ubíhající, blížící, chladnoucí, chybějící, cvrčící, doplňující, hovořící, kralující, kroutící
- ADP: na, za, o, pro, v, přes, po, před, pod, ve
- DET: to, tu, všechno, kterou, které, své, ten, svou, jeho, svůj
- NOUN: chvíli, den, oči, život, hlavu, ruku, čas, dveře, dítě, ruce
- NUM: pár, dva, tři, dvě, jednu, jeden, deset, čtyři, třicet, jednoho
- PRON: se, mě, ho, co, ji, je, nic, něco, nás, tě
- PROPN: Janičku, Alžbětu, Valentýnu, Láďu, Havla, Oscara, Veroniku, Flajšmana, Filipa, Ajaxe
- Dat
- ADJ: druhému, ostatním, Máchovu, jinému, neznámému, vlastním, dalšímu, malé, malému, staré
- ADJ-Part: umírajícímu, bdícímu, hledajícímu, osvobozujícímu, pochybujícímu, přijíždějícím, sedícím, stárnoucímu, stříkajícím, vedoucím
- ADP: k, ke, kvůli, proti, vůči, díky, naproti, navzdory, vstříc, blíž
- DET: tomu, svému, své, jeho, svým, té, všem, které, kterým, mému
- NOUN: otci, dívce, dveřím, ženě, mladíkovi, oknu, synovi, člověku, ženám, domu
- NUM: jednomu, oběma, dvěma, jedné, třem, pár, čtyřem
- PRON: si, mi, mu, jí, ti, nám, jim, vám, mně, sobě
- PROPN: Havlovi, Valentýně, Alžbětě, Leošovi, Janičce, Eduardovi, Flajšmanovi, Havlenovi, Ježíškovi, Láďovi
- Gen
- ADJ: jiného, velkého, celého, nového, prvního, druhé, starých, první, jediného, jiných
- ADJ-Part: blížícího, hledajících, hořící, tající, vzrušujícího, bzučících, dospívajících, dupajících, jsoucího, klesající
- ADP: do, z, od, u, ze, kolem, bez, vedle, podle, za
- DET: toho, svého, jeho, té, těch, svých, všech, mého, své, jejich
- NOUN: let, života, dne, školy, práce, lidí, času, dveří, domu, hodin
- NUM: jednoho, jedné, tisíc, dvou, čtyř, tří, obou, pěti, set, třiceti
- PRON: mě, nich, sebe, ní, něj, nás, ho, jich, něho, jí
- PROPN: Prahy, Poděbrad, Čáslavi, Boleslava, Kolína, Krásné, Moravy, Náchoda, Německa, Československa
- Ins
- ADJ: ostatními, stejnou, druhým, celým, dlouhou, největší, pravou, velkým, celou, dlouhými
- ADJ-Part: bušícím, rostoucím, blížícím, končící, letící, nadcházejícím, nastávající, naříkajícími, neustávajícím, následujícím
- ADP: s, před, se, za, nad, pod, mezi, přede, nade, pode
- DET: tím, svým, svou, svými, jeho, mým, tou, kterým, kterou, všemi
- NOUN: očima, hlavou, rukou, směrem, cestou, oknem, rameny, hlasem, nohama, rukama
- NUM: jedním, dvěma, jednou, pár, pěti, deseti, oběma, čtyřiceti, čtyřmi, dvanácti
- PRON: ním, sebou, mnou, ní, nimi, čím, námi, tebou, vámi, něčím
- PROPN: Leošem, Valentýnou, Janičkou, Alicí, Eduardem, Alžbětou, Filipem, Láďou, Veronikou, Amadeem
- Loc
- ADJ: prvním, druhém, poslední, druhé, malém, celé, jiném, spodní, velké, velkém
- ADJ-Part: milujících, táhnoucím, visících, bojujících, hnisajících, jiskřícím, následujícím, osvobozujícím, plujících, poletující
- ADP: v, na, po, ve, o, při
- DET: tom, té, svém, jeho, své, kterém, svých, jejím, tomto, které
- NOUN: životě, září, chvíli, době, ruce, světě, domě, pokoji, straně, schodech
- NUM: jedné, jednom, dvou, dvaceti, pár, půl, deseti, třech, osmnácti, čtyřiceti
- PRON: něm, sobě, mně, nich, ní, čem, níž, němž, nichž, něčem
- PROPN: Praze, Poděbradech, Čáslavi, Československu, Kolíně, Náchodě, Čechách, Berlíně, Slaném, Valentýně
- Nom
- ADJ: první, celá, jasné, starý, malá, další, celý, možné, jediný, mladý
- ADJ-Part: rozhodující, stojící, třesoucí, klečící, nastávající, následující, tančící, vracející, zbývající, Dmoucí
- ADP: de
- DET: to, který, která, ten, jeho, které, ta, sám, moje, všechno
- NOUN: člověk, plod, dívka, profesor, mistr, dítě, muž, Kůra, lidé, mladík
- NUM: jeden, dva, jedna, oba, dvě, pár, jedno, tři, čtyři, deset
- PRON: já, co, kdo, on, nikdo, ty, někdo, nic, ona, vy
- PROPN: Láďa, Leoš, Valentýna, Eduard, Havel, Alžběta, Flajšman, Veronika, Havlena, Filip
- Voc
- ADJ: milá, milý, Milí, urozený, drahá, drazí, vzácný, vážený, zlatá, Dobrá
- DET: má, můj, Vaše, moje, náš
- NOUN: pane, tatínku, primáři, paní, dědečku, doktore, pánové, mistře, slečno, Obušku
- NUM: jeden
- PRON: vy, ty
- PROPN: Simono, Láďo, Alžběto, Alžbětko, Havle, Alice, Filipe, Flajšmánku, Miloši, Valentýno
- Npr
- PRON: jež, jenž, jehož, jemuž, jíž, již, jímž, jimiž, jimž, jejž
- Pre
- PRON: ní, něj, nich, ním, něho, něm, ni, němu, nimi, ně
Degree and Polarity
- Cmp
- ADJ: starší, lepší, větší, mladší, menší, vyšší, delší, horší, hezčí, silnější
- ADV: víc, později, dřív, dál, dříve, méně, raději, lépe, více, hůř
- Pos
- ADJ: celý, další, jiného, poslední, malé, celé, celou, velké, vlastní, celá
- ADV: dobře, často, dlouho, konečně, rychle, brzy, stejně, náhle, úplně, vždy
- DET: každý, každou, každé, každá, každým, každého, každém, každému
- NOUN: hospodský
- Sup
- ADJ: nejlepší, největší, nejbližší, nejrychlejší, největším, nejkrásnější, nejmladší, nejbohatší, nejsladší, nejstarší
- ADV: nejvíc, nejdřív, nejméně, nejraději, nejrychleji, nejdál, nejlépe, nejvíce, nejdéle, nejmíň
- Neg
- ADJ: nerad, nebezpečné, neznámý, nerada, nedaleké, nekonečnou, nekonečné, nepříjemné, neznámému, nešťastná
- ADJ-Part: nedotčena, neexistujícího, nejsoucí, nepoškozeno, nepřejícího, neustávající, neustávajícím
- ADV: nenápadně, nechápavě, netrpělivě, nesměle, nejistě, nerozhodně, nebezpečně, neochotně, nedůvěřivě, nevzrušeně
- AUX-Fin: není, nebude, nebudu, nejsem, nejsou, nebudeš, Nebývají, nejsme, nejste, Nebuď
- AUX-Inf: nebýt
- AUX-Part: nebyl, nebylo, nebyla, nebyly, nebyli, nebývalo
- NOUN: nemožnosti, nevinnost, nedar, nepřejícnost, neznalost, Nezávislost, necudnost, nekrása, nemravnost, neodpovědnosti
- VERB-Conv: netuše, Nechtíc, nedbaje, nedbajíc, nespouštějíc, netroufajíc, nevěda, nevšímajíc
- VERB-Fin: nevím, není, nemám, nemá, nechci, nemůže, nemůžu, nevíte, nechce, nemáš
- VERB-Inf: nebýt, nedívat, Neposuzovat, Nespat, nebrat, nedráždit, nedávat, nehovořit, nejíst, nekazit
- VERB-Part: nemohl, neměl, nevěděl, nebyl, neměla, nebylo, nechtěl, nemohla, nechtěla, nevěděla
- Pos
- ADJ: celý, rád, další, jiného, poslední, malé, celé, celou, velké, vlastní
- ADJ-Part: přesvědčen, řečeno, oblečena, uspořádány, následující, rozhodující, třesoucí, napsáno, nastávající, obklopen
- ADV: vždycky, dobře, často, víc, dlouho, konečně, rychle, brzy, stejně, náhle
- AUX-Conv: jsouc
- AUX-Fin: jsem, je, jsme, bude, jsou, jste, jsi, budu, budeš, budou
- AUX-Inf: být, stát
- AUX-Part: byl, byla, bylo, byly, byli, býval, bývala, bývali, bývalo, šlo
- DET: každý, každou, každé, každá, každým, každého, každém, každému
- NOUN: chvíli, život, oči, dítě, den, člověk, plod, dívka, profesor, ruce
- PROPN: Láďa, Leoš, Valentýna, Eduard, Havel, Alžběta, Flajšman, Veronika, Havlena, Filip
- VERB-Conv: chtěje, hledajíc, Divě, Jda, Opíraje, Pronášejíc, Třesouc, domnívajíc, doufajíce, drže
- VERB-Fin: je, má, mám, může, jsi, musí, mají, musím, vím, stojí
- VERB-Inf: dělat, mít, říct, vidět, být, jít, udělat, žít, stát, dát
- VERB-Part: řekl, měl, bylo, měla, řekla, mohl, chtěl, byl, byla, chtěla
- Short
- ADJ: rád, ráda, rádi, přesvědčen, jist, možno, nerad, vinen, řečeno, oblečena
- ADJ-Part: přesvědčen, řečeno, oblečena, uspořádány, napsáno, obklopen, poslán, pozván, zakázáno, ztraceno
- PRON: se, si, mi, mě, ho, mu, ti, tě
Verbal Features
- Imp
- ADJ-Part: následující, rozhodující, třesoucí, nastávající, povznášející, stojící, vynikající, zbývající, blížícího, bušícím
- AUX-Conv: jsouc
- VERB-Conv: chtěje, hledajíc, netuše, Divě, Jda, Nechtíc, Opíraje, Pronášejíc, Třesouc, domnívajíc
- Perf
- VERB-Conv: připomenuv, vrhnuv, vzdychnuv
- Cnd
- AUX-Fin: by, bych, byste, bys, bychom, bysme
- VERB-Fin: by, bych, bys
- Imp
- AUX-Fin: buď, buďte, Buďme, Nebuď
- VERB-Fin: řekni, dej, nech, pojď, podívej, počkej, neboj, vezmi, vrať, vzpomeňte
- Ind
- AUX-Fin: jsem, je, jsme, bude, jsou, jste, jsi, není, budu, budeš
- VERB-Fin: je, má, mám, může, nevím, jsi, musí, není, mají, musím
- Fut
- AUX-Fin: bude, budu, budeš, budou, nebude, nebudu, budeme, budete, nebudeš, nebudeme
- VERB-Fin: bude, nepůjde, nepůjdu, nebude, půjde, půjdeme, půjdu, budou, nebudu, pojedeme
- Past
- AUX-Part: byl, byla, bylo, byly, byli, nebyl, nebylo, nebyla, býval, bývala
- VERB-Conv: připomenuv, vrhnuv, vzdychnuv
- VERB-Part: řekl, měl, bylo, měla, řekla, mohl, chtěl, byl, byla, chtěla
- Pres
- ADJ-Part: následující, rozhodující, třesoucí, nastávající, povznášející, stojící, vynikající, zbývající, blížícího, bušícím
- AUX-Conv: jsouc
- AUX-Fin: jsem, je, jsme, jsou, jste, jsi, není, nejsem, nejsou, bývá
- VERB-Conv: chtěje, hledajíc, netuše, Divě, Jda, Nechtíc, Opíraje, Pronášejíc, Třesouc, domnívajíc
- VERB-Fin: je, má, mám, může, nevím, jsi, musí, není, mají, musím
- Act
- ADJ-Part: následující, rozhodující, třesoucí, nastávající, povznášející, stojící, vynikající, zbývající, blížícího, bušícím
- AUX-Conv: jsouc
- AUX-Fin: jsem, je, jsme, bude, jsou, jste, jsi, není, budu, budeš
- AUX-Part: byl, byla, bylo, byly, byli, nebyl, nebylo, nebyla, býval, bývala
- VERB-Conv: chtěje, hledajíc, netuše, Divě, Jda, Nechtíc, Opíraje, Pronášejíc, Třesouc, domnívajíc
- VERB-Fin: je, má, mám, může, nevím, jsi, musí, není, mají, musím
- VERB-Part: řekl, měl, bylo, měla, řekla, mohl, chtěl, byl, byla, chtěla
- Pass
- ADJ-Part: přesvědčen, řečeno, oblečena, uspořádány, napsáno, obklopen, poslán, pozván, zakázáno, ztraceno
Pronouns, Determiners, Quantifiers
- Dem
- ADV: tak, tam, teď, tu, tady, tehdy, proto, nyní, dosud, tentokrát
- DET: to, ten, tom, toho, tím, té, ta, tu, tomu, tohle
- Dem,Ind
- ADV: nesčetněkrát
- Emp
- DET: sám, sama, sami, samo, samy, samu
- Ind
- ADV: někdy, nějak, kdysi, někde, někam, jaksi, několikrát, málokdy, kdykoli, mnohokrát
- DET: několik, nějaký, nějaké, nějakou, několika, mnoho, hodně, moc, víc, málo
- PRON: něco, někdo, někoho, cosi, někomu, cokoli, něčím, kdosi, něčem, kdekdo
- Int,Rel
- ADV: jak, proč, kde, kdy, kam, odkud, kolikrát, kudy, Jaks
- DET: který, které, která, kterou, kteří, kolik, jaké, kterého, kterým, jakou
- PRON: co, kdo, čím, čem, koho, čeho, čemu, komu, kým, copak
- Neg
- ADV: nikdy, nijak, nikde, nikam
- DET: žádný, žádné, žádnou, žádná, žádném, žádného, žádnej, nijaké, pražádný, žádnému
- PRON: nic, nikdo, nikoho, nikomu, ničeho, ničemu, nikým, ničím, ničem
- Prs
- DET: jeho, své, její, jejich, moje, svou, svého, můj, svým, svůj
- PRON: se, si, mi, mě, ho, já, mu, ji, je, jí
- Rel
- DET: jehož, jejichž, jejíž, jejímž
- PRON: což, níž, jež, nichž, němž, jenž, nímž, nimiž, něhož, jehož
- Tot
- ADV: všude, vždy, navždy, odevšad, odjakživa
- DET: všechno, každý, všichni, všechny, všech, každou, vše, každé, všeho, všem
- PRON: všecko, samé, veškeré, samá, veškerá, samého, samých, samým, veškeru, veškerý
- Card
- DET: několik, tolik, kolik, několika, mnoho, hodně, moc, víc, málo, mnoha
- NUM: pár, jeden, dva, dvě, jednoho, tři, jedna, jednu, oba, čtyři
- Frac
- NUM: desetin, čtvrtiny, třetinu
- Mult
- ADV: jednou, dvakrát, kolikrát, několikrát, třikrát, párkrát, mnohokrát, tolikrát, pětkrát, stokrát
- Mult,Sets
- ADJ: Obojí, dvojí, dvojím, oboje, obého
- Ord
- ADJ: první, druhý, druhé, třetí, prvním, druhou, druhá, druhém, druhého, prvního
- ADV: poprvé, podruhé, popáté, potřetí, popadesáté, posté, potisící
- Sets
- ADJ: jedny, jedněch
- Yes
- ADJ: Alžbětina, Havlovo, Láďova, Máchovo, Máchovu, Mašínovi, Valentýnina, Valentýniny, Valentýnině, doktorčin
- DET: jeho, své, její, jejich, moje, svou, svého, můj, svým, svůj
- Yes
- DET: své, svou, svého, svým, svůj, svých, svém, svoji, svoje, svému
- PRON: se, si, sebe, sobě, sebou
- 1
- AUX-Fin: jsem, bych, jsme, bychom, budu, nebudu, nejsem, budeme, bysme, nejsme
- DET: moje, můj, naše, mého, náš, mé, mých, mým, mojí, moji
- PRON: mi, mě, já, nás, mně, nám, mnou, mne, my, námi
- VERB-Fin: mám, nevím, musím, vím, nemám, chci, nechci, prosím, ptám, mohu
- 2
- AUX-Fin: jste, jsi, byste, bys, budeš, budete, nebudeš, si, buď, buďte
- DET: vaše, tvůj, tvoje, tvé, váš, vaší, tvou, tvá, tvojí, tvého
- PRON: ti, ty, tě, vás, vám, vy, tebe, tebou, tobě, vámi
- VERB-Fin: jsi, víš, máš, víte, chceš, můžeš, máte, řekni, myslíš, musíš
- 3
- AUX-Fin: je, by, bude, jsou, není, budou, nebude, nejsou, bývá, bývají
- DET: jeho, její, jejich, jejím, jejího, jejích, jehož, jejímu, jejichž, jejíž
- PRON: ho, mu, ji, je, jí, ní, on, něj, nich, jim
- VERB-Fin: je, má, může, musí, není, mají, stojí, jde, jsou, bude
- Fem
- ADJ: Alžbětina, Valentýnina, Valentýniny, Valentýnině, doktorčin, dívčina, dívčiny, Alžbětin, Valentýnin, doktorčina
- DET: její, jejich, jejím, jejího, jejích, jejímu, jejíž, jejímž, jejichž
- Masc
- ADJ: Havlovo, Láďova, Máchovo, Máchovu, Mašínovi, otcova, primářova, primářově, přítelova, Flajšmanova
- DET: jeho, jejich, jehož, jejichž
- Neut
- DET: jeho, jejich
- Plur
- DET: jejich, naše, náš, vaše, naší, naši, našem, našeho, našich, váš
- Sing
- DET: jeho, její, moje, můj, mého, mé, mých, mým, mojí, tvůj
Other Features
- Abbr
- Yes
- ADV: apod
- NOUN: dr, elektro, prof
- PROPN: K, M, L, T, V, A, C, J, E, F
- Yes
- AdpType
- Comprep
- ADP: vzhledem
- Prep
- ADP: na, v, do, s, z, k, o, za, po, pro
- Voc
- ADP: ve, ze, se, ke, beze, ode, přede, nade, pode, skrze
- Comprep
- ConjType
- Oper
- CCONJ: krát
- Oper
- Hyph
- Yes
- ADJ: marx, dvou, troj, tří, československo
- Yes
- NameType
- Com
- PROPN: Rut, Slavia, Vikárky, Pribina, RUT, Sparta, Vikárka, Vitana
- Geo
- PROPN: Praze, Prahy, Čáslavi, Čáslav, Krásné, Kanada, Moravy, Čechách, Bystrice, Evropu
- Giv
- PROPN: Láďa, Leoš, Valentýna, Eduard, Alžběta, Veronika, Filip, Alice, Honza, Janičku
- Nat
- PROPN: Němci, Němec, Žid, Američani, Francouz, Japonci, Němců, Němcům, Římané, Američané
- Sur
- PROPN: Havel, Flajšman, Havlena, Havla, Havlovi, Mourková, Flajšmana, Jahoda, Frejka, Krista
- Com
- NumForm
- Digit
- NUM: 1, 1942, 1948, 1953, 11, 1945, 20, 10, 1938, 1943
- Word
- NUM: pár, jeden, dva, dvě, jednoho, tři, jedna, jednu, oba, čtyři
- Digit
- NumValue
- 1
- ADJ: jedny, jedněch
- 1,2,3
- NUM: jeden, dva, dvě, jednoho, tři, jedna, jednu, oba, čtyři, jedné
- 1
- Style
- Arch
- ADV: raděj
- NOUN: léta, léty, koleni, létech, včerejška
- PRON: jej
- Coll
- ADJ: dobrý, jednoduchý, Filipově, Milí, bystrý, chytrej, cílevědomej, dlouhý, dobrým, druhým
- ADJ-Part: sbalíno
- ADV: dřív, nejdřív, móc, dýl, hloub
- AUX-Fin: si, bysme, nejseš
- DET: který, tvýho, žádnej, každý, které, mý, naše, takovýho, támhleten, tý
- NOUN: holkama, kopečkama, leta, prsama, ženskýma
- PART: prej, přeci, Neee
- PRON: jí, veškeru, jenž, samý
- VERB-Fin: odejdem, rozejdem, si
- VERB-Inf: pomoct
- VERB-Part: nevlít, nevšim
- Arch
Syntax
Auxiliary Verbs and Copula
- This corpus uses 4 lemmas as copulas (cop). Examples: být, bývat, jít, stát.
- This corpus uses 3 lemmas as auxiliaries (aux). Examples: být, bývat, ztracený.
- This corpus uses 1 lemmas as passive auxiliaries (aux:pass). Examples: být.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Fin--NOUN-Acc-ADP(přes) (1)
- VERB-Fin--NOUN-Gen (41)
- VERB-Fin--NOUN-Nom (1289)
- VERB-Fin--PRON (7)
- VERB-Fin--PRON-Acc (1)
- VERB-Fin--PRON-Gen (4)
- VERB-Fin--PRON-Nom (594)
- VERB-Inf--NOUN-Nom (19)
- VERB-Inf--PRON-Gen (2)
- VERB-Inf--PRON-Nom (26)
- VERB-Part--NOUN-Gen (65)
- VERB-Part--NOUN-Nom (3213)
- VERB-Part--PRON (10)
- VERB-Part--PRON-Gen (9)
- VERB-Part--PRON-Nom (708)
- obj
- VERB-Conv--NOUN-Acc (16)
- VERB-Conv--NOUN-Dat (2)
- VERB-Conv--NOUN-Gen (1)
- VERB-Conv--NOUN-Ins (3)
- VERB-Conv--PRON-Acc (1)
- VERB-Conv--PRON-Nom (1)
- VERB-Fin--NOUN-Acc (1128)
- VERB-Fin--NOUN-Dat (54)
- VERB-Fin--NOUN-Gen (85)
- VERB-Fin--NOUN-Ins (43)
- VERB-Fin--NOUN-Nom (3)
- VERB-Fin--PRON (1)
- VERB-Fin--PRON-Acc (731)
- VERB-Fin--PRON-Acc-ADP(o) (2)
- VERB-Fin--PRON-Dat (221)
- VERB-Fin--PRON-Gen (27)
- VERB-Fin--PRON-Ins (2)
- VERB-Fin--PRON-Nom (2)
- VERB-Inf--NOUN-Acc (678)
- VERB-Inf--NOUN-Dat (34)
- VERB-Inf--NOUN-Gen (45)
- VERB-Inf--NOUN-Ins (20)
- VERB-Inf--NOUN-Nom (2)
- VERB-Inf--PRON (1)
- VERB-Inf--PRON-Acc (467)
- VERB-Inf--PRON-Dat (91)
- VERB-Inf--PRON-Gen (13)
- VERB-Inf--PRON-Ins (3)
- VERB-Inf--PRON-Nom (1)
- VERB-Part--NOUN-Acc (2700)
- VERB-Part--NOUN-Dat (123)
- VERB-Part--NOUN-Gen (157)
- VERB-Part--NOUN-Ins (128)
- VERB-Part--NOUN-Loc (1)
- VERB-Part--NOUN-Nom (13)
- VERB-Part--PRON (7)
- VERB-Part--PRON-Acc (1314)
- VERB-Part--PRON-Dat (449)
- VERB-Part--PRON-Gen (48)
- VERB-Part--PRON-Ins (17)
- VERB-Part--PRON-Nom (1)
- iobj
- VERB-Conv--PRON-Acc (1)
- VERB-Conv--PRON-Dat (1)
- VERB-Fin--NOUN-Acc (21)
- VERB-Fin--NOUN-Dat (34)
- VERB-Fin--NOUN-Gen (5)
- VERB-Fin--NOUN-Ins (8)
- VERB-Fin--PRON-Acc (46)
- VERB-Fin--PRON-Dat (208)
- VERB-Fin--PRON-Gen (3)
- VERB-Fin--PRON-Ins (1)
- VERB-Inf--NOUN-Acc (10)
- VERB-Inf--NOUN-Dat (26)
- VERB-Inf--NOUN-Gen (1)
- VERB-Inf--NOUN-Ins (5)
- VERB-Inf--PRON-Acc (13)
- VERB-Inf--PRON-Dat (119)
- VERB-Inf--PRON-Gen (3)
- VERB-Inf--PRON-Ins (2)
- VERB-Part--NOUN-Acc (57)
- VERB-Part--NOUN-Dat (103)
- VERB-Part--NOUN-Gen (20)
- VERB-Part--NOUN-Ins (20)
- VERB-Part--PRON-Acc (79)
- VERB-Part--PRON-Dat (463)
- VERB-Part--PRON-Gen (21)
Reflexive Verbs
- This corpus contains 1009 lemmas that occur at least once with an expl:pv child. Examples: stát se, dívat se, zeptat se, zdát se, snažit se, ptát se, vrátit se, podívat se, všimnout si, myslet si, usmát se, bát se, rozhodnout se, dát se, zastavit se, chovat se, smát se, uvědomit si, dostat se, dotknout se, objevit se, starat se, vydat se, představit si, vzpomenout si, cítit se, ozvat se, posadit se, podařit se, uvědomovat si, vracet se, líbit se, divit se, narodit se, obrátit se, prohlížet si, představovat si, těšit se, dít se, otočit se, jmenovat se, otázat se, stěžovat si, přát si, vzít si, bránit se, pustit se, stávat se, blížit se, dozvědět se
Reflexive Passive
- This corpus contains 201 lemmas that occur at least once with an expl:pass child. Examples: dát se, otevřít se, chtít se, říkat se, muset se, dělat se, začít se, vědět se, mluvit se, najít se, používat se, psát se, rozkřiknout se, moci se, měnit se, počítat se, připravovat se, příst se, vařit se, vysílat se, zbarvovat se, změnit se, bojovat se, chodit se, dostat se, dělávat se, hrnout se, hrát se, jet se, kouřit se, mít se, nabízet se, otevírat se, pootevřít se, posílat se, poznat se, prodlužovat se, prodávat se, proměnit se, propouštět se, pěstovat se, předpokládat se, přestavět se, rozkmitat se, roznést se, stavět se, svítit se, uvidět se, vcházet se, vyhodit se
Verbs with Reflexive Core Objects
- This corpus contains 259 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: říkat si, koupit si, říci si, svlékat se, svléknout se, mít se, schovat se, nalít si, převléknout se, přečíst si, slyšet se, vidět se, nabídnout se, vyčítat si, zabít se, znát se, nasadit si, nechat si, odpovědět si, opakovat si, prostřít se, namlouvat si, navonět se, odpustit si, pomoci si, ponechat si, potkat se, psát si, přesvědčit se, převlékat se, připomenout si, přiznat si, schovávat se, udržet se, ujistit se, chytnout se, držet se, dělat si, kupovat si, milující se, nazvat se, obléknout se, obout se, odradit se, odvést se, odvézt se, ohlásit se, omlouvat se, omluvit se, osvobozovat se
- Out of those, 12 lemmas occurred more than once, but never without a reflexive dependent. Examples: převléknout, prostřít, navonět, obout, převlékat, milující, omlouvat, omluvit, ptát, sprchovat, ubránit, zakoupit
Relations Overview
- This corpus uses 11 relation subtypes: advmod:emph, aux:pass, csubj:pass, det:numgov, det:nummod, expl:pass, expl:pv, nsubj:pass, nummod:gov, obl:agent, obl:arg
- The following 1 main types are not used alone, they are always subtyped: expl
- The following 5 relation types are not used in this corpus at all: dislocated, clf, list, goeswith, reparandum