UD Kazakh KTB
Language: Kazakh (code: kk
)
Family: Turkic, Northwestern
This treebank has been part of Universal Dependencies since the UD v1.3 release.
The following people have contributed to making this treebank part of UD: Aibek Makazhanov, Jonathan North Washington, Francis Tyers.
Repository: UD_Kazakh-KTB
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.2
License: CC BY-SA 4.0
Genre: wiki, fiction, news
Questions, comments? General annotation questions (either Kazakh-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [aibek • makazhanov (æt) nu • edu • kz, jonathan • north • washington (æt) gmail • com, ftyers (æt) prompsit • com]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually, natively in UD style |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | annotated manually |
Features | annotated manually in non-UD style, automatically converted to UD |
Relations | annotated manually, natively in UD style |
Description
The UD Kazakh treebank is a combination of text from various sources including Wikipedia, some folk tales, sentences from the UDHR, news and phrasebook sentences. Sentences IDs include partial document identifiers.
The tokenisation in the Kazakh UD treebank follows the principles of Turkic lexica in Apertium. Morphological processing in the Kazakh UD treebank follows the principles of Turkic lexica in Apertium. The treebank was randomly split into training (80%), testing (10%), and development (10%) sets.
Acknowledgments
Please, cite the following papers if you use Kazakh UD treebank:
@inproceedings{tyers_tl2015, author = {Tyers, Francis M. and Washington, Jonathan N.}, title = {Towards a Free/Open-source Universal-dependency Treebank for Kazakh}, booktitle = {3rd International Conference on Turkic Languages Processing, (TurkLang 2015)}, pages = {276–289}, year = {2015}, }
@inproceedings{makazhan_tl2015, author = {Makazhanov, Aibek and Sultangazina, Aitolkyn and Makhambetov, Olzhas and Yessenbayev, Zhandos}, title = {Syntactic Annotation of Kazakh: Following the Universal Dependencies Guidelines. A report}, booktitle = {3rd International Conference on Turkic Languages Processing, (TurkLang 2015)}, pages = {338–350}, year = {2015}, }
Statistics of UD Kazakh KTB
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Aspect – Case – Degree – Evident – Gender – Mood – Number – Number[psor] – NumType – Person – Person[psor] – Polarity – Polite – PronType – Tense – VerbForm – Voice
Relations
acl – acl:poss – acl:relcl – advcl – advmod – amod – appos – aux – case – cc – ccomp – clf – compound – compound:lvc – conj – cop – csubj – dep – det – discourse – flat:name – iobj – iobj:caus – mark – nmod – nmod:poss – nsubj – nummod – obj – obl – obl:own – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 1078 sentences, 10383 tokens and 10536 syntactic words.
- This corpus contains 1946 tokens (19%) that are not followed by a space.
- This corpus contains 15 types of words with spaces. Examples: алсам екен, араласқан жоқ, аңдысам екен, болған емес, болған жоқ, деген екен, естіген жоқ екен, еш нәрсені, келген жоқ, көрген емеспін, оқыған жоқ, сыйлайды екенсің, сыйламайды екенсің, тұрған жоқ, ұшырасқан жоқ
- This corpus contains 96 types of words that contain both letters and punctuation. Examples: ж., М., сондай-ақ, б.з.б., млн., млрд., т.б., -ақ, А., АҚШ-пен, Р., қарым-қатынастарды, 100-ге, 19,4°С-қа, 20-шы, 22%-ы, 2°С-тан, 3-ші, 30-шы, 35-те, 36%-ы, 400-ге, 55-ші, 70%-ін, 80-ге, 90%-ына, 90%-ға, Азық-түлікке, Ата-аналардың, Брютон-стриттегі, Г., Дар-әл-Харб, Деште-Кевир, Деште-Лух, Ел-жұрттарыңыздың, Жауын-шашынның, И., КСРО-дағы, Келе-келе, Кура-Аракс, Көші-қон, Премьер-Министрге, Рио-де-Жанейродағы, С., Сан-Паулуда, Санкт-Петербург, Солтүстік-батысын, Т., Тап-таза, ФИФА-ның
- This corpus contains 153 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 121 types of multi-word tokens. Examples: бар, ешкім, басқа, қуаныштымын, және, Ешкімді, Жасаған-ау, Сондықтан, аласыз, балалы, бола, болғанда, екеуі, ешқандай, жылы, кетті, кімдікі, көрсетер, тағы, Азамат, Баласыз, Бәрі, Дінге, Елсіз, Сүйсем, Төстік, Шолпан, айтшы, алды, алмай, аузымен, ашылса, аң, бала, балалары, басшылары, басын, бизнесі, бойынша, болмаса, болса, біз, білесіз, білмейміз-ау, білсе, бітімді, бұзылады-ау, бөлімде, дайынбыз, дұрыс.
Morphology
Tags
- This corpus uses 17 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus contains 10 word types tagged as particles (PART): ау, ба, бе, ер, ма, ме, ше, шы, шығар, қой
- This corpus contains 35 lemmas tagged as pronouns (PRON): барлық, барша, біз, бір, бір-бір, бірдеме, біреу, бірқатар, бұл, бәрі, ешкім, ешнәрсе, ештеңе, ешқандай, кім, күллі, манағы, мен, мына, мынау, не, нелік, немене, нәрсе, ол, олар, осы, сен, сол, сіз, сіздер, қандай, қанша, әрбіреу, өз
- This corpus contains 35 lemmas tagged as determiners (DET): ана, анау, барлық, басқа, бір, бірнеше, бірсыпыра, бірталай, бірқатар, бүкіл, бұл, ешбір, ешқандай, кей, кейбір, көп, көптеген, манағы, мына, мұндай, не, ол, осы, осындай, сол, сондай, түрлі, қай, қандай, қанша, әлгі, әлдебір, әр, әртүрлі, өз
- Out of the above, 14 lemmas occurred sometimes as PRON and sometimes as DET: барлық, бір, бірқатар, бұл, ешқандай, манағы, мына, не, ол, осы, сол, қандай, қанша, өз
- This corpus contains 24 lemmas tagged as auxiliaries (AUX): ал, атан, бар, баста, бер, бол, болуға, біл, біт, гөр, е, жат, жібер, жүр, кел, кет, көр, отыр, таста, түс, тұр, шық, қал, қой
- Out of the above, 21 lemmas occurred sometimes as AUX and sometimes as VERB: ал, атан, бар, баста, бер, бол, біл, біт, жат, жібер, жүр, кел, кет, көр, отыр, таста, түс, тұр, шық, қал, қой
- There are 5 (de)verbal forms:
- Conv
- AUX: болып, болса, болмаса, алып, берсек, бола, болсам, болсаң, жатса, жіберіп
- VERB: деп, алып, бастап, барып, Сөйтіп, беріп, болып, қашып, құлап, айналып
- Cov
- AUX: болып, бола, келе, алмай, бара, боп, отыра, тұра
- VERB: басып, дами, алып, бара, жоспарланып, қарап, ала, бақылап, жаулап, көріп
- Fin
- AUX: болды, еді, жатыр, бастады, кетті, емес, келеді, отыр, екен, болады
- VERB: деді, біледі, болды, келді, өтті, береді, шықты, алды, ашылды, болады
- Ger
- AUX: екенін, болуы, болу, болуға, болғанда, болғанын, алатынына, алмауда, алғаннан, алғаныма
- VERB: алуға, жасау, келгенде, оқу, шешуі, қорғалуға, алу, асыру, атауға, ашылу
- Part
- AUX: жатқан, болған, отырған, тұрған, алмайтындай, алмаған, болатын, болушы, отыратын, қойған
- VERB: болған, деген, шыққан, туған, түскен, айтарлықтай, айтқан, алған, аталған, билеген
Nominal Features
- Fem
- NOUN: Елизавета
- PROPN: Айгүл, Шолпан, Елизавета, Айгүлдің, Александра, Алтынай, Ақбала, Мария, Шолпанның, Айгүлден
- Masc
- NOUN: Эдуард
- PROPN: Бекболат, Азамат, Нұрсұлтан, Назарбаев, Ерназардың, Азаматтың, Реза, Төстік, Қожа, Азаматты
- Plur
- ADJ: ақтардың, Ақтар, баршаларын, лақаптар, туындылар, қызылдар, әскерилер, өзгелері
- AUX-Conv: берсек
- AUX-Fin: бастады, жатырмыз, келді, алмады, берді, беретін, быз, жатыр, жатырсыздар, жүрміз
- NOUN: тілдерін, жылдары, ғасырларда, өзгерістер, қатынастар, актерлер, мемлекеттер, орыстар, сайлаушылар, толқулар
- PRON: біз, біздің, олар, бізді, олардың, сіздер, Бұлардың, Сіздерді, бізге, оларды
- PROPN: ильхандар, салжұқтар, Әзірбайжандар
- VERB-Fin: келді, сақталған, айтамыз, басталды, білейік, орнады, айқындаймыз, алды, алдық, атқарылды
- VERB-Ger: бірігулері, жасаулары, келгендеріңіз, ұсынғандар
- Sing
- AUX-Conv: болса, болмаса, болсам, болсаң, жатса, кетпесем
- AUX-Fin: болды, еді, жатыр, емес, кетті, бастады, келеді, отыр, екен, болады
- PRON: мен, ол, оның, сіздің, оны, сені, Сіз, маған, оған, Сен
- VERB-Conv: берсе, десең, жатса, Сүйсем, алмаса, ашылса, барса, болса, білсе, білсең
- VERB-Cov: Тарағысы, айтқым, айтқысы, оқытса, Қарағысы, қайтқысы, қатысқысы, құттықтағым, ұсынғым
- VERB-Fin: деді, біледі, болды, өтті, береді, шықты, болады, болыпты, келді, табылады
- Abl
- ADJ: алыстан, жаңадан, күштіден, көптен, жартысынан
- AUX-Ger: алғаннан, болғандықтан, біткеннен
- NOUN: жылдан, футболдан, Соғыстан, ауылдан, дүниеден, елден, күннен, пендеден, шеттен, ғасырдан
- NUM: бірінен, 2°С-тан, миллионнан, мыңнан, қырықтан
- PRON: одан, онан, содан, Бірінен, Менен, Мұнан, Неліктен, Сізден, осыдан
- PROPN: Азиядан, Астанадан, Германиядан, Сұзыдан, Айгүлден, Төлегеннен
- VERB-Ger: кеткеннен, алмастан, басталғаннан, бақылаудан, жетіспеушілігінен, жолыққаннан, жөндеуден, сөйлегеннен, тұрғызылғандықтан, қорыққаннан
- Acc
- ADJ: талайды, өзгені, Солтүстік-батысын, Турасын, баршаларын, барыңды, оңтүстігін, солтүстік-шығысын, өзгесін
- AUX-Ger: екенін, болғанын, болмасымды, болғанымды, екендіктерін, жатқанын, жүргенін, шығуды
- NOUN: тілдерін, жобаны, сөзді, чемпионатты, қызды, малын, ахуалды, бейбітшілікті, дыбысты, елді
- NUM: 70%-ін, Бірін
- PRON: оны, сені, бізді, Мені, Сізді, Ешкімді, Кімді, Сіздерді, бәрін, оларды
- PROPN: Иранды, Азаматты, Арабияны, Мысырды, Палестинаны, Сирияны, Қазақстанды, Қожанасырды
- VERB-Ger: біткенді, ойнағанды, алуды, алғанын, білгенді, демократияландыруды, етуді, жазылмасын, жолдауыңызды, жымиғанын
- Dat
- ADJ: алысқа, жайға, жылдығына
- AUX-Ger: болуға, алатынына, алғаныма, болғаныма, екеніне, кетпесіне, тұруға, шығуға, қалғанына
- NOUN: жерге, үйге, адамға, жылға, дағдарысқа, дүниеге, елге, пайызға, тысқа, аймаққа
- NUM: 100-ге, 19,4°С-қа, 400-ге, 80-ге, 90%-ына, 90%-ға
- PRON: оған, маған, кімге, саған, Соған, бізге, ешкімге, оларға, сізге, сіздерге
- PROPN: Астанаға, Иранға, Қазақстанға, Арменияға, Бағдадқа, Византияға, Германияға, Семейге, Тибетке, Украинаға
- VERB-Ger: алуға, қорғалуға, атауға, білуге, орнатуға, табуға, тұруға, азапталуға, айналуға, айрылмауға
- VERB-Part: Блоктарға, сездірмеске
- Gen
- ADJ: ақтардың, жаттың, туындының, жылдығының
- NOUN: жылдың, ғасырдың, халықтың, адамның, елдің, Жобаның, ағаштың, еліміздің, қазақтың, қаланың
- NUM: екеуінің
- PRON: біздің, оның, сіздің, олардың, соның, өзінің, менің, мұның, өзіміздің, Аның
- PROPN: Қазақстанның, Иранның, Астананың, Ерназардың, Азаматтың, Азияның, Еуропаның, Айгүлдің, Алматының, Бекболаттың
- VERB-Ger: жүргізудің, тартудың, теңелуінің, тырысуының, қосылудың, қосылуының, әкелудің
- Ins
- AUX-Ger: екенімен
- NOUN: сезіммен, Асумен, Жорғалықпенен, Күнмен, Нашақорлықпен, Патшамен, Тәсілмен, абыроймен, ерлікпен, жолмен
- PRON: осымен, Онымен, Сізбен, бір-бірімен, бұлармен, кіммен, немен, соныменен
- PROPN: АҚШ-пен, Ауғанстанмен, Грузиямен, Қазақстанмен, Өзбекстанмен, Назарбаевпен
- VERB-Ger: берумен, болуымен, бояумен, жеумен, кигенмен, оқығанменен, сайлануыңызбен, сорумен, қаруымен, өткізілуімен
- Loc
- ADJ: аулақта, жартысында, Анығында
- AUX-Ger: болғанда, алмауда, жүргенде
- NOUN: елде, ғасырда, түрде, елдегі, кезде, жерде, арасында, кезінде, баспасөзде, бақшада
- NUM: 35-те
- PRON: мұнда, Сізде, осында, өзінде, онда, Бізде, Менде, сонда
- PROPN: Қазақстанда, Астанада, Тегеранда, Қазақстандағы, Алматыда, Бразилияда, Иранда, Азияда, Азиядағы, Америкада
- VERB-Ger: келгенде, салыстырғанда, Сөйткенде, араздасқанда, асқанда, ашқанда, дамуда, дамытуда, дегенде, жүргенде
- Nom
- ADJ: бар, атты, дауысты, жақын, жоқ, жуығы, көп, түркі, Ақтар, баршасы
- ADP: дейінгі, кейінгі
- ADV: қазіргі, соңғы, Арғы, Бүгінгі, Ендігі, Жоғарғы, бергі, биылғы, ежелгі, күндізгі
- AUX-Ger: болуы, болу, болатыны, білу, екені, жатқаны, жүрген, көруіміз, отырғаным, қалған
- DET: не
- NOUN: мемлекет, ел, орыс, қазақ, Президент, адам, бала, кісі, мал, орын
- NUM: бірі, екеуі, 2030, 22%-ы, 27%, 30%, 36%-ы, 5%, 51%, 58,3%
- PRON: біз, мен, ол, бұл, не, кім, олар, өзі, ешкім, бәрі
- PROPN: Иран, Қазақстан, АҚШ, Алматы, Астана, Бекболат, Азамат, Нұрсұлтан, Ұлыбритания, Айгүл
- VERB-Ger: жасау, оқу, шешуі, алу, асыру, ашылу, келген, көрсету, салу, сақтау
- VERB-Part: келген, көбейгені
Degree and Polarity
- Cmp
- ADJ: Жақынырақ, анығырақ, арзанырақ, кішірек, тазалау
- ADV: Кейінірек
- Neg
- AUX-Conv: болмаса, кетпесем
- AUX-Cov: алмай
- AUX-Fin: емес, алмайды, алмады, алмаймын, алмас, болған емес, болған жоқ, келген жоқ, келмеді, көрме
- AUX-Ger: алмауда, болмасымды, кетпесіне
- AUX-Part: алмайтындай, алмаған
- VERB-Conv: алаланбай, алмаса, аспай, жемей, жығылмай, келмей, саналмаса, қалдырмай, қорықпай, қылмай
- VERB-Cov: ашпай, білінбей, келмей
- VERB-Fin: келмейді, болмайды, айтпайды, білмеймін, қылмады, айтылмады, айырмайды, араласпаймын, араласқан жоқ, аяма
- VERB-Ger: айрылмауға, алаланбауы, алмастан, бермеуі, жазылмасын, жетіспеушілігінен, келмеуі, сұғылмауына, қосылмау
- VERB-Part: Ашылмайтын, еңсерілмейтін, жатпайтын, оқымаған, сездірмеске, сүймеген, шешілмеген, Қорықпайтын
Verbal Features
- Imp
- AUX-Conv: бола
- AUX-Cov: бола, келе, алмай, бара, отыра, тұра
- AUX-Ger: алатынына, болатыны
- AUX-Part: алмайтындай, болатын, отыратын
- VERB-Conv: қайта, ажарлана, арсыздана, арттыра, жая, мадақтай, тұра, шақыра, қаша
- VERB-Cov: дами, бара, ала, отыра, араласа, арта, бере, жете, келе, кіре
- VERB-Ger: жығатынын, мақтанатыны, табылатынын, әкелетіні, өзгеретінін
- VERB-Part: жейтін, тұратын, Ашылмайтын, Танытатын, асыратын, баратын, болатын, білетін, бұзатын, дайындайтын
- Perf
- AUX-Conv: болып, алып, жіберіп, жүріп, отырып, тұрып
- AUX-Cov: болып, алмай, боп
- VERB-Conv: деп, алып, бастап, барып, Сөйтіп, беріп, болып, қашып, құлап, айналып
- VERB-Cov: басып, алып, жоспарланып, қарап, бақылап, жаулап, көріп, шығып, құрып, беріп
- Cnd
- AUX-Conv: болса, болмаса, берсек, болсам, болсаң, жатса, кетпесем
- VERB-Conv: берсе, десең, жатса, Сүйсем, алмаса, ашылса, барса, болса, білсе, білсең
- VERB-Cov: оқытса
- Imp
- AUX-Fin: бер, гөр, көрме, қал
- VERB-Fin: алыңыз, же, Аттан, айт, аяма, бер, берме, беріңіз, жасаңыздар, жинаңыз
- Ind
- AUX-Fin: болды, еді, жатыр, бастады, кетті, емес, келеді, отыр, екен, болады
- VERB-Fin: деді, біледі, болды, келді, өтті, береді, шықты, алды, ашылды, болады
- Opt
- AUX-Fin: болсын, алсын, берсін, болайын, тұрайық, қойсын
- VERB-Fin: білейік, білсін, аяйын, барайын, барсын, берейік, білдірсін, жалынсын, жейік, жисын
- Pot
- AUX-Part: болушы
- VERB-Part: айтарлықтай, айтушы, алаңдарлықтай, атқарушы, басқарушы, деуші, жетелеуші, шығарушы, қабылдаушы, қорқушы
- Vol
- VERB-Cov: Тарағысы, айтқым, айтқысы, Қарағысы, қайтқысы, қатысқысы, құттықтағым, ұсынғым
- VERB-Fin: алсам екен, аңдысам екен
- Aor
- AUX-Fin: емес, келеді, екен, болады, мын, алмайды, береді, кетеді, тұрады, қалады
- VERB-Fin: біледі, береді, болады, табылады, түседі, тұрады, көрінеді, дейді, келеді, келмейді
- Fut
- AUX-Fin: алмас
- AUX-Ger: болмасымды, кетпесіне
- VERB-Fin: көрсет, барарсың, бүлінер, бәсеңдер, естірсіз, көрер, соғармын, суынар, сөйлесерміз, ішермін
- VERB-Ger: алмастан, жазылмасын
- VERB-Part: Блоктарға, артар, аяр, дер, сездірмеске
- FutPlan
- AUX-Fin: бермек, болмақ
- VERB-Fin: кеңейтілмек, көздемек
- VERB-Ger: білмек
- Past
- AUX-Fin: болды, еді, бастады, кетті, қалды, алды, болған, келді, алмады, берді
- AUX-Ger: екенін, болғанда, болғанын, алғаннан, алғаныма, болғаныма, болғанымды, біткеннен, екені, екенімен
- AUX-Part: жатқан, болған, отырған, тұрған, алмаған, қойған
- VERB-Fin: деді, болды, келді, өтті, шықты, алды, ашылды, болыпты, құрылды, жойылды
- VERB-Ger: келгенде, біткенді, келген, кеткеннен, ойнағанды, салыстырғанда, Сөйткенде, алғанын, араздасқанда, артқан
- VERB-Part: болған, деген, шыққан, туған, түскен, айтарлықтай, айтқан, алған, аталған, билеген
- Pres
- AUX-Fin: жатыр, отыр, жатырмыз, жүр, тұр, отырмын, тұрмын, жатырмын, жатырсыздар, жүрміз
- VERB-Fin: тұр
- Coop
- VERB-Conv: тартысып, Қиюласып, өлтіріспей
- VERB-Cov: айтысып, араласа, соғыса, танысып, қатысқысы, құшақтасып
- VERB-Fin: айналысады, араласқан жоқ, байланысты, бөлісеміз, жалғасты, жасасты, келісті, сөйлесерміз, танысты, қатысамын
- VERB-Ger: жетіспеушілігінен, танысқаныма, істесуге, Қалыптасу, қатысуға, әңгімелесуіміз, өлтіріскеніне
- VERB-Part: таласқандай, топтасқан
- Pass
- VERB-Conv: алаланбай, ажарлана, ашылса, байқалып, басталып, бұзылып, жарияланып, жасалып, жығылмай, расталса
- VERB-Cov: жоспарланып, бөлініп, өткізіліп, басылып, білінбей, бұжырланып, жіберіліп, көрсетіліп, сайланып, салына
- VERB-Fin: ашылды, табылады, құрылды, жойылды, көрінеді, анықталады, басталды, берілді, жарияланады, жасалады
- VERB-Ger: қорғалуға, ашылу, азапталуға, алаланбауы, асырылуы, аяқталуы, басталуы, басталғаннан, басылуы, білінген
- VERB-Part: аталған, кеңейтілген, табылған, Атқарылған, Ашылмайтын, арналған, белгіленген, еңсерілмейтін, жабдықталған, жарияланған
- Fh
- AUX-Fin: екен, болыпты, кетіпті, шығыпты
- VERB-Fin: болыпты, келіпті, деген екен, демепті, елемепті, естіген жоқ екен, жасапты, жиналыпты, кетіпті, сыйлайды екенсің
Pronouns, Determiners, Quantifiers
- Dem
- DET: осы, бұл, ол, сол, мына, бұ, мұндай, манағы, Анау, Мұнша
- PRON: бұл, ол, мұнда, одан, оны, соның, мұның, олай, оған, бұ
- Ind
- DET: бір, кейбір, сондай, Кей, Осындай, басқа, түрлі, Әлдебір
- PRON: біреу, Бірінен, бірдеме, біреуге, біреудің, нәрсе, Әрбіреудің
- Int
- ADJ: қандай
- ADV: қайда, қайдан, қалай, қашан, неге, неліктен, қашанғы
- DET: қай, не, қандай
- PRON: не, кім, қандай, қанша, немене, кімге, Кімді, Неліктен, Неміз, кіммен
- Neg
- DET: ешқандай, ешбір
- PRON: ешкім, Ешкімді, ешкімге, ешқандай, Ештеңе, еш нәрсені
- Prs
- PRON: біз, мен, ол, біздің, оның, олар, сіздің, оны, сені, Сіз
- Qnt
- DET: барлық, әр, бүкіл, бірқатар, көп, көптеген, қанша, бірнеше, Бірталай, бірсыпыра
- PRON: бәрі, барлығы, бәрін, бірқатары, күллі
- Rcp
- PRON: бір-бірімен
- Ref
- DET: өз
- PRON: өзі, өзінің, өзіміздің, өзінде, өзінше, өздері, өздерінің, өздерің, өзін, өзін-өзі
- Tot
- PRON: баршаға
- Card
- NUM: бір, екі, миллиард, үш, 12, төрт, сегіз, 1, 4, 5
- Card,Ord
- NUM: бірі, бір, 3, бірдей, млн., мың, 1, 1220, 13, 1380
- Coll
- NUM: екеуі, екеуінің, біреуі, үшеуі
- Ord
- NUM: 2, үшінші, 1, 11, 18, 19, 20, 12, 14, 16
- 1
- AUX-Conv: берсек, болсам, кетпесем
- AUX-Fin: мын, жатырмыз, алдым, алмаймын, отырмын, тұрмын, беремін, болайын, болдым, быз
- PRON: біз, мен, біздің, маған, бізді, менің, Мені, бізге, Бізде, Менде
- VERB-Conv: Сүйсем, жатсам, тұрсам
- VERB-Cov: айтқым, құттықтағым, ұсынғым
- VERB-Fin: құттықтаймын, айтамыз, алам, білейік, білмеймін, көрдім, ойлаймын, айқындаймыз, алдым, алдық
- 2
- AUX-Conv: болсаң
- AUX-Fin: аласыз, бер, гөр, жатырсыздар, келдіңіз, келесіз, көрме, отырсыздар, тұрсыңдар, қал
- PRON: сіздің, сені, Сіз, Сен, Сізде, Сізді, саған, сіздер, Сіздерді, сізге
- VERB-Conv: десең, білсең, салсаң
- VERB-Fin: алыңыз, же, Аттан, айт, айтасың, атасың, аяма, барарсың, бер, берме
- 3
- AUX-Conv: болса, болмаса, жатса
- AUX-Fin: болды, еді, жатыр, бастады, кетті, емес, келеді, отыр, екен, болады
- PRON: ол, оның, олар, оны, олардың, оған, Аның, одан, оларды, оларға
- VERB-Conv: берсе, жатса, алмаса, ашылса, барса, болса, білсе, жалынса, жыласа, жүрсе
- VERB-Cov: Тарағысы, айтқысы, оқытса, Қарағысы, қайтқысы, қатысқысы
- VERB-Fin: деді, біледі, болды, келді, өтті, береді, шықты, алды, ашылды, болады
- Form
- AUX-Fin: аласыз, жатырсыздар, келдіңіз, келесіз, отырсыздар
- NOUN: Ел-жұрттарыңыздың, Мерекелеріңізбен, Сұрақтарыңызды, атыңыз, елдеріңіз, елордаларыңызға, еліңіз, сапарыңыз, саясатыңыздың, сеніміңізді
- NUM: жетіңіз
- PRON: сіздің, Сіз, Сізде, Сізді, сіздер, Сіздерді, сізге, сіздерге, Сізбен, Сізден
- VERB-Fin: алыңыз, беріңіз, болдыңыз, білесіз, естірсіз, жасаңыздар, жинаңыз, сөйлейсіз, табыласыздар, шығарасыз
- VERB-Ger: жолдауыңызды, келгендеріңіз, сайлануыңызбен, қылғаныңыз
- Plur
- AUX-Ger: екендіктерін, көруіміз
- NOUN: еліміздің, еліміз, Алдымыз, Дамуымыз, Еліміздегі, Конституциямызды, Отанымыз, азаматтарымыз, алғысымызды, аспанымыз
- PRON: өзіміздің, өздері, Неміз, өздерінің, өздерің
- VERB-Ger: кездесуіміз, әңгімелесуіміз, өлуіміз
- Plur,Sing
- ADJ: жартысында, жуығы, Анығында, Солтүстік-батысын, Турасын, баршаларын, баршасы, жартысынан, жылдығына, жылдығының
- AUX-Ger: екенін, болуы, болғанын, алатынына, болатыны, екені, екенімен, екеніне, жатқаны, жатқанын
- NOUN: басшысы, жылы, әулеті, тілдерін, арасында, кезінде, халқы, Президенті, мемлекеті, ішінде
- NUM: бірі, екеуі, екеуінің, бірінен, 22%-ы, 36%-ы, 70%-ін, 90%-ына, Бірін, біреуі
- PRON: өзі, бәрі, өзінің, өзінде, өзінше, барлығы, бәрін, Бірінен, Онысы, бір-бірімен
- PROPN: Алашордасының, Арабиясының
- VERB-Ger: шешуі, алаланбауы, алуы, алғанын, асырылуы, атқаруы, аяқталуы, басталуы, басылуы, бермеуі
- VERB-Part: көбейгені
- Sing
- ADJ: барыңды
- AUX-Ger: алғаныма, болмасымды, болғаныма, болғанымды, отырғаным
- NOUN: Інім, Атым, Ағам, Ел-жұрттарыңыздың, Жасым, Жауыңнан, Мерекелеріңізбен, Отаным, Съездің, Сұрақтарыңызды
- NUM: жетіңіз
- PRON: өзіңіздің
- VERB-Ger: жолдауыңызды, келгендеріңіз, көргеніме, сайлануыңызбен, танысқаныма, қылғаныңыз
Other Features
- Person[psor]
- 1
- AUX-Ger: алғаныма, болмасымды, болғаныма, болғанымды, көруіміз, отырғаным
- NOUN: еліміздің, еліміз, Інім, Алдымыз, Атым, Ағам, Дамуымыз, Еліміздегі, Жасым, Конституциямызды
- PRON: өзіміздің, Неміз
- VERB-Ger: кездесуіміз, көргеніме, танысқаныма, әңгімелесуіміз, өлуіміз
- 2
- ADJ: барыңды
- NOUN: Ел-жұрттарыңыздың, Жауыңнан, Мерекелеріңізбен, Съездің, Сұрақтарыңызды, атыңды, атыңыз, балаң, балаңа, басың
- NUM: жетіңіз
- PRON: өздерің, өзіңіздің
- VERB-Ger: жолдауыңызды, келгендеріңіз, сайлануыңызбен, қылғаныңыз
- 3
- ADJ: жартысында, жуығы, Анығында, Солтүстік-батысын, Турасын, баршаларын, баршасы, жартысынан, жылдығына, жылдығының
- AUX-Ger: екенін, болуы, болғанын, алатынына, болатыны, екендіктерін, екені, екенімен, екеніне, жатқаны
- NOUN: басшысы, жылы, әулеті, тілдерін, арасында, кезінде, халқы, Президенті, мемлекеті, ішінде
- NUM: бірі, екеуі, екеуінің, бірінен, 22%-ы, 36%-ы, 70%-ін, 90%-ына, Бірін, біреуі
- PRON: өзі, бәрі, өзінің, өзінде, өзінше, барлығы, бәрін, өздері, Бірінен, Онысы
- PROPN: Алашордасының, Арабиясының
- VERB-Ger: шешуі, алаланбауы, алуы, алғанын, асырылуы, атқаруы, аяқталуы, басталуы, басылуы, бермеуі
- VERB-Part: көбейгені
- 1
Syntax
Auxiliary Verbs and Copula
- This corpus uses 5 lemmas as copulas (cop). Examples: бол, е, тұр, атан, болуға.
- This corpus uses 21 lemmas as auxiliaries (aux). Examples: жат, ал, отыр, кел, кет, тұр, баста, бер, қал, жүр, шық, бар, бол, көр, жібер, түс, қой, біл, біт, гөр, таста.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Conv--NOUN-Nom (37)
- VERB-Conv--PRON-Dat (1)
- VERB-Conv--PRON-Nom (8)
- VERB-Cov--NOUN-Nom (72)
- VERB-Cov--PRON-Gen (1)
- VERB-Cov--PRON-Nom (37)
- VERB-Fin--NOUN (4)
- VERB-Fin--NOUN-Nom (288)
- VERB-Fin--PRON-Nom (84)
- VERB-Ger--NOUN-Gen (17)
- VERB-Ger--NOUN-Nom (29)
- VERB-Ger--PRON-Gen (7)
- VERB-Ger--PRON-Nom (10)
- VERB-Part--NOUN-Gen (2)
- VERB-Part--NOUN-Nom (24)
- VERB-Part--PRON-Nom (3)
- obj
- VERB-Conv--NOUN-Acc (27)
- VERB-Conv--NOUN-Nom (25)
- VERB-Conv--PRON-Acc (4)
- VERB-Conv--PRON-Nom (3)
- VERB-Cov--NOUN-Acc (34)
- VERB-Cov--NOUN-Dat (2)
- VERB-Cov--NOUN-Nom (19)
- VERB-Cov--PRON-Acc (5)
- VERB-Cov--PRON-Nom (1)
- VERB-Fin--NOUN-Acc (106)
- VERB-Fin--NOUN-Dat (7)
- VERB-Fin--NOUN-Nom (82)
- VERB-Fin--PRON-Acc (31)
- VERB-Fin--PRON-Dat (1)
- VERB-Fin--PRON-Nom (3)
- VERB-Ger--NOUN-Acc (55)
- VERB-Ger--NOUN-Dat (2)
- VERB-Ger--NOUN-Nom (44)
- VERB-Ger--PRON-Acc (8)
- VERB-Ger--PRON-Dat (1)
- VERB-Part--NOUN-Acc (15)
- VERB-Part--NOUN-Dat (1)
- VERB-Part--NOUN-Nom (11)
- VERB-Part--PRON-Acc (1)
- VERB-Part--PRON-Nom (1)
- iobj
- VERB-Fin--NOUN-Dat (1)
- VERB-Ger--NOUN-Abl (1)
- VERB-Part--NOUN-Dat (1)
Relations Overview
- This corpus uses 7 relation subtypes: acl:poss, acl:relcl, compound:lvc, flat:name, iobj:caus, nmod:poss, obl:own
- The following 1 main types are not used alone, they are always subtyped: flat
- The following 6 relation types are not used in this corpus at all: expl, dislocated, fixed, list, goeswith, reparandum