UD Tamil TTB
Language: Tamil (code: ta
)
Family: Dravidian, Southern
This treebank has been part of Universal Dependencies since the UD v1.2 release.
The following people have contributed to making this treebank part of UD: Loganathan Ramasamy, Daniel Zeman.
Repository: UD_Tamil-TTB
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.2
License: CC BY-NC-SA 3.0
Genre: news
Questions, comments? General annotation questions (either Tamil-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [zeman (æt) ufal • mff • cuni • cz]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually in non-UD style, automatically converted to UD |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | annotated manually |
Features | annotated manually in non-UD style, automatically converted to UD |
Relations | annotated manually in non-UD style, automatically converted to UD |
Description
The UD Tamil treebank is based on the Tamil Dependency Treebank created at the Charles University in Prague by Loganathan Ramasamy.
The treebank was part of HamleDT, a collection of treebanks converted to the Prague dependency style (since 2011). Later versions of HamleDT added a conversion to the Stanford dependencies (2014) and to Universal Dependencies (HamleDT 3.0, 2015). The first release of Universal Dependencies that includes this treebank is UD v1.2 in November 2015. It is essentially the HamleDT conversion but the data is not identical to HamleDT 3.0 because the conversion procedure has been further improved.
References:
- http://ufal.mff.cuni.cz/~ramasamy/tamiltb/0.1/ … TamilTB
- http://ufal.mff.cuni.cz/hamledt … HamleDT
- http://ufal.mff.cuni.cz/treex … Treex is the software used for conversion
- http://ufal.mff.cuni.cz/interset … Interset was used to convert POS tags and features
@inproceedings{ta, author = {Ramasamy, Loganathan and \v{Z}abokrtsk'{y}, Zden\v{e}k}, year = {2012}, title = {Prague Dependency Style Treebank for {Tamil}}, booktitle = {Proceedings of Eighth International Conference on Language Resources and Evaluation ({LREC} 2012)}, address = {.{I}stanbul, Turkey}, editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Uğur Doğan and Bente Maegaard and Joseph Mariani and Asuncion Moreno and Jan Odijk and Stelios Piperidis}, isbn = {978-2-9517408-7-7}, pages = {1888–1894}, url = {http://www.lrec-conf.org/proceedings/lrec2012/summaries/456.html} }
Acknowledgments
Statistics of UD Tamil TTB
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – NOUN – NUM – PART – PRON – PROPN – PUNCT – VERB – X
Features
AdpType – Animacy – Case – Gender – Mood – Number – NumForm – NumType – Person – Polarity – Polite – PronType – PunctType – Reflex – Tense – VerbForm – Voice
Relations
acl – advcl – advmod – advmod:emph – amod – appos – aux – case – cc – ccomp – compound – compound:prt – conj – cop – csubj – det – iobj – mark – nmod – nsubj – nsubj:pass – nummod – obj – obl – obl:arg – parataxis – punct – root – xcomp
Tokenization and Word Segmentation
- This corpus contains 600 sentences, 8635 tokens and 9581 syntactic words.
- This corpus contains 977 tokens (11%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 61 types of words that contain both letters and punctuation. Examples: ஐ.நா., தி.மு.க., 1992-ம், இ-மெயில், கே.எஸ்.ஸ்ரீபதி, டி.வி., 1-ம், 12-ம், 125-ம், 15-ம், 21-ம், இ-மெயிலில், இந்திய-அமெரிக்க, ஐ.ஏ.எஸ்., கே.பி.பி., 10-க்க், 15-ல், 18-ல், 1954-ம், 1977-ம், 1987-ம், 1996-ம், 2001-ம், 2005-வது, 2006-ம், 2008-ம், 2009-ல், 2022-ம், 28-ம், 444-ல், 6-ம், இந்தியா-அமெரிக்கா, என்.எல்.சி., எம்.எஸ்ஸி., எம்.பி.க்கள், எம்.பி.ய், எல்.என்., எல்.மணி, எஸ்.எம்., எஸ்.எஸ்., எஸ்.கைகாட்டி, எஸ்.மாலதி, எஸ்.மாலதிய், ஏ.எம்., ஏ.கே.செல்வராஜ், ஐ.நா.வின், ஐ.பி.எல்., கே.எஸ்., கே.கே.மாதன், செப்.15-ம்
- This corpus contains 835 multi-word tokens. On average, one multi-word token consists of 2.13 syntactic words.
- There are 620 types of multi-word tokens. Examples: என்றும், இடையிலான, செயலாளராக, தெரிவிக்கப்பட்டுள்ளது, தெரிவித்துள்ளது, தெரிவித்துள்ளார், இடத்தையும், குறிப்பிடத்தக்கது, வெளியிட்டுள்ள, Kஉறித்தும், பேருக்கும், ஆதரவாக, காரணமாக, குறிப்பிடப்பட்டுள்ளது, கூறியுள்ளார், பாதிக்கப்படும், அதிகாரிகளும், ஆணையராக, இடத்திலேயே, உத்தரவிட்டுள்ளார், உயிரிழந்ததாக, ஏற்படுத்தியுள்ளது, ஏற்பட்டுள்ளது, குறித்தும், குறிப்பிட்டுள்ளார், செய்துள்ளது, செய்துள்ளனர், தலைவருமான, தலைவரும், நம்புவதாக, நாடுகளும், நிதியிலிருந்து, படவில்லை, பேசியதாவது, விட்டதாகவும், வெளியாகியுள்ளது, அடைக்கப்பட்டிருந்த, அதற்கான, அந்நாட்டின், அனுமதித்திருக்கும், அமெரிக்காவும், அமைந்துள்ளது, அரசும், அறிவித்துள்ளது, அறிவித்துள்ளார், அறையோ, ஆட்சியராக, ஆணையராகப், ஆண்டுகளாக, ஆயிரமாக.
Morphology
Tags
- This corpus uses 14 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, NOUN, NUM, PART, PRON, PROPN, PUNCT, VERB, X
- This corpus does not use the following tags: SCONJ, INTJ, SYM
- This corpus contains 39 word types tagged as particles (PART): ஆ, ஆக, ஆகக், ஆகத், ஆகப், ஆகவ், ஆன, ஆறு, ஆவது, உடன், உம், எடுப்பத், என, எனக், எனத், எனவ், என்கிற, என்பதால், என்பது, என்பதை, என்பதைய், என்ற, என்றால், என்று, என்ற், ஏ, ஏயே, ஏய், ஓ, காட்டிலும், கூட, கொடுப்பத், தான், படி, பிறகே, போது, மட்டுமே, வரை, விட
- This corpus contains 25 lemmas tagged as pronouns (PRON): அதன், அது, அனைத்து, அனைவர், அவர், அவர்களால், அவை, இது, இவர், இவை, உங்கள், எங்கள், எது, எத்தகையது, என், ஏத், தன், தம், தான், நம், நாங்கள், நான், நாம், நீங்கள், யார்
- This corpus contains 12 lemmas tagged as determiners (DET): அதிகம், அந்த, அந்தந்த, இந்த, எந்த, ஒரு, குறைவு, கொஞ்சம், மிக, மிகவும், முழு, முழுவதும்
- This corpus contains 29 lemmas tagged as auxiliaries (AUX): அல், ஆகு, ஆவர், இரு, இல், உள், என், கிடை, கூடு, கூறு, கொடு, கொள், செய், தகு, படு, பிடு, பெறு, போ, மாட்டு, முடி, முயல், வரல், வரு, வா, விடு, விரி, வீடு, வேண்டு, வை
- Out of the above, 25 lemmas occurred sometimes as AUX and sometimes as VERB: அல், ஆகு, இரு, இல், உள், என், கிடை, கூடு, கூறு, கொடு, கொள், செய், தகு, படு, பிடு, பெறு, போ, முடி, முயல், வரு, வா, விடு, வீடு, வேண்டு, வை
- There are 4 (de)verbal forms:
- Fin
- AUX: உள்ளது, வேண்டும், உள்ளார், இல்லை, உள்ளனர், பட்டது, உள்ளன, வருகின்றனர், இருந்தது, ப்படும்
- PART: என்றால்
- VERB: தெரிவித்தார், என்றார், உள்ளது, கூறினார், தெரிகிறது, தெரிவித்தன, நடைபெறும், உயிரிழந்தனர், இருக்கும், இருந்தார்
- Ger
- AUX: உள்ளத், இருப்பத், விட்டத், பட்டது, பட்டதற்கு, போவத், வருவது, இருப்பது, உள்ளதால், கொண்டத்
- PART: என்பது, என்பதை, என்பதால், எடுப்பத், என்பதைய், கொடுப்பத்
- VERB: கூறியத், உயிரிழந்தத், உயிரிழப்பத், கொள்வதற்க், நம்புவத், பேசியத், இடம்பெறுவதற்கு, இருந்தத், ஈடுபட்டது, செயல்படுவதற்க்
- Inf
- AUX: ப்பட, செய்ய, செய்யப், படவ், பட, கொள்ள, செய்யக், செய்யவ், படக், பட்ட
- PART: என்று, என, என்ற், எனத், எனக், எனவ்
- VERB: தெரிவிக்கப், செய்யப், வழங்கப், நியமிக்கப், குறிப்பிடத், குறிப்பிடப், அளிக்கப், செய்ய, தெரிய, எடுக்கப்
- Part
- ADJ: உள்ள, உள்ளிட்ட, இருந்த, நடைபெற்ற, வந்த, வரும், ஆகிய, நடைபெறும், இருக்கும், கொண்ட
- AUX: பட்ட், பட்டு, கொண்டு, செய்து, கொண்ட், செய்த், விட்டு, வந்து, ப்பட்ட், வந்த்
- NOUN: சேர்ந்தவர்கள், என்பவர், அற்றவன், இருந்தவர், உயிரிழந்தவர்கள், செய்தவர்களில், செய்தவர்கள், சேர்ந்தவர், தெரிந்தவர், மீறுவோருக்கு
- PART: என்ற, என்கிற
- VERB: தெரிவித்த், செய்து, கொண்டு, கலந்து, கூறிய், வெளியிட்ட், தெரிவித்து, வெளியாகிய், அறிவித்த், சென்ற்
Nominal Features
- Com
- AUX-Fin: உள்ளார், உள்ளனர், வருகின்றனர், இருந்தார், உள்ளோம், கொண்டார், படுகின்றனர், பட்டனர், இருக்கிறார், உள்ளேன்
- NOUN: தலைவர், செயலாளர், முதல்வர், பேர், மக்கள், அதிகாரிகள், அமைச்சர், அதிபர், உறுப்பினர், புலிகள்
- NOUN-Part: சேர்ந்தவர்கள், என்பவர், இருந்தவர், உயிரிழந்தவர்கள், செய்தவர்களில், செய்தவர்கள், சேர்ந்தவர், தெரிந்தவர், மீறுவோருக்கு, வாழ்ந்தவர்கள்
- NUM: ஒருவர்
- PRON: அவர், அனைவரும், அவர்கள், தனது, நான், அவரது, அவர்களை, அவர்களுக்கு, அவருக்கு, அவர்களது
- PROPN: ஒபாமா, ஜெயலலிதா, சிங், எடியூரப்பா, கருணாநிதி, மோடி, வைகோ, ஒபாமாவின், மாலதி, இந்தியர்கள்
- VERB-Fin: தெரிவித்தார், என்றார், கூறினார், உயிரிழந்தனர், இருந்தார், தெரிவித்தனர், காயமடைந்தனர், பார்வையிட்டார், பெற்றார், பேசினார்
- Masc
- NOUN: அற்றவன், ஆடவனின்
- NOUN-Part: அற்றவன்
- Neut
- AUX-Fin: உள்ளது, வேண்டும், இல்லை, பட்டது, உள்ளன, இருந்தது, ப்படும், வருகிறது, படுகிறது, வருகின்றன
- AUX-Ger: உள்ளத், இருப்பத், விட்டத், பட்டது, பட்டதற்கு, போவத், வருவது, இருப்பது, உள்ளதால், கொண்டத்
- NOUN: அரசு, நாடுகள், ஆண்டு, கட்சி, தலைமைச், நிலையில், அணு, அறிக்கையில், அரசின், பகுதியில்
- NUM: ஒன்றை, 10-க்க், 1200க்க், 15-ல், 18-ல், 1992-96ல், 1995ல், 2009-ல், 444-ல், ஆயிரத்த்
- PART-Ger: என்பது, என்பதை, என்பதால், எடுப்பத், என்பதைய், கொடுப்பத்
- PRON: இது, அது, அதை, இதை, அதில், இதன், அதற்க், அனைத்தும், எதுவும், அதனைத்
- PROPN: இந்தியா, இந்திய, அமெரிக்க, இலங்கை, அதிமுக, பாகிஸ்தான், காங்கிரஸ், கிரிக்கெட், தமிழக, சர்வதேச
- VERB-Fin: உள்ளது, தெரிகிறது, தெரிவித்தன, நடைபெறும், இருக்கும், இல்லை, நடைபெற்றது, ஏற்படுத்தும், தெரிவிக்கிறது, அமையும்
- VERB-Ger: கூறியத், உயிரிழந்தத், உயிரிழப்பத், கொள்வதற்க், நம்புவத், பேசியத், இடம்பெறுவதற்கு, இருந்தத், ஈடுபட்டது, செயல்படுவதற்க்
- Anim
- AUX-Fin: உள்ளனர், உள்ளோம், உள்ளேன், கொள்கிறேன், மாட்டேன், வருகின்றனர், ஆவர், இருக்கிறேன், இருக்கிறோம், படுகின்றனர்
- NOUN: பேர், மக்கள், அதிகாரிகள், புலிகள், போலீஸார், தலைவர்கள், தொழிலாளர்கள், பணியாளர்கள், உறுப்பினர்கள், பொதுமக்கள்
- NOUN-Part: சேர்ந்தவர்கள்
- PRON: அனைவரும், அவர்கள், தனது, நான், அவர்களை, அவர்களுக்கு, அவர்களது, எனது, நாம், யாரும்
- PROPN: இந்தியர்கள், தமிழர்களுக்க், தமிழர்களை, எமெலேக்களை, எமெலேக்கள், தமிழர்களைச், இந்தியர்களை, எமெலேக்களின், எம்.பி.க்கள், எம்பிக்களின்
- VERB-Fin: காயமடைந்தனர், அஞ்சுகிறீர்கள், இருங்கள், உள்ளேன், எதிர்க்கிறோம், கருதுகிறேன், கேட்டுக்கொள்கிறேன், செய்கிறோம், புறக்கணிக்கிறேன், மேற்கொண்டேன்
- Plur
- AUX-Fin: இல்லை, உள்ளனர், உள்ளன, வருகின்றனர், வருகின்றன, உள்ளோம், படுகின்றனர், பட்டனர், இருந்தன, கொண்டனர்
- NOUN: நாடுகள், பேர், மக்கள், அதிகாரிகள், புலிகள், போலீஸார், தலைவர்கள், தொழிலாளர்கள், நாட்கள், பணியாளர்கள்
- NOUN-Part: சேர்ந்தவர்கள், உயிரிழந்தவர்கள், செய்தவர்களில், செய்தவர்கள், மீறுவோருக்கு, வாழ்ந்தவர்கள்
- PRON: அனைவரும், அவர்கள், அவர்களை, அவர்களுக்கு, அவர்களது, நாம், தங்கள், நாங்கள், அனைத்தும், நீங்கள்
- PROPN: இந்தியர்கள், தமிழர்களுக்க், தமிழர்களை, எமெலேக்களை, எமெலேக்கள், தமிழர்களைச், இடங்களுக்கு, இந்தியர்களை, எமெலேக்களின், எம்.பி.க்கள்
- VERB-Fin: தெரிவித்தன, உயிரிழந்தனர், இல்லை, தெரிவித்தனர், காயமடைந்தனர், போராடுவோம், உள்ளன, ஏற்படுகின்றன, கிடைக்காது, சென்றனர்
- VERB-Ger: வேண்டியவை
- Sing
- AUX-Fin: உள்ளது, வேண்டும், உள்ளார், பட்டது, இருந்தது, ப்படும், வருகிறது, படுகிறது, இருந்தார், இருக்கிறது
- AUX-Ger: உள்ளத், இருப்பத், விட்டத், பட்டது, பட்டதற்கு, போவத், வருவது, இருப்பது, உள்ளதால், கொண்டத்
- NOUN: அரசு, தலைவர், செயலாளர், முதல்வர், ஆண்டு, அமைச்சர், கட்சி, தலைமைச், நிலையில், அணு
- NOUN-Part: என்பவர், அற்றவன், இருந்தவர், சேர்ந்தவர், தெரிந்தவர்
- NUM: ஒன்றை, 10-க்க், 1200க்க், 15-ல், 18-ல், 1992-96ல், 1995ல், 2009-ல், 444-ல், ஆயிரத்த்
- PART-Ger: என்பது, என்பதை, என்பதால், எடுப்பத், என்பதைய், கொடுப்பத்
- PRON: அவர், இது, தனது, அது, அதை, நான், அவரது, இதை, அதில், அவருக்கு
- PROPN: இந்தியா, இந்திய, அமெரிக்க, இலங்கை, அதிமுக, பாகிஸ்தான், காங்கிரஸ், கிரிக்கெட், தமிழக, ஒபாமா
- VERB-Fin: தெரிவித்தார், என்றார், உள்ளது, கூறினார், தெரிகிறது, நடைபெறும், இருக்கும், இருந்தார், நடைபெற்றது, ஏற்படுத்தும்
- VERB-Ger: கூறியத், உயிரிழந்தத், உயிரிழப்பத், கொள்வதற்க், நம்புவத், பேசியத், இடம்பெறுவதற்கு, இருந்தத், ஈடுபட்டது, செயல்படுவதற்க்
- Acc
- AUX-Ger: உள்ளதைய், கொள்வதைய்
- NOUN: இடத்தைய், நிலையங்களை, வெடிகளை, அணையை, அரசை, ஆட்சியை, உத்தரவை, ஊதியத்தை, பணிகளை, பேச்சுவார்த்தை
- NUM: ஒன்றை
- PART-Ger: என்பதை, என்பதைய்
- PRON: அதை, அவர்களை, இதை, அதனைத், அதைப், அவற்றை, இதைச், இதைத், இவற்றை, உங்களைச்
- PROPN: ஜெயலலிதாவை, தமிழர்களை, ராஜபட்சவை, எமெலேக்களை, கங்கையை, தமிழர்களைச், தீட்சித்தை, தேவியைய், ஆப்பிரிக்காவை, இந்தியர்களை
- VERB-Ger: ஓய்வுபெற்றதைத், கூறுவதைய், செலுத்துவதை, போராடியதைப், முடிவடைந்ததைத்
- Com
- NOUN: மனிதாபிமானத்தோடு, அமைப்புடன், அவருடன், உயிருடன், சிலருடன், தங்கப்பதக்கத்துடன், துணையோடு, நம்பிக்கையோடு, நேயத்துடன், நேயத்தோடு
- Dat
- AUX-Ger: பட்டதற்கு, கொண்டதற்க்
- NOUN: மணிக்கு, பேருக்க், மக்களுக்கு, அரசுக்கு, ஆண்டுக்கு, ஆண்டுகளுக்குப், அளவுக்கு, குற்றத்துக்க், கோடிக்க், தொகுதிகளுக்க்
- NOUN-Part: மீறுவோருக்கு
- NUM: 10-க்க், 1200க்க், ஒன்றுக்கு
- PRON: அவர்களுக்கு, அவருக்கு, தனக்கு, அதற்க், அவருக்குப், எனக்கு, அதற்கு, இதற்கு, இவர்களுக்க், உங்களுக்கு
- PROPN: இந்தியாவுக்கு, தமிழர்களுக்க், கருணாநிதிக்கு, தமிழகத்துக்கு, தில்லிக்கு, பாகிஸ்தானுக்கு, பாகிஸ்தானுக்குச், அமெரிக்காவுக்கு, அமெரிக்காவுக்குச், அமெரிக்காவுக்க்
- VERB-Ger: கொள்வதற்க், இடம்பெறுவதற்கு, நடத்துவதற்க், வாழ்வதற்கு, இடிப்பதற்க், உருவாவதற்கு, எட்டுவதற்கு, எதிர்கொள்வதற்க், கட்டுவதற்க், கலப்பதற்க்
- Gen
- NOUN: அரசின், நாடுகளின், நாட்டின், சட்டத்தின், சபையின், புலிகளின், அணியின், அமைப்பின், சங்கத்தின், நிறுவனத்தின்
- PRON: தனது, அவரது, அவர்களது, இதன், எனது, தங்கள், அதன், உங்கள், என், என்னுடைய
- PROPN: ஒபாமாவின், அமெரிக்காவின், இந்தியாவின், தமிழகத்தின், ராஜபட்சவின், ஹென்றியின், ஆசியான், ஐ.நா.வின், கருணாநிதியின், காங்கிரஸின்
- VERB-Ger: விடுத்ததன்
- Ins
- AUX-Ger: உள்ளதால்
- NOUN: காரணத்தால், ஒப்பந்தத்தால், செயல்களால், தங்கத்தால், நோயால், பித்தளையால், பிரச்னையால், போரினால், முயற்சியால், விடுதலைப்புலிகளால்
- PART-Ger: என்பதால்
- PRON: அவர்களால், எங்களால்
- PROPN: சிவாச்சாரியர்களால்
- VERB-Ger: அளிக்காததால், ஆகியதால், ஆனதால், இல்லாததால், புறக்கணிப்பதால், போட்டியிடுவதால்
- Loc
- NOUN: நிலையில், அறிக்கையில், பகுதியில், வகையில், கவுன்சிலில், தலைமையில், அளவில், சிறையில், முறையில், இடத்தில்
- NOUN-Part: செய்தவர்களில்
- NUM: 15-ல், 18-ல், 1992-96ல், 1995ல், 2009-ல், 444-ல், ஆயிரத்த், ஐந்தில், ஒன்றில், மூன்றில்
- PRON: அதில்
- PROPN: இந்தியாவில், சென்னையில், பிகாரில், ஆப்கானிஸ்தானில், அமெரிக்காவில், இலங்கையில், நார்வேயில், ஹூஸ்டனில், ஆப்கனில், இ-மெயிலில்
- VERB-Ger: நிறைவேற்றுவதில், உள்ளதால், கிடைத்ததில், கையெழுத்தாவதில், சுத்தப்படுத்துவதில், செயல்படுத்துவதில், தொகுத்ததில், மோதியதில், விபத்துக்குள்ளானதில், வெடித்ததில்
- Nom
- AUX-Ger: உள்ளத், இருப்பத், விட்டத், பட்டது, போவத், வருவது, இருப்பது, கொண்டத், கொள்ளல், பட்டத்
- NOUN: அரசு, நாடுகள், தலைவர், செயலாளர், முதல்வர், பேர், ஆண்டு, மக்கள், அதிகாரிகள், அமைச்சர்
- NOUN-Part: சேர்ந்தவர்கள், என்பவர், அற்றவன், இருந்தவர், உயிரிழந்தவர்கள், செய்தவர்கள், சேர்ந்தவர், தெரிந்தவர், வாழ்ந்தவர்கள்
- NUM: ஒருவர்
- PART-Ger: என்பது, எடுப்பத், கொடுப்பத்
- PRON: அவர், இது, அனைவரும், அவர்கள், அது, நான், நாம், யாரும், நாங்கள், நீங்கள்
- PROPN: இந்தியா, இலங்கை, அதிமுக, பாகிஸ்தான், காங்கிரஸ், கிரிக்கெட், ஒபாமா, ஜெயலலிதா, சென்னை, சிங்
- VERB-Ger: கூறியத், உயிரிழந்தத், உயிரிழப்பத், நம்புவத், பேசியத், இருந்தத், ஈடுபட்டது, செயல்படுவதற்க், செய்தத், நடத்தியத்
Degree and Polarity
- Neg
- ADJ-Part: செய்யாத, அல்லாத, எடுக்காத, சரியில்லாத, சாராத, நடத்தாத, வெடிக்காத
- AUX-Fin: முடியாது, கூடாது, மாட்டாது, படாது, வேண்டாம்
- VERB-Fin: கவலைப்படாதீர்கள்
- VERB-Ger: முடியாதது
- VERB-Part: இல்லாமல், செயல்படாமல், தரா, நிறைவேற்றா, ஏற்றுக்கொள்ளாமல், கண்டுகொள்ளாமல், குறிப்பிடாமல், செய்யப்படாமல், பெறாமல், முடியாமல்
- Pos
- ADJ-Part: உள்ள, உள்ளிட்ட, இருந்த, நடைபெற்ற, வந்த, வரும், ஆகிய, நடைபெறும், இருக்கும், கொண்ட
- AUX-Fin: உள்ளது, வேண்டும், உள்ளார், இல்லை, உள்ளனர், பட்டது, உள்ளன, வருகின்றனர், இருந்தது, ப்படும்
- AUX-Ger: உள்ளத், இருப்பத், விட்டத், பட்டது, பட்டதற்கு, போவத், வருவது, இருப்பது, உள்ளதால், கொண்டத்
- AUX-Inf: ப்பட, செய்ய, செய்யப், படவ், பட, கொள்ள, செய்யக், செய்யவ், படக், பட்ட
- AUX-Part: பட்ட், பட்டு, கொண்டு, செய்து, கொண்ட், செய்த், விட்டு, வந்து, ப்பட்ட், வந்த்
- NOUN-Part: சேர்ந்தவர்கள், என்பவர், அற்றவன், இருந்தவர், உயிரிழந்தவர்கள், செய்தவர்களில், செய்தவர்கள், சேர்ந்தவர், தெரிந்தவர், மீறுவோருக்கு
- NUM: ஒன்றை, 10-க்க், 1200க்க், 15-ல், 18-ல், 1992-96ல், 1995ல், 2009-ல், 444-ல், ஆயிரத்த்
- PART-Fin: என்றால்
- PART-Ger: என்பது, என்பதை, என்பதால், எடுப்பத், என்பதைய், கொடுப்பத்
- PART-Inf: என்று, என, என்ற், எனத், எனக், எனவ்
- PART-Part: என்ற, என்கிற
- VERB-Fin: தெரிவித்தார், என்றார், உள்ளது, கூறினார், தெரிகிறது, தெரிவித்தன, நடைபெறும், உயிரிழந்தனர், இருக்கும், இருந்தார்
- VERB-Ger: கூறியத், உயிரிழந்தத், உயிரிழப்பத், கொள்வதற்க், நம்புவத், பேசியத், இடம்பெறுவதற்கு, இருந்தத், ஈடுபட்டது, செயல்படுவதற்க்
- VERB-Inf: தெரிவிக்கப், செய்யப், வழங்கப், நியமிக்கப், குறிப்பிடத், குறிப்பிடப், அளிக்கப், செய்ய, தெரிய, எடுக்கப்
- VERB-Part: தெரிவித்த், செய்து, கொண்டு, கலந்து, கூறிய், வெளியிட்ட், தெரிவித்து, வெளியாகிய், அறிவித்த், சென்ற்
Verbal Features
- Cnd
- AUX-Fin: விட்டால், இருந்தால், பட்டால், வந்தால், இருப்பின், விடில், வைத்தால்
- PART-Fin: என்றால்
- VERB-Fin: ஆனால், உடைத்தால், ஏற்பட்டால், கட்டினால், பெற்றால், இருந்தால், கலந்தால், காட்டினால், நிறைவேற்றினால், விதித்தால்
- Imp
- VERB-Fin: இருங்கள்
- Ind
- AUX-Fin: உள்ளது, வேண்டும், உள்ளார், இல்லை, உள்ளனர், பட்டது, உள்ளன, வருகின்றனர், இருந்தது, ப்படும்
- VERB-Fin: தெரிவித்தார், என்றார், உள்ளது, கூறினார், தெரிகிறது, தெரிவித்தன, நடைபெறும், உயிரிழந்தனர், இருக்கும், இருந்தார்
- Fut
- ADJ-Part: வரும், நடைபெறும், இருக்கும், வசிக்கும், ஆளும், ஏற்படும், செல்லும், பேசும், அப்புறப்படுத்தும், அளிக்கும்
- AUX-Fin: வேண்டும், ப்படும், முடியும், கூடும், படும், படுவார்கள், ஆகும், ஆவர், கொள்வார், விடும்
- AUX-Ger: இருப்பத், போவத், வருவது, இருப்பது, வருவத், கிடைப்பது, கூறியிருப்பத், கொடுப்பது, கொள்வது, கொள்வதைய்
- NOUN-Part: சேர்ந்தவர்கள், என்பவர், உயிரிழந்தவர்கள், செய்தவர்களில், செய்தவர்கள், மீறுவோருக்கு
- PART-Ger: என்பது, என்பதை, என்பதால், எடுப்பத், என்பதைய், கொடுப்பத்
- VERB-Fin: நடைபெறும், இருக்கும், ஏற்படுத்தும், போராடுவோம், அமையும், உதவும், தொடங்கும், பொருந்தும், அவசியமாகும், ஆராயப்படும்
- VERB-Ger: உயிரிழப்பத், கொள்வதற்க், நம்புவத், இடம்பெறுவதற்கு, செயல்படுவதற்க், நடத்துவதற்க், நிறைவேற்றுவதில், வாழ்வதற்கு, அமைப்பது, ஆலோசிக்கப்படுவத்
- Past
- ADJ-Part: உள்ளிட்ட, இருந்த, நடைபெற்ற, வந்த, ஆகிய, கொண்ட, நடந்த, பெற்ற, பேசிய, சென்ற
- AUX-Fin: பட்டது, இருந்தது, இருந்தார், கொண்டார், தக்கது, விட்டது, பட்டனர், இருந்தன, கொண்டது, கொண்டனர்
- AUX-Ger: விட்டத், பட்டது, பட்டதற்கு, கொண்டத், பட்டத், இருந்தத், கூடியத், கொண்டதற்க், பெற்றுவிட்டத்
- NOUN-Part: சேர்ந்தவர், தெரிந்தவர், வாழ்ந்தவர்கள்
- PART-Part: என்ற
- VERB-Fin: தெரிவித்தார், என்றார், கூறினார், தெரிவித்தன, உயிரிழந்தனர், இருந்தார், தெரிவித்தனர், நடைபெற்றது, காயமடைந்தனர், பார்வையிட்டார்
- VERB-Ger: கூறியத், உயிரிழந்தத், பேசியத், இருந்தத், ஈடுபட்டது, செய்தத், நடத்தியத், நம்பியத், அறிவித்தது, ஆகியதால்
- Pres
- ADJ-Part: இருக்கிற, என்கிற, படுகிற, இருக்கின்ற, ஒதுக்குகின்ற, பணியாற்றுகிற, மடிகின்ற, மாற்றுகின்ற, வருகிற
- AUX-Fin: வருகின்றனர், வருகிறது, படுகிறது, வருகின்றன, இருக்கிறது, படுகின்றனர், இருக்கிறார், கொள்கிறேன், படுகின்றன, இருக்கினறனர்
- NOUN-Part: இருந்தவர்
- PART-Part: என்கிற
- VERB-Fin: தெரிகிறது, தெரிவிக்கிறது, ஏற்படுகின்றன, செல்கிறார், தெரிவிக்கின்றனர், போட்டியிடுகின்றன, அஞ்சுகிறீர்கள், அறிவிக்கிறது, அளிக்கிறது, ஆற்றுகிறோம்
- VERB-Ger: கூறுகிறார்
- Act
- AUX-Fin: உள்ளது, வேண்டும், உள்ளார், இல்லை, உள்ளனர், உள்ளன, வருகின்றனர், இருந்தது, வருகிறது, இருந்தார்
- AUX-Ger: உள்ளத், இருப்பத், விட்டத், போவத், வருவது, இருப்பது, உள்ளதால், கொண்டத், கொள்ளல், வருவத்
- AUX-Inf: செய்ய, செய்யப், கொள்ள, செய்யக், செய்யவ், வர, வரப், விட, விடக், விடப்
- AUX-Part: கொண்டு, செய்து, கொண்ட், செய்த், விட்டு, வந்து, வந்த், இருந்து, இருந்த், பிடித்த்
- VERB-Fin: தெரிவித்தார், என்றார், உள்ளது, கூறினார், தெரிகிறது, தெரிவித்தன, நடைபெறும், உயிரிழந்தனர், இருக்கும், இருந்தார்
- VERB-Ger: கூறியத், உயிரிழந்தத், உயிரிழப்பத், கொள்வதற்க், நம்புவத், பேசியத், இடம்பெறுவதற்கு, இருந்தத், ஈடுபட்டது, செயல்படுவதற்க்
- VERB-Inf: தெரிவிக்கப், செய்யப், வழங்கப், நியமிக்கப், குறிப்பிடத், குறிப்பிடப், அளிக்கப், செய்ய, தெரிய, எடுக்கப்
- VERB-Part: தெரிவித்த், செய்து, கொண்டு, கலந்து, கூறிய், வெளியிட்ட், தெரிவித்து, வெளியாகிய், அறிவித்த், சென்ற்
- Pass
- AUX-Fin: பட்டது, ப்படும், படுகிறது, படுகின்றனர், பட்டனர், படுகின்றன, படும், படுவார்கள், பட்டன, பட்டார்
- AUX-Ger: பட்டது, பட்டதற்கு, பட்டத்
- AUX-Inf: ப்பட, படவ், பட, படக், பட்ட
- AUX-Part: பட்ட், பட்டு, ப்பட்ட்
- VERB-Ger: படுவதற்க்
Pronouns, Determiners, Quantifiers
- Ind
- PRON: யாரும், எதுவும், யாருக்கும், யாரையும்
- Int
- PRON: யார், எத்தகையது, ஏத், யாருடைய
- Prs
- PRON: அவர், இது, அனைவரும், அவர்கள், தனது, அது, அதை, நான், அவரது, அவர்களை
- Card
- DET: மிக, மிகப், அதிக, அதிகம், மிகச், மிகவும், முழுவதும், குறைவாகவே, கொஞ்சம், முழுக்
- NUM: இரு, ஆயிரம், மூன்று, லட்சம், இரண்டு, ஆயிரத்து, கோடி, மீட்டர், 1.30, ஒன்பது
- Ord
- ADJ: முதல், இரண்டாவது, 1992-ம், 1-ம், 12-ம், 125-ம், 15-ம், 21-ம், 11வது, 12வது
- Yes
- PRON: தனது, தனக்கு, தங்களது, தங்களின், தன்னைப், தமக்க்
- 1
- AUX-Fin: உள்ளோம், உள்ளேன், கொள்கிறேன், மாட்டேன், இருக்கிறேன், இருக்கிறோம், போனேன், வருகிறோம்
- PRON: நான், எனது, நாம், தனக்கு, நாங்கள், எனக்கு, எங்களால், எனக்க், என், என்னுடைய
- VERB-Fin: போராடுவோம், வாழ்ந்தோம், ஆற்றுகிறோம், உள்ளேன், எதிர்க்கிறோம், கட்டுவோம், கருதுகிறேன், கேட்டுக்கொள்கிறேன், செய்கிறோம், செய்வோம்
- 2
- AUX-Fin: இருக்கிறீர்கள், வருகிறீர்கள்
- PRON: நீங்கள், உங்களுக்கு, உங்களைச், உங்கள்
- VERB-Fin: அஞ்சுகிறீர்கள், இருங்கள், கவலைப்படாதீர்கள், விரும்புகிறீர்கள்
- 3
- AUX-Fin: உள்ளது, வேண்டும், உள்ளார், இல்லை, உள்ளனர், பட்டது, உள்ளன, வருகின்றனர், இருந்தது, ப்படும்
- AUX-Ger: உள்ளத், இருப்பத், விட்டத், பட்டது, பட்டதற்கு, போவத், வருவது, இருப்பது, உள்ளதால், கொண்டத்
- NOUN: அரசு, நாடுகள், தலைவர், செயலாளர், முதல்வர், பேர், ஆண்டு, மக்கள், அதிகாரிகள், அமைச்சர்
- NOUN-Part: சேர்ந்தவர்கள், என்பவர், அற்றவன், இருந்தவர், உயிரிழந்தவர்கள், செய்தவர்களில், செய்தவர்கள், சேர்ந்தவர், தெரிந்தவர், மீறுவோருக்கு
- NUM: ஒன்றை, 10-க்க், 1200க்க், 15-ல், 18-ல், 1992-96ல், 1995ல், 2009-ல், 444-ல், ஆயிரத்த்
- PART-Ger: என்பது, என்பதை, என்பதால், எடுப்பத், என்பதைய், கொடுப்பத்
- PRON: அவர், இது, அனைவரும், அவர்கள், தனது, அது, அதை, அவரது, அவர்களை, இதை
- PROPN: இந்தியா, இந்திய, அமெரிக்க, இலங்கை, அதிமுக, பாகிஸ்தான், காங்கிரஸ், கிரிக்கெட், தமிழக, ஒபாமா
- VERB-Fin: தெரிவித்தார், என்றார், உள்ளது, கூறினார், தெரிகிறது, தெரிவித்தன, நடைபெறும், உயிரிழந்தனர், இருக்கும், இருந்தார்
- VERB-Ger: கூறியத், உயிரிழந்தத், உயிரிழப்பத், கொள்வதற்க், நம்புவத், பேசியத், இடம்பெறுவதற்கு, இருந்தத், ஈடுபட்டது, செயல்படுவதற்க்
- Form
- AUX-Fin: உள்ளார், வருகின்றனர், இருந்தார், கொண்டார், பட்டனர், இருக்கிறார், கொண்டனர், செய்தனர், படுகின்றனர், படுவார்கள்
- NOUN: தலைவர், செயலாளர், முதல்வர், அமைச்சர், அதிபர், உறுப்பினர், ஆணையர், செயலர், ஒருவர், பொதுச்செயலர்
- NOUN-Part: என்பவர், சேர்ந்தவர்கள், இருந்தவர், உயிரிழந்தவர்கள், செய்தவர்களில், செய்தவர்கள், சேர்ந்தவர், தெரிந்தவர், மீறுவோருக்கு, வாழ்ந்தவர்கள்
- NUM: ஒருவர்
- PRON: அவர், அவரது, அவருக்கு, அவருக்குப், இவர், உங்களைச், உங்கள், நீங்கள்
- PROPN: ஒபாமா, ஜெயலலிதா, சிங், எடியூரப்பா, கருணாநிதி, மோடி, வைகோ, ஒபாமாவின், மாலதி, சாய்னா
- VERB-Fin: தெரிவித்தார், என்றார், கூறினார், உயிரிழந்தனர், இருந்தார், தெரிவித்தனர், பார்வையிட்டார், பெற்றார், பேசினார், வகித்தார்
Other Features
- AdpType
- Post
- ADP: ஆக, உடன், இலிருந்து, குறித்து, மீது, சார்பில், மூலம், இடம், இருந்து, இடையில்
- Post
- NumForm
- Digit
- NUM: 2, 10, 20, 3, 80, 16, 4, 5, 50, 6
- Digit
- PunctType
- Comm
- PUNCT: ,, -, :, (, ), ", ரூ, ரூ., ;, ’
- Peri
- PUNCT: .
- Comm
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: முயல்.
- This corpus uses 24 lemmas as auxiliaries (aux). Examples: உள், படு, வேண்டு, இரு, வரு, கொள், இல், செய், விடு, வா, கூடு, முடி, மாட்டு, ஆகு, தகு, வீடு, போ, வை, ஆவர், கூறு, கொடு, பிடு, வரல், விரி.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Fin--NOUN-Acc (1)
- VERB-Fin--NOUN-Dat (3)
- VERB-Fin--NOUN-Nom (100)
- VERB-Fin--PRON-Nom (40)
- VERB-Ger--NOUN-Nom (29)
- VERB-Ger--PRON-Nom (5)
- VERB-Inf--NOUN-Dat (1)
- VERB-Inf--NOUN-Nom (81)
- VERB-Inf--PRON-Acc (1)
- VERB-Inf--PRON-Nom (17)
- VERB-Part--NOUN-Nom (104)
- VERB-Part--PRON-Nom (26)
- obj
- VERB-Fin--NOUN-Acc (36)
- VERB-Fin--NOUN-Dat (7)
- VERB-Fin--NOUN-Loc (1)
- VERB-Fin--NOUN-Nom (65)
- VERB-Fin--PRON-Dat (3)
- VERB-Ger--NOUN-Acc (16)
- VERB-Ger--NOUN-Dat (2)
- VERB-Ger--NOUN-Nom (33)
- VERB-Ger--PRON-Acc (5)
- VERB-Ger--PRON-Nom (1)
- VERB-Inf--NOUN-Acc (50)
- VERB-Inf--NOUN-Dat (8)
- VERB-Inf--NOUN-Nom (46)
- VERB-Inf--PRON-Acc (6)
- VERB-Inf--PRON-Dat (8)
- VERB-Inf--PRON-Nom (1)
- VERB-Part--NOUN-Acc (77)
- VERB-Part--NOUN-Dat (8)
- VERB-Part--NOUN-Nom (58)
- VERB-Part--PRON-Acc (14)
- VERB-Part--PRON-Dat (2)
- iobj
- VERB-Fin--NOUN-Loc (2)
- VERB-Fin--NOUN-Nom (5)
- VERB-Fin--PRON-Dat (1)
- VERB-Ger--NOUN-Nom (2)
- VERB-Inf--NOUN-Nom (3)
- VERB-Inf--PRON-Nom (1)
- VERB-Part--NOUN-Dat (2)
- VERB-Part--NOUN-Gen (1)
- VERB-Part--NOUN-Nom (10)
- VERB-Part--PRON-Nom (1)
Verbs with Reflexive Core Objects
- This corpus contains 4 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: அல் தனக்கு, இடம் தனக்கு, தரு தனக்கு, புறக்கணி தன்னைப்
Relations Overview
- This corpus uses 4 relation subtypes: advmod:emph, compound:prt, nsubj:pass, obl:arg
- The following 12 relation types are not used in this corpus at all: vocative, expl, dislocated, discourse, clf, fixed, flat, list, orphan, goeswith, reparandum, dep