UD Portuguese Bosque
Language: Portuguese (code: pt
)
Family: Indo-European, Romance
This treebank has been part of Universal Dependencies since the UD v1.2 release.
The following people have contributed to making this treebank part of UD: Alexandre Rademaker, Eckhard Bick, Fabricio Chalub, Cláudia Freitas, Guilherme Paulino-Passos, Luisa Rocha, Isabela Soares-Bastos, Livy Real, Valeria de Paiva, Daniel Zeman, Martin Popel, David Mareček, Natalia Silveira, André Martins.
Repository: UD_Portuguese-Bosque
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.2
License: CC BY-SA 4.0
Genre: news, blog
Questions, comments? General annotation questions (either Portuguese-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [arademaker (æt) gmail • com]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion |
UPOS | annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion |
XPOS | annotated manually |
Features | annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion |
Relations | annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion |
Description
This Universal Dependencies (UD) Portuguese treebank is based on the Constraint Grammar converted version of the Bosque, which is part of the Floresta Sintá(c)tica treebank. It contains both European (CETEMPúblico) and Brazilian (CETENFolha) variants.
This Universal Dependencies (UD) Portuguese treebank is based on the Constraint Grammar converted version of the Bosque, which is part of the Floresta Sintá(c)tica treebank.
Eckhard Bick has maintained since 2008 an experimental version of the dependency Bosque for research, which was not aligned with either the Linguateca published constituent version or the 7.4 dependency version of the Bosque. In 2016, Eckhard Bick wrote UD conversion rules for Constraint Grammar input, and applied these to the updated version of the dependency Bosque (Linguateca site version 7.5 of March 2016).
In October 2016, Alexandre Rademaker, Cláudia Freitas, Fabricio Chalub, Valeria de Paiva and Livy Maria Real Coelho, aiming at full compatibility with ConLL UD specifications, consistency-checked and discussed the 7.5 UD Bosque, leading to a further round of manual treebank corrections and conversion rule changes by Bick. The conversion grammar used contains some 530 rules. Of these 70 were simple feature mapping rules, and 130 were local MWE splitting rules, assigning internal structure, POS and features to MWE’s from the Bosque. The remainder of the rules handle UD-specific dependency and function label changes in a context-dependent fashion. The main issues were raising of copula dependents to subject complements, inversion of prepositional dependency and a change from syntactic to semantic verb chain dependency.
The new UD treebank retains the additional tags for NP definiteness and complex tenses, as well as the original syntactic function tags and secondary morphological tags of the original Bosque. Thus the treebank retains its original linguistic focus, in addition to coping with the machine learning uses targeted by the ConLL UD format.
Acknowledgments
The UD_Portuguese releases 1.2 to 1.4 were based on a different conversion of Bosque, used in the CoNLL-X Shared Task in dependency parsing (2006); the CoNLL version was taken and converted to the Prague dependency style as a part of HamleDT (since 2011). Later versions of HamleDT added a conversion to the Stanford dependencies (2014) and to Universal Dependencies (HamleDT 3.0, 2015).
UD release 1.4 contained two conversions of Bosque: one labeled UD_Portuguese (via CoNLL 2006 and HamleDT) and another labeled UD_Portuguese-Bosque (the new conversion described above).
The two versions were merged (and labeled UD_Portuguese) in UD release 2.0. The merged version is based mostly on the new conversion by Bick et al.. The conversion by Zeman et al. was used to cross-validate. After the alignment of the sentences from the two versions, the data was split in dev, test and train following the distribution of sentences from Zeman et al.
The conversion was implemented by Eckhard Bick and revised by:
- Alexandre Rademaker
- Fabricio Chalub
- Claudia Freitas
- Guilherme Paulino-Passos
- Luisa Rocha
- Isabela Soares-Bastos
- Livy Real
- Valeria Paiva
The HamleDT conversion was implemented by Dan Zeman and revised by:
- Martin Popel
- David Mareček
- Daniel Zeman
- Natalia Silveira
- André Martins
Statistics of UD Portuguese Bosque
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
AdpType – Case – Definite – Foreign – Gender – Mood – Number – NumType – Person – Polarity – PronType – Tense – VerbForm – Voice
Relations
acl – acl:relcl – advcl – advmod – amod – appos – aux – aux:pass – case – cc – ccomp – compound – conj – cop – csubj – dep – det – discourse – dislocated – expl – fixed – flat – flat:foreign – flat:name – goeswith – iobj – mark – nmod – nmod:npmod – nmod:tmod – nsubj – nsubj:pass – nummod – obj – obl – obl:agent – orphan – parataxis – punct – reparandum – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 9365 sentences, 210960 tokens and 227794 syntactic words.
- This corpus contains 29566 tokens (14%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 786 types of words that contain both letters and punctuation. Examples: sexta-feira, norte-americano, p., segunda-feira, R., primeiro-ministro, norte-americana, terça-feira, quarta-feira, quinta-feira, S., ex-presidente, vice-presidente, porta-voz, Grã-Bretanha, cessar-fogo, etc., ex-ministro, fim-de-semana, norte-americanos, secretário-geral, d., art., dr., meio-campo, tel., av., director-geral, mão-de-obra, pára-quedas, sr., Guiné-Bissau, Jr., dia-a-dia, ex-jogador, pág., social-democrata, A., CD-ROM, Timor-Leste, co-produção, d', ex-governador, IPC-r, Jean-Pierre, auto-estrada, dom., ed., ex-secretário, infra-estrutura
- This corpus contains 16834 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 743 types of multi-word tokens. Examples: do, da, no, na, dos, ao, à, das, pelo, pela, nos, às, aos, nas, num, numa, pelos, deste, pelas, desta, neste, nesta, nesse, disso, trata-se, desse, deles, destes, dele, daí, dessa, encontra-se, nessa, dela, daquela, delas, nestes, desses, nela, nestas, daqueles, dessas, destas, deve-se, naquele, recorde-se, daquele, encontram-se, naquela, nele.
Morphology
Tags
- This corpus uses 17 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus contains 4 word types tagged as particles (PART): anti, ex, pré-, pós
- This corpus contains 61 lemmas tagged as pronouns (PRON): _, a, algo, algum, alguém, ambos, aquele, aquilo, cada, certo, cujo, demais, dezena, diferentes, ela, elas, ele, ele/ela, eles, eles/elas, esse, este, eu, gente, isso, isto, mais, mesmo, meu, muito, mundo, nada, nenhum, ninguém, nosso, nós, o, onde, outrem, outro, pouco, qual, qualquer, quanto, que, quem, quê, se, seu, si, tal, tanto, todas, todo, tu, tudo, um, você, várias, vários, vós
- This corpus contains 53 lemmas tagged as determiners (DET): $2e, _, a, algum, ambos, aquele, bastante, cada, certo, certos, cujo, demais, dezena, dezenas, diferentes, diversos, esse, este, la, menos, meu, muitas, muito, muitíssimo, nada, nenhum, nosso, o, outro, pouco, próprio, qual, qualquer, qualquier, quando, quanto, que, semelhante, seu, tal, tanto, teu, toda, todo, tudo, tão, um, uma, umo, uns, vosso, várias, vários
- Out of the above, 33 lemmas occurred sometimes as PRON and sometimes as DET: _, a, algum, ambos, aquele, cada, certo, cujo, demais, dezena, diferentes, esse, este, meu, muito, nada, nenhum, nosso, o, outro, pouco, qual, qualquer, quanto, que, seu, tal, tanto, todo, tudo, um, várias, vários
- This corpus contains 47 lemmas tagged as auxiliaries (AUX): _, abster, acabar, aceitar, agredir, ameaçar, andar, atualizar, chegar, comedir, começar, continuar, converter, costumar, deixar, deslocar, dever, discutir, encaminhar, envergonhar, estar, fazer, ferir, ficar, foi, haver, interpelar, ir, parar, parecer, passar, perdoar, permitir, poder, procurar, proibir, recomeçar, rejeitar, reunir, ser, tender, ter, tomar, tornar, vir, voltar, é
- Out of the above, 43 lemmas occurred sometimes as AUX and sometimes as VERB: _, abster, acabar, aceitar, agredir, ameaçar, andar, atualizar, chegar, comedir, começar, continuar, converter, deixar, deslocar, dever, discutir, encaminhar, envergonhar, estar, fazer, ferir, ficar, haver, ir, parar, parecer, passar, perdoar, permitir, poder, procurar, proibir, recomeçar, rejeitar, reunir, ser, tender, ter, tomar, tornar, vir, voltar
- There are 4 (de)verbal forms:
- Fin
- AUX: é, foi, está, são, foram, vai, pode, era, estão, tem
- INTJ: viu
- NOUN: garante
- VERB: há, disse, tem, diz, é, fez, afirmou, foi, têm, faz
- Ger
- AUX: sendo, tendo, estando, passando, devendo, deixando, podendo, voltando, continuando, vindo
- PRON: se
- VERB: tendo, dando, incluindo, fazendo, ganhando, dizendo, passando, mostrando, considerando, esperando
- Inf
- AUX: ser, ter, estar, vir, continuar, serem, poder, ir, terem, passar
- NOUN: bafejar, decorrer, entardecer, entender, quebrar, Olhar, distender, fumar
- VERB: fazer, ter, ver, dar, dizer, falar, manter, saber, ir, passar
- Part
- ADJ: eleito, Animado, achado, acirrada, animada, apropriados, atacados, coloridas, cotados, definidas
- AUX: sido, vindo, estado, acabado, agredido, ido, permitido, Acabadinho, acabados, aceite
- NOUN: feridos, arguido, chibatadas, classificado, colocado, colocados, culpados, envolvidos, esperado, ocorrido
- PROPN: visto, Dado
- VERB: feito, feita, feitas, dito, tido, eleito, passado, visto, aberto, considerado
Nominal Features
- Fem
- ADJ: primeira, nova, maior, grande, última, mesma, segunda, boa, política, novas
- ADJ-Part: acirrada, animada, coloridas, definidas, drogada, estimada, existente, mista, orquestrada, pesada
- ADP: da
- ADV: mais, bastante
- AUX-Part: convertidas, discutidas, feridas, rejeitada
- DET: a, as, uma, sua, esta, suas, essa, toda, outras, algumas
- INTJ: Obrigada, rua
- NOUN: pessoas, parte, semana, empresa, empresas, forma, cidade, casa, vida, vezes
- NOUN-Part: chibatadas, verificada, apresentada, cochilada, compostas, destinadas, enterradas, largada, organizadas, participada
- NUM: meia
- PRON: que, se, ela, a, as, elas, lhe, esta, eu, qual
- PROPN: Lisboa, Folha, Alemanha, França, Comissão, Espanha, Europa, Câmara, Rússia, Associação
- SCONJ: se
- VERB: feita, feitas, considerada, criada, realizada, dada, passada, utilizada, apresentada, marcada
- VERB-Part: feita, feitas, considerada, criada, realizada, dada, passada, utilizada, apresentada, marcada
- X: made, Body, morcilla, natura
- Masc
- ADJ: primeiro, novo, mesmo, último, passado, segundo, últimos, bom, maior, grande
- ADJ-Part: eleito, Animado, achado, apropriados, atacados, cotados, detalhados, errado, ferido, fragilizado
- ADP: por, como, a
- ADV: não, menos, mais, bom, claro, forte, mal, muito, novo, quanto
- AUX-Part: sido, Acabadinho, acabados, aceite, atualizados, deslocado, interpelado, perdoados, proibido
- CCONJ: entanto, mesmo
- DET: o, os, um, seu, este, seus, esse, todos, outros, outro
- INTJ: Adeus
- NOUN: anos, milhões, ano, presidente, dia, país, contos, tempo, grupo, governo
- NOUN-Inf: Olhar
- NOUN-Part: feridos, arguido, classificado, colocado, colocados, culpados, envolvidos, esperado, ocorrido, previsto
- NUM: cento, meia, dúzia, um, 185/60, XVII
- PART: pós
- PRON: que, se, o, ele, isso, tudo, eles, lhe, os, isto
- PROPN: São, Portugal, Brasil, José, Governo, EUA, Rio, Estados, João, PÚBLICO
- PROPN-Part: visto, Dado
- SCONJ: que, como
- SYM: %, US$, R$, CR$
- VERB: feito, eleito, aberto, considerado, ligados, realizado, acusado, divulgado, entregue, condenado
- VERB-Fin: considerara
- VERB-Part: feito, eleito, aberto, considerado, ligados, realizado, acusado, divulgado, entregue, condenado
- X: Dream, MacMillan, consejero, dolce, godfather, kebab, killer, line, primitive, prélude
- Unsp
- ADJ: melhor, capaz, especial, favorável, inconvenientes, jovens, mole, 2., I, II
- DET: mais, cada, qual, qualquer, Que, tal
- NOUN: especialistas, representantes, jornalistas, jovens, habitantes, visitantes, Presidente, artistas, clientes, especial
- PRON: se, quem, me, nos, eu, você, nós, que, lhe, mim
- PRON-Ger: se
- PROPN: Coimbra, Alvalade, Maastricht, Barcelos, Braga, Ermesinde, Aveiro, Drosnin, Frankfurt, Jacarta
- SCONJ: se
- Plur
- ADJ: grandes, últimos, novos, novas, primeiros, principais, melhores, internacionais, maiores, públicos
- ADJ-Part: apropriados, atacados, coloridas, cotados, definidas, detalhados, pegos, pretendidas, privilegiados, restritas
- ADV: menos, mais
- AUX: são, foram, estão, podem, vão, têm, serão, devem, eram, estavam
- AUX-Fin: são, foram, estão, podem, vão, têm, serão, devem, eram, estavam
- AUX-Inf: serem, terem, estarem, estarmos, haverem, passarem, poderem, continuarem, irem, podermos
- AUX-Part: acabados, atualizados, convertidas, discutidas, feridas, perdoados
- DET: os, as, seus, suas, todos, outros, outras, alguns, algumas, todas
- NOUN: anos, milhões, pessoas, contos, dias, pontos, empresas, meses, países, vezes
- NOUN-Part: feridos, chibatadas, colocados, culpados, envolvidos, recomendados, usados, visitados, afectados, blindados
- PRON: que, se, eles, os, nos, todos, outros, as, elas, nós
- PROPN: EUA, Estados, Assuntos, Nações, Antas, Açores, Comandos, Encontros, Forças, Misericórdias
- SYM: %, US$, R$, CR$
- VERB-Fin: têm, existem, fizeram, dizem, querem, dão, fazem, temos, chegaram, conseguiram
- VERB-Inf: terem, ficarem, aceitarem, chegarem, exigirem, fazerem, fornecerem, funcionarem, manterem, mostrarem
- VERB-Part: feitas, ligados, feitos, acusados, realizados, chamados, colocados, apresentadas, envolvidos, realizadas
- X: made
- Sing
- ADJ: primeiro, maior, primeira, novo, grande, nova, mesmo, melhor, último, nacional
- ADJ-Part: eleito, Animado, achado, acirrada, animada, drogada, errado, estimada, existente, ferido
- ADP: por, da, como, sobre, a
- ADV: não, mais, bem, menos, bastante, bom, claro, forte, mal, muito
- AUX-Fin: é, foi, está, vai, pode, era, tem, será, deve, estava
- AUX-Inf: ser, ter, estar, ir, começar, haver, poder, vir
- AUX-Part: sido, Acabadinho, aceite, deslocado, interpelado, proibido, rejeitada
- CCONJ: e, entanto, mesmo
- DET: o, a, um, uma, sua, seu, este, esta, esse, qualquer
- INTJ: Adeus, Obrigada, rua, viu
- INTJ-Fin: viu
- NOUN: presidente, ano, dia, país, tempo, grupo, governo, estado, parte, acordo
- NOUN-Fin: garante
- NOUN-Inf: Olhar, distender, fumar
- NOUN-Part: arguido, classificado, colocado, esperado, ocorrido, previsto, verificada, acumulado, amassado, apresentada
- NUM: cento, meia, 3, dúzia, 14, 2, 4, 94, um, 185/60
- PART: pós
- PRON: que, se, o, ele, isso, lhe, quem, tudo, eu, ela
- PRON-Ger: se
- PROPN: Paulo, Nacional, São, Portugal, Porto, Unidos, Brasil, José, Lisboa, Silva
- PROPN-Part: visto, Dado
- PUNCT: ?
- SCONJ: que, como, se
- SYM: R$, US$
- VERB: há, disse, tem, diz, é, fez, afirmou, foi, faz, teve
- VERB-Fin: há, disse, tem, diz, é, fez, afirmou, foi, faz, teve
- VERB-Inf: ter, dar, haver, retirar, saber, ver, aprovar, atingir, cair, chegar
- VERB-Part: feita, feito, eleito, aberto, considerado, considerada, realizado, acusado, criada, divulgado
- X: for, jet, ski, Burgos, Children, Dictionary, Sure, Team, non-mesuré, Body
- Unsp
- DET: mais, Que, o(s)
- NOUN: tratamento(s)
- PRON: mais, quem, que, menos, aquilo, mundo
- Acc
- PRON: se, o, me, a, nos, lo, os, la, as, los
- PRON-Ger: se
- SCONJ: se
- Dat
- PRON: lhe, me, nos, lhes, se, Ihe, vos
- Nom
- PRON: ele, eu, eles, ela, você, nós, elas, vocês, voce, vós
- Def
- ADP: da
- DET: o, a, os, as, esta, o(s), um
- PRON: o, os, a, as, que
- Ind
- DET: um, uma, outra, Nada, o, uns
- NUM: um
- PRON: um
- PROPN: um
Degree and Polarity
- Neg
- ADV: não, nada
- INTJ: não
Verbal Features
- Cnd
- AUX-Fin: seria, poderia, teria, deveria, seriam, estaria, iria, teriam, acabaria, deveriam
- VERB-Fin: gostaria, ficaria, daria, teria, faria, seria, diria, gostariam, tentaria, teriam
- Imp
- AUX-Fin: Sê
- VERB-Fin: move, Olha, chega, vide
- Ind
- AUX-Fin: é, foi, está, são, foram, vai, pode, era, estão, tem
- INTJ-Fin: viu
- NOUN-Fin: garante
- VERB-Fin: há, disse, tem, diz, é, fez, afirmou, foi, têm, faz
- Sub
- AUX-Fin: seja, for, tenha, fosse, possa, sejam, esteja, estejam, possam, estivesse
- VERB-Fin: seja, tenha, quiser, leia, recorde, haja, houver, pense, veja, for
- Fut
- AUX-Fin: será, poderá, deverá, serão, terá, for, irá, estará, deverão, poderão
- VERB-Fin: terá, terão, haverá, será, quiser, ficará, houver, fará, for, permitirá
- Imp
- AUX-Fin: era, estava, tinha, eram, estavam, fosse, havia, tinham, haviam, ia
- VERB-Fin: tinha, havia, fazia, dizia, era, encontrava, estavam, parecia, tinham, conseguia
- Past
- AUX: foi, foram, esteve, acabou, fui, voltou, começou, chegou, passou, teve
- AUX-Fin: foi, foram, esteve, acabou, fui, voltou, começou, chegou, passou, teve
- INTJ-Fin: viu
- VERB-Fin: disse, fez, afirmou, foi, teve, deu, ficou, chegou, conseguiu, aconteceu
- Pqp
- AUX-Fin: fora, acabara, foram, começara, tiveram
- VERB-Fin: fizera, tornara, desaparecera, dissera, levara, Nascera, Quisera, Saíra, abrangera, aconteceram
- Pres
- AUX-Fin: é, está, são, vai, pode, estão, tem, deve, podem, seja
- NOUN-Fin: garante
- VERB-Fin: há, tem, diz, é, têm, faz, afirma, dá, quer, trata
- Pass
- ADJ-Part: pegos
- NOUN-Part: afectados, apresentada, compostas, denunciados, estimado, recomendados, requeridas
- VERB-Fin: fez, Esperam, Sustêm, Trata, Vejam, avaliam, citem, confirmou, conhecem, descobriram
- VERB-Inf: anunciar, aprovar, candidatar, contrair, divulgar, dizer, elaborar, entender, evitar, pagar
- VERB-Part: feita, feito, feitas, considerado, considerada, aprovada, lançado, acompanhado, tomada, apresentada
Pronouns, Determiners, Quantifiers
- Art
- DET: o, a, os, as, um, uma, uns, esta, umas, outra
- NUM: um
- PRON: o, os, a, as, que, um
- PROPN: um
- Dem
- DET: este, esta, esse, essa, estes, estas, esses, aquele, essas, o
- NOUN: aquele
- PRON: o, isso, isto, os, a, este, esta, as, mesmo, aquilo
- Emp
- ADJ: próprio, própria, próprias
- DET: próprio, própria, próprios, próprias
- Ind
- ADJ: diferentes, outra
- ADV: mais, bastante, menos, muito
- DET: qualquer, outros, outro, mais, outras, alguns, algumas, outra, muitos, vários
- NOUN: outros
- PRON: tudo, nada, outros, ninguém, que, outro, algo, alguns, mais, alguém
- PROPN: que
- Int
- ADV: quanto
- DET: que, quanto, quais, qual, Quantos, Quantas, quando
- PRON: que, quem, qual, quais, quanto, quantos, quê
- SCONJ: que
- Neg
- DET: nenhum, nenhuma
- PRON: nada, nenhuma, nenhum
- Prs
- DET: sua, seu, seus, suas, meu, nossa, nosso, minha, nossos, nossas
- PRON: se, ele, lhe, o, eles, eu, ela, me, nos, a
- PRON-Ger: se
- SCONJ: se
- Rel
- ADP: segundo, enquanto, como, quando, apenas, conforme
- DET: cujo, cuja, cujas, qual, cujos, quais, quanto, Quantos
- PRON: que, quem, qual, quais, tudo, quanto, cuja, quantos, Nada, qu
- SCONJ: que
- Tot
- DET: todos, cada, toda, todo, todas, ambos, ambas, tudo
- PRON: todos, ambos, todas, todo, cada, Ambas, tudo
- Card
- DET: um, uma
- NOUN: um, 11, 1200, 156.942, 86.871, onze, quatro, três
- NUM: um, dois, três, mil, uma, duas, quatro, cinco, 15, 30
- PROPN: 1.560, 1.565, Doze
- Frac
- NUM: meia
- Mult
- NUM: cento
- Ord
- ADJ: primeiro, primeira, último, última, segundo, últimos, segunda, primeiros, terceiro, terceira
- NUM: quinta, XVII
- Range
- NUM: 07.00-09.00, 10.00-12.00
- Sets
- NUM: dúzia
- 1
- AUX: estamos, estou, fui, vamos, podemos, somos, vou, sou, tenho, temos
- AUX-Fin: estamos, estou, fui, vamos, podemos, somos, vou, sou, tenho, temos
- AUX-Inf: estarmos, podermos, sermos
- PRON: eu, me, nos, nós, mim, nosco
- VERB-Fin: sei, tenho, acho, temos, espero, penso, queremos, quero, acredito, creio
- VERB-Inf: adaptarmos, apanhá, dependermos, entender, montarmos, ocuparmos, olharmos, ouvirmos, subir, termos
- 2
- AUX-Fin: Sê, vais
- PRON: te, ti, vos, vós
- VERB-Fin: move, Compreendeste, Criaste, Olha, Rodeaste, Roubarás, Roubaste, Saiba, chamais, chega
- 3
- AUX-Fin: é, foi, está, são, foram, vai, pode, era, estão, tem
- AUX-Inf: serem, ser, ter, terem, estarem, estar, haverem, ir, passarem, poderem
- INTJ-Fin: viu
- NOUN-Fin: garante
- NOUN-Inf: distender, fumar
- PRON: se, ele, lhe, o, eles, ela, a, elas, você, lo
- PRON-Ger: se
- SCONJ: se
- VERB-Fin: há, tem, disse, diz, é, fez, afirmou, foi, têm, faz
- VERB-Inf: terem, ter, dar, ficarem, haver, retirar, saber, ver, aceitarem, aprovar
Other Features
- AdpType
- Prep
- ADP: de, com, por
- Preppron
- ADP: da
- Prep
- Foreign
- Yes
- NOUN: bodyboard
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 2 lemmas as copulas (cop). Examples: ser, estar.
- This corpus uses 45 lemmas as auxiliaries (aux). Examples: ter, poder, ir, dever, estar, vir, continuar, começar, acabar, ser, passar, haver, voltar, deixar, parecer, chegar, ficar, costumar, andar, parar, abster, aceitar, agredir, ameaçar, atualizar, comedir, converter, deslocar, discutir, encaminhar, envergonhar, fazer, ferir, interpelar, perdoar, permitir, procurar, proibir, recomeçar, rejeitar, reunir, sujar, tender, tomar, tornar.
- This corpus uses 3 lemmas as passive auxiliaries (aux:pass). Examples: ser, _, ficar.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN (1)
- VERB--PRON (1)
- VERB-Fin--NOUN (3469)
- VERB-Fin--NOUN-ADP(a) (1)
- VERB-Fin--PRON (1702)
- VERB-Fin--PRON-ADP(de) (1)
- VERB-Fin--PRON-Acc (219)
- VERB-Fin--PRON-Nom (332)
- VERB-Ger--NOUN (72)
- VERB-Ger--PRON (27)
- VERB-Ger--PRON-Acc (15)
- VERB-Ger--PRON-Nom (7)
- VERB-Inf--NOUN (598)
- VERB-Inf--PRON (183)
- VERB-Inf--PRON-Acc (77)
- VERB-Inf--PRON-Nom (55)
- VERB-Part--NOUN (213)
- VERB-Part--PRON (58)
- VERB-Part--PRON-Acc (2)
- VERB-Part--PRON-Nom (13)
- obj
- VERB--NOUN (2)
- VERB--PRON (2)
- VERB--PRON-Acc (1)
- VERB-Fin--NOUN (3747)
- VERB-Fin--NOUN-ADP(com) (1)
- VERB-Fin--NOUN-ADP(de) (3)
- VERB-Fin--PRON (445)
- VERB-Fin--PRON-Acc (335)
- VERB-Fin--PRON-Dat (3)
- VERB-Fin--PRON-Nom (3)
- VERB-Ger--NOUN (386)
- VERB-Ger--NOUN-ADP(com) (1)
- VERB-Ger--NOUN-ADP(de) (1)
- VERB-Ger--PRON (13)
- VERB-Ger--PRON-Acc (23)
- VERB-Ger--PRON-Dat (1)
- VERB-Inf--NOUN (2109)
- VERB-Inf--NOUN-ADP(a) (12)
- VERB-Inf--NOUN-ADP(como) (1)
- VERB-Inf--PRON (121)
- VERB-Inf--PRON-Acc (131)
- VERB-Inf--PRON-Acc-ADP(a) (1)
- VERB-Part--NOUN (182)
- VERB-Part--NOUN-ADP(por) (1)
- VERB-Part--PRON (30)
- VERB-Part--PRON-Acc (13)
- iobj
- VERB-Fin--NOUN-ADP(a) (2)
- VERB-Fin--NOUN-ADP(de) (1)
- VERB-Fin--NOUN-ADP(em) (1)
- VERB-Fin--NOUN-ADP(para) (1)
- VERB-Fin--PRON-Acc (7)
- VERB-Fin--PRON-Dat (157)
- VERB-Ger--PRON-Dat (8)
- VERB-Inf--PRON-Dat (39)
- VERB-Part--PRON-Dat (14)
Relations Overview
- This corpus uses 8 relation subtypes: acl:relcl, aux:pass, flat:foreign, flat:name, nmod:npmod, nmod:tmod, nsubj:pass, obl:agent
- The following 2 relation types are not used in this corpus at all: clf, list