Treebank Statistics: UD_Czech-CAC: POS Tags: VERB
There are 3708 VERB
lemmas (13%), 10752 VERB
types (17%) and 40590 VERB
tokens (8%).
Out of 16 observed tags, the rank of VERB
is: 3 in number of lemmas, 3 in number of types and 5 in number of tokens.
The 10 most frequent VERB
lemmas: mít, být, moci, muset, jít, lze, stát, chtít, dát, pracovat
The 10 most frequent VERB
types: je, má, mají, musí, může, jde, lze, jsou, mohou, můžeme
The 10 most frequent ambiguous lemmas: mít (VERB 2327, AUX 5), být (AUX 14145, VERB 1828), moci (VERB 1433, AUX 5), muset (VERB 687, AUX 2), stát (VERB 348, NOUN 169), vyžadovat (VERB 116, AUX 1), znát (VERB 111, ADJ 1), růst (NOUN 104, VERB 58), vzrůst (VERB 32, NOUN 13), bývat (AUX 84, VERB 29)
The 10 most frequent ambiguous types: je (AUX 4424, VERB 731, PRON 356), má (VERB 727, AUX 1, DET 1), musí (VERB 375, AUX 1), může (VERB 377, AUX 1), jsou (AUX 1389, VERB 259), mohou (VERB 239, AUX 1), měl (VERB 143, AUX 2), měla (VERB 126, AUX 1), bylo (AUX 533, VERB 102), není (AUX 411, VERB 83)
- je
- má
- VERB 727: V dnešní době má kosmetika , tedy péče o zdraví a krásu , nový obsah .
- AUX 1: Každý má vlastní vztah k událostem a faktům , která dokument uvádí a zobecňuje , a každý by ovšem měl také využít svých zkušeností z nedávných těžkých let , aby by sám přispěl k velkému dění , jímž naše odbory postupně obnovují svůj revoluční charakter a masový vliv , i v tom smyslu Závěry ukazují směr , kudy vést konkrétní a účinný boj s pozůstatky či opětovnými projevy reformistických tendencí v odborové práci a jak i kam tuto každodenní činnost zaměřovat , aby by sloužila dělnické třídě v souladu se zájmy i její historickou úlohou .
- DET 1: Pozvala mne k sobě do Krasnodaru má přítelkyně Sima Chakurate , se kterou jsme se poznaly v době druhé světové války v koncentračním táboře Ravensbrücku , kde jsme prožily krutých dva a půl roku .
- musí
- může
- jsou
- mohou
- měl
- měla
- bylo
- není
Morphology
The form / lemma ratio of VERB
is 2.899676 (the average of all parts of speech is 2.186309).
The 1st highest number of forms (30) was observed with the lemma “být”: Budiž, Buď, bude, budou, budu, byl, byla, byli, bylo, byly, být, býti, je, jest, jsem, jsme, jsou, jste, nebude, nebudu, nebyl, nebyla, nebyli, nebylo, nebyly, nebýt, nejsme, nejsou, nejste, není.
The 2nd highest number of forms (26) was observed with the lemma “moci”: moci, mohl, mohla, mohli, mohlo, mohly, mohou, mohu, může, můžeme, můžete, můžeš, můžu, nemohl, nemohla, nemohli, nemohlo, nemohly, nemohou, nemohu, nemůže, nemůžeme, nemůžete, nemůžeš, nemůžou, nemůžu.
The 3rd highest number of forms (26) was observed with the lemma “mít”: Nemáš, mají, má, mám, máme, máte, máš, mít, míti, mějte, měl, měla, měli, mělo, měly, nemají, nemá, nemám, nemáme, nemáte, nemít, neměl, neměla, neměli, nemělo, neměly.
VERB
occurs with 12 features: Polarity (40590; 100% instances), VerbForm (40590; 100% instances), Number (32976; 81% instances), Tense (32524; 80% instances), Voice (32524; 80% instances), Aspect (24956; 61% instances), Mood (22405; 55% instances), Person (22405; 55% instances), Gender (10563; 26% instances), Animacy (3259; 8% instances), Style (53; 0% instances), Foreign (7; 0% instances)
VERB
occurs with 31 feature-value pairs: Animacy=Anim
, Animacy=Inan
, Aspect=Imp
, Aspect=Perf
, Foreign=Yes
, Gender=Fem,Masc
, Gender=Fem,Neut
, Gender=Masc
, Gender=Neut
, Mood=Imp
, Mood=Ind
, Number=Plur
, Number=Plur,Sing
, Number=Sing
, Person=1
, Person=2
, Person=3
, Polarity=Neg
, Polarity=Pos
, Style=Arch
, Style=Coll
, Style=Rare
, Style=Vrnc
, Tense=Fut
, Tense=Past
, Tense=Pres
, VerbForm=Conv
, VerbForm=Fin
, VerbForm=Inf
, VerbForm=Part
, Voice=Act
VERB
occurs with 113 feature combinations.
The most frequent feature combination is Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act
(6317 tokens).
Examples: znamená, patří, odpovídá, stává, představuje, dochází, tvoří, ukazuje, říká, vyžaduje
Relations
VERB
nodes are attached to their parents using 18 different relations: root (17046; 42% instances), conj (6969; 17% instances), acl (5947; 15% instances), xcomp (3703; 9% instances), advcl (2501; 6% instances), csubj (2196; 5% instances), ccomp (1257; 3% instances), parataxis (505; 1% instances), csubj:pass (125; 0% instances), dep (125; 0% instances), orphan (106; 0% instances), appos (62; 0% instances), cc (24; 0% instances), case (12; 0% instances), advmod (9; 0% instances), advmod:emph (1; 0% instances), flat:foreign (1; 0% instances), nmod (1; 0% instances)
Parents of VERB
nodes belong to 16 different parts of speech: (17046; 42% instances), VERB (13644; 34% instances), NOUN (5660; 14% instances), ADJ (2410; 6% instances), DET (870; 2% instances), ADV (506; 1% instances), PROPN (160; 0% instances), PRON (94; 0% instances), SYM (65; 0% instances), NUM (47; 0% instances), SCONJ (41; 0% instances), PART (21; 0% instances), AUX (17; 0% instances), INTJ (5; 0% instances), CCONJ (3; 0% instances), PUNCT (1; 0% instances)
331 (1%) VERB
nodes are leaves.
2615 (6%) VERB
nodes have one child.
5241 (13%) VERB
nodes have two children.
32403 (80%) VERB
nodes have three or more children.
The highest child degree of a VERB
node is 13.
Children of VERB
nodes are attached using 34 different relations: punct (33354; 22% instances), obl (20097; 13% instances), nsubj (18314; 12% instances), obj (18256; 12% instances), advmod (13151; 9% instances), conj (7479; 5% instances), cc (6091; 4% instances), expl:pv (5780; 4% instances), mark (5070; 3% instances), obl:arg (5014; 3% instances), xcomp (4121; 3% instances), aux (3083; 2% instances), advcl (2281; 2% instances), expl:pass (2084; 1% instances), ccomp (1570; 1% instances), nsubj:pass (1437; 1% instances), iobj (1311; 1% instances), csubj (929; 1% instances), dep (789; 1% instances), parataxis (342; 0% instances), advmod:emph (300; 0% instances), csubj:pass (103; 0% instances), nmod (90; 0% instances), discourse (77; 0% instances), appos (59; 0% instances), obl:agent (56; 0% instances), vocative (49; 0% instances), orphan (42; 0% instances), acl (22; 0% instances), amod (12; 0% instances), nummod (6; 0% instances), cop (4; 0% instances), det (4; 0% instances), flat:foreign (3; 0% instances)
Children of VERB
nodes belong to 16 different parts of speech: NOUN (50921; 34% instances), PUNCT (33355; 22% instances), VERB (13644; 9% instances), ADV (13519; 9% instances), PRON (13192; 9% instances), CCONJ (5833; 4% instances), DET (5708; 4% instances), SCONJ (4963; 3% instances), AUX (3079; 2% instances), ADJ (2894; 2% instances), PROPN (2223; 1% instances), PART (854; 1% instances), NUM (662; 0% instances), SYM (509; 0% instances), ADP (20; 0% instances), INTJ (4; 0% instances)