Treebank Statistics: UD_Czech: POS Tags: NUM
There are 3436 NUM
lemmas (6%), 3543 NUM
types (3%) and 41507 NUM
tokens (3%).
Out of 17 observed tags, the rank of NUM
is: 5 in number of lemmas, 5 in number of types and 11 in number of tokens.
The 10 most frequent NUM
lemmas: jeden, dva, 1, tři, 2, oba, 3, 4, pět, čtyři
The 10 most frequent NUM
types: 1, 2, 3, dva, tři, 4, jeden, 6, dvě, tisíc
The 10 most frequent ambiguous lemmas: jeden (NUM 2526, ADJ 31), tři (NUM 1207, ADJ 1), pět (NUM 625, VERB 1), tisíc (NUM 539, NOUN 330, ADV 1), 12 (NUM 307, ADV 1), osm (NUM 236, ADJ 1), I (NUM 97, PROPN 62, ADJ 17, PRON 16), půl (NOUN 177, NUM 64), třináct (NUM 53, ADJ 1), sto (NOUN 304, NUM 41)
The 10 most frequent ambiguous types: tisíc (NUM 538, NOUN 92), dvou (NUM 519, ADJ 1), 12 (NUM 306, ADV 1), tří (NUM 239, ADJ 3), jedno (NUM 152, ADJ 1), jednou (ADV 165, NUM 129), čtyř (NUM 100, ADJ 1), I (CCONJ 465, NUM 97, PROPN 62, ADJ 19, PRON 6, NOUN 1), osmi (NUM 91, ADJ 1), půl (NOUN 164, NUM 64)
- tisíc
- dvou
- NUM 519: Kompletní informace pro drobného investora v LN na dvou stránkách
- ADJ 1: Izraelský premiér Jicchak Rabin včera prohlásil , že palestinský předák Jásir Arafat požádal o dvou až třítýdenní odklad , který by umožnil Palestincům připravit se na převzetí správy nad autonomními územími v pásmu Gazy a v Jerichu na západním břehu Jordánu .
- 12
- tří
- jedno
- NUM 152: Když jedno chybí , nepodaří se to .
- ADJ 1: Ke snížení úroků z depozit dochází u T - Kont ( o 1.5 - 2 % ) , u vkladových certifikátů s výjimkou jedno - a dvouměsíčních certifikátů ( o 0 , 2 až 2.5 % ) a u vkladů právnických osob a fyzických osob - podnikatelů na tři , šest a devět měsíců ( o 0.15 až 0.8 % ) .
- jednou
- čtyř
- I
- CCONJ 465: I velké firmy se specializují jen na několik málo teritorií .
- NUM 97: KAREL HAVLÍČEK BOROVSKÝ , Dílo I
- PROPN 62: Akademikem se zato stal známý teoretik antisemitismu I . Šafarevič .
- ADJ 19: S V . I . P . prostory však prý byla na obou stadionech spokojenost . . .
- PRON 6: Jen zřídkakdy Moby bere do svých rukou i hardcoreovou kytaru ( All That I Need Is To Be Loved ) .
- NOUN 1: V Soluně například stojí 0.11 karátový diamant ( barvy I , velmi dobrého až dobrého brusu a čistoty SI 1 ) včetně DPH 2700 korun ( do konce dubna ho pořídíte za 2400 korun ) .
- osmi
- půl
Morphology
The form / lemma ratio of NUM
is 1.031141 (the average of all parts of speech is 2.181792).
The 1st highest number of forms (10) was observed with the lemma “jeden”: jeden, jedna, jedno, jednoho, jednom, jednomu, jednou, jednu, jedné, jedním.
The 2nd highest number of forms (8) was observed with the lemma “třetina”: třetin, třetina, třetinou, třetinu, třetiny, třetinách, třetinám, třetině.
The 3rd highest number of forms (7) was observed with the lemma “čtvrtina”: čtvrtina, čtvrtinami, čtvrtinou, čtvrtinu, čtvrtiny, čtvrtinách, čtvrtině.
NUM
occurs with 10 features: NumType (41507; 100% instances), NumForm (41165; 99% instances), Number (11649; 28% instances), Case (11623; 28% instances), NumValue (8050; 19% instances), Gender (4759; 11% instances), Animacy (303; 1% instances), Foreign (29; 0% instances), NameType (20; 0% instances), Style (2; 0% instances)
NUM
occurs with 25 feature-value pairs: Animacy=Anim
, Animacy=Inan
, Case=Acc
, Case=Dat
, Case=Gen
, Case=Ins
, Case=Loc
, Case=Nom
, Foreign=Yes
, Gender=Fem
, Gender=Fem,Neut
, Gender=Masc
, Gender=Masc,Neut
, Gender=Neut
, NameType=Com
, NumForm=Digit
, NumForm=Roman
, NumForm=Word
, NumType=Card
, NumType=Frac
, NumValue=1,2,3
, Number=Dual
, Number=Plur
, Number=Sing
, Style=Arch
NUM
occurs with 59 feature combinations.
The most frequent feature combination is NumForm=Digit|NumType=Card
(29481 tokens).
Examples: 1, 2, 3, 4, 6, 5, 1992, 10, 1994, 1993
Relations
NUM
nodes are attached to their parents using 24 different relations: nummod (19664; 47% instances), nummod:gov (7348; 18% instances), conj (3769; 9% instances), compound (2801; 7% instances), dep (1946; 5% instances), obl (1879; 5% instances), root (1216; 3% instances), obj (751; 2% instances), nsubj (712; 2% instances), orphan (474; 1% instances), appos (292; 1% instances), obl:arg (234; 1% instances), nmod (123; 0% instances), nsubj:pass (90; 0% instances), xcomp (81; 0% instances), advcl (39; 0% instances), acl (28; 0% instances), ccomp (25; 0% instances), iobj (17; 0% instances), parataxis (8; 0% instances), advmod:emph (5; 0% instances), csubj (2; 0% instances), mark (2; 0% instances), csubj:pass (1; 0% instances)
Parents of NUM
nodes belong to 15 different parts of speech: NOUN (26219; 63% instances), NUM (6292; 15% instances), VERB (3326; 8% instances), PROPN (2594; 6% instances), (1216; 3% instances), ADJ (1018; 2% instances), ADV (342; 1% instances), SYM (256; 1% instances), PRON (125; 0% instances), DET (65; 0% instances), CCONJ (28; 0% instances), PUNCT (22; 0% instances), ADP (2; 0% instances), INTJ (1; 0% instances), PART (1; 0% instances)
21605 (52%) NUM
nodes are leaves.
13351 (32%) NUM
nodes have one child.
3734 (9%) NUM
nodes have two children.
2817 (7%) NUM
nodes have three or more children.
The highest child degree of a NUM
node is 27.
Children of NUM
nodes are attached using 31 different relations: punct (11628; 37% instances), nmod (4125; 13% instances), conj (3693; 12% instances), compound (2801; 9% instances), case (2109; 7% instances), advmod:emph (2028; 6% instances), cc (1221; 4% instances), dep (793; 3% instances), amod (629; 2% instances), cop (466; 1% instances), nsubj (386; 1% instances), advmod (307; 1% instances), mark (305; 1% instances), orphan (266; 1% instances), appos (241; 1% instances), obl (141; 0% instances), nummod (99; 0% instances), det (72; 0% instances), parataxis (50; 0% instances), acl (42; 0% instances), xcomp (33; 0% instances), csubj (30; 0% instances), det:nummod (23; 0% instances), advcl (22; 0% instances), obj (19; 0% instances), aux (9; 0% instances), discourse (4; 0% instances), fixed (2; 0% instances), flat:foreign (1; 0% instances), obl:arg (1; 0% instances), vocative (1; 0% instances)
Children of NUM
nodes belong to 16 different parts of speech: PUNCT (11628; 37% instances), NUM (6292; 20% instances), NOUN (4417; 14% instances), ADP (2093; 7% instances), ADV (1494; 5% instances), CCONJ (1162; 4% instances), SYM (929; 3% instances), PART (915; 3% instances), ADJ (830; 3% instances), AUX (475; 2% instances), PROPN (403; 1% instances), SCONJ (301; 1% instances), VERB (215; 1% instances), DET (209; 1% instances), PRON (183; 1% instances), INTJ (1; 0% instances)