Treebank Statistics: UD_Czech: POS Tags: ADJ
There are 14826 ADJ
lemmas (25%), 40175 ADJ
types (31%) and 189185 ADJ
tokens (13%).
Out of 17 observed tags, the rank of ADJ
is: 3 in number of lemmas, 1 in number of types and 3 in number of tokens.
The 10 most frequent ADJ
lemmas: český, velký, nový, další, první, jiný, druhý, vysoký, dobrý, celý
The 10 most frequent ADJ
types: první, další, české, nové, druhé, poslední, státní, dalších, možné, vlastní
The 10 most frequent ambiguous lemmas: velký (ADJ 2468, ADV 1), obchodní (ADJ 588, ADV 1), starý (ADJ 567, NOUN 5), známý (ADJ 560, NOUN 21), domácí (ADJ 515, NOUN 5), mladý (ADJ 443, NOUN 3), třeba (ADJ 409, ADV 404), blízký (ADJ 314, NOUN 2), vedoucí (ADJ 156, NOUN 145), spolkový (ADJ 117, NOUN 1)
The 10 most frequent ambiguous types: vlastní (ADJ 464, VERB 76), třeba (ADJ 408, ADV 372), hlavní (ADJ 298, NOUN 3), tzv (ADJ 359, ADV 1), domácí (ADJ 230, NOUN 2), dobré (ADJ 211, NOUN 1), vysoké (ADJ 190, NOUN 1), a (CCONJ 31068, ADJ 183, NOUN 49, ADP 7), lepší (ADJ 169, VERB 2), o (ADP 9669, ADJ 110, PUNCT 99, NOUN 4)
- vlastní
- třeba
- hlavní
- tzv
- ADJ 359: Notář v tomto řízení vystupuje jako tzv . soudní komisař .
- ADV 1: D . Kolářová : Tím , že není dostatečná legislativa , začala zoufalá kalvárie , mnozí majitelé se chovají tzv . tržně , to však znamená , že v praxi jednají podle zásady “ co není zakázáno , je dovoleno “ a pak vzniká morální džungle .
- domácí
- dobré
- vysoké
- a
- CCONJ 31068: Zvedněte telefon a zavolejte .
- ADJ 183: a . s . Malostranské nám . 2 118 00 Praha 1 Tel . / fax : 684 62 55
- NOUN 49: Ušetříte téměř 90 % proti variantě a ) .
- ADP 7: ” Všichni chtěli kopírovat trend a la Boris Korbel , kdy se do přestupů vrážely obrovské částky , a projevuje se to dodnes , “ dodává manažer FC Boby Brno .
- lepší
- o
Morphology
The form / lemma ratio of ADJ
is 2.709767 (the average of all parts of speech is 2.181792).
The 1st highest number of forms (32) was observed with the lemma “známý”: nejznámější, nejznámějších, nejznámějším, neznáma, neznámo, neznámou, neznámá, neznámé, neznámého, neznámém, neznámí, neznámý, neznámých, neznámým, neznámými, znám, známa, známi, známo, známou, známy, známá, známé, známého, známém, známému, známí, známý, známých, známým, známými, známější.
The 2nd highest number of forms (31) was observed with the lemma “dobrý”: Dobrú, dobrou, dobrá, dobré, dobrého, dobrém, dobrému, dobrý, dobrých, dobrým, dobrými, dobří, lepší, lepších, lepšího, lepším, lepšími, lepšímu, nedobrou, nedobrá, nedobré, nedobrého, nedobrý, nedobrých, nejlepší, nejlepších, nejlepšího, nejlepším, nejlepšími, nejlepšímu, nelepší.
The 3rd highest number of forms (31) was observed with the lemma “velký”: největší, největších, největšího, největším, největšími, největšímu, nevelkou, nevelká, nevelké, nevelkého, nevelký, nevelkých, nevelkým, nevelkými, velcí, velkou, velká, velké, velkého, velkém, velkému, velký, velkých, velkým, velkými, větší, větších, většího, větším, většími, většímu.
ADJ
occurs with 20 features: Number (184587; 98% instances), Gender (184564; 98% instances), Polarity (181483; 96% instances), Case (173088; 91% instances), Degree (165170; 87% instances), Animacy (75523; 40% instances), VerbForm (14024; 7% instances), Voice (14024; 7% instances), Variant (11414; 6% instances), Aspect (9991; 5% instances), NumType (4990; 3% instances), NameType (4756; 3% instances), Tense (4498; 2% instances), Gender[psor] (2707; 1% instances), Poss (2707; 1% instances), Foreign (2670; 1% instances), Abbr (1714; 1% instances), Hyph (398; 0% instances), Style (172; 0% instances), NumValue (30; 0% instances)
ADJ
occurs with 67 feature-value pairs: Abbr=Yes
, Animacy=Anim
, Animacy=Inan
, Aspect=Imp
, Aspect=Perf
, Case=Acc
, Case=Dat
, Case=Gen
, Case=Ins
, Case=Loc
, Case=Nom
, Case=Voc
, Degree=Cmp
, Degree=Pos
, Degree=Sup
, Foreign=Yes
, Gender=Fem
, Gender=Fem,Masc
, Gender=Fem,Neut
, Gender=Masc
, Gender=Neut
, Gender[psor]=Fem
, Gender[psor]=Masc
, Hyph=Yes
, NameType=Com
, NameType=Com,Geo
, NameType=Com,Giv
, NameType=Com,Oth
, NameType=Com,Pro
, NameType=Com,Pro,Sur
, NameType=Com,Sur
, NameType=Geo
, NameType=Geo,Giv
, NameType=Geo,Oth
, NameType=Geo,Pro
, NameType=Geo,Sur
, NameType=Giv
, NameType=Giv,Sur
, NameType=Nat
, NameType=Oth
, NameType=Oth,Sur
, NameType=Pro
, NameType=Sur
, NumType=Mult,Sets
, NumType=Ord
, NumType=Sets
, NumValue=1
, Number=Dual
, Number=Plur
, Number=Plur,Sing
, Number=Sing
, Polarity=Neg
, Polarity=Pos
, Poss=Yes
, Style=Arch
, Style=Coll
, Style=Expr
, Style=Rare
, Style=Slng
, Style=Vrnc
, Style=Vulg
, Tense=Past
, Tense=Pres
, Variant=Short
, VerbForm=Part
, Voice=Act
, Voice=Pass
ADJ
occurs with 848 feature combinations.
The most frequent feature combination is Case=Gen|Degree=Pos|Gender=Fem|Number=Sing|Polarity=Pos
(13446 tokens).
Examples: české, evropské, nové, národní, politické, slovenské, státní, světové, celé, velké
Relations
ADJ
nodes are attached to their parents using 30 different relations: amod (157736; 83% instances), root (8928; 5% instances), conj (8747; 5% instances), obj (1794; 1% instances), flat:foreign (1692; 1% instances), dep (1593; 1% instances), xcomp (1564; 1% instances), acl (1322; 1% instances), obl (1157; 1% instances), ccomp (1120; 1% instances), nsubj (872; 0% instances), advcl (815; 0% instances), obl:arg (503; 0% instances), appos (382; 0% instances), orphan (280; 0% instances), csubj (193; 0% instances), parataxis (148; 0% instances), iobj (106; 0% instances), nsubj:pass (58; 0% instances), flat (56; 0% instances), cc (51; 0% instances), csubj:pass (37; 0% instances), nmod (11; 0% instances), obl:agent (7; 0% instances), advmod:emph (4; 0% instances), fixed (4; 0% instances), advmod (2; 0% instances), case (1; 0% instances), mark (1; 0% instances), vocative (1; 0% instances)
Parents of ADJ
nodes belong to 16 different parts of speech: NOUN (154124; 81% instances), (8928; 5% instances), VERB (8879; 5% instances), ADJ (7858; 4% instances), PROPN (6624; 4% instances), DET (993; 1% instances), NUM (830; 0% instances), PRON (570; 0% instances), ADV (286; 0% instances), PART (45; 0% instances), SYM (17; 0% instances), CCONJ (11; 0% instances), ADP (10; 0% instances), SCONJ (5; 0% instances), INTJ (3; 0% instances), PUNCT (2; 0% instances)
141990 (75%) ADJ
nodes are leaves.
21831 (12%) ADJ
nodes have one child.
5944 (3%) ADJ
nodes have two children.
19420 (10%) ADJ
nodes have three or more children.
The highest child degree of a ADJ
node is 19.
Children of ADJ
nodes are attached using 37 different relations: punct (26094; 21% instances), obl (14191; 11% instances), advmod (14089; 11% instances), cop (11575; 9% instances), conj (8884; 7% instances), cc (7569; 6% instances), nsubj (7505; 6% instances), aux:pass (6068; 5% instances), nsubj:pass (4559; 4% instances), mark (3673; 3% instances), obj (3591; 3% instances), obl:arg (2129; 2% instances), csubj (2084; 2% instances), case (1882; 2% instances), advcl (1826; 1% instances), advmod:emph (1274; 1% instances), aux (923; 1% instances), xcomp (824; 1% instances), dep (788; 1% instances), nmod (687; 1% instances), obl:agent (591; 0% instances), expl:pv (538; 0% instances), appos (431; 0% instances), orphan (343; 0% instances), flat:foreign (308; 0% instances), nummod (261; 0% instances), amod (248; 0% instances), ccomp (232; 0% instances), parataxis (229; 0% instances), det (124; 0% instances), acl (121; 0% instances), csubj:pass (64; 0% instances), flat (42; 0% instances), discourse (23; 0% instances), expl:pass (5; 0% instances), vocative (3; 0% instances), det:nummod (2; 0% instances)
Children of ADJ
nodes belong to 16 different parts of speech: NOUN (27706; 22% instances), PUNCT (26097; 21% instances), AUX (18566; 15% instances), ADV (15508; 13% instances), ADJ (7858; 6% instances), CCONJ (7439; 6% instances), VERB (6285; 5% instances), SCONJ (3530; 3% instances), PROPN (2773; 2% instances), DET (2430; 2% instances), PRON (2085; 2% instances), ADP (1882; 2% instances), NUM (1018; 1% instances), PART (579; 0% instances), SYM (19; 0% instances), INTJ (5; 0% instances)