Treebank Statistics: UD_Czech: Features: Number
This feature is universal.
It occurs with 3 different values: Dual, Plur, Sing.
Some words have combined values of the feature; 1 combinations have been observed: Plur|Sing.
This is a layered feature with the following layers: Number, Number[psor].
834248 tokens (55%) have a non-empty value of Number.
129500 types (101%) occur at least once with a non-empty value of Number.
49112 lemmas (84%) occur at least once with a non-empty value of Number.
The feature is used with 8 part-of-speech tags: NOUN (363302; 24% instances), ADJ (184587; 12% instances), VERB (111091; 7% instances), PROPN (68761; 5% instances), DET (49586; 3% instances), AUX (31663; 2% instances), PRON (13609; 1% instances), NUM (11649; 1% instances).
NOUN
363302 NOUN tokens (98% of all NOUN tokens) have a non-empty value of Number.
The most frequent other feature values with which NOUN and Number co-occurred: Polarity=Pos (362738; 100%), Animacy=EMPTY (203009; 56%).
NOUN tokens may have the following values of Number:
Dual(81; 0% of non-emptyNumber): očima, rukama, nohama, ušimaPlur(103375; 28% of non-emptyNumber): korun, let, procent, lidí, letech, lidé, milionů, miliónů, zemí, dolarůSing(259846; 72% of non-emptyNumber): roku, roce, době, případě, společnosti, zákona, rok, ministr, vláda, stranyEMPTY(9064): Kč, s, r, p, m, tel, c, č, km, b
| Paradigm ruka | Sing | Dual | Plur |
|---|---|---|---|
| Case=Acc | ruku | ruce | |
| Case=Dat | ruce | ||
| Case=Gen | ruky | rukou | |
| Case=Ins | rukou | rukama | |
| Case=Loc | ruce | rukou, rukách | |
| Case=Nom | ruka | ruce |
ADJ
184587 ADJ tokens (98% of all ADJ tokens) have a non-empty value of Number.
The most frequent other feature values with which ADJ and Number co-occurred: Polarity=Pos (172448; 93%), Degree=Pos (153949; 83%), Animacy=EMPTY (109074; 59%).
ADJ tokens may have the following values of Number:
Dual(24; 0% of non-emptyNumber): zavřenýma, otevřenýma, Sudetoněmeckýma, dlouhýma, filmovýma, holýma, odřenýma, oteklýma, plnýma, prázdnýmaPlur(56301; 31% of non-emptyNumber): další, dalších, českých, posledních, nové, jiných, nových, jednotlivých, různých, zahraničníchPlur,Sing(2554; 1% of non-emptyNumber): připravena, schopna, otevřena, uzavřena, založena, zahájena, stanovena, určena, podepsána, rádaSing(125708; 68% of non-emptyNumber): první, české, další, druhé, poslední, státní, možné, třeba, česká, vlastníEMPTY(4598): tzv, New, a, the, čs, česko, open, sv, RM, US
| Paradigm otevřený | Plur,Sing | Sing | Dual | Plur |
|---|---|---|---|---|
| Animacy=Anim|Case=Nom|Degree=Pos|Gender=Masc | otevřený | |||
| Animacy=Anim|Gender=Masc|Variant=Short|VerbForm=Part|Voice=Pass | otevřeni | |||
| Animacy=Inan|Case=Acc|Degree=Pos|Gender=Masc | otevřený | otevřené | ||
| Animacy=Inan|Case=Acc|Degree=Cmp|Gender=Masc | otevřenější | |||
| Animacy=Inan|Case=Dat|Degree=Pos|Gender=Masc | otevřeným | |||
| Animacy=Inan|Case=Gen|Degree=Pos|Gender=Masc | otevřeného | otevřených | ||
| Animacy=Inan|Case=Ins|Degree=Pos|Gender=Masc | otevřeným | |||
| Animacy=Inan|Case=Loc|Degree=Pos|Gender=Masc | otevřeném | |||
| Animacy=Inan|Case=Nom|Degree=Pos|Gender=Masc | otevřený | |||
| Animacy=Inan|Case=Nom|Degree=Cmp|Gender=Masc | otevřenější | |||
| Animacy=Inan|Gender=Fem,Masc|Variant=Short|VerbForm=Part|Voice=Pass | otevřeny | |||
| Case=Acc|Degree=Pos|Gender=Fem | otevřenou | otevřené | ||
| Case=Acc|Degree=Pos|Gender=Neut | otevřené | otevřená | ||
| Case=Acc|Degree=Cmp|Gender=Neut | otevřenější | |||
| Case=Dat|Degree=Pos|Gender=Fem | otevřené | |||
| Case=Dat|Degree=Pos|Gender=Neut | otevřenému | |||
| Case=Gen|Degree=Pos|Gender=Fem | otevřené | otevřených | ||
| Case=Gen|Degree=Pos|Gender=Neut | otevřeného | |||
| Case=Ins|Degree=Pos|Gender=Fem | otevřenou | otevřenýma | otevřenými | |
| Case=Ins|Degree=Pos|Gender=Neut | otevřeným | otevřenými | ||
| Case=Loc|Degree=Pos|Gender=Fem | otevřené | otevřených | ||
| Case=Loc|Degree=Pos|Gender=Neut | otevřeném | |||
| Case=Nom|Degree=Pos|Gender=Fem | otevřená | otevřené | ||
| Case=Nom|Degree=Pos|Gender=Neut | otevřené | otevřená | ||
| Case=Nom|Degree=Cmp|Gender=Fem | otevřenější | otevřenější | ||
| Gender=Masc|Variant=Short|VerbForm=Part|Voice=Pass | otevřen | |||
| Gender=Fem,Neut|Variant=Short|VerbForm=Part|Voice=Pass | otevřena | |||
| Gender=Neut|Variant=Short|VerbForm=Part|Voice=Pass | otevřeno |
VERB
111091 VERB tokens (82% of all VERB tokens) have a non-empty value of Number.
The most frequent other feature values with which VERB and Number co-occurred: Voice=Act (110205; 99%), Polarity=Pos (99260; 89%), Gender=EMPTY (60749; 55%), VerbForm=Fin (60731; 55%), Mood=Ind (59845; 54%), Tense=Pres (59397; 53%).
VERB tokens may have the following values of Number:
Plur(31746; 29% of non-emptyNumber): mají, jsou, mohou, měli, měly, máme, mohli, můžeme, nemají, chtějíPlur,Sing(9551; 9% of non-emptyNumber): měla, mohla, byla, stala, začala, získala, musela, vznikla, oznámila, rozhodlaSing(69794; 63% of non-emptyNumber): má, je, může, řekl, měl, jde, musí, lze, uvedl, říkáEMPTY(24419): mít, získat, stát, být, hrát, říci, platit, muset, dělat, dostat
| Paradigm mít | Plur,Sing | Sing | Plur |
|---|---|---|---|
| Animacy=Anim|Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměli | ||
| Animacy=Anim|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měli | ||
| Animacy=Inan|Gender=Fem,Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměly | ||
| Animacy=Inan|Gender=Fem,Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měly | ||
| Aspect=Imp|Gender=Masc|Polarity=Neg|Tense=Pres|VerbForm=Conv|Voice=Act | nemaje | ||
| Aspect=Imp|Gender=Masc|Polarity=Pos|Tense=Pres|VerbForm=Conv|Voice=Act | maje | ||
| Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměl | ||
| Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měl | ||
| Gender=Fem,Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměla | ||
| Gender=Fem,Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měla | ||
| Gender=Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nemělo | ||
| Gender=Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | mělo | ||
| Mood=Imp|Person=1|Polarity=Neg|VerbForm=Fin | Nemějme | ||
| Mood=Imp|Person=1|Polarity=Pos|VerbForm=Fin | mějme | ||
| Mood=Imp|Person=2|Polarity=Pos|VerbForm=Fin | mějte | ||
| Mood=Ind|Person=1|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nemám | nemáme | |
| Mood=Ind|Person=1|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | mám | máme | |
| Mood=Ind|Person=2|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nemáte | ||
| Mood=Ind|Person=2|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | máš | máte | |
| Mood=Ind|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nemá | nemají | |
| Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | má | mají |
PROPN
68761 PROPN tokens (82% of all PROPN tokens) have a non-empty value of Number.
The most frequent other feature values with which PROPN and Number co-occurred: Polarity=Pos (68761; 100%), Abbr=EMPTY (67938; 99%), Gender=Masc (44970; 65%), Case=Nom (37791; 55%), Animacy=Anim (34755; 51%).
PROPN tokens may have the following values of Number:
Plur(5579; 8% of non-emptyNumber): LN, USA, Čechách, Němci, Čech, Češi, ČEZ, Němců, Vítkovice, BudějoviceSing(63182; 92% of non-emptyNumber): Praha, Praze, Jiří, Jan, Evropy, Brno, Prahy, Václav, Jana, PetrEMPTY(15270): ČR, ODS, J, OSN, ODA, M, ČSFR, V, A, SR
| Paradigm Jan | Sing | Plur |
|---|---|---|
| Case=Acc | Jana | Jany |
| Case=Dat | Janu, Janovi | |
| Case=Gen | Jana, JANA | Janů |
| Case=Ins | Janem | |
| Case=Loc | Janu, Janovi | |
| Case=Nom | Jan, JAN | Janové |
Number seems to be lexical feature of PROPN. 98% lemmas (12972) occur only with one value of Number.
DET
49586 DET tokens (88% of all DET tokens) have a non-empty value of Number.
The most frequent other feature values with which DET and Number co-occurred: Person=EMPTY (45202; 91%), Number[psor]=EMPTY (45202; 91%), Animacy=EMPTY (42599; 86%), Poss=EMPTY (40302; 81%).
DET tokens may have the following values of Number:
Dual(4; 0% of non-emptyNumber): jejíma, svýma, těmaPlur(13372; 27% of non-emptyNumber): které, kteří, všechny, všech, těchto, své, tyto, svých, některé, některýchSing(36210; 73% of non-emptyNumber): to, který, která, tím, tom, této, které, tomu, tento, svéEMPTY(6879): jeho, jejich, několik, několika, mnoho, jejichž, mnoha, kolik, jehož, tolik
| Paradigm ten | Sing | Dual | Plur |
|---|---|---|---|
| Abbr=Yes|Case=Nom|Gender=Neut | t | ||
| Animacy=Anim|Case=Acc|Gender=Masc | toho | ty | |
| Animacy=Anim|Case=Nom|Gender=Masc | ti | ||
| Animacy=Inan|Case=Acc|Gender=Masc | ten | ty | |
| Animacy=Inan|Case=Nom|Gender=Masc | ty | ||
| Case=Acc|Gender=Fem | tu | ty | |
| Case=Acc|Gender=Neut | to | ta | |
| Case=Dat|Gender=Masc,Neut | tomu | ||
| Case=Dat|Gender=Fem | té | ||
| Case=Dat | těm | ||
| Case=Gen|Gender=Masc,Neut | toho | ||
| Case=Gen|Gender=Fem | té | ||
| Case=Gen | těch | ||
| Case=Ins|Gender=Masc,Neut | tím | ||
| Case=Ins|Gender=Fem | tou | těma | |
| Case=Ins | těmi | ||
| Case=Loc|Gender=Masc,Neut | tom | ||
| Case=Loc|Gender=Fem | té | ||
| Case=Loc | těch | ||
| Case=Nom|Gender=Masc | ten | ||
| Case=Nom|Gender=Fem | ta | ty | |
| Case=Nom|Gender=Neut | to, ten | ta | |
| Case=Nom|Gender=Neut|Style=Coll | ty |
AUX
31663 AUX tokens (76% of all AUX tokens) have a non-empty value of Number.
The most frequent other feature values with which AUX and Number co-occurred: Voice=Act (30553; 96%), Polarity=Pos (27599; 87%), Gender=EMPTY (24884; 79%), VerbForm=Fin (24880; 79%), Mood=Ind (23770; 75%), Person=3 (19844; 63%), Tense=Pres (19272; 61%).
AUX tokens may have the following values of Number:
Plur(8394; 27% of non-emptyNumber): jsou, jsme, budou, byly, bychom, byli, nejsou, jste, budeme, nebudouPlur,Sing(1579; 5% of non-emptyNumber): byla, nebyla, bývala, nebývalaSing(21690; 69% of non-emptyNumber): je, bude, byl, jsem, bylo, není, bych, nebude, nebyl, nebyloEMPTY(9730): by, být, býti, nebýt
| Paradigm být | Plur,Sing | Sing | Plur |
|---|---|---|---|
| Animacy=Anim|Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyli | ||
| Animacy=Anim|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byli | ||
| Animacy=Inan|Gender=Fem,Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyly | ||
| Animacy=Inan|Gender=Fem,Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byly | ||
| Aspect=Imp|Gender=Masc|Polarity=Pos|Tense=Pres|VerbForm=Conv|Voice=Act | jsa | ||
| Aspect=Imp|Gender=Fem,Neut|Polarity=Pos|Tense=Pres|VerbForm=Conv|Voice=Act | jsouc | ||
| Aspect=Imp|Polarity=Pos|Tense=Pres|VerbForm=Conv|Voice=Act | jsouce | ||
| Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyl | ||
| Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byl | ||
| Gender=Fem,Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyla | ||
| Gender=Fem,Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byla | ||
| Gender=Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebylo | ||
| Gender=Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bylo | ||
| Mood=Cnd|Person=1|VerbForm=Fin | bych | bychom | |
| Mood=Cnd|Person=2|VerbForm=Fin | bys | byste | |
| Mood=Imp|Person=1|Polarity=Pos|VerbForm=Fin | Buďme | ||
| Mood=Imp|Person=2|Polarity=Neg|VerbForm=Fin | Nebuďte | ||
| Mood=Imp|Person=2|Polarity=Pos|VerbForm=Fin | buď | buďte | |
| Mood=Imp|Person=3|Polarity=Pos|Style=Arch|VerbForm=Fin | buď | budiž | |
| Mood=Imp|Person=3|Polarity=Pos|VerbForm=Fin | budiž | ||
| Mood=Ind|Person=1|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebudu | nebudeme | |
| Mood=Ind|Person=1|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nejsem | nejsme | |
| Mood=Ind|Person=1|Polarity=Pos|Style=Coll|Tense=Fut|VerbForm=Fin|Voice=Act | budem | ||
| Mood=Ind|Person=1|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | budu | budeme | |
| Mood=Ind|Person=1|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | jsem | jsme | |
| Mood=Ind|Person=2|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | Nebudeš | nebudete | |
| Mood=Ind|Person=2|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nejste | ||
| Mood=Ind|Person=2|Polarity=Pos|Style=Coll|Tense=Pres|VerbForm=Fin|Voice=Act | si | ||
| Mood=Ind|Person=2|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | budeš | budete | |
| Mood=Ind|Person=2|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | jsi | jste | |
| Mood=Ind|Person=3|Polarity=Neg|Style=Arch|Tense=Pres|VerbForm=Fin|Voice=Act | nésó | ||
| Mood=Ind|Person=3|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebude | nebudou | |
| Mood=Ind|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | není | nejsou | |
| Mood=Ind|Person=3|Polarity=Pos|Style=Arch|Tense=Pres|VerbForm=Fin|Voice=Act | jest | ||
| Mood=Ind|Person=3|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | bude | budou | |
| Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | je | jsou |
PRON
13609 PRON tokens (30% of all PRON tokens) have a non-empty value of Number.
The most frequent other feature values with which PRON and Number co-occurred: Reflex=EMPTY (13609; 100%), Variant=EMPTY (11591; 85%), PronType=Prs (11129; 82%), PrepCase=EMPTY (8684; 64%), Gender=EMPTY (7289; 54%), Person=3 (7277; 53%).
PRON tokens may have the following values of Number:
Plur(6227; 46% of non-emptyNumber): nás, je, nám, nich, jim, nichž, my, jich, nimi, něSing(7382; 54% of non-emptyNumber): mu, ji, ho, mi, ní, něj, jej, níž, já, měEMPTY(31316): se, si, co, kdo, což, nic, něco, nikdo, sebe, někdo
| Paradigm on | Sing | Plur |
|---|---|---|
| Animacy=Anim|Case=Nom|Gender=Masc | oni | |
| Animacy=Inan|Case=Nom|Gender=Masc | ony | |
| Case=Acc|Gender=Masc,Neut|PrepCase=Pre | něj, něho | |
| Case=Acc|Gender=Masc,Neut|Style=Arch | jej | |
| Case=Acc|Gender=Masc,Neut|Variant=Short | ho | |
| Case=Acc|Gender=Masc | jeho | |
| Case=Acc|Gender=Fem|PrepCase=Pre | ni | |
| Case=Acc|Gender=Fem|PrepCase=Pre|Style=Coll | ní | |
| Case=Acc|Gender=Fem | ji, jí | |
| Case=Acc|Gender=Neut|PrepCase=Pre | ně | |
| Case=Acc|Gender=Neut | je | |
| Case=Acc|PrepCase=Pre | ně | |
| Case=Acc | je | |
| Case=Dat|Gender=Masc,Neut|PrepCase=Pre | němu | |
| Case=Dat|Gender=Masc,Neut | jemu | |
| Case=Dat|Gender=Masc,Neut|Variant=Short | mu | |
| Case=Dat|Gender=Fem|PrepCase=Pre | ní | |
| Case=Dat|Gender=Fem | jí, ji | |
| Case=Dat|PrepCase=Pre | nim | |
| Case=Dat | jim | |
| Case=Gen|Gender=Masc,Neut|PrepCase=Pre | něj, něho | |
| Case=Gen|Gender=Masc,Neut | jej | |
| Case=Gen|Gender=Masc,Neut|Variant=Short | ho | |
| Case=Gen|Gender=Masc | jeho | |
| Case=Gen|Gender=Fem|PrepCase=Pre | ní | |
| Case=Gen|Gender=Fem | jí | |
| Case=Gen|PrepCase=Pre | nich | |
| Case=Gen | jich | |
| Case=Ins|Gender=Masc,Neut|PrepCase=Pre | ním | |
| Case=Ins|Gender=Masc,Neut | jím | |
| Case=Ins|Gender=Fem|PrepCase=Pre | ní | |
| Case=Ins|Gender=Fem | jí | |
| Case=Ins|PrepCase=Pre | nimi | |
| Case=Ins | jimi | |
| Case=Loc|Gender=Masc,Neut|PrepCase=Pre | něm | |
| Case=Loc|Gender=Fem|PrepCase=Pre | ní | |
| Case=Loc|PrepCase=Pre | nich | |
| Case=Nom|Gender=Masc | on | |
| Case=Nom|Gender=Fem | ona | ony |
| Case=Nom|Gender=Neut | ono |
NUM
11649 NUM tokens (28% of all NUM tokens) have a non-empty value of Number.
The most frequent other feature values with which NUM and Number co-occurred: NumForm=Word (11307; 97%), NumType=Card (11307; 97%), NumValue=1,2,3 (8050; 69%), Gender=EMPTY (6890; 59%).
NUM tokens may have the following values of Number:
Dual(27; 0% of non-emptyNumber): oběma, dvěma, čtyřmaPlur(6148; 53% of non-emptyNumber): dva, tři, dvě, dvou, čtyři, obou, oba, tří, pěti, oběSing(5474; 47% of non-emptyNumber): jeden, tisíc, pět, jednoho, jedné, jedna, jednu, deset, jedním, šestEMPTY(29858): 1, 2, 3, 4, 6, 5, 1992, 10, 1994, 1993
| Paradigm dva | Dual | Plur |
|---|---|---|
| Case=Acc|Gender=Masc | dva | |
| Case=Acc|Gender=Fem,Neut | dvě | |
| Case=Dat | dvěma | |
| Case=Gen | dvou | |
| Case=Ins|Gender=Fem | dvěma | |
| Case=Ins | dvěma | |
| Case=Loc | dvou | |
| Case=Nom|Gender=Masc | dva | |
| Case=Nom|Gender=Fem,Neut | dvě |
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number:
NOUN –[amod]–> ADJ (147785; 98%),
NOUN –[nmod]–> NOUN (67169; 61%),
VERB –[nsubj]–> NOUN (35612; 81%),
NOUN –[det]–> DET (23388; 82%),
NOUN –[conj]–> NOUN (16967; 78%),
NOUN –[nmod]–> PROPN (11931; 53%),
PROPN –[flat]–> PROPN (10798; 82%),
VERB –[nsubj]–> PROPN (10134; 75%),
ADJ –[cop]–> AUX (9996; 86%),
VERB –[conj]–> VERB (9686; 72%).