Treebank Statistics: UD_Czech: Features: Number
This feature is universal.
It occurs with 3 different values: Dual
, Plur
, Sing
.
Some words have combined values of the feature; 1 combinations have been observed: Plur|Sing
.
This is a layered feature with the following layers: Number, Number[psor].
834248 tokens (55%) have a non-empty value of Number
.
129500 types (101%) occur at least once with a non-empty value of Number
.
49112 lemmas (84%) occur at least once with a non-empty value of Number
.
The feature is used with 8 part-of-speech tags: NOUN (363302; 24% instances), ADJ (184587; 12% instances), VERB (111091; 7% instances), PROPN (68761; 5% instances), DET (49586; 3% instances), AUX (31663; 2% instances), PRON (13609; 1% instances), NUM (11649; 1% instances).
NOUN
363302 NOUN tokens (98% of all NOUN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NOUN
and Number
co-occurred: Polarity=Pos (362738; 100%), Animacy=EMPTY (203009; 56%).
NOUN
tokens may have the following values of Number
:
Dual
(81; 0% of non-emptyNumber
): očima, rukama, nohama, ušimaPlur
(103375; 28% of non-emptyNumber
): korun, let, procent, lidí, letech, lidé, milionů, miliónů, zemí, dolarůSing
(259846; 72% of non-emptyNumber
): roku, roce, době, případě, společnosti, zákona, rok, ministr, vláda, stranyEMPTY
(9064): Kč, s, r, p, m, tel, c, č, km, b
Paradigm ruka | Sing | Dual | Plur |
---|---|---|---|
Case=Acc | ruku | ruce | |
Case=Dat | ruce | ||
Case=Gen | ruky | rukou | |
Case=Ins | rukou | rukama | |
Case=Loc | ruce | rukou, rukách | |
Case=Nom | ruka | ruce |
ADJ
184587 ADJ tokens (98% of all ADJ
tokens) have a non-empty value of Number
.
The most frequent other feature values with which ADJ
and Number
co-occurred: Polarity=Pos (172448; 93%), Degree=Pos (153949; 83%), Animacy=EMPTY (109074; 59%).
ADJ
tokens may have the following values of Number
:
Dual
(24; 0% of non-emptyNumber
): zavřenýma, otevřenýma, Sudetoněmeckýma, dlouhýma, filmovýma, holýma, odřenýma, oteklýma, plnýma, prázdnýmaPlur
(56301; 31% of non-emptyNumber
): další, dalších, českých, posledních, nové, jiných, nových, jednotlivých, různých, zahraničníchPlur,Sing
(2554; 1% of non-emptyNumber
): připravena, schopna, otevřena, uzavřena, založena, zahájena, stanovena, určena, podepsána, rádaSing
(125708; 68% of non-emptyNumber
): první, české, další, druhé, poslední, státní, možné, třeba, česká, vlastníEMPTY
(4598): tzv, New, a, the, čs, česko, open, sv, RM, US
Paradigm otevřený | Plur,Sing | Sing | Dual | Plur |
---|---|---|---|---|
Animacy=Anim|Case=Nom|Degree=Pos|Gender=Masc | otevřený | |||
Animacy=Anim|Gender=Masc|Variant=Short|VerbForm=Part|Voice=Pass | otevřeni | |||
Animacy=Inan|Case=Acc|Degree=Pos|Gender=Masc | otevřený | otevřené | ||
Animacy=Inan|Case=Acc|Degree=Cmp|Gender=Masc | otevřenější | |||
Animacy=Inan|Case=Dat|Degree=Pos|Gender=Masc | otevřeným | |||
Animacy=Inan|Case=Gen|Degree=Pos|Gender=Masc | otevřeného | otevřených | ||
Animacy=Inan|Case=Ins|Degree=Pos|Gender=Masc | otevřeným | |||
Animacy=Inan|Case=Loc|Degree=Pos|Gender=Masc | otevřeném | |||
Animacy=Inan|Case=Nom|Degree=Pos|Gender=Masc | otevřený | |||
Animacy=Inan|Case=Nom|Degree=Cmp|Gender=Masc | otevřenější | |||
Animacy=Inan|Gender=Fem,Masc|Variant=Short|VerbForm=Part|Voice=Pass | otevřeny | |||
Case=Acc|Degree=Pos|Gender=Fem | otevřenou | otevřené | ||
Case=Acc|Degree=Pos|Gender=Neut | otevřené | otevřená | ||
Case=Acc|Degree=Cmp|Gender=Neut | otevřenější | |||
Case=Dat|Degree=Pos|Gender=Fem | otevřené | |||
Case=Dat|Degree=Pos|Gender=Neut | otevřenému | |||
Case=Gen|Degree=Pos|Gender=Fem | otevřené | otevřených | ||
Case=Gen|Degree=Pos|Gender=Neut | otevřeného | |||
Case=Ins|Degree=Pos|Gender=Fem | otevřenou | otevřenýma | otevřenými | |
Case=Ins|Degree=Pos|Gender=Neut | otevřeným | otevřenými | ||
Case=Loc|Degree=Pos|Gender=Fem | otevřené | otevřených | ||
Case=Loc|Degree=Pos|Gender=Neut | otevřeném | |||
Case=Nom|Degree=Pos|Gender=Fem | otevřená | otevřené | ||
Case=Nom|Degree=Pos|Gender=Neut | otevřené | otevřená | ||
Case=Nom|Degree=Cmp|Gender=Fem | otevřenější | otevřenější | ||
Gender=Masc|Variant=Short|VerbForm=Part|Voice=Pass | otevřen | |||
Gender=Fem,Neut|Variant=Short|VerbForm=Part|Voice=Pass | otevřena | |||
Gender=Neut|Variant=Short|VerbForm=Part|Voice=Pass | otevřeno |
VERB
111091 VERB tokens (82% of all VERB
tokens) have a non-empty value of Number
.
The most frequent other feature values with which VERB
and Number
co-occurred: Voice=Act (110205; 99%), Polarity=Pos (99260; 89%), Gender=EMPTY (60749; 55%), VerbForm=Fin (60731; 55%), Mood=Ind (59845; 54%), Tense=Pres (59397; 53%).
VERB
tokens may have the following values of Number
:
Plur
(31746; 29% of non-emptyNumber
): mají, jsou, mohou, měli, měly, máme, mohli, můžeme, nemají, chtějíPlur,Sing
(9551; 9% of non-emptyNumber
): měla, mohla, byla, stala, začala, získala, musela, vznikla, oznámila, rozhodlaSing
(69794; 63% of non-emptyNumber
): má, je, může, řekl, měl, jde, musí, lze, uvedl, říkáEMPTY
(24419): mít, získat, stát, být, hrát, říci, platit, muset, dělat, dostat
Paradigm mít | Plur,Sing | Sing | Plur |
---|---|---|---|
Animacy=Anim|Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměli | ||
Animacy=Anim|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měli | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměly | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měly | ||
Aspect=Imp|Gender=Masc|Polarity=Neg|Tense=Pres|VerbForm=Conv|Voice=Act | nemaje | ||
Aspect=Imp|Gender=Masc|Polarity=Pos|Tense=Pres|VerbForm=Conv|Voice=Act | maje | ||
Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměl | ||
Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měl | ||
Gender=Fem,Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměla | ||
Gender=Fem,Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měla | ||
Gender=Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nemělo | ||
Gender=Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | mělo | ||
Mood=Imp|Person=1|Polarity=Neg|VerbForm=Fin | Nemějme | ||
Mood=Imp|Person=1|Polarity=Pos|VerbForm=Fin | mějme | ||
Mood=Imp|Person=2|Polarity=Pos|VerbForm=Fin | mějte | ||
Mood=Ind|Person=1|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nemám | nemáme | |
Mood=Ind|Person=1|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | mám | máme | |
Mood=Ind|Person=2|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nemáte | ||
Mood=Ind|Person=2|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | máš | máte | |
Mood=Ind|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nemá | nemají | |
Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | má | mají |
PROPN
68761 PROPN tokens (82% of all PROPN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PROPN
and Number
co-occurred: Polarity=Pos (68761; 100%), Abbr=EMPTY (67938; 99%), Gender=Masc (44970; 65%), Case=Nom (37791; 55%), Animacy=Anim (34755; 51%).
PROPN
tokens may have the following values of Number
:
Plur
(5579; 8% of non-emptyNumber
): LN, USA, Čechách, Němci, Čech, Češi, ČEZ, Němců, Vítkovice, BudějoviceSing
(63182; 92% of non-emptyNumber
): Praha, Praze, Jiří, Jan, Evropy, Brno, Prahy, Václav, Jana, PetrEMPTY
(15270): ČR, ODS, J, OSN, ODA, M, ČSFR, V, A, SR
Paradigm Jan | Sing | Plur |
---|---|---|
Case=Acc | Jana | Jany |
Case=Dat | Janu, Janovi | |
Case=Gen | Jana, JANA | Janů |
Case=Ins | Janem | |
Case=Loc | Janu, Janovi | |
Case=Nom | Jan, JAN | Janové |
Number
seems to be lexical feature of PROPN
. 98% lemmas (12972) occur only with one value of Number
.
DET
49586 DET tokens (88% of all DET
tokens) have a non-empty value of Number
.
The most frequent other feature values with which DET
and Number
co-occurred: Person=EMPTY (45202; 91%), Number[psor]=EMPTY (45202; 91%), Animacy=EMPTY (42599; 86%), Poss=EMPTY (40302; 81%).
DET
tokens may have the following values of Number
:
Dual
(4; 0% of non-emptyNumber
): jejíma, svýma, těmaPlur
(13372; 27% of non-emptyNumber
): které, kteří, všechny, všech, těchto, své, tyto, svých, některé, některýchSing
(36210; 73% of non-emptyNumber
): to, který, která, tím, tom, této, které, tomu, tento, svéEMPTY
(6879): jeho, jejich, několik, několika, mnoho, jejichž, mnoha, kolik, jehož, tolik
Paradigm ten | Sing | Dual | Plur |
---|---|---|---|
Abbr=Yes|Case=Nom|Gender=Neut | t | ||
Animacy=Anim|Case=Acc|Gender=Masc | toho | ty | |
Animacy=Anim|Case=Nom|Gender=Masc | ti | ||
Animacy=Inan|Case=Acc|Gender=Masc | ten | ty | |
Animacy=Inan|Case=Nom|Gender=Masc | ty | ||
Case=Acc|Gender=Fem | tu | ty | |
Case=Acc|Gender=Neut | to | ta | |
Case=Dat|Gender=Masc,Neut | tomu | ||
Case=Dat|Gender=Fem | té | ||
Case=Dat | těm | ||
Case=Gen|Gender=Masc,Neut | toho | ||
Case=Gen|Gender=Fem | té | ||
Case=Gen | těch | ||
Case=Ins|Gender=Masc,Neut | tím | ||
Case=Ins|Gender=Fem | tou | těma | |
Case=Ins | těmi | ||
Case=Loc|Gender=Masc,Neut | tom | ||
Case=Loc|Gender=Fem | té | ||
Case=Loc | těch | ||
Case=Nom|Gender=Masc | ten | ||
Case=Nom|Gender=Fem | ta | ty | |
Case=Nom|Gender=Neut | to, ten | ta | |
Case=Nom|Gender=Neut|Style=Coll | ty |
AUX
31663 AUX tokens (76% of all AUX
tokens) have a non-empty value of Number
.
The most frequent other feature values with which AUX
and Number
co-occurred: Voice=Act (30553; 96%), Polarity=Pos (27599; 87%), Gender=EMPTY (24884; 79%), VerbForm=Fin (24880; 79%), Mood=Ind (23770; 75%), Person=3 (19844; 63%), Tense=Pres (19272; 61%).
AUX
tokens may have the following values of Number
:
Plur
(8394; 27% of non-emptyNumber
): jsou, jsme, budou, byly, bychom, byli, nejsou, jste, budeme, nebudouPlur,Sing
(1579; 5% of non-emptyNumber
): byla, nebyla, bývala, nebývalaSing
(21690; 69% of non-emptyNumber
): je, bude, byl, jsem, bylo, není, bych, nebude, nebyl, nebyloEMPTY
(9730): by, být, býti, nebýt
Paradigm být | Plur,Sing | Sing | Plur |
---|---|---|---|
Animacy=Anim|Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyli | ||
Animacy=Anim|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byli | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyly | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byly | ||
Aspect=Imp|Gender=Masc|Polarity=Pos|Tense=Pres|VerbForm=Conv|Voice=Act | jsa | ||
Aspect=Imp|Gender=Fem,Neut|Polarity=Pos|Tense=Pres|VerbForm=Conv|Voice=Act | jsouc | ||
Aspect=Imp|Polarity=Pos|Tense=Pres|VerbForm=Conv|Voice=Act | jsouce | ||
Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyl | ||
Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byl | ||
Gender=Fem,Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyla | ||
Gender=Fem,Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byla | ||
Gender=Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebylo | ||
Gender=Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bylo | ||
Mood=Cnd|Person=1|VerbForm=Fin | bych | bychom | |
Mood=Cnd|Person=2|VerbForm=Fin | bys | byste | |
Mood=Imp|Person=1|Polarity=Pos|VerbForm=Fin | Buďme | ||
Mood=Imp|Person=2|Polarity=Neg|VerbForm=Fin | Nebuďte | ||
Mood=Imp|Person=2|Polarity=Pos|VerbForm=Fin | buď | buďte | |
Mood=Imp|Person=3|Polarity=Pos|Style=Arch|VerbForm=Fin | buď | budiž | |
Mood=Imp|Person=3|Polarity=Pos|VerbForm=Fin | budiž | ||
Mood=Ind|Person=1|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebudu | nebudeme | |
Mood=Ind|Person=1|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nejsem | nejsme | |
Mood=Ind|Person=1|Polarity=Pos|Style=Coll|Tense=Fut|VerbForm=Fin|Voice=Act | budem | ||
Mood=Ind|Person=1|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | budu | budeme | |
Mood=Ind|Person=1|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | jsem | jsme | |
Mood=Ind|Person=2|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | Nebudeš | nebudete | |
Mood=Ind|Person=2|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nejste | ||
Mood=Ind|Person=2|Polarity=Pos|Style=Coll|Tense=Pres|VerbForm=Fin|Voice=Act | si | ||
Mood=Ind|Person=2|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | budeš | budete | |
Mood=Ind|Person=2|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | jsi | jste | |
Mood=Ind|Person=3|Polarity=Neg|Style=Arch|Tense=Pres|VerbForm=Fin|Voice=Act | nésó | ||
Mood=Ind|Person=3|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebude | nebudou | |
Mood=Ind|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | není | nejsou | |
Mood=Ind|Person=3|Polarity=Pos|Style=Arch|Tense=Pres|VerbForm=Fin|Voice=Act | jest | ||
Mood=Ind|Person=3|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | bude | budou | |
Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | je | jsou |
PRON
13609 PRON tokens (30% of all PRON
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PRON
and Number
co-occurred: Reflex=EMPTY (13609; 100%), Variant=EMPTY (11591; 85%), PronType=Prs (11129; 82%), PrepCase=EMPTY (8684; 64%), Gender=EMPTY (7289; 54%), Person=3 (7277; 53%).
PRON
tokens may have the following values of Number
:
Plur
(6227; 46% of non-emptyNumber
): nás, je, nám, nich, jim, nichž, my, jich, nimi, něSing
(7382; 54% of non-emptyNumber
): mu, ji, ho, mi, ní, něj, jej, níž, já, měEMPTY
(31316): se, si, co, kdo, což, nic, něco, nikdo, sebe, někdo
Paradigm on | Sing | Plur |
---|---|---|
Animacy=Anim|Case=Nom|Gender=Masc | oni | |
Animacy=Inan|Case=Nom|Gender=Masc | ony | |
Case=Acc|Gender=Masc,Neut|PrepCase=Pre | něj, něho | |
Case=Acc|Gender=Masc,Neut|Style=Arch | jej | |
Case=Acc|Gender=Masc,Neut|Variant=Short | ho | |
Case=Acc|Gender=Masc | jeho | |
Case=Acc|Gender=Fem|PrepCase=Pre | ni | |
Case=Acc|Gender=Fem|PrepCase=Pre|Style=Coll | ní | |
Case=Acc|Gender=Fem | ji, jí | |
Case=Acc|Gender=Neut|PrepCase=Pre | ně | |
Case=Acc|Gender=Neut | je | |
Case=Acc|PrepCase=Pre | ně | |
Case=Acc | je | |
Case=Dat|Gender=Masc,Neut|PrepCase=Pre | němu | |
Case=Dat|Gender=Masc,Neut | jemu | |
Case=Dat|Gender=Masc,Neut|Variant=Short | mu | |
Case=Dat|Gender=Fem|PrepCase=Pre | ní | |
Case=Dat|Gender=Fem | jí, ji | |
Case=Dat|PrepCase=Pre | nim | |
Case=Dat | jim | |
Case=Gen|Gender=Masc,Neut|PrepCase=Pre | něj, něho | |
Case=Gen|Gender=Masc,Neut | jej | |
Case=Gen|Gender=Masc,Neut|Variant=Short | ho | |
Case=Gen|Gender=Masc | jeho | |
Case=Gen|Gender=Fem|PrepCase=Pre | ní | |
Case=Gen|Gender=Fem | jí | |
Case=Gen|PrepCase=Pre | nich | |
Case=Gen | jich | |
Case=Ins|Gender=Masc,Neut|PrepCase=Pre | ním | |
Case=Ins|Gender=Masc,Neut | jím | |
Case=Ins|Gender=Fem|PrepCase=Pre | ní | |
Case=Ins|Gender=Fem | jí | |
Case=Ins|PrepCase=Pre | nimi | |
Case=Ins | jimi | |
Case=Loc|Gender=Masc,Neut|PrepCase=Pre | něm | |
Case=Loc|Gender=Fem|PrepCase=Pre | ní | |
Case=Loc|PrepCase=Pre | nich | |
Case=Nom|Gender=Masc | on | |
Case=Nom|Gender=Fem | ona | ony |
Case=Nom|Gender=Neut | ono |
NUM
11649 NUM tokens (28% of all NUM
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NUM
and Number
co-occurred: NumForm=Word (11307; 97%), NumType=Card (11307; 97%), NumValue=1,2,3 (8050; 69%), Gender=EMPTY (6890; 59%).
NUM
tokens may have the following values of Number
:
Dual
(27; 0% of non-emptyNumber
): oběma, dvěma, čtyřmaPlur
(6148; 53% of non-emptyNumber
): dva, tři, dvě, dvou, čtyři, obou, oba, tří, pěti, oběSing
(5474; 47% of non-emptyNumber
): jeden, tisíc, pět, jednoho, jedné, jedna, jednu, deset, jedním, šestEMPTY
(29858): 1, 2, 3, 4, 6, 5, 1992, 10, 1994, 1993
Paradigm dva | Dual | Plur |
---|---|---|
Case=Acc|Gender=Masc | dva | |
Case=Acc|Gender=Fem,Neut | dvě | |
Case=Dat | dvěma | |
Case=Gen | dvou | |
Case=Ins|Gender=Fem | dvěma | |
Case=Ins | dvěma | |
Case=Loc | dvou | |
Case=Nom|Gender=Masc | dva | |
Case=Nom|Gender=Fem,Neut | dvě |
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number
:
NOUN –[amod]–> ADJ (147785; 98%),
NOUN –[nmod]–> NOUN (67169; 61%),
VERB –[nsubj]–> NOUN (35612; 81%),
NOUN –[det]–> DET (23388; 82%),
NOUN –[conj]–> NOUN (16967; 78%),
NOUN –[nmod]–> PROPN (11931; 53%),
PROPN –[flat]–> PROPN (10798; 82%),
VERB –[nsubj]–> PROPN (10134; 75%),
ADJ –[cop]–> AUX (9996; 86%),
VERB –[conj]–> VERB (9686; 72%).