Treebank Statistics: UD_Czech-PUD: Features: Number
This feature is universal.
It occurs with 3 different values: Dual
, Plur
, Sing
.
Some words have combined values of the feature; 1 combinations have been observed: Plur|Sing
.
This is a layered feature with the following layers: Number, Number[psor].
10441 tokens (56%) have a non-empty value of Number
.
6632 types (88%) occur at least once with a non-empty value of Number
.
4305 lemmas (81%) occur at least once with a non-empty value of Number
.
The feature is used with 9 part-of-speech tags: NOUN (4321; 23% instances), ADJ (2245; 12% instances), VERB (1462; 8% instances), PROPN (903; 5% instances), DET (683; 4% instances), AUX (533; 3% instances), PRON (153; 1% instances), NUM (140; 1% instances), CCONJ (1; 0% instances).
NOUN
4321 NOUN tokens (96% of all NOUN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NOUN
and Number
co-occurred: Polarity=Pos (4313; 100%), Animacy=EMPTY (2412; 56%).
NOUN
tokens may have the following values of Number
:
Dual
(1; 0% of non-emptyNumber
): ušimaPlur
(1231; 28% of non-emptyNumber
): let, letech, lidí, dolarů, eur, liber, lidé, voleb, obyvatel, datSing
(3089; 71% of non-emptyNumber
): roce, roku, století, době, oblasti, l, moře, války, území, místoEMPTY
(161): DNA, GCA, MPS, Pebe, Really, m, my, t, A, AIDS
Paradigm rok | Sing | Plur |
---|---|---|
Animacy=Inan|Case=Acc|Gender=Masc | rok | roky |
Animacy=Inan|Case=Gen|Gender=Masc | roku, roka | |
Animacy=Inan|Case=Ins|Gender=Masc | rokem | |
Animacy=Inan|Case=Loc|Gender=Masc | roce, roku | |
Animacy=Inan|Case=Nom|Gender=Masc | rok | |
Case=Acc|Gender=Neut|Style=Arch | léta | |
Case=Gen|Gender=Neut | let | |
Case=Ins|Gender=Neut | lety | |
Case=Loc|Gender=Neut | letech |
ADJ
2245 ADJ tokens (98% of all ADJ
tokens) have a non-empty value of Number
.
The most frequent other feature values with which ADJ
and Number
co-occurred: Polarity=Pos (2076; 92%), VerbForm=EMPTY (1977; 88%), Voice=EMPTY (1977; 88%), Degree=Pos (1763; 79%), Animacy=EMPTY (1369; 61%).
ADJ
tokens may have the following values of Number
:
Dual
(1; 0% of non-emptyNumber
): nastraženýmaPlur
(718; 32% of non-emptyNumber
): další, nové, posledních, Spojených, různých, dalších, jiných, malé, nových, prvníPlur,Sing
(53; 2% of non-emptyNumber
): poražena, vytvořena, založena, chráněna, definována, dána, hlášena, kritizována, obviněna, odstraněnaSing
(1473; 66% of non-emptyNumber
): první, druhé, jižní, severní, další, hlavní, velká, každý, větší, novéEMPTY
(39): The, National, El, New, Saint, San, a, American, Beverly, Canadian
Paradigm známý | Plur,Sing | Sing | Plur |
---|---|---|---|
Animacy=Anim|Case=Nom|Degree=Sup|Gender=Masc|Polarity=Pos | nejznámější | ||
Animacy=Inan|Case=Acc|Degree=Pos|Gender=Masc|Polarity=Pos | známý | ||
Animacy=Inan|Case=Gen|Degree=Pos|Gender=Masc|Polarity=Pos | známých | ||
Animacy=Inan|Case=Nom|Degree=Pos|Gender=Masc|Polarity=Pos | známý | známé | |
Case=Nom|Degree=Pos|Gender=Fem|Polarity=Pos | známá | ||
Case=Nom|Degree=Pos|Gender=Neut|Polarity=Neg | neznámé | ||
Gender=Fem,Neut|Polarity=Pos|Variant=Short | známa | ||
Gender=Neut|Polarity=Pos|Variant=Short | známo |
VERB
1462 VERB tokens (83% of all VERB
tokens) have a non-empty value of Number
.
The most frequent other feature values with which VERB
and Number
co-occurred: Voice=Act (1460; 100%), Polarity=Pos (1369; 94%), Animacy=EMPTY (1274; 87%), Mood=EMPTY (889; 61%), Person=EMPTY (889; 61%), Tense=Past (887; 61%), VerbForm=Part (886; 61%).
VERB
tokens may have the following values of Number
:
Plur
(374; 26% of non-emptyNumber
): mohou, mají, měly, existují, jsou, mohli, musíme, musíte, měli, můžouPlur,Sing
(203; 14% of non-emptyNumber
): stala, uvedla, mohla, vedla, měla, ukázala, vydala, začala, řekla, umožnilaSing
(885; 61% of non-emptyNumber
): řekl, má, je, může, říká, mohl, měl, stal, lze, obsahujeEMPTY
(293): mít, vidět, získat, najít, opustit, pokračovat, stát, vést, dělat, muset
Paradigm mít | Plur,Sing | Sing | Plur |
---|---|---|---|
Animacy=Anim|Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part | neměli | ||
Animacy=Anim|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part | měli | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Pos|Tense=Past|VerbForm=Part | měly | ||
Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part | neměl | ||
Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part | měl | ||
Gender=Fem,Neut|Polarity=Neg|Tense=Past|VerbForm=Part | neměla | ||
Gender=Fem,Neut|Polarity=Pos|Tense=Past|VerbForm=Part | měla | ||
Gender=Neut|Polarity=Neg|Tense=Past|VerbForm=Part | nemělo | ||
Gender=Neut|Polarity=Pos|Tense=Past|VerbForm=Part | mělo | ||
Mood=Ind|Person=1|Polarity=Pos|Tense=Pres|VerbForm=Fin | máme | ||
Mood=Ind|Person=2|Polarity=Pos|Tense=Pres|VerbForm=Fin | máte | ||
Mood=Ind|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin | nemá | nemají | |
Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin | má | mají |
PROPN
903 PROPN tokens (83% of all PROPN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PROPN
and Number
co-occurred: Polarity=Pos (903; 100%), Foreign=EMPTY (857; 95%), Gender=Masc (604; 67%).
PROPN
tokens may have the following values of Number
:
Plur
(68; 8% of non-emptyNumber
): USA, Alpy, Andy, Australané, Mayové, News, Číňanů, Řekové, Židů, AboriginciSing
(835; 92% of non-emptyNumber
): Čína, Francie, Albánie, Británii, Clintonové, Evropě, Itálii, Trump, Trumpa, AmerikyEMPTY
(188): Čching, BBC, Danevirke, CNN, EU, Aviva, Bank, Brisbane, Company, Investors
Paradigm Andy | Sing | Plur |
---|---|---|
Animacy=Anim|Case=Dat|Gender=Masc|NameType=Giv | Andymu | |
Animacy=Anim|Case=Gen|Gender=Masc|NameType=Giv | Andyho | |
Case=Nom|Gender=Fem|NameType=Geo | Andy |
Number
seems to be lexical feature of PROPN
. 100% lemmas (635) occur only with one value of Number
.
DET
683 DET tokens (84% of all DET
tokens) have a non-empty value of Number
.
The most frequent other feature values with which DET
and Number
co-occurred: Gender[psor]=EMPTY (655; 96%), Number[psor]=EMPTY (628; 92%), Person=EMPTY (628; 92%), Animacy=EMPTY (597; 87%), Reflex=EMPTY (596; 87%), Poss=EMPTY (541; 79%).
DET
tokens may have the following values of Number
:
Plur
(180; 26% of non-emptyNumber
): které, kteří, své, tyto, svých, ty, těchto, která, někteří, všechSing
(503; 74% of non-emptyNumber
): to, který, která, toho, tím, její, tento, tohoto, své, totoEMPTY
(130): jeho, jejich, mnoho, několik, mnoha, jejichž, jehož, několika, tolik, kolika
Paradigm ten | Sing | Plur |
---|---|---|
Animacy=Anim|Case=Acc|Gender=Masc | ty | |
Animacy=Inan|Case=Acc|Gender=Masc | ten | |
Animacy=Inan|Case=Nom|Gender=Masc | ty | |
Case=Acc|Gender=Fem | ty | |
Case=Acc|Gender=Neut | to | |
Case=Dat|Gender=Masc,Neut | tomu | |
Case=Dat | těm | |
Case=Gen|Gender=Masc,Neut | toho | |
Case=Gen|Gender=Fem | té | |
Case=Gen | těch | |
Case=Ins|Gender=Masc,Neut | tím | |
Case=Ins|Gender=Fem | tou | |
Case=Ins | těmi | |
Case=Loc|Gender=Masc,Neut | tom | |
Case=Loc|Gender=Fem | té | |
Case=Nom|Gender=Masc | ten | |
Case=Nom|Gender=Fem | ta | ty |
Case=Nom|Gender=Neut | to |
AUX
533 AUX tokens (82% of all AUX
tokens) have a non-empty value of Number
.
The most frequent other feature values with which AUX
and Number
co-occurred: Voice=Act (529; 99%), Polarity=Pos (487; 91%), Gender=EMPTY (282; 53%), VerbForm=Fin (282; 53%), Mood=Ind (278; 52%).
AUX
tokens may have the following values of Number
:
Plur
(114; 21% of non-emptyNumber
): jsou, byly, byli, jsme, budou, nebyly, budeme, jste, nebudou, nejsouPlur,Sing
(51; 10% of non-emptyNumber
): byla, nebylaSing
(368; 69% of non-emptyNumber
): je, byl, bylo, bude, jsem, není, nebude, nebyl, budu, bychEMPTY
(115): by, být
Paradigm být | Plur,Sing | Sing | Plur |
---|---|---|---|
Animacy=Anim|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byli | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyly | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byly | ||
Aspect=Imp|Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | byl | ||
Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyl | ||
Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byl | ||
Gender=Fem,Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyla | ||
Gender=Fem,Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byla | ||
Gender=Fem|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byla | ||
Gender=Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebylo | ||
Gender=Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bylo | ||
Mood=Cnd|Person=1|VerbForm=Fin | bych | bychom | |
Mood=Cnd|Person=2|VerbForm=Fin | byste | ||
Mood=Ind|Person=1|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebudu | ||
Mood=Ind|Person=1|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | Nejsme | ||
Mood=Ind|Person=1|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | budu | budeme | |
Mood=Ind|Person=1|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | jsem | jsme | |
Mood=Ind|Person=2|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | jste | ||
Mood=Ind|Person=3|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebude | nebudou | |
Mood=Ind|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | není | nejsou | |
Mood=Ind|Person=3|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | bude | budou | |
Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | je | jsou |
PRON
153 PRON tokens (26% of all PRON
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PRON
and Number
co-occurred: Reflex=EMPTY (153; 100%), PronType=Prs (128; 84%), Variant=EMPTY (123; 80%), Person=3 (101; 66%), PrepCase=EMPTY (89; 58%).
PRON
tokens may have the following values of Number
:
Plur
(49; 32% of non-emptyNumber
): nich, jim, nimi, nás, je, nichž, nám, jich, ně, ježSing
(104; 68% of non-emptyNumber
): ho, ní, jí, mu, mě, ji, něj, ním, jenž, nížEMPTY
(425): se, si, co, což, nic, něco, kdo, někdo, sebe, sobě
Paradigm on | Sing | Plur |
---|---|---|
Animacy=Anim|Case=Nom|Gender=Masc | oni | |
Case=Acc|Gender=Masc,Neut|PrepCase=Pre | něj, něho, ho | |
Case=Acc|Gender=Masc,Neut|Variant=Short | ho | |
Case=Acc|Gender=Fem | ji | |
Case=Acc|Gender=Neut | je | |
Case=Acc|PrepCase=Pre | ně | |
Case=Acc | je | |
Case=Dat|Gender=Masc,Neut|PrepCase=Pre | němu | |
Case=Dat|Gender=Masc,Neut|Variant=Short | mu | |
Case=Dat|Gender=Fem | jí | |
Case=Dat | jim | |
Case=Gen|Gender=Masc,Neut|PrepCase=Pre | něj | |
Case=Gen|Gender=Fem|PrepCase=Pre | ní | |
Case=Gen|Gender=Fem | jí | |
Case=Gen|PrepCase=Pre | nich | |
Case=Gen | jich | |
Case=Ins|Gender=Masc,Neut|PrepCase=Pre | ním | |
Case=Ins|Gender=Masc,Neut | jím | |
Case=Ins|Gender=Fem|PrepCase=Pre | ní | |
Case=Ins|PrepCase=Pre | nimi | |
Case=Loc|Gender=Masc,Neut|PrepCase=Pre | něm | |
Case=Loc|Gender=Fem|PrepCase=Pre | ní | |
Case=Loc|PrepCase=Pre | nich | |
Case=Nom|Gender=Masc | on | |
Case=Nom|Gender=Fem | ona |
NUM
140 NUM tokens (31% of all NUM
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NUM
and Number
co-occurred: NumType=Card (140; 100%), NumForm=Word (140; 100%), NumValue=1,2,3 (102; 73%), Gender=EMPTY (78; 56%).
NUM
tokens may have the following values of Number
:
Plur
(82; 59% of non-emptyNumber
): dva, čtyři, dvou, dvě, dvěma, tři, oba, obou, šesti, desetiSing
(58; 41% of non-emptyNumber
): jedné, jeden, deset, jedna, jedním, jedno, jednoho, jednu, šest, devětEMPTY
(319): 1, 3, 20, 2014, 2015, 5, I, 10, 100, 1492
Paradigm deset | Sing | Plur |
---|---|---|
Case=Acc | deset | |
Case=Gen | deseti |
CCONJ
1 CCONJ tokens (0% of all CCONJ
tokens) have a non-empty value of Number
.
CCONJ
tokens may have the following values of Number
:
Sing
(1; 100% of non-emptyNumber
): iEMPTY
(660): a, ale, i, nebo, však, avšak, nicméně, až, ani, tedy
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number
:
NOUN –[amod]–> ADJ (1713; 99%),
NOUN –[nmod]–> NOUN (666; 60%),
VERB –[nsubj]–> NOUN (395; 73%),
NOUN –[det]–> DET (309; 78%),
NOUN –[conj]–> NOUN (192; 75%),
VERB –[nsubj]–> PROPN (179; 80%),
NOUN –[nmod]–> PROPN (168; 55%),
ADJ –[aux:pass]–> AUX (145; 89%),
VERB –[conj]–> VERB (133; 78%),
ADJ –[cop]–> AUX (128; 86%).