Treebank Statistics: UD_Czech-CAC: Features: Number
This feature is universal.
It occurs with 3 different values: Dual
, Plur
, Sing
.
Some words have combined values of the feature; 1 combinations have been observed: Plur|Sing
.
This is a layered feature with the following layers: Number, Number[psor].
287247 tokens (58%) have a non-empty value of Number
.
63358 types (101%) occur at least once with a non-empty value of Number
.
25882 lemmas (91%) occur at least once with a non-empty value of Number
.
The feature is used with 8 part-of-speech tags: NOUN (135047; 27% instances), ADJ (73929; 15% instances), VERB (32976; 7% instances), DET (17302; 3% instances), AUX (11901; 2% instances), PROPN (7864; 2% instances), PRON (5757; 1% instances), NUM (2471; 0% instances).
NOUN
135047 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NOUN
and Number
co-occurred: Polarity=Pos (134853; 100%), Animacy=EMPTY (79164; 59%).
NOUN
tokens may have the following values of Number
:
Dual
(25; 0% of non-emptyNumber
): očima, rukama, nohama, ušimaPlur
(39714; 29% of non-emptyNumber
): let, pracovníků, úkolů, výsledky, lidí, úkoly, podmínky, letech, lidé, práceSing
(95308; 71% of non-emptyNumber
): práce, roce, práci, roku, době, společnosti, oblasti, hlediska, činnosti, výrobyEMPTY
(1135): ÚV, ZV, ZO, JZD, Kčs, ONV, ÚR, MěstNV, BSP, BP
Paradigm ruka | Sing | Dual | Plur |
---|---|---|---|
Case=Acc | ruku | ruce | |
Case=Dat | ruce | ||
Case=Gen | ruky | rukou | |
Case=Ins | rukou | rukama | |
Case=Loc | ruce | rukou, rukách | |
Case=Nom | ruka | ruce |
ADJ
73929 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Number
.
The most frequent other feature values with which ADJ
and Number
co-occurred: Polarity=Pos (71064; 96%), Degree=Pos (62548; 85%), Animacy=EMPTY (44966; 61%).
ADJ
tokens may have the following values of Number
:
Dual
(7; 0% of non-emptyNumber
): holýma, jinýma, otevřenýma, plnýma, radostnýma, velkýma, zadnímaPlur
(25656; 35% of non-emptyNumber
): jednotlivých, různých, dalších, další, jiných, nové, výrobních, různé, nových, základníchPlur,Sing
(1143; 2% of non-emptyNumber
): věnována, dána, provedena, určena, zahájena, povinna, založena, dokončena, stanovena, vybudovánaSing
(47123; 64% of non-emptyNumber
): pracovní, první, možno, další, socialistické, druhé, základní, vlastní, národního, většíEMPTY
(293): Králové, elektro, marxisticko, fit, Karpatsko, teoreticko, online, rakousko, super, československo
Paradigm otevřený | Plur,Sing | Sing | Dual | Plur |
---|---|---|---|---|
Animacy=Inan|Case=Acc|Degree=Pos|Gender=Masc | otevřený | otevřené | ||
Animacy=Inan|Case=Gen|Degree=Pos|Gender=Masc | otevřeného | |||
Animacy=Inan|Case=Ins|Degree=Pos|Gender=Masc | otevřeným | otevřenými | ||
Animacy=Inan|Case=Nom|Degree=Pos|Gender=Masc | otevřený | otevřené | ||
Animacy=Inan|Gender=Fem,Masc|Variant=Short|VerbForm=Part|Voice=Pass | otevřeny | |||
Case=Acc|Degree=Pos|Gender=Fem | otevřenou | otevřené | ||
Case=Acc|Degree=Pos|Gender=Neut | otevřené | otevřená | ||
Case=Acc|Degree=Cmp|Gender=Fem | otevřenější | |||
Case=Dat|Degree=Cmp|Gender=Neut | otevřenějšímu | |||
Case=Gen|Degree=Pos|Gender=Fem | otevřené | otevřených | ||
Case=Gen|Degree=Pos|Gender=Neut | otevřeného | |||
Case=Ins|Degree=Pos|Gender=Fem | otevřenou | otevřenýma | ||
Case=Ins|Degree=Pos|Gender=Neut | otevřeným | |||
Case=Loc|Degree=Pos|Gender=Fem | otevřené | otevřených | ||
Case=Loc|Degree=Pos|Gender=Neut | otevřeném | |||
Case=Nom|Degree=Pos|Gender=Fem | otevřená | |||
Case=Nom|Degree=Pos|Gender=Neut | otevřené | |||
Gender=Masc|Variant=Short|VerbForm=Part|Voice=Pass | otevřen | |||
Gender=Fem,Neut|Variant=Short|VerbForm=Part|Voice=Pass | otevřena | |||
Gender=Neut|Variant=Short|VerbForm=Part|Voice=Pass | otevřeno |
VERB
32976 VERB tokens (81% of all VERB
tokens) have a non-empty value of Number
.
The most frequent other feature values with which VERB
and Number
co-occurred: Voice=Act (32524; 99%), Polarity=Pos (30074; 91%), Gender=EMPTY (22413; 68%), VerbForm=Fin (22405; 68%), Mood=Ind (21953; 67%), Tense=Pres (21876; 66%), Person=3 (18472; 56%).
VERB
tokens may have the following values of Number
:
Plur
(12074; 37% of non-emptyNumber
): mají, jsou, mohou, můžeme, máme, musíme, musí, mohli, měli, mělyPlur,Sing
(2062; 6% of non-emptyNumber
): měla, byla, mohla, stala, začala, dosáhla, vznikla, dala, zůstala, objevilaSing
(18840; 57% of non-emptyNumber
): je, má, může, jde, lze, musí, měl, nelze, bylo, znamenáEMPTY
(7614): mít, být, zajistit, říci, vidět, dělat, řešit, věnovat, použít, provádět
Paradigm mít | Plur,Sing | Sing | Plur |
---|---|---|---|
Animacy=Anim|Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměli | ||
Animacy=Anim|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měli | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměly | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měly | ||
Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměl | ||
Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měl | ||
Gender=Fem,Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměla | ||
Gender=Fem,Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měla | ||
Gender=Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nemělo | ||
Gender=Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | mělo | ||
Mood=Imp|Person=2|Polarity=Pos|VerbForm=Fin | mějte | ||
Mood=Ind|Person=1|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nemám | nemáme | |
Mood=Ind|Person=1|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | mám | máme | |
Mood=Ind|Person=2|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | Nemáš | nemáte | |
Mood=Ind|Person=2|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | máš | máte | |
Mood=Ind|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nemá | nemají | |
Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | má | mají |
DET
17302 DET tokens (86% of all DET
tokens) have a non-empty value of Number
.
The most frequent other feature values with which DET
and Number
co-occurred: Person=EMPTY (15446; 89%), Number[psor]=EMPTY (15446; 89%), Animacy=EMPTY (14877; 86%), Poss=EMPTY (14006; 81%).
DET
tokens may have the following values of Number
:
Dual
(5; 0% of non-emptyNumber
): mýma, našima, těmaPlur
(4859; 28% of non-emptyNumber
): které, těchto, tyto, kteří, některých, některé, svých, své, našich, tySing
(12438; 72% of non-emptyNumber
): to, který, která, tím, této, tom, toho, tento, tohoto, tomuEMPTY
(2714): jejich, jeho, několik, mnoho, jehož, jejichž, několika, mnoha, kolik, tolik
Paradigm ten | Sing | Dual | Plur |
---|---|---|---|
Animacy=Anim|Case=Acc|Gender=Masc | toho | ty | |
Animacy=Anim|Case=Nom|Gender=Masc | ti | ||
Animacy=Inan|Case=Acc|Gender=Masc | ten | ty | |
Animacy=Inan|Case=Nom|Gender=Masc | ty | ||
Case=Acc|Gender=Fem | tu | ty | |
Case=Acc|Gender=Neut | to | Ta | |
Case=Dat|Gender=Masc,Neut | tomu | ||
Case=Dat|Gender=Fem | té | ||
Case=Dat | těm | ||
Case=Gen|Gender=Masc,Neut | toho | ||
Case=Gen|Gender=Fem | té | ||
Case=Gen | těch | ||
Case=Ins|Gender=Masc,Neut | tím | ||
Case=Ins|Gender=Fem | tou | těma | |
Case=Ins | těmi | ||
Case=Loc|Gender=Masc,Neut | tom | ||
Case=Loc|Gender=Fem | té | ||
Case=Loc|Gender=Fem|Style=Coll | tý | ||
Case=Loc | těch | ||
Case=Nom|Gender=Masc | ten | ||
Case=Nom|Gender=Fem | ta | ty | |
Case=Nom|Gender=Neut | to | ta |
AUX
11901 AUX tokens (84% of all AUX
tokens) have a non-empty value of Number
.
The most frequent other feature values with which AUX
and Number
co-occurred: Voice=Act (11531; 97%), Polarity=Pos (10659; 90%), Gender=EMPTY (9451; 79%), VerbForm=Fin (9449; 79%), Mood=Ind (9079; 76%), Person=3 (7997; 67%), Tense=Pres (7983; 67%).
AUX
tokens may have the following values of Number
:
Plur
(3421; 29% of non-emptyNumber
): jsou, jsme, byly, budou, bychom, nejsou, budeme, byli, jste, bystePlur,Sing
(579; 5% of non-emptyNumber
): byla, nebyla, mělaSing
(7901; 66% of non-emptyNumber
): je, bude, byl, bylo, není, jsem, bych, nebylo, bývá, nebylEMPTY
(2343): by, být, býti, pěstovat, vyžadovat
Paradigm být | Plur,Sing | Sing | Plur |
---|---|---|---|
Animacy=Anim|Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyli | ||
Animacy=Anim|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byli | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyly | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byly | ||
Aspect=Imp|Gender=Fem,Neut|Polarity=Pos|Tense=Pres|VerbForm=Conv|Voice=Act | jsouc | ||
Aspect=Imp|Polarity=Pos|Tense=Pres|VerbForm=Conv|Voice=Act | jsouce | ||
Aspect=Perf|Polarity=Pos|Tense=Past|VerbForm=Conv|Voice=Act | byvše | ||
Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyl | ||
Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byl | ||
Gender=Fem,Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyla | ||
Gender=Fem,Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byla | ||
Gender=Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebylo | ||
Gender=Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bylo | ||
Mood=Cnd|Person=1|VerbForm=Fin | bych | bychom | |
Mood=Cnd|Person=2|VerbForm=Fin | bys | byste | |
Mood=Imp|Person=1|Polarity=Pos|VerbForm=Fin | buďme | ||
Mood=Imp|Person=2|Polarity=Neg|VerbForm=Fin | Nebuď | ||
Mood=Imp|Person=2|Polarity=Pos|VerbForm=Fin | buď | buďte | |
Mood=Imp|Person=3|Polarity=Pos|VerbForm=Fin | budiž | ||
Mood=Ind|Person=1|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebudu | nebudeme | |
Mood=Ind|Person=1|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nejsem | nejsme | |
Mood=Ind|Person=1|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | budu | budeme | |
Mood=Ind|Person=1|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | jsem | jsme | |
Mood=Ind|Person=2|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebudeš | nebudete | |
Mood=Ind|Person=2|Polarity=Pos|Style=Coll|Tense=Pres|VerbForm=Fin|Voice=Act | seš | ||
Mood=Ind|Person=2|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | budeš | budete | |
Mood=Ind|Person=2|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | jsi, si | jste | |
Mood=Ind|Person=3|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebude | nebudou | |
Mood=Ind|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | není | nejsou | |
Mood=Ind|Person=3|Polarity=Pos|Style=Arch|Tense=Pres|VerbForm=Fin|Voice=Act | jest | ||
Mood=Ind|Person=3|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | bude | budou | |
Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | je | jsou |
PROPN
7864 PROPN tokens (80% of all PROPN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PROPN
and Number
co-occurred: Polarity=Pos (7864; 100%), Abbr=EMPTY (7851; 100%), Gender=Masc (4797; 61%), Case=Nom (3937; 50%).
PROPN
tokens may have the following values of Number
:
Plur
(677; 9% of non-emptyNumber
): Čechách, Klatovech, Pardubice, horách, Bubny, Holešovice, Čech, Holešovic, Karpaty, KlatovySing
(7187; 91% of non-emptyNumber
): Praze, Praha, Škoda, Prahy, Fučík, Erben, Československa, Karel, Horálek, ZeměEMPTY
(1950): KSČ, ROH, SSSR, ÚJČ, SSM, ČSAV, ČSSR, ČSR, TIBA, NDR
Paradigm Karel | Sing | Plur |
---|---|---|
Case=Acc | Karla | |
Case=Dat | Karlu | |
Case=Gen | Karla | |
Case=Ins | Karlem | |
Case=Loc | Karlu | |
Case=Nom | Karel | Karlové |
Number
seems to be lexical feature of PROPN
. 99% lemmas (3077) occur only with one value of Number
.
PRON
5757 PRON tokens (36% of all PRON
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PRON
and Number
co-occurred: Reflex=EMPTY (5756; 100%), Variant=EMPTY (5267; 91%), PrepCase=EMPTY (3949; 69%), PronType=Prs (3455; 60%), Gender=EMPTY (3156; 55%).
PRON
tokens may have the following values of Number
:
Plur
(3314; 58% of non-emptyNumber
): všech, nás, je, všechny, nám, nich, nichž, jim, jež, všichniSing
(2443; 42% of non-emptyNumber
): ji, mu, ho, níž, všechno, němž, ní, jej, mi, jáEMPTY
(10276): se, si, co, což, sebe, něco, nic, kdo, sobě, sebou
Paradigm on | Sing | Plur |
---|---|---|
Animacy=Anim|Case=Nom|Gender=Masc | oni | |
Case=Acc|Gender=Masc,Neut|PrepCase=Pre | něj, něho | |
Case=Acc|Gender=Masc,Neut|Style=Arch | jej | |
Case=Acc|Gender=Masc,Neut|Variant=Short | ho | |
Case=Acc|Gender=Masc | jeho | |
Case=Acc|Gender=Fem|PrepCase=Pre | ni | |
Case=Acc|Gender=Fem | ji | |
Case=Acc|Gender=Neut|PrepCase=Pre | ně | |
Case=Acc|Gender=Neut | je | |
Case=Acc|PrepCase=Pre | ně | |
Case=Acc | je | |
Case=Dat|Gender=Masc,Neut|PrepCase=Pre | němu | |
Case=Dat|Gender=Masc,Neut | jemu | |
Case=Dat|Gender=Masc,Neut|Variant=Short | mu | |
Case=Dat|Gender=Fem|PrepCase=Pre | ní | |
Case=Dat|Gender=Fem | jí | |
Case=Dat|PrepCase=Pre | nim | |
Case=Dat | jim | |
Case=Gen|Gender=Masc,Neut|PrepCase=Pre | něho, něj | |
Case=Gen|Gender=Masc,Neut | jej | |
Case=Gen|Gender=Masc | jeho | |
Case=Gen|Gender=Fem|PrepCase=Pre | ní | |
Case=Gen|Gender=Fem | jí | |
Case=Gen|PrepCase=Pre | nich | |
Case=Gen | jich | |
Case=Ins|Gender=Masc,Neut|PrepCase=Pre | ním | |
Case=Ins|Gender=Masc,Neut | jím | |
Case=Ins|Gender=Fem|PrepCase=Pre | ní | |
Case=Ins|Gender=Fem | jí | |
Case=Ins|PrepCase=Pre | nimi, jimi | |
Case=Ins | jimi | |
Case=Loc|Gender=Masc,Neut|PrepCase=Pre | něm | |
Case=Loc|Gender=Fem|PrepCase=Pre | ní | |
Case=Loc|PrepCase=Pre | nich | |
Case=Nom|Gender=Masc | on | |
Case=Nom|Gender=Fem | ona | ony |
Case=Nom|Gender=Neut | ono |
NUM
2471 NUM tokens (34% of all NUM
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NUM
and Number
co-occurred: NumType=Card (2411; 98%), NumForm=Word (2411; 98%), NumValue=1,2,3 (1962; 79%), Gender=EMPTY (1272; 51%).
NUM
tokens may have the following values of Number
:
Dual
(2; 0% of non-emptyNumber
): dvěma, oběmaPlur
(1281; 52% of non-emptyNumber
): dvou, dvě, tři, dva, obou, dvěma, tří, čtyři, oba, oběSing
(1188; 48% of non-emptyNumber
): jeden, jedné, jednoho, jedním, jednu, jedna, pět, jednom, jedno, tisícEMPTY
(4836): #
Paradigm dva | Dual | Plur |
---|---|---|
Case=Acc|Gender=Masc | dva | |
Case=Acc|Gender=Fem,Neut | dvě | |
Case=Dat | dvěma | |
Case=Gen | dvou | |
Case=Ins|Gender=Fem | dvěma | |
Case=Ins | dvěma | |
Case=Loc | dvou | |
Case=Nom|Gender=Masc | dva | |
Case=Nom|Gender=Fem,Neut | dvě |
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number
:
NOUN –[amod]–> ADJ (59502; 99%),
NOUN –[nmod]–> NOUN (27065; 61%),
NOUN –[conj]–> NOUN (11413; 81%),
VERB –[nsubj]–> NOUN (10861; 85%),
NOUN –[det]–> DET (8870; 81%),
ADJ –[cop]–> AUX (3949; 87%),
VERB –[conj]–> VERB (3891; 79%),
ADJ –[conj]–> ADJ (3690; 93%),
NOUN –[acl]–> VERB (3069; 63%),
VERB –[nsubj]–> DET (2649; 92%).