Treebank Statistics: UD_Czech-CAC: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
Some words have combined values of the feature; 3 combinations have been observed: Fem|Masc, Fem|Neut, Masc|Neut.
This is a layered feature with the following layers: Gender, Gender[psor].
252494 tokens (51%) have a non-empty value of Gender.
58315 types (93%) occur at least once with a non-empty value of Gender.
25144 lemmas (88%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (136143; 28% instances), ADJ (73917; 15% instances), DET (15571; 3% instances), VERB (10563; 2% instances), PROPN (9803; 2% instances), PRON (2848; 1% instances), AUX (2450; 0% instances), NUM (1199; 0% instances).
NOUN
136143 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Polarity=Pos (135949; 100%), Number=Sing (95308; 70%), Animacy=EMPTY (79760; 59%).
NOUN tokens may have the following values of Gender:
Fem(55016; 40% of non-emptyGender): práce, práci, oblasti, době, společnosti, činnosti, výroby, teorie, organizace, stranyMasc(56383; 41% of non-emptyGender): roce, roku, pracovníků, úkolů, výsledky, jazyka, procesu, lidí, člověka, úkolyNeut(24744; 18% of non-emptyGender): let, hlediska, období, prostředí, zařízení, řešení, plnění, množství, poznání, stoletíEMPTY(39): luxe, nepusto, pusto, PN, r, I, Las, MDAS, UBV, causa
| Paradigm rok | Masc | Neut |
|---|---|---|
| Animacy=Inan|Case=Acc|Number=Sing | rok | |
| Animacy=Inan|Case=Acc|Number=Plur | roky | |
| Animacy=Inan|Case=Dat|Number=Sing | roku | |
| Animacy=Inan|Case=Gen|Number=Sing | roku, roka | |
| Animacy=Inan|Case=Gen|Number=Plur | roků | |
| Animacy=Inan|Case=Ins|Number=Sing | rokem | |
| Animacy=Inan|Case=Ins|Number=Plur | roky | |
| Animacy=Inan|Case=Loc|Number=Sing | roce | |
| Animacy=Inan|Case=Nom|Number=Sing | rok | |
| Animacy=Inan|Case=Nom|Number=Plur | roky | |
| Case=Gen|Number=Plur | let | |
| Case=Ins|Number=Plur | lety | |
| Case=Loc|Number=Plur | letech |
Gender seems to be lexical feature of NOUN. 100% lemmas (11076) occur only with one value of Gender.
ADJ
73917 ADJ tokens (100% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Polarity=Pos (71070; 96%), Degree=Pos (62554; 85%), Number=Sing (47115; 64%), Animacy=EMPTY (44952; 61%).
ADJ tokens may have the following values of Gender:
Fem(29468; 40% of non-emptyGender): pracovní, socialistické, nové, další, první, základní, současné, druhé, společenské, celéFem,Masc(1139; 2% of non-emptyGender): uvedeny, určeny, splněny, provedeny, spojeny, stanoveny, připraveny, vytvořeny, umístěny, charakterizoványFem,Neut(1143; 2% of non-emptyGender): věnována, dána, provedena, určena, zahájena, povinna, založena, dokončena, stanovena, vybudovánaMasc(29026; 39% of non-emptyGender): další, jednotlivých, první, základní, pracovní, dalších, velký, celý, pracujících, novéNeut(13141; 18% of non-emptyGender): možno, možné, nutno, nutné, národního, další, posledních, jiné, řečeno, vědeckéhoEMPTY(305): Králové, elektro, marxisticko, fit, Karpatsko, dvojí, jedněch, teoreticko, obojí, online
| Paradigm uvedený | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
|---|---|---|---|---|---|
| Animacy=Anim|Case=Gen|Degree=Pos|Number=Plur|Polarity=Pos | uvedených | ||||
| Animacy=Anim|Case=Nom|Degree=Pos|Number=Sing|Polarity=Pos | uvedený | ||||
| Animacy=Anim|Case=Nom|Degree=Pos|Number=Plur|Polarity=Pos | uvedení | ||||
| Animacy=Anim|Number=Plur|Polarity=Pos|Variant=Short|VerbForm=Part|Voice=Pass | uvedeni | ||||
| Animacy=Inan|Case=Acc|Degree=Pos|Number=Sing|Polarity=Pos | uvedený | ||||
| Animacy=Inan|Case=Acc|Degree=Pos|Number=Plur|Polarity=Neg | neuvedené | ||||
| Animacy=Inan|Case=Acc|Degree=Pos|Number=Plur|Polarity=Pos | uvedené | ||||
| Animacy=Inan|Case=Dat|Degree=Pos|Number=Plur|Polarity=Pos | uvedeným | ||||
| Animacy=Inan|Case=Gen|Degree=Pos|Number=Sing|Polarity=Pos | uvedeného | ||||
| Animacy=Inan|Case=Gen|Degree=Pos|Number=Plur|Polarity=Pos | uvedených | ||||
| Animacy=Inan|Case=Ins|Degree=Pos|Number=Sing|Polarity=Pos | uvedeným | ||||
| Animacy=Inan|Case=Ins|Degree=Pos|Number=Plur|Polarity=Pos | uvedenými | ||||
| Animacy=Inan|Case=Loc|Degree=Pos|Number=Sing|Polarity=Pos | uvedeném | ||||
| Animacy=Inan|Case=Loc|Degree=Pos|Number=Plur|Polarity=Pos | uvedených | ||||
| Animacy=Inan|Case=Nom|Degree=Pos|Number=Sing|Polarity=Pos | uvedený | ||||
| Animacy=Inan|Case=Nom|Degree=Pos|Number=Plur|Polarity=Pos | uvedené | ||||
| Animacy=Inan|Number=Plur|Polarity=Pos|Variant=Short|VerbForm=Part|Voice=Pass | uvedeny | ||||
| Case=Acc|Degree=Pos|Number=Sing|Polarity=Pos | uvedenou | uvedené | |||
| Case=Acc|Degree=Pos|Number=Plur|Polarity=Pos | uvedené | Uvedená | |||
| Case=Dat|Degree=Pos|Number=Sing|Polarity=Pos | uvedené | uvedenému | |||
| Case=Dat|Degree=Pos|Number=Plur|Polarity=Pos | uvedeným | ||||
| Case=Gen|Degree=Pos|Number=Sing|Polarity=Pos | uvedené | uvedeného | |||
| Case=Gen|Degree=Pos|Number=Plur|Polarity=Pos | uvedených | uvedených | |||
| Case=Ins|Degree=Pos|Number=Sing|Polarity=Pos | uvedenou | uvedeným | |||
| Case=Ins|Degree=Pos|Number=Plur|Polarity=Pos | uvedenými | uvedenými | |||
| Case=Loc|Degree=Pos|Number=Sing|Polarity=Pos | uvedené | uvedeném | |||
| Case=Loc|Degree=Pos|Number=Plur|Polarity=Pos | uvedených | uvedených | |||
| Case=Nom|Degree=Pos|Number=Sing|Polarity=Pos | uvedená | uvedené | |||
| Case=Nom|Degree=Pos|Number=Plur|Polarity=Pos | uvedené | uvedená | |||
| Number=Sing|Polarity=Pos|Variant=Short|VerbForm=Part|Voice=Pass | uveden | uvedeno | |||
| Number=Plur,Sing|Polarity=Pos|Variant=Short|VerbForm=Part|Voice=Pass | uvedena |
DET
15571 DET tokens (78% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Person=EMPTY (14047; 90%), Number[psor]=EMPTY (14047; 90%), Animacy=EMPTY (13146; 84%), Poss=EMPTY (12859; 83%), Number=Sing (12438; 80%).
DET tokens may have the following values of Gender:
Fem(4751; 31% of non-emptyGender): které, která, této, své, naší, tato, svou, tyto, kterou, tutoFem,Neut(136; 1% of non-emptyGender): naše, moje, vaše, tvojeMasc(3928; 25% of non-emptyGender): který, které, kteří, tento, každý, tyto, sám, některé, svůj, tenMasc,Neut(3597; 23% of non-emptyGender): tím, tom, toho, tomu, tohoto, tomto, našeho, svého, našem, svýmNeut(3159; 20% of non-emptyGender): to, které, toto, která, své, tato, každé, takové, některá, jejíEMPTY(4445): jejich, jeho, těchto, některých, několik, svých, mnoho, našich, jehož, jejichž
| Paradigm můj | Fem,Neut | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|---|
| Animacy=Anim|Case=Acc|Number=Sing|Number[psor]=Plur | našeho | ||||
| Animacy=Anim|Case=Nom|Number=Plur|Number[psor]=Sing | moji | ||||
| Animacy=Anim|Case=Nom|Number=Plur|Number[psor]=Plur | naši | ||||
| Animacy=Inan|Case=Acc|Number=Sing|Number[psor]=Sing | můj | ||||
| Animacy=Inan|Case=Acc|Number=Sing|Number[psor]=Plur | náš | ||||
| Animacy=Inan|Case=Nom|Number=Plur|Number[psor]=Plur | naše | ||||
| Case=Acc|Number=Sing|Number[psor]=Sing | mou | moje | |||
| Case=Acc|Number=Sing|Number[psor]=Plur | naši | naše | |||
| Case=Acc|Number=Plur|Number[psor]=Sing | mé | mé | |||
| Case=Dat|Number=Sing|Number[psor]=Sing | mému | mé | |||
| Case=Dat|Number=Sing|Number[psor]=Plur | našemu | naší | |||
| Case=Gen|Number=Sing|Number[psor]=Sing | mého | mé, mojí | |||
| Case=Gen|Number=Sing|Number[psor]=Plur | našeho | naší | |||
| Case=Ins|Number=Sing|Number[psor]=Sing | mým | mou, mojí | |||
| Case=Ins|Number=Sing|Number[psor]=Plur | naším | naší | |||
| Case=Ins|Number=Dual|Number[psor]=Sing | mýma | ||||
| Case=Ins|Number=Dual|Number[psor]=Plur | našima | ||||
| Case=Loc|Number=Sing|Number[psor]=Sing | mém | mé | |||
| Case=Loc|Number=Sing|Number[psor]=Plur | našem | naší | |||
| Case=Nom|Number=Sing|Number[psor]=Sing | moje | můj | má | mé | |
| Case=Nom|Number=Sing|Number[psor]=Plur | naše | náš | |||
| Case=Nom|Number=Plur|Number[psor]=Sing | moje | Mé | |||
| Case=Nom|Number=Plur|Number[psor]=Plur | naše |
VERB
10563 VERB tokens (26% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Person=EMPTY (10563; 100%), Mood=EMPTY (10563; 100%), Voice=Act (10563; 100%), Tense=Past (10530; 100%), VerbForm=Part (10529; 100%), Polarity=Pos (9746; 92%).
VERB tokens may have the following values of Gender:
Fem,Masc(1176; 11% of non-emptyGender): měly, mohly, byly, staly, vznikly, začaly, vytvořily, vedly, dosáhly, nemělyFem,Neut(2069; 20% of non-emptyGender): měla, byla, mohla, stala, začala, dosáhla, vznikla, dala, zůstala, objevilaMasc(5703; 54% of non-emptyGender): měl, mohli, mohl, měli, byl, řekl, chtěl, stal, ukázal, dostalNeut(1615; 15% of non-emptyGender): bylo, došlo, mělo, podařilo, mohlo, stalo, nebylo, ukázalo, šlo, začaloEMPTY(30027): je, má, mají, musí, může, jde, lze, jsou, mohou, můžeme
| Paradigm mít | Fem,Masc | Fem,Neut | Masc | Neut |
|---|---|---|---|---|
| Animacy=Anim|Number=Plur|Polarity=Neg | neměli | |||
| Animacy=Anim|Number=Plur|Polarity=Pos | měli | |||
| Animacy=Inan|Number=Plur|Polarity=Neg | neměly | |||
| Animacy=Inan|Number=Plur|Polarity=Pos | měly | |||
| Number=Sing|Polarity=Neg | neměl | nemělo | ||
| Number=Sing|Polarity=Pos | měl | mělo | ||
| Number=Plur,Sing|Polarity=Neg | neměla | |||
| Number=Plur,Sing|Polarity=Pos | měla |
PROPN
9803 PROPN tokens (100% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Polarity=Pos (9803; 100%), Abbr=EMPTY (7931; 81%), Number=Sing (7187; 73%).
PROPN tokens may have the following values of Gender:
Fem(3429; 35% of non-emptyGender): KSČ, Praze, Praha, ČSAV, ČSSR, SSM, Škoda, Prahy, ČSR, NDRMasc(5431; 55% of non-emptyGender): SSSR, ÚJČ, Fučík, Erben, TIBA, Karel, Horálek, OV, USA, VÚMNeut(943; 10% of non-emptyGender): ROH, Československa, GŘ, Brně, Slovensku, Československu, MZVŽ, Brno, RVHP, ÚstíEMPTY(11): KRB, Opeplatis, Ganges, Gaudeamus, TOK, igitur
| Paradigm KSČ | Masc | Fem |
|---|---|---|
| Animacy=Inan | KSČ | |
| KSČ |
Gender seems to be lexical feature of PROPN. 99% lemmas (3427) occur only with one value of Gender.
PRON
2848 PRON tokens (18% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Reflex=EMPTY (2848; 100%), Variant=EMPTY (2536; 89%), Number=Sing (2103; 74%), PrepCase=EMPTY (1914; 67%), Person=EMPTY (1576; 55%).
PRON tokens may have the following values of Gender:
Fem(872; 31% of non-emptyGender): ji, všechny, níž, ní, jí, jež, ni, veškeré, jíž, veškerouMasc(622; 22% of non-emptyGender): všechny, všichni, kdo, někdo, nikdo, jeho, jenž, on, oni, veškeréMasc,Neut(1017; 36% of non-emptyGender): mu, ho, němž, jej, něm, něho, ním, něj, něhož, všehoNeut(337; 12% of non-emptyGender): všechno, vše, je, všechna, jež, ně, co, ono, veškeré, všeckoEMPTY(13185): se, si, co, všech, nás, je, nám, nich, nichž, jim
| Paradigm on | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|
| Animacy=Anim|Case=Nom|Number=Plur | oni | |||
| Case=Acc|Number=Sing|PrepCase=Pre | něj, něho | ni | ně | |
| Case=Acc|Number=Sing | jeho | ji | je | |
| Case=Acc|Number=Sing|Style=Arch | jej | |||
| Case=Acc|Number=Sing|Variant=Short | ho | |||
| Case=Dat|Number=Sing|PrepCase=Pre | němu | ní | ||
| Case=Dat|Number=Sing | jemu | jí | ||
| Case=Dat|Number=Sing|Variant=Short | mu | |||
| Case=Gen|Number=Sing|PrepCase=Pre | něho, něj | ní | ||
| Case=Gen|Number=Sing | jeho | jej | jí | |
| Case=Ins|Number=Sing|PrepCase=Pre | ním | ní | ||
| Case=Ins|Number=Sing | jím | jí | ||
| Case=Loc|Number=Sing|PrepCase=Pre | něm | ní | ||
| Case=Nom|Number=Sing | on | ona | ono | |
| Case=Nom|Number=Plur | ony |
AUX
2450 AUX tokens (17% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Person=EMPTY (2450; 100%), Mood=EMPTY (2450; 100%), Voice=Act (2450; 100%), Tense=Past (2449; 100%), VerbForm=Part (2449; 100%), Polarity=Pos (2266; 92%), Number=Sing (1313; 54%).
AUX tokens may have the following values of Gender:
Fem,Masc(462; 19% of non-emptyGender): byly, nebyly, bývaly, mohlyFem,Neut(580; 24% of non-emptyGender): byla, nebyla, jsouc, mělaMasc(749; 31% of non-emptyGender): byl, byli, nebyl, býval, nebyli, měl, MohlNeut(659; 27% of non-emptyGender): bylo, nebylo, bývaloEMPTY(11794): je, by, jsou, bude, být, jsme, není, jsem, budou, bychom
| Paradigm být | Fem,Masc | Fem,Neut | Masc | Neut |
|---|---|---|---|---|
| Animacy=Anim|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyli | |||
| Animacy=Anim|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byli | |||
| Animacy=Inan|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyly | |||
| Animacy=Inan|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byly | |||
| Aspect=Imp|Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Conv | jsouc | |||
| Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyl | nebylo | ||
| Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | bylo | ||
| Number=Plur,Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyla | |||
| Number=Plur,Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byla |
NUM
1199 NUM tokens (16% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumValue=1,2,3 (1139; 95%), NumForm=Word (1139; 95%), NumType=Card (1139; 95%), Number=Sing (798; 67%).
NUM tokens may have the following values of Gender:
Fem(331; 28% of non-emptyGender): jedné, jednu, jedna, jednou, třetinu, třetina, třetiny, čtvrtiny, dvanáctinu, třetinouFem,Neut(191; 16% of non-emptyGender): dvě, oběMasc(387; 32% of non-emptyGender): jeden, dva, oba, jednohoMasc,Neut(241; 20% of non-emptyGender): jednoho, jedním, jednom, jednomuNeut(49; 4% of non-emptyGender): jednoEMPTY(6108): #, dvou, tři, obou, dvěma, tří, pět, čtyři, tisíc, půl
| Paradigm jeden | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|
| Animacy=Anim|Case=Acc | jednoho | |||
| Animacy=Inan|Case=Acc | jeden | |||
| Case=Acc | jednu | jedno | ||
| Case=Dat | jednomu | jedné | ||
| Case=Gen | jednoho | jedné | ||
| Case=Ins | jedním | jednou | ||
| Case=Loc | jednom | jedné | ||
| Case=Nom | jeden | jedna | jedno |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (59331; 99%),
NOUN –[conj]–> NOUN (7050; 50%),
ADJ –[conj]–> ADJ (3642; 92%),
ADJ –[nsubj]–> NOUN (1912; 77%),
VERB –[conj]–> VERB (1111; 59%),
PROPN –[flat]–> PROPN (838; 99%),
PROPN –[nmod]–> NOUN (754; 85%),
PROPN –[conj]–> PROPN (746; 65%),
VERB –[nsubj]–> PROPN (733; 54%),
NOUN –[appos]–> NOUN (692; 50%).