Treebank Statistics: UD_Czech-CLTT: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
Some words have combined values of the feature; 3 combinations have been observed: Fem|Masc, Fem|Neut, Masc|Neut.
This is a layered feature with the following layers: Gender, Gender[psor].
19272 tokens (54%) have a non-empty value of Gender.
3629 types (77%) occur at least once with a non-empty value of Gender.
1610 lemmas (60%) occur at least once with a non-empty value of Gender.
The feature is used with 7 part-of-speech tags: NOUN (11303; 32% instances), ADJ (6766; 19% instances), DET (892; 3% instances), VERB (116; 0% instances), PRON (90; 0% instances), AUX (59; 0% instances), NUM (46; 0% instances).
NOUN
11303 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Polarity=Pos (11288; 100%), Number=Sing (7969; 71%), Animacy=EMPTY (6755; 60%).
NOUN tokens may have the following values of Gender:
Fem(4546; 40% of non-emptyGender): jednotky, jednotka, položka, závěrky, jednotek, společnosti, položek, informace, položky, závěrkuMasc(4548; 40% of non-emptyGender): majetku, dni, závazků, odstavce, dne, majetek, případě, náklady, závazky, ziskuNeut(2209; 20% of non-emptyGender): období, ocenění, účetnictví, ustanovení, vymezení, sestavení, účtování, uspořádání, použití, hospodaření
| Paradigm rok | Masc | Neut |
|---|---|---|
| Animacy=Inan|Case=Acc|Number=Sing | rok | |
| Animacy=Inan|Case=Gen|Number=Sing | roku | |
| Animacy=Inan|Case=Ins|Number=Sing | rokem | |
| Animacy=Inan|Case=Loc|Number=Sing | roce | |
| Animacy=Inan|Case=Nom|Number=Sing | rok | |
| Case=Gen|Number=Plur | let | |
| Case=Loc|Number=Plur | letech |
Gender seems to be lexical feature of NOUN. 100% lemmas (859) occur only with one value of Gender.
ADJ
6766 ADJ tokens (100% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Polarity=Pos (6585; 97%), Degree=Pos (6010; 89%), Number=Sing (4201; 62%), Animacy=EMPTY (4043; 60%).
ADJ tokens may have the following values of Gender:
Fem(3094; 46% of non-emptyGender): účetní, účetních, konsolidované, konsolidující, výroční, reálnou, finanční, pořizovací, českou, uvedenéFem,Masc(165; 2% of non-emptyGender): povinny, zahrnuty, obchodovány, uvedeny, vykázány, účtovány, uzavřeny, vyjádřeny, známy, ověřenyFem,Neut(78; 1% of non-emptyGender): povinna, sestavena, zavedena, uvedena, známa, dotčena, oprávněna, schopna, vyhlášena, vykazovánaMasc(2623; 39% of non-emptyGender): účetní, účetních, účetního, obchodního, právních, peněžních, právní, zvláštního, právního, zvláštníchNeut(806; 12% of non-emptyGender): účetního, účetní, účetním, obsahové, jiných, stanoveno, technické, účetních, minulé, účinnémEMPTY(15): do, něm, od, pod
| Paradigm uvedený | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
|---|---|---|---|---|---|
| Animacy=Anim|Case=Acc|Degree=Pos|Number=Plur|Polarity=Neg | neuvedené | ||||
| Animacy=Inan|Case=Acc|Degree=Pos|Number=Sing|Polarity=Pos | uvedený | ||||
| Animacy=Inan|Case=Acc|Degree=Pos|Number=Plur|Polarity=Pos | uvedené | ||||
| Animacy=Inan|Case=Dat|Degree=Pos|Number=Sing|Polarity=Pos | uvedenému | ||||
| Animacy=Inan|Case=Gen|Degree=Pos|Number=Sing|Polarity=Pos | uvedeného | ||||
| Animacy=Inan|Case=Gen|Degree=Pos|Number=Plur|Polarity=Pos | uvedených | ||||
| Animacy=Inan|Case=Ins|Degree=Pos|Number=Sing|Polarity=Pos | uvedeným | ||||
| Animacy=Inan|Case=Loc|Degree=Pos|Number=Sing|Polarity=Pos | uvedeném | ||||
| Animacy=Inan|Case=Loc|Degree=Pos|Number=Plur|Polarity=Pos | uvedených | ||||
| Animacy=Inan|Case=Nom|Degree=Pos|Number=Sing|Polarity=Pos | uvedený | ||||
| Animacy=Inan|Case=Nom|Degree=Pos|Number=Plur|Polarity=Pos | uvedené | ||||
| Animacy=Inan|Number=Plur|Polarity=Pos|Variant=Short|VerbForm=Part|Voice=Pass | uvedeny | ||||
| Case=Acc|Degree=Pos|Number=Sing|Polarity=Pos | uvedené | ||||
| Case=Acc|Degree=Pos|Number=Plur|Polarity=Pos | uvedené | uvedená | |||
| Case=Dat|Degree=Pos|Number=Sing|Polarity=Pos | uvedené | ||||
| Case=Dat|Degree=Pos|Number=Plur|Polarity=Pos | uvedeným | ||||
| Case=Gen|Degree=Pos|Number=Sing|Polarity=Neg | neuvedené | ||||
| Case=Gen|Degree=Pos|Number=Sing|Polarity=Pos | uvedené | ||||
| Case=Gen|Degree=Pos|Number=Plur|Polarity=Pos | uvedených | uvedených | |||
| Case=Ins|Degree=Pos|Number=Sing|Polarity=Pos | uvedenou | ||||
| Case=Ins|Degree=Pos|Number=Plur|Polarity=Pos | uvedenými | ||||
| Case=Loc|Degree=Pos|Number=Sing|Polarity=Pos | uvedené | ||||
| Case=Loc|Degree=Pos|Number=Plur|Polarity=Pos | uvedených | ||||
| Case=Nom|Degree=Pos|Number=Sing|Polarity=Neg | neuvedená | ||||
| Case=Nom|Degree=Pos|Number=Sing|Polarity=Pos | uvedená | ||||
| Case=Nom|Degree=Pos|Number=Plur|Polarity=Pos | uvedené | uvedená | |||
| Number=Sing|Polarity=Pos|Variant=Short|VerbForm=Part|Voice=Pass | uveden | uvedeno | |||
| Number=Plur,Sing|Polarity=Pos|Variant=Short|VerbForm=Part|Voice=Pass | uvedena |
DET
892 DET tokens (75% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number[psor]=EMPTY (860; 96%), Person=EMPTY (860; 96%), Poss=EMPTY (839; 94%), Number=Sing (639; 72%).
DET tokens may have the following values of Gender:
Fem(396; 44% of non-emptyGender): které, této, která, tato, tyto, kterou, tuto, její, své, všechnyMasc(181; 20% of non-emptyGender): které, který, tento, tyto, všechny, každého, každý, svůj, takový, jejíMasc,Neut(201; 23% of non-emptyGender): tohoto, kterém, kterému, tomto, kterým, tímto, kterého, jejího, tím, jejímNeut(114; 13% of non-emptyGender): to, které, která, toto, všechna, její, některá, každé, samo, takovéEMPTY(302): jejich, jeho, těchto, kterých, všech, kterým, jejichž, jehož, kterými, svých
| Paradigm který | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|
| Animacy=Inan|Case=Acc|Number=Sing | který | |||
| Animacy=Inan|Case=Nom|Number=Plur | které | |||
| Case=Acc|Number=Sing | kterou | které | ||
| Case=Acc|Number=Plur | které | které | ||
| Case=Dat|Number=Sing | kterému | které | ||
| Case=Gen|Number=Sing | kterého | které | ||
| Case=Ins|Number=Sing | kterým | kterou | ||
| Case=Loc|Number=Sing | kterém | které | ||
| Case=Nom|Number=Sing | který | která | které | |
| Case=Nom|Number=Plur | které | která |
VERB
116 VERB tokens (6% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Mood=EMPTY (116; 100%), Person=EMPTY (116; 100%), Voice=Act (116; 100%), Tense=Past (115; 99%), VerbForm=Part (115; 99%), Polarity=Pos (106; 91%).
VERB tokens may have the following values of Gender:
Fem,Masc(35; 30% of non-emptyGender): přestaly, nastaly, staly, dosáhly, existovaly, překročily, rozhodly, navazovaly, neprošly, nepřevýšilyFem,Neut(51; 44% of non-emptyGender): nabyla, určila, překročila, sestavila, stanovila, podávala, provedla, dospěla, mohla, mělaMasc(11; 9% of non-emptyGender): Dal, dozvěděl, mohl, nepožádali, nezahájil, počínaje, přesáhl, rovnal, schválili, stalNeut(19; 16% of non-emptyGender): došlo, trvalo, započalo, mohlo, přešlo, uzavřeloEMPTY(1741): obsahuje, rozumí, může, uvede, mohou, použijí, stanoví, vést, musí, účtuje
| Paradigm moci | Fem,Neut | Masc | Neut |
|---|---|---|---|
| Number=Sing | mohl | mohlo | |
| Number=Plur,Sing | mohla |
PRON
90 PRON tokens (14% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Reflex=EMPTY (90; 100%), Variant=EMPTY (89; 99%), Number=Sing (85; 94%), Person=EMPTY (54; 60%), PronType=Rel (46; 51%).
PRON tokens may have the following values of Gender:
Fem(28; 31% of non-emptyGender): jí, ji, ní, níž, veškeré, jež, nižMasc(6; 7% of non-emptyGender): jenž, veškeréMasc,Neut(55; 61% of non-emptyGender): němž, jej, němuž, jehož, nějž, něj, veškerého, ho, jemu, jímžNeut(1; 1% of non-emptyGender): veškeréEMPTY(541): se, nichž, je, jim, jimiž, nich, sobě, jimi, nimi, ně
| Paradigm veškerý | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|
| Animacy=Inan|Case=Nom|Number=Plur | veškeré | |||
| Case=Acc|Number=Sing | veškeré | |||
| Case=Acc|Number=Plur | veškeré | veškeré | ||
| Case=Gen|Number=Sing | veškerého | |||
| Case=Nom|Number=Plur | veškeré |
AUX
59 AUX tokens (10% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Mood=EMPTY (59; 100%), Tense=Past (59; 100%), Person=EMPTY (59; 100%), Voice=Act (59; 100%), VerbForm=Part (59; 100%), Polarity=Pos (47; 80%).
AUX tokens may have the following values of Gender:
Fem,Masc(26; 44% of non-emptyGender): byly, nebylyFem,Neut(9; 15% of non-emptyGender): byla, nebylaMasc(14; 24% of non-emptyGender): byl, nebylNeut(10; 17% of non-emptyGender): byloEMPTY(511): je, jsou, nejsou, být, není, by, bude, budou
| Paradigm být | Fem,Masc | Fem,Neut | Masc | Neut |
|---|---|---|---|---|
| Animacy=Inan|Number=Plur|Polarity=Neg | nebyly | |||
| Animacy=Inan|Number=Plur|Polarity=Pos | byly | |||
| Number=Sing|Polarity=Neg | nebyl | |||
| Number=Sing|Polarity=Pos | byl | bylo | ||
| Number=Plur,Sing|Polarity=Neg | nebyla | |||
| Number=Plur,Sing|Polarity=Pos | byla |
NUM
46 NUM tokens (10% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumForm=Word (46; 100%), NumType=Card (46; 100%), NumValue=1,2,3 (46; 100%), Number=Sing (38; 83%).
NUM tokens may have the following values of Gender:
Fem(11; 24% of non-emptyGender): jedné, jednou, jednuFem,Neut(7; 15% of non-emptyGender): dvě, oběMasc(19; 41% of non-emptyGender): jeden, dvaMasc,Neut(6; 13% of non-emptyGender): jednoho, jednom, jednomu, jednímNeut(3; 7% of non-emptyGender): jednoEMPTY(394): 1, 3, 2, 4, 5, 41, 7, tří, 10, 2004
| Paradigm jeden | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|
| Animacy=Inan|Case=Acc | jeden | |||
| Case=Acc | jednu | jedno | ||
| Case=Dat | jednomu | |||
| Case=Gen | jednoho | jedné | ||
| Case=Ins | jedním | jednou | ||
| Case=Loc | jednom | |||
| Case=Nom | jeden |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (5933; 97%),
NOUN –[conj]–> NOUN (979; 54%),
ADJ –[conj]–> ADJ (190; 83%),
NOUN –[appos]–> NOUN (48; 72%),
NOUN –[xcomp]–> ADJ (15; 94%),
VERB –[conj]–> VERB (11; 52%),
DET –[nmod]–> NOUN (9; 82%),
ADJ –[dep]–> NOUN (6; 75%),
ADJ –[obj]–> PRON (6; 55%),
ADJ –[amod]–> ADJ (5; 83%).