Treebank Statistics: UD_Czech-CLTT: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
Some words have combined values of the feature; 3 combinations have been observed: Fem|Masc
, Fem|Neut
, Masc|Neut
.
This is a layered feature with the following layers: Gender, Gender[psor].
19272 tokens (54%) have a non-empty value of Gender
.
3629 types (77%) occur at least once with a non-empty value of Gender
.
1610 lemmas (60%) occur at least once with a non-empty value of Gender
.
The feature is used with 7 part-of-speech tags: NOUN (11303; 32% instances), ADJ (6766; 19% instances), DET (892; 3% instances), VERB (116; 0% instances), PRON (90; 0% instances), AUX (59; 0% instances), NUM (46; 0% instances).
NOUN
11303 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Polarity=Pos (11288; 100%), Number=Sing (7969; 71%), Animacy=EMPTY (6755; 60%).
NOUN
tokens may have the following values of Gender
:
Fem
(4546; 40% of non-emptyGender
): jednotky, jednotka, položka, závěrky, jednotek, společnosti, položek, informace, položky, závěrkuMasc
(4548; 40% of non-emptyGender
): majetku, dni, závazků, odstavce, dne, majetek, případě, náklady, závazky, ziskuNeut
(2209; 20% of non-emptyGender
): období, ocenění, účetnictví, ustanovení, vymezení, sestavení, účtování, uspořádání, použití, hospodaření
Paradigm rok | Masc | Neut |
---|---|---|
Animacy=Inan|Case=Acc|Number=Sing | rok | |
Animacy=Inan|Case=Gen|Number=Sing | roku | |
Animacy=Inan|Case=Ins|Number=Sing | rokem | |
Animacy=Inan|Case=Loc|Number=Sing | roce | |
Animacy=Inan|Case=Nom|Number=Sing | rok | |
Case=Gen|Number=Plur | let | |
Case=Loc|Number=Plur | letech |
Gender
seems to be lexical feature of NOUN
. 100% lemmas (859) occur only with one value of Gender
.
ADJ
6766 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Polarity=Pos (6585; 97%), Degree=Pos (6010; 89%), Number=Sing (4201; 62%), Animacy=EMPTY (4043; 60%).
ADJ
tokens may have the following values of Gender
:
Fem
(3094; 46% of non-emptyGender
): účetní, účetních, konsolidované, konsolidující, výroční, reálnou, finanční, pořizovací, českou, uvedenéFem,Masc
(165; 2% of non-emptyGender
): povinny, zahrnuty, obchodovány, uvedeny, vykázány, účtovány, uzavřeny, vyjádřeny, známy, ověřenyFem,Neut
(78; 1% of non-emptyGender
): povinna, sestavena, zavedena, uvedena, známa, dotčena, oprávněna, schopna, vyhlášena, vykazovánaMasc
(2623; 39% of non-emptyGender
): účetní, účetních, účetního, obchodního, právních, peněžních, právní, zvláštního, právního, zvláštníchNeut
(806; 12% of non-emptyGender
): účetního, účetní, účetním, obsahové, jiných, stanoveno, technické, účetních, minulé, účinnémEMPTY
(15): do, něm, od, pod
Paradigm uvedený | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
---|---|---|---|---|---|
Animacy=Anim|Case=Acc|Degree=Pos|Number=Plur|Polarity=Neg | neuvedené | ||||
Animacy=Inan|Case=Acc|Degree=Pos|Number=Sing|Polarity=Pos | uvedený | ||||
Animacy=Inan|Case=Acc|Degree=Pos|Number=Plur|Polarity=Pos | uvedené | ||||
Animacy=Inan|Case=Dat|Degree=Pos|Number=Sing|Polarity=Pos | uvedenému | ||||
Animacy=Inan|Case=Gen|Degree=Pos|Number=Sing|Polarity=Pos | uvedeného | ||||
Animacy=Inan|Case=Gen|Degree=Pos|Number=Plur|Polarity=Pos | uvedených | ||||
Animacy=Inan|Case=Ins|Degree=Pos|Number=Sing|Polarity=Pos | uvedeným | ||||
Animacy=Inan|Case=Loc|Degree=Pos|Number=Sing|Polarity=Pos | uvedeném | ||||
Animacy=Inan|Case=Loc|Degree=Pos|Number=Plur|Polarity=Pos | uvedených | ||||
Animacy=Inan|Case=Nom|Degree=Pos|Number=Sing|Polarity=Pos | uvedený | ||||
Animacy=Inan|Case=Nom|Degree=Pos|Number=Plur|Polarity=Pos | uvedené | ||||
Animacy=Inan|Number=Plur|Polarity=Pos|Variant=Short|VerbForm=Part|Voice=Pass | uvedeny | ||||
Case=Acc|Degree=Pos|Number=Sing|Polarity=Pos | uvedené | ||||
Case=Acc|Degree=Pos|Number=Plur|Polarity=Pos | uvedené | uvedená | |||
Case=Dat|Degree=Pos|Number=Sing|Polarity=Pos | uvedené | ||||
Case=Dat|Degree=Pos|Number=Plur|Polarity=Pos | uvedeným | ||||
Case=Gen|Degree=Pos|Number=Sing|Polarity=Neg | neuvedené | ||||
Case=Gen|Degree=Pos|Number=Sing|Polarity=Pos | uvedené | ||||
Case=Gen|Degree=Pos|Number=Plur|Polarity=Pos | uvedených | uvedených | |||
Case=Ins|Degree=Pos|Number=Sing|Polarity=Pos | uvedenou | ||||
Case=Ins|Degree=Pos|Number=Plur|Polarity=Pos | uvedenými | ||||
Case=Loc|Degree=Pos|Number=Sing|Polarity=Pos | uvedené | ||||
Case=Loc|Degree=Pos|Number=Plur|Polarity=Pos | uvedených | ||||
Case=Nom|Degree=Pos|Number=Sing|Polarity=Neg | neuvedená | ||||
Case=Nom|Degree=Pos|Number=Sing|Polarity=Pos | uvedená | ||||
Case=Nom|Degree=Pos|Number=Plur|Polarity=Pos | uvedené | uvedená | |||
Number=Sing|Polarity=Pos|Variant=Short|VerbForm=Part|Voice=Pass | uveden | uvedeno | |||
Number=Plur,Sing|Polarity=Pos|Variant=Short|VerbForm=Part|Voice=Pass | uvedena |
DET
892 DET tokens (75% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number[psor]=EMPTY (860; 96%), Person=EMPTY (860; 96%), Poss=EMPTY (839; 94%), Number=Sing (639; 72%).
DET
tokens may have the following values of Gender
:
Fem
(396; 44% of non-emptyGender
): které, této, která, tato, tyto, kterou, tuto, její, své, všechnyMasc
(181; 20% of non-emptyGender
): které, který, tento, tyto, všechny, každého, každý, svůj, takový, jejíMasc,Neut
(201; 23% of non-emptyGender
): tohoto, kterém, kterému, tomto, kterým, tímto, kterého, jejího, tím, jejímNeut
(114; 13% of non-emptyGender
): to, které, která, toto, všechna, její, některá, každé, samo, takovéEMPTY
(302): jejich, jeho, těchto, kterých, všech, kterým, jejichž, jehož, kterými, svých
Paradigm který | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Animacy=Inan|Case=Acc|Number=Sing | který | |||
Animacy=Inan|Case=Nom|Number=Plur | které | |||
Case=Acc|Number=Sing | kterou | které | ||
Case=Acc|Number=Plur | které | které | ||
Case=Dat|Number=Sing | kterému | které | ||
Case=Gen|Number=Sing | kterého | které | ||
Case=Ins|Number=Sing | kterým | kterou | ||
Case=Loc|Number=Sing | kterém | které | ||
Case=Nom|Number=Sing | který | která | které | |
Case=Nom|Number=Plur | které | která |
VERB
116 VERB tokens (6% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Mood=EMPTY (116; 100%), Person=EMPTY (116; 100%), Voice=Act (116; 100%), Tense=Past (115; 99%), VerbForm=Part (115; 99%), Polarity=Pos (106; 91%).
VERB
tokens may have the following values of Gender
:
Fem,Masc
(35; 30% of non-emptyGender
): přestaly, nastaly, staly, dosáhly, existovaly, překročily, rozhodly, navazovaly, neprošly, nepřevýšilyFem,Neut
(51; 44% of non-emptyGender
): nabyla, určila, překročila, sestavila, stanovila, podávala, provedla, dospěla, mohla, mělaMasc
(11; 9% of non-emptyGender
): Dal, dozvěděl, mohl, nepožádali, nezahájil, počínaje, přesáhl, rovnal, schválili, stalNeut
(19; 16% of non-emptyGender
): došlo, trvalo, započalo, mohlo, přešlo, uzavřeloEMPTY
(1741): obsahuje, rozumí, může, uvede, mohou, použijí, stanoví, vést, musí, účtuje
Paradigm moci | Fem,Neut | Masc | Neut |
---|---|---|---|
Number=Sing | mohl | mohlo | |
Number=Plur,Sing | mohla |
PRON
90 PRON tokens (14% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Reflex=EMPTY (90; 100%), Variant=EMPTY (89; 99%), Number=Sing (85; 94%), Person=EMPTY (54; 60%), PronType=Rel (46; 51%).
PRON
tokens may have the following values of Gender
:
Fem
(28; 31% of non-emptyGender
): jí, ji, ní, níž, veškeré, jež, nižMasc
(6; 7% of non-emptyGender
): jenž, veškeréMasc,Neut
(55; 61% of non-emptyGender
): němž, jej, němuž, jehož, nějž, něj, veškerého, ho, jemu, jímžNeut
(1; 1% of non-emptyGender
): veškeréEMPTY
(541): se, nichž, je, jim, jimiž, nich, sobě, jimi, nimi, ně
Paradigm veškerý | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Animacy=Inan|Case=Nom|Number=Plur | veškeré | |||
Case=Acc|Number=Sing | veškeré | |||
Case=Acc|Number=Plur | veškeré | veškeré | ||
Case=Gen|Number=Sing | veškerého | |||
Case=Nom|Number=Plur | veškeré |
AUX
59 AUX tokens (10% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Mood=EMPTY (59; 100%), Tense=Past (59; 100%), Person=EMPTY (59; 100%), Voice=Act (59; 100%), VerbForm=Part (59; 100%), Polarity=Pos (47; 80%).
AUX
tokens may have the following values of Gender
:
Fem,Masc
(26; 44% of non-emptyGender
): byly, nebylyFem,Neut
(9; 15% of non-emptyGender
): byla, nebylaMasc
(14; 24% of non-emptyGender
): byl, nebylNeut
(10; 17% of non-emptyGender
): byloEMPTY
(511): je, jsou, nejsou, být, není, by, bude, budou
Paradigm být | Fem,Masc | Fem,Neut | Masc | Neut |
---|---|---|---|---|
Animacy=Inan|Number=Plur|Polarity=Neg | nebyly | |||
Animacy=Inan|Number=Plur|Polarity=Pos | byly | |||
Number=Sing|Polarity=Neg | nebyl | |||
Number=Sing|Polarity=Pos | byl | bylo | ||
Number=Plur,Sing|Polarity=Neg | nebyla | |||
Number=Plur,Sing|Polarity=Pos | byla |
NUM
46 NUM tokens (10% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumForm=Word (46; 100%), NumType=Card (46; 100%), NumValue=1,2,3 (46; 100%), Number=Sing (38; 83%).
NUM
tokens may have the following values of Gender
:
Fem
(11; 24% of non-emptyGender
): jedné, jednou, jednuFem,Neut
(7; 15% of non-emptyGender
): dvě, oběMasc
(19; 41% of non-emptyGender
): jeden, dvaMasc,Neut
(6; 13% of non-emptyGender
): jednoho, jednom, jednomu, jednímNeut
(3; 7% of non-emptyGender
): jednoEMPTY
(394): 1, 3, 2, 4, 5, 41, 7, tří, 10, 2004
Paradigm jeden | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Animacy=Inan|Case=Acc | jeden | |||
Case=Acc | jednu | jedno | ||
Case=Dat | jednomu | |||
Case=Gen | jednoho | jedné | ||
Case=Ins | jedním | jednou | ||
Case=Loc | jednom | |||
Case=Nom | jeden |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (5933; 97%),
NOUN –[conj]–> NOUN (979; 54%),
ADJ –[conj]–> ADJ (190; 83%),
NOUN –[appos]–> NOUN (48; 72%),
NOUN –[xcomp]–> ADJ (15; 94%),
VERB –[conj]–> VERB (11; 52%),
DET –[nmod]–> NOUN (9; 82%),
ADJ –[dep]–> NOUN (6; 75%),
ADJ –[obj]–> PRON (6; 55%),
ADJ –[amod]–> ADJ (5; 83%).