Treebank Statistics: UD_Czech-FicTree: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
This is a layered feature with the following layers: Gender, Gender[psor].
68808 tokens (41%) have a non-empty value of Gender
.
23540 types (86%) occur at least once with a non-empty value of Gender
.
11566 lemmas (84%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (27596; 17% instances), VERB (14516; 9% instances), ADJ (10889; 7% instances), DET (8093; 5% instances), PRON (3610; 2% instances), PROPN (2255; 1% instances), AUX (1010; 1% instances), NUM (839; 1% instances).
NOUN
27596 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Polarity=Pos (27558; 100%), Number=Sing (21353; 77%), Animacy=EMPTY (15698; 57%).
NOUN
tokens may have the following values of Gender
:
Fem
(11622; 42% of non-emptyGender
): chvíli, oči, dívka, ruce, dveře, paní, děti, Kůra, práce, ženaMasc
(11898; 43% of non-emptyGender
): život, den, člověk, plod, profesor, mistr, čas, muž, lidé, mladíkNeut
(4076; 15% of non-emptyGender
): dítě, let, slova, září, místo, tělo, srdce, okna, štěstí, léta
Paradigm dítě | Fem | Neut |
---|---|---|
Case=Acc|Number=Sing | dítě | |
Case=Acc|Number=Plur | děti | |
Case=Dat|Number=Sing | dítěti | |
Case=Dat|Number=Plur | dětem | |
Case=Gen|Number=Sing | dítěte | |
Case=Gen|Number=Plur | dětí | |
Case=Ins|Number=Sing | dítětem | |
Case=Ins|Number=Plur | dětmi | |
Case=Loc|Number=Plur | dětech | |
Case=Nom|Number=Sing | dítě | |
Case=Nom|Number=Plur | děti | |
Case=Voc|Number=Plur | děti |
Gender
seems to be lexical feature of NOUN
. 100% lemmas (5250) occur only with one value of Gender
.
VERB
14516 VERB tokens (58% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Voice=Act (14516; 100%), Person=EMPTY (14516; 100%), Mood=EMPTY (14516; 100%), Tense=Past (14467; 100%), VerbForm=Part (14464; 100%), Polarity=Pos (13013; 90%), Number=Sing (12521; 86%), Animacy=Anim (7753; 53%).
VERB
tokens may have the following values of Gender
:
Fem
(4552; 31% of non-emptyGender
): měla, řekla, byla, chtěla, mohla, vzala, přišla, začala, dala, nemělaMasc
(8586; 59% of non-emptyGender
): řekl, měl, mohl, chtěl, byl, viděl, začal, přišel, vzal, zeptalNeut
(1378; 9% of non-emptyGender
): bylo, stalo, zdálo, napadlo, nebylo, mělo, začalo, šlo, mohlo, podařiloEMPTY
(10434): je, má, mám, může, nevím, dělat, musí, není, mají, mít
Paradigm mít | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Number=Sing|Polarity=Neg | neměl | ||
Animacy=Anim|Number=Sing|Polarity=Pos | měl | ||
Animacy=Anim|Number=Plur|Polarity=Neg | neměli | ||
Animacy=Anim|Number=Plur|Polarity=Pos | měli | ||
Animacy=Inan|Number=Sing|Polarity=Pos | měl | ||
Animacy=Inan|Number=Plur|Polarity=Pos | měly | ||
Number=Sing|Polarity=Neg | neměla | nemělo | |
Number=Sing|Polarity=Pos | měla | mělo | |
Number=Plur|Polarity=Neg | neměly | ||
Number=Plur|Polarity=Pos | měly | měla |
ADJ
10889 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Polarity=Pos (9991; 92%), Degree=Pos (9039; 83%), Number=Sing (8342; 77%), Animacy=EMPTY (6273; 58%).
ADJ
tokens may have the following values of Gender
:
Fem
(4428; 41% of non-emptyGender
): celou, poslední, první, ráda, celá, další, malá, hlavní, velké, malouMasc
(4616; 42% of non-emptyGender
): celý, rád, další, první, malý, druhý, starý, jediný, ostatní, mladýNeut
(1845; 17% of non-emptyGender
): jiného, jasné, možné, jiná, malé, celé, první, druhé, lepší, těžkéEMPTY
(11): marx, I, Saint, dvou, make, ping, show, troj, tří, československo
Paradigm celý | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|Number=Sing|Polarity=Pos | celého | ||
Animacy=Anim|Case=Gen|Number=Sing|Polarity=Pos | celého | ||
Animacy=Anim|Case=Nom|Number=Sing|Polarity=Pos | celý | ||
Animacy=Anim|Case=Nom|Number=Plur|Polarity=Pos | celí | ||
Animacy=Inan|Case=Acc|Number=Sing|Polarity=Neg | Necelý | ||
Animacy=Inan|Case=Acc|Number=Sing|Polarity=Pos | celý | ||
Animacy=Inan|Case=Acc|Number=Plur|Polarity=Pos | celé | ||
Animacy=Inan|Case=Dat|Number=Sing|Polarity=Pos | celému | ||
Animacy=Inan|Case=Gen|Number=Sing|Polarity=Pos | celého | ||
Animacy=Inan|Case=Ins|Number=Sing|Polarity=Pos | celým | ||
Animacy=Inan|Case=Loc|Number=Sing|Polarity=Pos | celém | ||
Animacy=Inan|Case=Nom|Number=Sing|Polarity=Pos | celý | ||
Animacy=Inan|Case=Nom|Number=Plur|Polarity=Neg | necelé | ||
Case=Acc|Number=Sing|Polarity=Pos | celou | celé | |
Case=Acc|Number=Plur|Polarity=Pos | celé | celá | |
Case=Dat|Number=Sing|Polarity=Pos | celé | celému | |
Case=Gen|Number=Sing|Polarity=Pos | celé | celého | |
Case=Gen|Number=Plur|Polarity=Pos | celých | ||
Case=Ins|Number=Sing|Polarity=Pos | celou | celým | |
Case=Loc|Number=Sing|Polarity=Pos | celé | celém | |
Case=Nom|Number=Sing|Polarity=Pos | celá | celé | |
Case=Nom|Number=Plur|Polarity=Pos | celé |
DET
8093 DET tokens (96% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number[psor]=EMPTY (6697; 83%), Person=EMPTY (6697; 83%), Number=Sing (6639; 82%), Poss=EMPTY (5949; 74%), Animacy=EMPTY (5406; 67%).
DET
tokens may have the following values of Gender
:
Fem
(2339; 29% of non-emptyGender
): která, jeho, té, které, tu, ta, své, svou, kterou, jejíMasc
(2687; 33% of non-emptyGender
): který, ten, jeho, sám, každý, můj, svého, všichni, kteří, svůjNeut
(3067; 38% of non-emptyGender
): to, všechno, tom, tím, toho, tomu, tohle, které, jeho, svéEMPTY
(323): několik, tolik, kolik, několika, mnoho, hodně, moc, víc, málo, mnoha
Paradigm ten | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|Number=Sing | toho | ||
Animacy=Anim|Case=Acc|Number=Plur | ty | ||
Animacy=Anim|Case=Dat|Number=Sing | tomu | ||
Animacy=Anim|Case=Dat|Number=Plur | těm | ||
Animacy=Anim|Case=Gen|Number=Sing | toho | ||
Animacy=Anim|Case=Gen|Number=Plur | těch | ||
Animacy=Anim|Case=Ins|Number=Sing | tím | ||
Animacy=Anim|Case=Ins|Number=Plur | těmi | ||
Animacy=Anim|Case=Loc|Number=Sing | tom | ||
Animacy=Anim|Case=Loc|Number=Plur | těch | ||
Animacy=Anim|Case=Nom|Number=Sing | ten | ||
Animacy=Anim|Case=Nom|Number=Plur | ti | ||
Animacy=Inan|Case=Acc|Number=Sing | ten | ||
Animacy=Inan|Case=Acc|Number=Plur | ty | ||
Animacy=Inan|Case=Dat|Number=Sing | tomu | ||
Animacy=Inan|Case=Dat|Number=Plur | těm | ||
Animacy=Inan|Case=Gen|Number=Sing | toho | ||
Animacy=Inan|Case=Gen|Number=Plur | těch | ||
Animacy=Inan|Case=Ins|Number=Sing | tím | ||
Animacy=Inan|Case=Ins|Number=Plur | těmi | ||
Animacy=Inan|Case=Loc|Number=Sing | tom | ||
Animacy=Inan|Case=Loc|Number=Plur | těch | ||
Animacy=Inan|Case=Nom|Number=Sing | ten | ||
Animacy=Inan|Case=Nom|Number=Plur | ty | ||
Case=Acc|Number=Sing | tu | to | |
Case=Acc|Number=Plur | ty | ta | |
Case=Dat|Number=Sing | té | tomu | |
Case=Dat|Number=Plur | těm | ||
Case=Gen|Number=Sing | té | toho | |
Case=Gen|Number=Sing|Style=Coll | tý | ||
Case=Gen|Number=Plur | těch | těch | |
Case=Ins|Number=Sing | tou | tím | |
Case=Ins|Number=Plur | těmi | těmi | |
Case=Loc|Number=Sing | té | tom | |
Case=Loc|Number=Plur | těch | těch | |
Case=Nom|Number=Sing | ta | to | |
Case=Nom|Number=Plur | ty | ta |
PRON
3610 PRON tokens (26% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Reflex=EMPTY (3610; 100%), Person=3 (2937; 81%), PronType=Prs (2937; 81%), Variant=EMPTY (2620; 73%), Number=Sing (2524; 70%), Animacy=Anim (2036; 56%).
PRON
tokens may have the following values of Gender
:
Fem
(1058; 29% of non-emptyGender
): ji, jí, ní, ona, je, ni, nich, níž, ně, jichMasc
(2380; 66% of non-emptyGender
): ho, mu, kdo, je, on, nikdo, něj, někdo, ním, jimNeut
(172; 5% of non-emptyGender
): je, ho, všecko, ně, něj, něm, co, jež, mu, onoEMPTY
(10496): se, si, mi, co, mě, já, nic, něco, nás, ti
Paradigm on | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|Number=Sing|PrepCase=Pre | něj, něho | ||
Animacy=Anim|Case=Acc|Number=Sing | jeho | ||
Animacy=Anim|Case=Acc|Number=Sing|Style=Arch | jej | ||
Animacy=Anim|Case=Acc|Number=Sing|Variant=Short | ho | ||
Animacy=Anim|Case=Acc|Number=Plur|PrepCase=Pre | ně | ||
Animacy=Anim|Case=Acc|Number=Plur | je | ||
Animacy=Anim|Case=Dat|Number=Sing|PrepCase=Pre | němu | ||
Animacy=Anim|Case=Dat|Number=Sing | jemu | ||
Animacy=Anim|Case=Dat|Number=Sing|Variant=Short | mu | ||
Animacy=Anim|Case=Dat|Number=Plur|PrepCase=Pre | nim | ||
Animacy=Anim|Case=Dat|Number=Plur | jim | ||
Animacy=Anim|Case=Gen|Number=Sing|PrepCase=Pre | něj, něho | ||
Animacy=Anim|Case=Gen|Number=Sing | jeho | ||
Animacy=Anim|Case=Gen|Number=Sing|Variant=Short | ho | ||
Animacy=Anim|Case=Gen|Number=Plur|PrepCase=Pre | nich | ||
Animacy=Anim|Case=Gen|Number=Plur | jich | ||
Animacy=Anim|Case=Ins|Number=Sing|PrepCase=Pre | ním | ||
Animacy=Anim|Case=Ins|Number=Sing | jím | ||
Animacy=Anim|Case=Ins|Number=Plur|PrepCase=Pre | nimi | ||
Animacy=Anim|Case=Ins|Number=Plur | jimi | ||
Animacy=Anim|Case=Loc|Number=Sing|PrepCase=Pre | něm | ||
Animacy=Anim|Case=Loc|Number=Plur|PrepCase=Pre | nich | ||
Animacy=Anim|Case=Nom|Number=Sing | on | ||
Animacy=Anim|Case=Nom|Number=Plur | oni | ||
Animacy=Inan|Case=Acc|Number=Sing|PrepCase=Pre | něj | ||
Animacy=Inan|Case=Acc|Number=Sing|Style=Arch | jej | ||
Animacy=Inan|Case=Acc|Number=Sing|Variant=Short | ho | ||
Animacy=Inan|Case=Acc|Number=Plur|PrepCase=Pre | ně | ||
Animacy=Inan|Case=Acc|Number=Plur | je | ||
Animacy=Inan|Case=Dat|Number=Sing|PrepCase=Pre | němu | ||
Animacy=Inan|Case=Dat|Number=Sing|Variant=Short | mu | ||
Animacy=Inan|Case=Dat|Number=Plur | jim | ||
Animacy=Inan|Case=Gen|Number=Sing|PrepCase=Pre | něj, něho | ||
Animacy=Inan|Case=Gen|Number=Sing|Variant=Short | ho | ||
Animacy=Inan|Case=Gen|Number=Plur|PrepCase=Pre | nich | ||
Animacy=Inan|Case=Gen|Number=Plur | jich | ||
Animacy=Inan|Case=Ins|Number=Sing|PrepCase=Pre | ním | ||
Animacy=Inan|Case=Ins|Number=Plur|PrepCase=Pre | nimi | ||
Animacy=Inan|Case=Ins|Number=Plur | jimi | ||
Animacy=Inan|Case=Loc|Number=Sing|PrepCase=Pre | něm | ||
Animacy=Inan|Case=Loc|Number=Plur|PrepCase=Pre | nich | ||
Animacy=Inan|Case=Nom|Number=Plur | ony | ||
Case=Acc|Number=Sing|PrepCase=Pre | ni | ně, něj, něho | |
Case=Acc|Number=Sing | ji | je | |
Case=Acc|Number=Sing|Style=Coll | jí | ||
Case=Acc|Number=Sing|Variant=Short | ho | ||
Case=Acc|Number=Plur|PrepCase=Pre | ně | ně | |
Case=Acc|Number=Plur | je | je | |
Case=Dat|Number=Sing|PrepCase=Pre | ní | ||
Case=Dat|Number=Sing | jí | ||
Case=Dat|Number=Sing|Variant=Short | mu | ||
Case=Dat|Number=Plur|PrepCase=Pre | nim | nim | |
Case=Dat|Number=Plur | jim | ||
Case=Gen|Number=Sing|PrepCase=Pre | ní | něj, něho | |
Case=Gen|Number=Sing | jí | ||
Case=Gen|Number=Sing|Variant=Short | ho | ||
Case=Gen|Number=Plur|PrepCase=Pre | nich | ||
Case=Gen|Number=Plur | jich | jich | |
Case=Ins|Number=Sing|PrepCase=Pre | ní | ním | |
Case=Ins|Number=Sing | jí | jím | |
Case=Ins|Number=Plur|PrepCase=Pre | nimi | nimi | |
Case=Ins|Number=Plur | jimi | ||
Case=Loc|Number=Sing|PrepCase=Pre | ní | něm | |
Case=Loc|Number=Plur|PrepCase=Pre | nich | nich | |
Case=Nom|Number=Sing | ona | ono | |
Case=Nom|Number=Plur | ony | Ona |
PROPN
2255 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Polarity=Pos (2255; 100%), Number=Sing (2143; 95%), Case=Nom (1278; 57%), Animacy=Anim (1278; 57%).
PROPN
tokens may have the following values of Gender
:
Fem
(822; 36% of non-emptyGender
): Valentýna, Alžběta, Veronika, Alice, Praze, Prahy, Čáslavi, Janičku, Magda, MášaMasc
(1391; 62% of non-emptyGender
): Láďa, Leoš, Eduard, Havel, Flajšman, Havlena, Filip, Honza, K, NěmciNeut
(42; 2% of non-emptyGender
): Československu, Německa, zoo, Československa, C, Japonska, Německu, Ruska, Angeles, Gobi
Paradigm K | Masc | Fem |
---|---|---|
Animacy=Anim | K | |
K |
Gender
seems to be lexical feature of PROPN
. 98% lemmas (418) occur only with one value of Gender
.
AUX
1010 AUX tokens (15% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Voice=Act (1010; 100%), Person=EMPTY (1010; 100%), Mood=EMPTY (1010; 100%), Tense=Past (1009; 100%), VerbForm=Part (1009; 100%), Polarity=Pos (925; 92%), Number=Sing (865; 86%).
AUX
tokens may have the following values of Gender
:
Fem
(321; 32% of non-emptyGender
): byla, byly, nebyla, bývala, jsoucMasc
(475; 47% of non-emptyGender
): byl, byli, nebyl, byly, býval, nebyly, nebyli, bývaliNeut
(214; 21% of non-emptyGender
): bylo, nebylo, byla, bývalo, nebyla, nebývalo, šloEMPTY
(5508): jsem, by, je, bych, jsme, bude, jsou, jste, jsi, být
Paradigm být | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyl | ||
Animacy=Anim|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | ||
Animacy=Anim|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyli | ||
Animacy=Anim|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byli | ||
Animacy=Inan|Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyl | ||
Animacy=Inan|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | ||
Animacy=Inan|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyly | ||
Animacy=Inan|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byly | ||
Aspect=Imp|Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Conv | jsouc | ||
Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyla | nebylo | |
Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byla | bylo | |
Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyla | ||
Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byly | byla |
NUM
839 NUM tokens (59% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumValue=1,2,3 (834; 99%), NumForm=Word (834; 99%), NumType=Card (834; 99%), Number=Plur (425; 51%).
NUM
tokens may have the following values of Gender
:
Fem
(268; 32% of non-emptyGender
): dvě, jedna, jednu, jedné, tři, obě, jednou, dvou, čtyři, obouMasc
(467; 56% of non-emptyGender
): jeden, dva, jednoho, oba, tři, čtyři, jedním, dvěma, tisíc, dvouNeut
(104; 12% of non-emptyGender
): jedno, dvě, jednom, tři, jednoho, obě, jedním, půl, čtyř, čtyřiEMPTY
(573): pár, deset, dvacet, pět, třicet, šest, dvanáct, pěti, čtrnáct, devět
Paradigm jeden | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | jednoho, jeden | ||
Animacy=Anim|Case=Dat | jednomu | ||
Animacy=Anim|Case=Gen | jednoho | ||
Animacy=Anim|Case=Ins | jedním | ||
Animacy=Anim|Case=Nom | jeden | ||
Animacy=Anim|Case=Voc | jeden | ||
Animacy=Inan|Case=Acc | jeden | ||
Animacy=Inan|Case=Dat | jednomu | ||
Animacy=Inan|Case=Gen | jednoho | ||
Animacy=Inan|Case=Ins | jedním | ||
Animacy=Inan|Case=Loc | jednom | ||
Animacy=Inan|Case=Nom | jeden | ||
Case=Acc | jednu | jedno | |
Case=Dat | jedné | jednomu | |
Case=Gen | jedné | jednoho | |
Case=Ins | jednou | jedním | |
Case=Loc | jedné | jednom | |
Case=Nom | jedna | jedno |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (7654; 100%),
NOUN –[det]–> DET (4067; 99%),
VERB –[nsubj]–> NOUN (3148; 69%),
VERB –[conj]–> VERB (2881; 72%),
VERB –[nsubj]–> DET (682; 60%),
VERB –[nsubj]–> PROPN (675; 73%),
NOUN –[nummod]–> NUM (534; 85%),
ADJ –[conj]–> ADJ (518; 97%),
ADJ –[nsubj]–> NOUN (348; 98%),
PROPN –[nmod]–> NOUN (236; 95%).