Treebank Statistics: UD_Czech-FicTree: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
This is a layered feature with the following layers: Gender, Gender[psor].
68808 tokens (41%) have a non-empty value of Gender.
23540 types (86%) occur at least once with a non-empty value of Gender.
11566 lemmas (84%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (27596; 17% instances), VERB (14516; 9% instances), ADJ (10889; 7% instances), DET (8093; 5% instances), PRON (3610; 2% instances), PROPN (2255; 1% instances), AUX (1010; 1% instances), NUM (839; 1% instances).
NOUN
27596 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Polarity=Pos (27558; 100%), Number=Sing (21353; 77%), Animacy=EMPTY (15698; 57%).
NOUN tokens may have the following values of Gender:
Fem(11622; 42% of non-emptyGender): chvíli, oči, dívka, ruce, dveře, paní, děti, Kůra, práce, ženaMasc(11898; 43% of non-emptyGender): život, den, člověk, plod, profesor, mistr, čas, muž, lidé, mladíkNeut(4076; 15% of non-emptyGender): dítě, let, slova, září, místo, tělo, srdce, okna, štěstí, léta
| Paradigm dítě | Fem | Neut |
|---|---|---|
| Case=Acc|Number=Sing | dítě | |
| Case=Acc|Number=Plur | děti | |
| Case=Dat|Number=Sing | dítěti | |
| Case=Dat|Number=Plur | dětem | |
| Case=Gen|Number=Sing | dítěte | |
| Case=Gen|Number=Plur | dětí | |
| Case=Ins|Number=Sing | dítětem | |
| Case=Ins|Number=Plur | dětmi | |
| Case=Loc|Number=Plur | dětech | |
| Case=Nom|Number=Sing | dítě | |
| Case=Nom|Number=Plur | děti | |
| Case=Voc|Number=Plur | děti |
Gender seems to be lexical feature of NOUN. 100% lemmas (5250) occur only with one value of Gender.
VERB
14516 VERB tokens (58% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Voice=Act (14516; 100%), Person=EMPTY (14516; 100%), Mood=EMPTY (14516; 100%), Tense=Past (14467; 100%), VerbForm=Part (14464; 100%), Polarity=Pos (13013; 90%), Number=Sing (12521; 86%), Animacy=Anim (7753; 53%).
VERB tokens may have the following values of Gender:
Fem(4552; 31% of non-emptyGender): měla, řekla, byla, chtěla, mohla, vzala, přišla, začala, dala, nemělaMasc(8586; 59% of non-emptyGender): řekl, měl, mohl, chtěl, byl, viděl, začal, přišel, vzal, zeptalNeut(1378; 9% of non-emptyGender): bylo, stalo, zdálo, napadlo, nebylo, mělo, začalo, šlo, mohlo, podařiloEMPTY(10434): je, má, mám, může, nevím, dělat, musí, není, mají, mít
| Paradigm mít | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Number=Sing|Polarity=Neg | neměl | ||
| Animacy=Anim|Number=Sing|Polarity=Pos | měl | ||
| Animacy=Anim|Number=Plur|Polarity=Neg | neměli | ||
| Animacy=Anim|Number=Plur|Polarity=Pos | měli | ||
| Animacy=Inan|Number=Sing|Polarity=Pos | měl | ||
| Animacy=Inan|Number=Plur|Polarity=Pos | měly | ||
| Number=Sing|Polarity=Neg | neměla | nemělo | |
| Number=Sing|Polarity=Pos | měla | mělo | |
| Number=Plur|Polarity=Neg | neměly | ||
| Number=Plur|Polarity=Pos | měly | měla |
ADJ
10889 ADJ tokens (100% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Polarity=Pos (9991; 92%), Degree=Pos (9039; 83%), Number=Sing (8342; 77%), Animacy=EMPTY (6273; 58%).
ADJ tokens may have the following values of Gender:
Fem(4428; 41% of non-emptyGender): celou, poslední, první, ráda, celá, další, malá, hlavní, velké, malouMasc(4616; 42% of non-emptyGender): celý, rád, další, první, malý, druhý, starý, jediný, ostatní, mladýNeut(1845; 17% of non-emptyGender): jiného, jasné, možné, jiná, malé, celé, první, druhé, lepší, těžkéEMPTY(11): marx, I, Saint, dvou, make, ping, show, troj, tří, československo
| Paradigm celý | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc|Number=Sing|Polarity=Pos | celého | ||
| Animacy=Anim|Case=Gen|Number=Sing|Polarity=Pos | celého | ||
| Animacy=Anim|Case=Nom|Number=Sing|Polarity=Pos | celý | ||
| Animacy=Anim|Case=Nom|Number=Plur|Polarity=Pos | celí | ||
| Animacy=Inan|Case=Acc|Number=Sing|Polarity=Neg | Necelý | ||
| Animacy=Inan|Case=Acc|Number=Sing|Polarity=Pos | celý | ||
| Animacy=Inan|Case=Acc|Number=Plur|Polarity=Pos | celé | ||
| Animacy=Inan|Case=Dat|Number=Sing|Polarity=Pos | celému | ||
| Animacy=Inan|Case=Gen|Number=Sing|Polarity=Pos | celého | ||
| Animacy=Inan|Case=Ins|Number=Sing|Polarity=Pos | celým | ||
| Animacy=Inan|Case=Loc|Number=Sing|Polarity=Pos | celém | ||
| Animacy=Inan|Case=Nom|Number=Sing|Polarity=Pos | celý | ||
| Animacy=Inan|Case=Nom|Number=Plur|Polarity=Neg | necelé | ||
| Case=Acc|Number=Sing|Polarity=Pos | celou | celé | |
| Case=Acc|Number=Plur|Polarity=Pos | celé | celá | |
| Case=Dat|Number=Sing|Polarity=Pos | celé | celému | |
| Case=Gen|Number=Sing|Polarity=Pos | celé | celého | |
| Case=Gen|Number=Plur|Polarity=Pos | celých | ||
| Case=Ins|Number=Sing|Polarity=Pos | celou | celým | |
| Case=Loc|Number=Sing|Polarity=Pos | celé | celém | |
| Case=Nom|Number=Sing|Polarity=Pos | celá | celé | |
| Case=Nom|Number=Plur|Polarity=Pos | celé |
DET
8093 DET tokens (96% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number[psor]=EMPTY (6697; 83%), Person=EMPTY (6697; 83%), Number=Sing (6639; 82%), Poss=EMPTY (5949; 74%), Animacy=EMPTY (5406; 67%).
DET tokens may have the following values of Gender:
Fem(2339; 29% of non-emptyGender): která, jeho, té, které, tu, ta, své, svou, kterou, jejíMasc(2687; 33% of non-emptyGender): který, ten, jeho, sám, každý, můj, svého, všichni, kteří, svůjNeut(3067; 38% of non-emptyGender): to, všechno, tom, tím, toho, tomu, tohle, které, jeho, svéEMPTY(323): několik, tolik, kolik, několika, mnoho, hodně, moc, víc, málo, mnoha
| Paradigm ten | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc|Number=Sing | toho | ||
| Animacy=Anim|Case=Acc|Number=Plur | ty | ||
| Animacy=Anim|Case=Dat|Number=Sing | tomu | ||
| Animacy=Anim|Case=Dat|Number=Plur | těm | ||
| Animacy=Anim|Case=Gen|Number=Sing | toho | ||
| Animacy=Anim|Case=Gen|Number=Plur | těch | ||
| Animacy=Anim|Case=Ins|Number=Sing | tím | ||
| Animacy=Anim|Case=Ins|Number=Plur | těmi | ||
| Animacy=Anim|Case=Loc|Number=Sing | tom | ||
| Animacy=Anim|Case=Loc|Number=Plur | těch | ||
| Animacy=Anim|Case=Nom|Number=Sing | ten | ||
| Animacy=Anim|Case=Nom|Number=Plur | ti | ||
| Animacy=Inan|Case=Acc|Number=Sing | ten | ||
| Animacy=Inan|Case=Acc|Number=Plur | ty | ||
| Animacy=Inan|Case=Dat|Number=Sing | tomu | ||
| Animacy=Inan|Case=Dat|Number=Plur | těm | ||
| Animacy=Inan|Case=Gen|Number=Sing | toho | ||
| Animacy=Inan|Case=Gen|Number=Plur | těch | ||
| Animacy=Inan|Case=Ins|Number=Sing | tím | ||
| Animacy=Inan|Case=Ins|Number=Plur | těmi | ||
| Animacy=Inan|Case=Loc|Number=Sing | tom | ||
| Animacy=Inan|Case=Loc|Number=Plur | těch | ||
| Animacy=Inan|Case=Nom|Number=Sing | ten | ||
| Animacy=Inan|Case=Nom|Number=Plur | ty | ||
| Case=Acc|Number=Sing | tu | to | |
| Case=Acc|Number=Plur | ty | ta | |
| Case=Dat|Number=Sing | té | tomu | |
| Case=Dat|Number=Plur | těm | ||
| Case=Gen|Number=Sing | té | toho | |
| Case=Gen|Number=Sing|Style=Coll | tý | ||
| Case=Gen|Number=Plur | těch | těch | |
| Case=Ins|Number=Sing | tou | tím | |
| Case=Ins|Number=Plur | těmi | těmi | |
| Case=Loc|Number=Sing | té | tom | |
| Case=Loc|Number=Plur | těch | těch | |
| Case=Nom|Number=Sing | ta | to | |
| Case=Nom|Number=Plur | ty | ta |
PRON
3610 PRON tokens (26% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Reflex=EMPTY (3610; 100%), Person=3 (2937; 81%), PronType=Prs (2937; 81%), Variant=EMPTY (2620; 73%), Number=Sing (2524; 70%), Animacy=Anim (2036; 56%).
PRON tokens may have the following values of Gender:
Fem(1058; 29% of non-emptyGender): ji, jí, ní, ona, je, ni, nich, níž, ně, jichMasc(2380; 66% of non-emptyGender): ho, mu, kdo, je, on, nikdo, něj, někdo, ním, jimNeut(172; 5% of non-emptyGender): je, ho, všecko, ně, něj, něm, co, jež, mu, onoEMPTY(10496): se, si, mi, co, mě, já, nic, něco, nás, ti
| Paradigm on | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc|Number=Sing|PrepCase=Pre | něj, něho | ||
| Animacy=Anim|Case=Acc|Number=Sing | jeho | ||
| Animacy=Anim|Case=Acc|Number=Sing|Style=Arch | jej | ||
| Animacy=Anim|Case=Acc|Number=Sing|Variant=Short | ho | ||
| Animacy=Anim|Case=Acc|Number=Plur|PrepCase=Pre | ně | ||
| Animacy=Anim|Case=Acc|Number=Plur | je | ||
| Animacy=Anim|Case=Dat|Number=Sing|PrepCase=Pre | němu | ||
| Animacy=Anim|Case=Dat|Number=Sing | jemu | ||
| Animacy=Anim|Case=Dat|Number=Sing|Variant=Short | mu | ||
| Animacy=Anim|Case=Dat|Number=Plur|PrepCase=Pre | nim | ||
| Animacy=Anim|Case=Dat|Number=Plur | jim | ||
| Animacy=Anim|Case=Gen|Number=Sing|PrepCase=Pre | něj, něho | ||
| Animacy=Anim|Case=Gen|Number=Sing | jeho | ||
| Animacy=Anim|Case=Gen|Number=Sing|Variant=Short | ho | ||
| Animacy=Anim|Case=Gen|Number=Plur|PrepCase=Pre | nich | ||
| Animacy=Anim|Case=Gen|Number=Plur | jich | ||
| Animacy=Anim|Case=Ins|Number=Sing|PrepCase=Pre | ním | ||
| Animacy=Anim|Case=Ins|Number=Sing | jím | ||
| Animacy=Anim|Case=Ins|Number=Plur|PrepCase=Pre | nimi | ||
| Animacy=Anim|Case=Ins|Number=Plur | jimi | ||
| Animacy=Anim|Case=Loc|Number=Sing|PrepCase=Pre | něm | ||
| Animacy=Anim|Case=Loc|Number=Plur|PrepCase=Pre | nich | ||
| Animacy=Anim|Case=Nom|Number=Sing | on | ||
| Animacy=Anim|Case=Nom|Number=Plur | oni | ||
| Animacy=Inan|Case=Acc|Number=Sing|PrepCase=Pre | něj | ||
| Animacy=Inan|Case=Acc|Number=Sing|Style=Arch | jej | ||
| Animacy=Inan|Case=Acc|Number=Sing|Variant=Short | ho | ||
| Animacy=Inan|Case=Acc|Number=Plur|PrepCase=Pre | ně | ||
| Animacy=Inan|Case=Acc|Number=Plur | je | ||
| Animacy=Inan|Case=Dat|Number=Sing|PrepCase=Pre | němu | ||
| Animacy=Inan|Case=Dat|Number=Sing|Variant=Short | mu | ||
| Animacy=Inan|Case=Dat|Number=Plur | jim | ||
| Animacy=Inan|Case=Gen|Number=Sing|PrepCase=Pre | něj, něho | ||
| Animacy=Inan|Case=Gen|Number=Sing|Variant=Short | ho | ||
| Animacy=Inan|Case=Gen|Number=Plur|PrepCase=Pre | nich | ||
| Animacy=Inan|Case=Gen|Number=Plur | jich | ||
| Animacy=Inan|Case=Ins|Number=Sing|PrepCase=Pre | ním | ||
| Animacy=Inan|Case=Ins|Number=Plur|PrepCase=Pre | nimi | ||
| Animacy=Inan|Case=Ins|Number=Plur | jimi | ||
| Animacy=Inan|Case=Loc|Number=Sing|PrepCase=Pre | něm | ||
| Animacy=Inan|Case=Loc|Number=Plur|PrepCase=Pre | nich | ||
| Animacy=Inan|Case=Nom|Number=Plur | ony | ||
| Case=Acc|Number=Sing|PrepCase=Pre | ni | ně, něj, něho | |
| Case=Acc|Number=Sing | ji | je | |
| Case=Acc|Number=Sing|Style=Coll | jí | ||
| Case=Acc|Number=Sing|Variant=Short | ho | ||
| Case=Acc|Number=Plur|PrepCase=Pre | ně | ně | |
| Case=Acc|Number=Plur | je | je | |
| Case=Dat|Number=Sing|PrepCase=Pre | ní | ||
| Case=Dat|Number=Sing | jí | ||
| Case=Dat|Number=Sing|Variant=Short | mu | ||
| Case=Dat|Number=Plur|PrepCase=Pre | nim | nim | |
| Case=Dat|Number=Plur | jim | ||
| Case=Gen|Number=Sing|PrepCase=Pre | ní | něj, něho | |
| Case=Gen|Number=Sing | jí | ||
| Case=Gen|Number=Sing|Variant=Short | ho | ||
| Case=Gen|Number=Plur|PrepCase=Pre | nich | ||
| Case=Gen|Number=Plur | jich | jich | |
| Case=Ins|Number=Sing|PrepCase=Pre | ní | ním | |
| Case=Ins|Number=Sing | jí | jím | |
| Case=Ins|Number=Plur|PrepCase=Pre | nimi | nimi | |
| Case=Ins|Number=Plur | jimi | ||
| Case=Loc|Number=Sing|PrepCase=Pre | ní | něm | |
| Case=Loc|Number=Plur|PrepCase=Pre | nich | nich | |
| Case=Nom|Number=Sing | ona | ono | |
| Case=Nom|Number=Plur | ony | Ona |
PROPN
2255 PROPN tokens (100% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Polarity=Pos (2255; 100%), Number=Sing (2143; 95%), Case=Nom (1278; 57%), Animacy=Anim (1278; 57%).
PROPN tokens may have the following values of Gender:
Fem(822; 36% of non-emptyGender): Valentýna, Alžběta, Veronika, Alice, Praze, Prahy, Čáslavi, Janičku, Magda, MášaMasc(1391; 62% of non-emptyGender): Láďa, Leoš, Eduard, Havel, Flajšman, Havlena, Filip, Honza, K, NěmciNeut(42; 2% of non-emptyGender): Československu, Německa, zoo, Československa, C, Japonska, Německu, Ruska, Angeles, Gobi
| Paradigm K | Masc | Fem |
|---|---|---|
| Animacy=Anim | K | |
| K |
Gender seems to be lexical feature of PROPN. 98% lemmas (418) occur only with one value of Gender.
AUX
1010 AUX tokens (15% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Voice=Act (1010; 100%), Person=EMPTY (1010; 100%), Mood=EMPTY (1010; 100%), Tense=Past (1009; 100%), VerbForm=Part (1009; 100%), Polarity=Pos (925; 92%), Number=Sing (865; 86%).
AUX tokens may have the following values of Gender:
Fem(321; 32% of non-emptyGender): byla, byly, nebyla, bývala, jsoucMasc(475; 47% of non-emptyGender): byl, byli, nebyl, byly, býval, nebyly, nebyli, bývaliNeut(214; 21% of non-emptyGender): bylo, nebylo, byla, bývalo, nebyla, nebývalo, šloEMPTY(5508): jsem, by, je, bych, jsme, bude, jsou, jste, jsi, být
| Paradigm být | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyl | ||
| Animacy=Anim|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | ||
| Animacy=Anim|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyli | ||
| Animacy=Anim|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byli | ||
| Animacy=Inan|Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyl | ||
| Animacy=Inan|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | ||
| Animacy=Inan|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyly | ||
| Animacy=Inan|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byly | ||
| Aspect=Imp|Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Conv | jsouc | ||
| Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyla | nebylo | |
| Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byla | bylo | |
| Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyla | ||
| Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byly | byla |
NUM
839 NUM tokens (59% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumValue=1,2,3 (834; 99%), NumForm=Word (834; 99%), NumType=Card (834; 99%), Number=Plur (425; 51%).
NUM tokens may have the following values of Gender:
Fem(268; 32% of non-emptyGender): dvě, jedna, jednu, jedné, tři, obě, jednou, dvou, čtyři, obouMasc(467; 56% of non-emptyGender): jeden, dva, jednoho, oba, tři, čtyři, jedním, dvěma, tisíc, dvouNeut(104; 12% of non-emptyGender): jedno, dvě, jednom, tři, jednoho, obě, jedním, půl, čtyř, čtyřiEMPTY(573): pár, deset, dvacet, pět, třicet, šest, dvanáct, pěti, čtrnáct, devět
| Paradigm jeden | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | jednoho, jeden | ||
| Animacy=Anim|Case=Dat | jednomu | ||
| Animacy=Anim|Case=Gen | jednoho | ||
| Animacy=Anim|Case=Ins | jedním | ||
| Animacy=Anim|Case=Nom | jeden | ||
| Animacy=Anim|Case=Voc | jeden | ||
| Animacy=Inan|Case=Acc | jeden | ||
| Animacy=Inan|Case=Dat | jednomu | ||
| Animacy=Inan|Case=Gen | jednoho | ||
| Animacy=Inan|Case=Ins | jedním | ||
| Animacy=Inan|Case=Loc | jednom | ||
| Animacy=Inan|Case=Nom | jeden | ||
| Case=Acc | jednu | jedno | |
| Case=Dat | jedné | jednomu | |
| Case=Gen | jedné | jednoho | |
| Case=Ins | jednou | jedním | |
| Case=Loc | jedné | jednom | |
| Case=Nom | jedna | jedno |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (7654; 100%),
NOUN –[det]–> DET (4067; 99%),
VERB –[nsubj]–> NOUN (3148; 69%),
VERB –[conj]–> VERB (2881; 72%),
VERB –[nsubj]–> DET (682; 60%),
VERB –[nsubj]–> PROPN (675; 73%),
NOUN –[nummod]–> NUM (534; 85%),
ADJ –[conj]–> ADJ (518; 97%),
ADJ –[nsubj]–> NOUN (348; 98%),
PROPN –[nmod]–> NOUN (236; 95%).