Gender
: gender
Gender is a lexical feature of nouns and inflectional feature of other parts of speech (adjectives, verbs) that mark agreement with nouns. There are three values of gender: masculine, feminine, and neuter.
See also the related feature of Animacy.
Masc
: masculine gender
Nouns denoting male persons are masculine. Other nouns may be also grammatically masculine, without any relation to sex.
Examples
- мужчина “man”
- замок “castle”
- грузовик “truck”
- председатель “chairman”
- судья “judge”
Fem
: feminine gender
Nouns denoting female persons are feminine. Other nouns may be also grammatically feminine, without any relation to sex.
Examples
- женщина “woman”
- роза “rose”
- песня “song”
- кость “bone”
Neut
: neuter gender
This third gender is for nouns that are neither masculine nor feminine (grammatically). Nouns whose nominative suffix is -о or -е (including a large group of deverbative nouns denoting actions) are usually neuter.
Examples
- место “place”
- море “sea”
- мясо “meat”
- здание “building”
Treebank Statistics (UD_Russian)
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
45156 tokens (51%) have a non-empty value of Gender
.
22932 types (84%) occur at least once with a non-empty value of Gender
.
14288 lemmas (83%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: ru-pos/NOUN (24010; 27% instances), ru-pos/ADJ (8422; 10% instances), ru-pos/PROPN (6294; 7% instances), ru-pos/VERB (3283; 4% instances), ru-pos/PRON (1249; 1% instances), ru-pos/DET (738; 1% instances), ru-pos/AUX (623; 1% instances), ru-pos/NUM (537; 1% instances).
NOUN
24010 ru-pos/NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (20746; 86%), Number=Sing (18071; 75%).
NOUN
tokens may have the following values of Gender
:
Fem
(7393; 31% of non-emptyGender
): области, войны, реки, территории, часть, части, компании, группы, площадь, армииMasc
(11991; 50% of non-emptyGender
): года, году, лет, человек, км, год, города, г., районе, годахNeut
(4626; 19% of non-emptyGender
): время, население, населения, название, место, качестве, село, начале, времени, участиеEMPTY
(52): No, n, T, f, i, x, С, AFe, B, H
Paradigm ГОД | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing | год, года | |
Case=Acc|Number=Plur | годы, лет, годов | годы |
Case=Dat|Number=Sing | году | |
Case=Dat|Number=Plur | годам | |
Case=Gen|Number=Sing | года | |
Case=Gen|Number=Plur | лет, годов | |
Case=Ins|Number=Sing | годом | |
Case=Ins|Number=Plur | годами | |
Case=Loc|Number=Sing | году | |
Case=Loc|Number=Plur | годах, годы | |
Case=Nom|Number=Sing | год | |
Case=Nom|Number=Plur | годы |
Gender
seems to be lexical feature of NOUN
. 99% lemmas (5838) occur only with one value of Gender
.
ADJ
8422 ru-pos/ADJ tokens (77% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (8421; 100%), Animacy=Inan (7652; 91%).
ADJ
tokens may have the following values of Gender
:
Fem
(2378; 28% of non-emptyGender
): второй, й, первой, российской, я, отечественной, большую, мировой, центральной, новойMasc
(4497; 53% of non-emptyGender
): 2010, 2008, 2004, 2006, 2009, 2011, первый, 2012, 2001, 2007Neut
(1547; 18% of non-emptyGender
): 12, 1, 15, 14, настоящее, 11, 21, 23, 16, 29EMPTY
(2455): х, других, различных, многие, новые, первых, самых, первые, новых, разных
Paradigm Й | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Gen | го | ||
Animacy=Anim|Case=Ins | им | ||
Animacy=Inan|Case=Acc | й | ю | е |
Animacy=Inan|Case=Dat | му | й | |
Animacy=Inan|Case=Gen | го | й | го |
Animacy=Inan|Case=Ins | м | й | |
Animacy=Inan|Case=Loc | м | й | |
Animacy=Inan|Case=Nom | й | я | е |
PROPN
6294 ru-pos/PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (6083; 97%), Animacy=Inan (3285; 52%).
PROPN
tokens may have the following values of Gender
:
Fem
(1704; 27% of non-emptyGender
): России, Украины, Франции, Германии, Европы, Испании, РФ, Москве, Франция, АнглииMasc
(4363; 69% of non-emptyGender
): США, СССР, де, Владимир, Александра, Александр, Карл, Крыма, Джон, КОАТУУNeut
(227; 4% of non-emptyGender
): ISO, Дубно, Марокко, IPO, MonaVie, Григорово, Домодедово, Евровидение, Закарпатье, Поволжье
Paradigm ДЕ | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | де | ||
Animacy=Anim|Case=Gen | де | ||
Animacy=Anim|Case=Ins | де | де | |
Animacy=Anim|Case=Loc | де | ||
Animacy=Anim|Case=Nom | де | ||
Animacy=Inan|Case=Loc | Де | ||
Animacy=Inan|Case=Nom | де |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (4361) occur only with one value of Gender
.
VERB
3283 ru-pos/VERB tokens (45% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Number=Sing (3283; 100%), Person=EMPTY (3283; 100%), Tense=Past (3064; 93%), Variant=EMPTY (2632; 80%), Aspect=Perf (2213; 67%), VerbForm=Fin (2040; 62%), Case=EMPTY (2040; 62%), Mood=Ind (2040; 62%), Animacy=EMPTY (2040; 62%).
VERB
tokens may have the following values of Gender
:
Fem
(796; 24% of non-emptyGender
): получила, основана, была, расположена, создана, вышла, род., состоялась, вошла, работалаMasc
(1964; 60% of non-emptyGender
): получил, родился, начал, работал, окончил, был, участвовал, вышел, расположен, писалNeut
(523; 16% of non-emptyGender
): было, составляло, удалось, расположено, принято, привело, произошло, пришлось, проживало, существовалоEMPTY
(4020): составляет, может, находится, входит, можно, имеет, есть, занимает, могут, нет
Paradigm БЫТЬ | Masc | Fem | Neut |
---|---|---|---|
был | была | было |
PRON
1249 ru-pos/PRON tokens (74% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (1249; 100%), Person=EMPTY (685; 55%).
PRON
tokens may have the following values of Gender
:
Fem
(230; 18% of non-emptyGender
): она, которой, которая, её, ней, которую, неё, ей, нее, ееMasc
(580; 46% of non-emptyGender
): он, который, его, ему, которого, него, ним, котором, им, нёмNeut
(439; 35% of non-emptyGender
): это, того, что, тем, том, то, этом, этого, которое, всегоEMPTY
(448): они, которые, которых, себя, собой, них, их, им, я, мы
Paradigm КОТОРЫЙ | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | которого, который | которую | |
Animacy=Anim|Case=Dat | которому | ||
Animacy=Anim|Case=Gen | которого | которой | |
Animacy=Anim|Case=Ins | которым | которой | |
Animacy=Anim|Case=Nom | который | которая | |
Animacy=Inan|Case=Acc | который | которую | которое, которого |
Animacy=Inan|Case=Dat | которому | которой | которому |
Animacy=Inan|Case=Gen | которого | которой | которого |
Animacy=Inan|Case=Ins | которым | которой | |
Animacy=Inan|Case=Loc | котором | которой | котором |
Animacy=Inan|Case=Nom | который | которая | которое |
Gender
seems to be lexical feature of PRON
. 92% lemmas (12) occur only with one value of Gender
.
DET
738 ru-pos/DET tokens (53% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (738; 100%), Person=EMPTY (705; 96%), Animacy=Inan (667; 90%), Reflex=EMPTY (569; 77%).
DET
tokens may have the following values of Gender
:
Fem
(220; 30% of non-emptyGender
): своей, этой, свою, эта, эту, всей, н., всю, каждой, каждаяMasc
(304; 41% of non-emptyGender
): этот, этого, the, свой, этом, своего, тот, каждый, весь, своемуNeut
(214; 29% of non-emptyGender
): то, это, том, своё, этого, что, свое, всё, своего, тогоEMPTY
(662): его, их, её, все, всех, некоторые, эти, своих, этих, свои
Paradigm ЭТОТ | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | этого | ||
Animacy=Anim|Case=Nom | этот | ||
Animacy=Inan|Case=Acc | этот | эту | это |
Animacy=Inan|Case=Dat | этому | этой | |
Animacy=Inan|Case=Gen | этого | этой, это | этого |
Animacy=Inan|Case=Ins | этим | этой | Этим |
Animacy=Inan|Case=Loc | этом | этой | этом |
Animacy=Inan|Case=Nom | этот | эта | это |
AUX
623 ru-pos/AUX tokens (62% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Person=EMPTY (623; 100%), Number=Sing (621; 100%), Tense=Past (617; 99%), Mood=Ind (603; 97%), VerbForm=Fin (603; 97%), Voice=EMPTY (583; 94%), Aspect=Imp (524; 84%).
AUX
tokens may have the following values of Gender
:
Fem
(144; 23% of non-emptyGender
): была, стала, являлась, Ставшая, оказалась, оставалась, осталась, песни, предусмотрена, признанаMasc
(346; 56% of non-emptyGender
): был, стал, являлся, назначен, считал, бывшего, бывшим, залы, мир, найденNeut
(133; 21% of non-emptyGender
): было, стало, явилось, движение, исполнено, оказалось, остававшееся, осталосьEMPTY
(380): были, является, это, быть, будет, являются, стали, будучи, будут, стать
Paradigm БЫТЬ | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Gen|VerbForm=Part|Voice=Act | бывшего | ||
Animacy=Anim|Case=Ins|VerbForm=Part|Voice=Act | бывшим | ||
Mood=Ind|VerbForm=Fin | был | была | было |
NUM
537 ru-pos/NUM tokens (29% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumType=Card (537; 100%), Animacy=Inan (434; 81%), Number=Sing (273; 51%).
NUM
tokens may have the following values of Gender
:
Fem
(121; 23% of non-emptyGender
): одной, две, одна, двух, одну, 2, 1, обе, двум, двумяMasc
(389; 72% of non-emptyGender
): два, один, 2, 1, двух, одного, одним, 22, оба, 21Neut
(27; 5% of non-emptyGender
): одно, одним, одного, 2, два, одном, 12, 22, 3166-2, 421EMPTY
(1285): несколько, 10, 4, три, 5, 3, 20, четыре, 16, 15
Paradigm ОДИН | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | одного | ||
Animacy=Anim|Case=Dat | одному | ||
Animacy=Anim|Case=Gen | одного | одного | |
Animacy=Anim|Case=Ins | одним | одной | |
Animacy=Anim|Case=Nom | один | одна | |
Animacy=Inan|Case=Acc | один | одну | одно, одного |
Animacy=Inan|Case=Dat | одному | одной | |
Animacy=Inan|Case=Gen | одного | одной | одного |
Animacy=Inan|Case=Ins | одним | одной | одним |
Animacy=Inan|Case=Loc | одном | одной | одном |
Animacy=Inan|Case=Nom | один | одна | одно |
Gender
seems to be lexical feature of NUM
. 92% lemmas (114) occur only with one value of Gender
.
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (6284; 73%),
NOUN –[conj]–> NOUN (900; 54%),
PROPN –[flat]–> PROPN (855; 100%),
NOUN –[appos]–> PROPN (730; 67%),
NOUN –[det]–> DET (564; 52%),
NOUN –[acl]–> VERB (463; 53%),
NOUN –[appos]–> NOUN (406; 52%),
VERB –[nsubj]–> PROPN (393; 68%),
PROPN –[conj]–> PROPN (379; 75%),
VERB –[aux:pass]–> AUX (353; 96%).
Treebank Statistics (UD_Russian-SynTagRus)
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
417908 tokens (42%) have a non-empty value of Gender
.
83600 types (78%) occur at least once with a non-empty value of Gender
.
31823 lemmas (80%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: ru-pos/NOUN (243108; 25% instances), ru-pos/ADJ (66634; 7% instances), ru-pos/PROPN (33696; 3% instances), ru-pos/VERB (33560; 3% instances), ru-pos/PRON (21515; 2% instances), ru-pos/DET (13062; 1% instances), ru-pos/AUX (3662; 0% instances), ru-pos/NUM (2671; 0% instances).
NOUN
243108 ru-pos/NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (210311; 87%), Number=Sing (170107; 70%).
NOUN
tokens may have the following values of Gender
:
Fem
(82461; 34% of non-emptyGender
): жизни, власти, страны, деньги, работы, экономики, системы, стороны, жизнь, странеMasc
(108449; 45% of non-emptyGender
): года, лет, году, %, раз, человек, люди, людей, человека, случаеNeut
(52198; 21% of non-emptyGender
): время, дело, времени, развития, государства, образования, место, словам, общества, числеEMPTY
(480): данным, данные, данных, данными, сот, окружающих, родных, ButtKicker, США, robots.txt
Paradigm спецпитание | Masc | Fem | Neut |
---|---|---|---|
Case=Acc | спецпитание | ||
Case=Gen | спецпитания | спецпитания |
Gender
seems to be lexical feature of NOUN
. 100% lemmas (15697) occur only with one value of Gender
.
ADJ
66634 ru-pos/ADJ tokens (66% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (66634; 100%), Degree=Pos (66282; 99%).
ADJ
tokens may have the following values of Gender
:
Fem
(23894; 36% of non-emptyGender
): российской, другой, должна, новой, самой, первую, политической, государственной, сама, первойMasc
(25700; 39% of non-emptyGender
): сам, должен, первый, каждый, новый, самый, другой, нового, второй, главныйNeut
(17040; 26% of non-emptyGender
): нужно, самом, известно, необходимо, самое, невозможно, должно, важно, другое, трудноEMPTY
(33846): других, многие, другие, должны, новые, многих, последние, новых, сами, самых
Paradigm другой | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | другого | ||
Animacy=Inan|Case=Acc | другой | ||
Case=Acc | другую, другой | другое | |
Case=Dat | другому | другой | другому |
Case=Gen | другого | другой | другого |
Case=Ins | другим | другой | другим |
Case=Loc | другом | другой | другом |
Case=Nom | другой | другая, другой | другое, др. |
PROPN
33696 ru-pos/PROPN tokens (93% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (32606; 97%), Animacy=Inan (17652; 52%).
PROPN
tokens may have the following values of Gender
:
Fem
(10362; 31% of non-emptyGender
): России, Россия, Москве, РФ, Москвы, Россию, Германии, Земли, РАН, ЕвропеMasc
(21730; 64% of non-emptyGender
): СССР, Путин, В., Владимир, Путина, Сергей, А., Института, Александр, НДСNeut
(1604; 5% of non-emptyGender
): СМИ, РИА, МВД, СНГ, Солнца, НАТО, МЧС, Минэкономразвития, Солнце, ТВEMPTY
(2554): США, MBA, ButtKicker, бен, PM, RoboCup, FOXP2, IT, Weta, А
Paradigm gongo | Masc | Fem | Neut |
---|---|---|---|
Case=Gen|Number=Sing | GONGO | ||
Case=Ins|Number=Plur | GONGO | ||
Case=Nom|Number=Plur | GONGO |
Gender
seems to be lexical feature of PROPN
. 98% lemmas (6952) occur only with one value of Gender
.
VERB
33560 ru-pos/VERB tokens (30% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Number=Sing (33560; 100%), Person=EMPTY (33560; 100%), Tense=Past (30982; 92%), Case=EMPTY (26995; 80%), Mood=Ind (23675; 71%), VerbForm=Fin (23675; 71%), Aspect=Perf (21111; 63%), Voice=Act (19516; 58%).
VERB
tokens may have the following values of Gender
:
Fem
(8876; 26% of non-emptyGender
): стала, могла, сказала, была, оказалась, появилась, шла, началась, окружающей, пришлаMasc
(17391; 52% of non-emptyGender
): стал, сказал, мог, заявил, был, сообщил, говорил, видел, оказался, отметилNeut
(7293; 22% of non-emptyGender
): было, стало, удалось, оказалось, казалось, пришлось, произошло, могло, связано, хотелосьEMPTY
(77181): может, есть, нет, могут, является, быть, говорит, сделать, стоит, стали
Paradigm мочь | Masc | Fem | Neut |
---|---|---|---|
Aspect=Imp|Case=Acc|Tense=Pres|VerbForm=Part | могущую | ||
Aspect=Imp|Mood=Ind|Tense=Past|VerbForm=Fin | мог | могла | могло |
Aspect=Perf|Mood=Ind|Tense=Past|VerbForm=Fin | смог | смогла | смогло |
PRON
21515 ru-pos/PRON tokens (47% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (21512; 100%), Person=3 (11556; 54%), Animacy=EMPTY (11556; 54%).
PRON
tokens may have the following values of Gender
:
Fem
(3331; 15% of non-emptyGender
): ее, она, нее, ней, ей, ею, её, нею, неё, темMasc
(7724; 36% of non-emptyGender
): он, его, ему, него, ним, нем, им, нему, нём, всеNeut
(10460; 49% of non-emptyGender
): это, то, того, том, все, этом, тем, этого, всего, оноEMPTY
(24066): я, их, мы, что, они, которые, них, нас, который, кто
Paradigm то | Masc | Fem | Neut |
---|---|---|---|
Case=Acc | том | то | |
Case=Dat | тому, т.п., т.п, т. | ||
Case=Gen | того | того | |
Case=Ins | тем | тем | |
Case=Loc | том | ||
Case=Nom | то, т.е., т.е, т., т |
DET
13062 ru-pos/DET tokens (65% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (13060; 100%).
DET
tokens may have the following values of Gender
:
Fem
(4788; 37% of non-emptyGender
): этой, своей, эта, свою, нашей, эту, такой, той, такая, всейMasc
(4879; 37% of non-emptyGender
): этот, тот, этом, этого, таким, такой, свой, своего, наш, весьNeut
(3395; 26% of non-emptyGender
): это, все, то, такое, том, свое, этого, этом, своего, нашеEMPTY
(7071): все, эти, всех, тех, этих, свои, те, своих, такие, таких
Paradigm этот | Masc | Fem | Neut |
---|---|---|---|
Case=Acc | этот, этого | эту | это |
Case=Dat | этому | этой | этому |
Case=Gen | этого | этой | этого |
Case=Ins | этим | этой | этим |
Case=Loc | этом | этой | этом |
Case=Nom | этот | эта | это |
AUX
3662 ru-pos/AUX tokens (50% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Voice=Act (3662; 100%), Person=EMPTY (3662; 100%), Tense=Past (3662; 100%), Number=Sing (3662; 100%), Aspect=Imp (3662; 100%), VerbForm=Fin (3659; 100%), Mood=Ind (3659; 100%).
AUX
tokens may have the following values of Gender
:
Fem
(821; 22% of non-emptyGender
): былаMasc
(1336; 36% of non-emptyGender
): был, бывший, бывшемNeut
(1505; 41% of non-emptyGender
): былоEMPTY
(3604): были, будет, быть, будут, есть, будем, буду, будучи, будете, будь
Paradigm быть | Masc | Fem | Neut |
---|---|---|---|
Case=Loc|VerbForm=Part | бывшем | ||
Case=Nom|VerbForm=Part | бывший | ||
Mood=Ind|VerbForm=Fin | был | была | было |
NUM
2671 ru-pos/NUM tokens (18% of all NUM
tokens) have a non-empty value of Gender
.
NUM
tokens may have the following values of Gender
:
Fem
(859; 32% of non-emptyGender
): одной, две, одна, одну, обе, обеих, обеими, обеим, двух, полторыMasc
(1497; 56% of non-emptyGender
): один, два, одного, одним, одном, полтора, одному, оба, обоих, двухNeut
(315; 12% of non-emptyGender
): одно, два, одним, одного, одном, одному, оба, полтора, обоихEMPTY
(12053): несколько, три, 10, двух, 20, больше, 1, 15, 2, 5
Paradigm один | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | одного | ||
Animacy=Inan|Case=Acc | один | ||
Case=Acc | одну | одно | |
Case=Dat | одному | одной | одному |
Case=Gen | одного | одной | одного |
Case=Ins | одним | одной | одним |
Case=Loc | одном | одной | одном |
Case=Nom | один | одна | одно |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (48848; 66%),
NOUN –[amod]–> DET (11375; 67%),
NOUN –[amod]–> VERB (5284; 56%),
PROPN –[flat:name]–> PROPN (4546; 99%),
NOUN –[appos]–> PROPN (3744; 81%),
VERB –[conj]–> VERB (2919; 54%),
ADJ –[nsubj]–> NOUN (2695; 63%),
ADJ –[conj]–> ADJ (2305; 94%),
VERB –[nsubj]–> PROPN (2167; 58%),
PROPN –[amod]–> ADJ (1666; 89%).
Gender in other languages: [am] [ar] [bg] [bxr] [ca] [ckb] [cop] [cs] [cu] [da] [de] [el] [en] [es] [et] [eu] [fa] [fo] [fr] [ga] [gl] [got] [grc] [he] [hi] [hr] [hu] [id] [it] [ja] [kk] [kmr] [ko] [la] [lv] [mr] [nl] [no] [pl] [pt] [ro] [ru] [sa] [sk] [sla] [sl] [so] [sr] [sv] [swl] [ta] [tr] [u] [ug] [uk] [ur] [vi] [yue] [zh]