Gender: gender
Gender is a lexical feature of nouns and inflectional feature of other parts of speech (adjectives, verbs) that mark agreement with nouns. There are three values of gender: masculine, feminine, and neuter.
See also the related feature of Animacy.
Masc: masculine gender
Nouns denoting male persons are masculine. Other nouns may be also grammatically masculine, without any relation to sex.
Examples
- мужчина “man”
- замок “castle”
- грузовик “truck”
- председатель “chairman”
- судья “judge”
Fem: feminine gender
Nouns denoting female persons are feminine. Other nouns may be also grammatically feminine, without any relation to sex.
Examples
- женщина “woman”
- роза “rose”
- песня “song”
- кость “bone”
Neut: neuter gender
This third gender is for nouns that are neither masculine nor feminine (grammatically). Nouns whose nominative suffix is -о or -е (including a large group of deverbative nouns denoting actions) are usually neuter.
Examples
- место “place”
- море “sea”
- мясо “meat”
- здание “building”
Treebank Statistics (UD_Russian)
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
45156 tokens (51%) have a non-empty value of Gender.
22932 types (84%) occur at least once with a non-empty value of Gender.
14288 lemmas (83%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: ru-pos/NOUN (24010; 27% instances), ru-pos/ADJ (8422; 10% instances), ru-pos/PROPN (6294; 7% instances), ru-pos/VERB (3283; 4% instances), ru-pos/PRON (1249; 1% instances), ru-pos/DET (738; 1% instances), ru-pos/AUX (623; 1% instances), ru-pos/NUM (537; 1% instances).
NOUN
24010 ru-pos/NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Animacy=Inan (20746; 86%), Number=Sing (18071; 75%).
NOUN tokens may have the following values of Gender:
Fem(7393; 31% of non-emptyGender): области, войны, реки, территории, часть, части, компании, группы, площадь, армииMasc(11991; 50% of non-emptyGender): года, году, лет, человек, км, год, города, г., районе, годахNeut(4626; 19% of non-emptyGender): время, население, населения, название, место, качестве, село, начале, времени, участиеEMPTY(52): No, n, T, f, i, x, С, AFe, B, H
| Paradigm ГОД | Masc | Fem |
|---|---|---|
| Case=Acc|Number=Sing | год, года | |
| Case=Acc|Number=Plur | годы, лет, годов | годы |
| Case=Dat|Number=Sing | году | |
| Case=Dat|Number=Plur | годам | |
| Case=Gen|Number=Sing | года | |
| Case=Gen|Number=Plur | лет, годов | |
| Case=Ins|Number=Sing | годом | |
| Case=Ins|Number=Plur | годами | |
| Case=Loc|Number=Sing | году | |
| Case=Loc|Number=Plur | годах, годы | |
| Case=Nom|Number=Sing | год | |
| Case=Nom|Number=Plur | годы |
Gender seems to be lexical feature of NOUN. 99% lemmas (5838) occur only with one value of Gender.
ADJ
8422 ru-pos/ADJ tokens (77% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (8421; 100%), Animacy=Inan (7652; 91%).
ADJ tokens may have the following values of Gender:
Fem(2378; 28% of non-emptyGender): второй, й, первой, российской, я, отечественной, большую, мировой, центральной, новойMasc(4497; 53% of non-emptyGender): 2010, 2008, 2004, 2006, 2009, 2011, первый, 2012, 2001, 2007Neut(1547; 18% of non-emptyGender): 12, 1, 15, 14, настоящее, 11, 21, 23, 16, 29EMPTY(2455): х, других, различных, многие, новые, первых, самых, первые, новых, разных
| Paradigm Й | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Gen | го | ||
| Animacy=Anim|Case=Ins | им | ||
| Animacy=Inan|Case=Acc | й | ю | е |
| Animacy=Inan|Case=Dat | му | й | |
| Animacy=Inan|Case=Gen | го | й | го |
| Animacy=Inan|Case=Ins | м | й | |
| Animacy=Inan|Case=Loc | м | й | |
| Animacy=Inan|Case=Nom | й | я | е |
PROPN
6294 ru-pos/PROPN tokens (100% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (6083; 97%), Animacy=Inan (3285; 52%).
PROPN tokens may have the following values of Gender:
Fem(1704; 27% of non-emptyGender): России, Украины, Франции, Германии, Европы, Испании, РФ, Москве, Франция, АнглииMasc(4363; 69% of non-emptyGender): США, СССР, де, Владимир, Александра, Александр, Карл, Крыма, Джон, КОАТУУNeut(227; 4% of non-emptyGender): ISO, Дубно, Марокко, IPO, MonaVie, Григорово, Домодедово, Евровидение, Закарпатье, Поволжье
| Paradigm ДЕ | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | де | ||
| Animacy=Anim|Case=Gen | де | ||
| Animacy=Anim|Case=Ins | де | де | |
| Animacy=Anim|Case=Loc | де | ||
| Animacy=Anim|Case=Nom | де | ||
| Animacy=Inan|Case=Loc | Де | ||
| Animacy=Inan|Case=Nom | де |
Gender seems to be lexical feature of PROPN. 99% lemmas (4361) occur only with one value of Gender.
VERB
3283 ru-pos/VERB tokens (45% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Number=Sing (3283; 100%), Person=EMPTY (3283; 100%), Tense=Past (3064; 93%), Variant=EMPTY (2632; 80%), Aspect=Perf (2213; 67%), VerbForm=Fin (2040; 62%), Case=EMPTY (2040; 62%), Mood=Ind (2040; 62%), Animacy=EMPTY (2040; 62%).
VERB tokens may have the following values of Gender:
Fem(796; 24% of non-emptyGender): получила, основана, была, расположена, создана, вышла, род., состоялась, вошла, работалаMasc(1964; 60% of non-emptyGender): получил, родился, начал, работал, окончил, был, участвовал, вышел, расположен, писалNeut(523; 16% of non-emptyGender): было, составляло, удалось, расположено, принято, привело, произошло, пришлось, проживало, существовалоEMPTY(4020): составляет, может, находится, входит, можно, имеет, есть, занимает, могут, нет
| Paradigm БЫТЬ | Masc | Fem | Neut |
|---|---|---|---|
| был | была | было |
PRON
1249 ru-pos/PRON tokens (74% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (1249; 100%), Person=EMPTY (685; 55%).
PRON tokens may have the following values of Gender:
Fem(230; 18% of non-emptyGender): она, которой, которая, её, ней, которую, неё, ей, нее, ееMasc(580; 46% of non-emptyGender): он, который, его, ему, которого, него, ним, котором, им, нёмNeut(439; 35% of non-emptyGender): это, того, что, тем, том, то, этом, этого, которое, всегоEMPTY(448): они, которые, которых, себя, собой, них, их, им, я, мы
| Paradigm КОТОРЫЙ | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | которого, который | которую | |
| Animacy=Anim|Case=Dat | которому | ||
| Animacy=Anim|Case=Gen | которого | которой | |
| Animacy=Anim|Case=Ins | которым | которой | |
| Animacy=Anim|Case=Nom | который | которая | |
| Animacy=Inan|Case=Acc | который | которую | которое, которого |
| Animacy=Inan|Case=Dat | которому | которой | которому |
| Animacy=Inan|Case=Gen | которого | которой | которого |
| Animacy=Inan|Case=Ins | которым | которой | |
| Animacy=Inan|Case=Loc | котором | которой | котором |
| Animacy=Inan|Case=Nom | который | которая | которое |
Gender seems to be lexical feature of PRON. 92% lemmas (12) occur only with one value of Gender.
DET
738 ru-pos/DET tokens (53% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number=Sing (738; 100%), Person=EMPTY (705; 96%), Animacy=Inan (667; 90%), Reflex=EMPTY (569; 77%).
DET tokens may have the following values of Gender:
Fem(220; 30% of non-emptyGender): своей, этой, свою, эта, эту, всей, н., всю, каждой, каждаяMasc(304; 41% of non-emptyGender): этот, этого, the, свой, этом, своего, тот, каждый, весь, своемуNeut(214; 29% of non-emptyGender): то, это, том, своё, этого, что, свое, всё, своего, тогоEMPTY(662): его, их, её, все, всех, некоторые, эти, своих, этих, свои
| Paradigm ЭТОТ | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | этого | ||
| Animacy=Anim|Case=Nom | этот | ||
| Animacy=Inan|Case=Acc | этот | эту | это |
| Animacy=Inan|Case=Dat | этому | этой | |
| Animacy=Inan|Case=Gen | этого | этой, это | этого |
| Animacy=Inan|Case=Ins | этим | этой | Этим |
| Animacy=Inan|Case=Loc | этом | этой | этом |
| Animacy=Inan|Case=Nom | этот | эта | это |
AUX
623 ru-pos/AUX tokens (62% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Person=EMPTY (623; 100%), Number=Sing (621; 100%), Tense=Past (617; 99%), Mood=Ind (603; 97%), VerbForm=Fin (603; 97%), Voice=EMPTY (583; 94%), Aspect=Imp (524; 84%).
AUX tokens may have the following values of Gender:
Fem(144; 23% of non-emptyGender): была, стала, являлась, Ставшая, оказалась, оставалась, осталась, песни, предусмотрена, признанаMasc(346; 56% of non-emptyGender): был, стал, являлся, назначен, считал, бывшего, бывшим, залы, мир, найденNeut(133; 21% of non-emptyGender): было, стало, явилось, движение, исполнено, оказалось, остававшееся, осталосьEMPTY(380): были, является, это, быть, будет, являются, стали, будучи, будут, стать
| Paradigm БЫТЬ | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Gen|VerbForm=Part|Voice=Act | бывшего | ||
| Animacy=Anim|Case=Ins|VerbForm=Part|Voice=Act | бывшим | ||
| Mood=Ind|VerbForm=Fin | был | была | было |
NUM
537 ru-pos/NUM tokens (29% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumType=Card (537; 100%), Animacy=Inan (434; 81%), Number=Sing (273; 51%).
NUM tokens may have the following values of Gender:
Fem(121; 23% of non-emptyGender): одной, две, одна, двух, одну, 2, 1, обе, двум, двумяMasc(389; 72% of non-emptyGender): два, один, 2, 1, двух, одного, одним, 22, оба, 21Neut(27; 5% of non-emptyGender): одно, одним, одного, 2, два, одном, 12, 22, 3166-2, 421EMPTY(1285): несколько, 10, 4, три, 5, 3, 20, четыре, 16, 15
| Paradigm ОДИН | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | одного | ||
| Animacy=Anim|Case=Dat | одному | ||
| Animacy=Anim|Case=Gen | одного | одного | |
| Animacy=Anim|Case=Ins | одним | одной | |
| Animacy=Anim|Case=Nom | один | одна | |
| Animacy=Inan|Case=Acc | один | одну | одно, одного |
| Animacy=Inan|Case=Dat | одному | одной | |
| Animacy=Inan|Case=Gen | одного | одной | одного |
| Animacy=Inan|Case=Ins | одним | одной | одним |
| Animacy=Inan|Case=Loc | одном | одной | одном |
| Animacy=Inan|Case=Nom | один | одна | одно |
Gender seems to be lexical feature of NUM. 92% lemmas (114) occur only with one value of Gender.
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (6284; 73%),
NOUN –[conj]–> NOUN (900; 54%),
PROPN –[flat]–> PROPN (855; 100%),
NOUN –[appos]–> PROPN (730; 67%),
NOUN –[det]–> DET (564; 52%),
NOUN –[acl]–> VERB (463; 53%),
NOUN –[appos]–> NOUN (406; 52%),
VERB –[nsubj]–> PROPN (393; 68%),
PROPN –[conj]–> PROPN (379; 75%),
VERB –[aux:pass]–> AUX (353; 96%).
Treebank Statistics (UD_Russian-SynTagRus)
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
417908 tokens (42%) have a non-empty value of Gender.
83600 types (78%) occur at least once with a non-empty value of Gender.
31823 lemmas (80%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: ru-pos/NOUN (243108; 25% instances), ru-pos/ADJ (66634; 7% instances), ru-pos/PROPN (33696; 3% instances), ru-pos/VERB (33560; 3% instances), ru-pos/PRON (21515; 2% instances), ru-pos/DET (13062; 1% instances), ru-pos/AUX (3662; 0% instances), ru-pos/NUM (2671; 0% instances).
NOUN
243108 ru-pos/NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Animacy=Inan (210311; 87%), Number=Sing (170107; 70%).
NOUN tokens may have the following values of Gender:
Fem(82461; 34% of non-emptyGender): жизни, власти, страны, деньги, работы, экономики, системы, стороны, жизнь, странеMasc(108449; 45% of non-emptyGender): года, лет, году, %, раз, человек, люди, людей, человека, случаеNeut(52198; 21% of non-emptyGender): время, дело, времени, развития, государства, образования, место, словам, общества, числеEMPTY(480): данным, данные, данных, данными, сот, окружающих, родных, ButtKicker, США, robots.txt
| Paradigm спецпитание | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc | спецпитание | ||
| Case=Gen | спецпитания | спецпитания |
Gender seems to be lexical feature of NOUN. 100% lemmas (15697) occur only with one value of Gender.
ADJ
66634 ru-pos/ADJ tokens (66% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (66634; 100%), Degree=Pos (66282; 99%).
ADJ tokens may have the following values of Gender:
Fem(23894; 36% of non-emptyGender): российской, другой, должна, новой, самой, первую, политической, государственной, сама, первойMasc(25700; 39% of non-emptyGender): сам, должен, первый, каждый, новый, самый, другой, нового, второй, главныйNeut(17040; 26% of non-emptyGender): нужно, самом, известно, необходимо, самое, невозможно, должно, важно, другое, трудноEMPTY(33846): других, многие, другие, должны, новые, многих, последние, новых, сами, самых
| Paradigm другой | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | другого | ||
| Animacy=Inan|Case=Acc | другой | ||
| Case=Acc | другую, другой | другое | |
| Case=Dat | другому | другой | другому |
| Case=Gen | другого | другой | другого |
| Case=Ins | другим | другой | другим |
| Case=Loc | другом | другой | другом |
| Case=Nom | другой | другая, другой | другое, др. |
PROPN
33696 ru-pos/PROPN tokens (93% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (32606; 97%), Animacy=Inan (17652; 52%).
PROPN tokens may have the following values of Gender:
Fem(10362; 31% of non-emptyGender): России, Россия, Москве, РФ, Москвы, Россию, Германии, Земли, РАН, ЕвропеMasc(21730; 64% of non-emptyGender): СССР, Путин, В., Владимир, Путина, Сергей, А., Института, Александр, НДСNeut(1604; 5% of non-emptyGender): СМИ, РИА, МВД, СНГ, Солнца, НАТО, МЧС, Минэкономразвития, Солнце, ТВEMPTY(2554): США, MBA, ButtKicker, бен, PM, RoboCup, FOXP2, IT, Weta, А
| Paradigm gongo | Masc | Fem | Neut |
|---|---|---|---|
| Case=Gen|Number=Sing | GONGO | ||
| Case=Ins|Number=Plur | GONGO | ||
| Case=Nom|Number=Plur | GONGO |
Gender seems to be lexical feature of PROPN. 98% lemmas (6952) occur only with one value of Gender.
VERB
33560 ru-pos/VERB tokens (30% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Number=Sing (33560; 100%), Person=EMPTY (33560; 100%), Tense=Past (30982; 92%), Case=EMPTY (26995; 80%), Mood=Ind (23675; 71%), VerbForm=Fin (23675; 71%), Aspect=Perf (21111; 63%), Voice=Act (19516; 58%).
VERB tokens may have the following values of Gender:
Fem(8876; 26% of non-emptyGender): стала, могла, сказала, была, оказалась, появилась, шла, началась, окружающей, пришлаMasc(17391; 52% of non-emptyGender): стал, сказал, мог, заявил, был, сообщил, говорил, видел, оказался, отметилNeut(7293; 22% of non-emptyGender): было, стало, удалось, оказалось, казалось, пришлось, произошло, могло, связано, хотелосьEMPTY(77181): может, есть, нет, могут, является, быть, говорит, сделать, стоит, стали
| Paradigm мочь | Masc | Fem | Neut |
|---|---|---|---|
| Aspect=Imp|Case=Acc|Tense=Pres|VerbForm=Part | могущую | ||
| Aspect=Imp|Mood=Ind|Tense=Past|VerbForm=Fin | мог | могла | могло |
| Aspect=Perf|Mood=Ind|Tense=Past|VerbForm=Fin | смог | смогла | смогло |
PRON
21515 ru-pos/PRON tokens (47% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (21512; 100%), Person=3 (11556; 54%), Animacy=EMPTY (11556; 54%).
PRON tokens may have the following values of Gender:
Fem(3331; 15% of non-emptyGender): ее, она, нее, ней, ей, ею, её, нею, неё, темMasc(7724; 36% of non-emptyGender): он, его, ему, него, ним, нем, им, нему, нём, всеNeut(10460; 49% of non-emptyGender): это, то, того, том, все, этом, тем, этого, всего, оноEMPTY(24066): я, их, мы, что, они, которые, них, нас, который, кто
| Paradigm то | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc | том | то | |
| Case=Dat | тому, т.п., т.п, т. | ||
| Case=Gen | того | того | |
| Case=Ins | тем | тем | |
| Case=Loc | том | ||
| Case=Nom | то, т.е., т.е, т., т |
DET
13062 ru-pos/DET tokens (65% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number=Sing (13060; 100%).
DET tokens may have the following values of Gender:
Fem(4788; 37% of non-emptyGender): этой, своей, эта, свою, нашей, эту, такой, той, такая, всейMasc(4879; 37% of non-emptyGender): этот, тот, этом, этого, таким, такой, свой, своего, наш, весьNeut(3395; 26% of non-emptyGender): это, все, то, такое, том, свое, этого, этом, своего, нашеEMPTY(7071): все, эти, всех, тех, этих, свои, те, своих, такие, таких
| Paradigm этот | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc | этот, этого | эту | это |
| Case=Dat | этому | этой | этому |
| Case=Gen | этого | этой | этого |
| Case=Ins | этим | этой | этим |
| Case=Loc | этом | этой | этом |
| Case=Nom | этот | эта | это |
AUX
3662 ru-pos/AUX tokens (50% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Voice=Act (3662; 100%), Person=EMPTY (3662; 100%), Tense=Past (3662; 100%), Number=Sing (3662; 100%), Aspect=Imp (3662; 100%), VerbForm=Fin (3659; 100%), Mood=Ind (3659; 100%).
AUX tokens may have the following values of Gender:
Fem(821; 22% of non-emptyGender): былаMasc(1336; 36% of non-emptyGender): был, бывший, бывшемNeut(1505; 41% of non-emptyGender): былоEMPTY(3604): были, будет, быть, будут, есть, будем, буду, будучи, будете, будь
| Paradigm быть | Masc | Fem | Neut |
|---|---|---|---|
| Case=Loc|VerbForm=Part | бывшем | ||
| Case=Nom|VerbForm=Part | бывший | ||
| Mood=Ind|VerbForm=Fin | был | была | было |
NUM
2671 ru-pos/NUM tokens (18% of all NUM tokens) have a non-empty value of Gender.
NUM tokens may have the following values of Gender:
Fem(859; 32% of non-emptyGender): одной, две, одна, одну, обе, обеих, обеими, обеим, двух, полторыMasc(1497; 56% of non-emptyGender): один, два, одного, одним, одном, полтора, одному, оба, обоих, двухNeut(315; 12% of non-emptyGender): одно, два, одним, одного, одном, одному, оба, полтора, обоихEMPTY(12053): несколько, три, 10, двух, 20, больше, 1, 15, 2, 5
| Paradigm один | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | одного | ||
| Animacy=Inan|Case=Acc | один | ||
| Case=Acc | одну | одно | |
| Case=Dat | одному | одной | одному |
| Case=Gen | одного | одной | одного |
| Case=Ins | одним | одной | одним |
| Case=Loc | одном | одной | одном |
| Case=Nom | один | одна | одно |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (48848; 66%),
NOUN –[amod]–> DET (11375; 67%),
NOUN –[amod]–> VERB (5284; 56%),
PROPN –[flat:name]–> PROPN (4546; 99%),
NOUN –[appos]–> PROPN (3744; 81%),
VERB –[conj]–> VERB (2919; 54%),
ADJ –[nsubj]–> NOUN (2695; 63%),
ADJ –[conj]–> ADJ (2305; 94%),
VERB –[nsubj]–> PROPN (2167; 58%),
PROPN –[amod]–> ADJ (1666; 89%).
Gender in other languages: [am] [ar] [bg] [bxr] [ca] [ckb] [cop] [cs] [cu] [da] [de] [el] [en] [es] [et] [eu] [fa] [fo] [fr] [ga] [gl] [got] [grc] [he] [hi] [hr] [hu] [id] [it] [ja] [kk] [kmr] [ko] [la] [lv] [mr] [nl] [no] [pl] [pt] [ro] [ru] [sa] [sk] [sla] [sl] [so] [sr] [sv] [swl] [ta] [tr] [u] [ug] [uk] [ur] [vi] [yue] [zh]