NUM

home ru/pos edit page issue tracker

This page still pertains to UD version 1.

`NUM`: numeral

Definition

A numeral is a word, functioning most typically as a determiner, adjective or pronoun, that expresses a number and a relation to the number, such as quantity, sequence, frequency or fraction.

Note that cardinal numerals are covered by NUM whether they are used as determiners or not (as in Windows 7) and whether they are expressed as words (четыре), digits (4) or Roman numerals (IV).

Russian grammar distinguishes several subclasses of pronominal numerals (quantifiers): interrogative and relative (сколько “how many”); demonstrative (столько “this many”); indefinite (несколько “several”). These words behave similarly to (most) cardinal numbers, e.g. they require that the counted noun phrase be in Genitive. They are not similar to adjectives (unlike their English counterparts).

In addition, several types of (non-pronominal) numerals, such as ordinal numerals and multiplicative numerals, are tagged ADJ or ADV, based on their syntactic and morphological behavior.

Examples

0, 1, 2, 3, 4, 5, 2014, 1000000, 3.14159265359
I, II, III, IV, V, MMXIV
один, два, три, четыре, пять, семьдесят “one, two, three, four, five, seventy”
половина, треть, четверть “one-half, one third, quarter”: denominators of fractions constitute a separate class of cardinal numerals.
двое, трое, четверо, пятеро “four, five”: collective numerals (see specific-syntax on their morphosyntactic behavior).
сколько, столько, предостаточно “how many, this many, more than enough”: pronominal quantifiers of imprecise quantity.

Counterexamples

первый, второй, третий “first, second, third”: adjectival ordinal numerals. They are tagged ADJ, and the ru-feat/NumType feature reveals their semantic relation to numbers.
впервые “for the first time”: adverbial ordinal numerals. They are tagged ADV, and the ru-feat/NumType feature reveals their semantic relation to numbers.
однажды, дважды, трижды “once, twice, three times”: multiplicative numerals. They are tagged ADV, and the ru-feat/NumType feature reveals their semantic relation to numbers.
пара, тройка, четверка “pair, triplet, foursome”: n-tuples (n-tice) are not considered numerals in the Russian grammar. They are tagged NOUN.
единица, двойка, тройка, четверка, пятерка “number one, number two, number three, number four, number five”: names of numbers, or of objects identified by the number (e.g. of a bus route). They are not considered numerals and they are tagged NOUN.

Border cases

тысяча, миллион, миллиард, триллион “thousand, million, billion, trillion”: words for large quantities are ambiguous between cardinal numerals (tagged NUM) and nouns. If they inflect as nouns, they are tagged NOUN; but the borderline is fuzzy. For instance, in phrases like тысячи людей вышли на улицы (“thousands of people went on the streets”), тысячи is a noun. In numeric expressions, e.g. 110 тысяч долларов (“110 thousand dollars”), it is a cardinal numeral.
много, мало, немного, немало, несколько, достаточно “many, few, not many, a lot, several, enough”: pronominal quantifiers are ambiguous between cardinal numerals (tagged NUM when they refer to imprecise quantities) and adverbs (tagged ADV when they refer to degree/intensity). As a rule, the latter have verbs, adjectives, and adverbs as their head (e.g. я был несколько груб “I was a bit rude”). Note that the words более, больше, менее, меньше “more than, less than” are considered comparative forms of the numerals много and мало when they are used in constructions with cardinal numerals, e.g. более пяти студентов “more than five students” (see specific-syntax).

Treebank Statistics (UD_Russian)

There are 640 NUM lemmas (4%), 681 NUM types (2%) and 1822 NUM tokens (2%). Out of 16 observed tags, the rank of NUM is: 6 in number of lemmas, 6 in number of types and 9 in number of tokens.

The 10 most frequent NUM lemmas: ОДИН, ДВА, НЕСКОЛЬКО, ТРИ, 2, 1, 10, ЧЕТЫРЕ, 4, 3

The 10 most frequent NUM types: 2, два, один, несколько, 1, 10, двух, 4, три, 5

The 10 most frequent ambiguous lemmas: НЕСКОЛЬКО (NUM 62, ADV 5), ТРИ (NUM 52, ADV 1), 2 (NUM 50, ADV 21, ADJ 7), 1 (NUM 39, ADJ 27, ADV 17), 10 (NUM 37, ADJ 12, ADV 8), 4 (NUM 30, ADV 12, ADJ 10), 3 (NUM 27, ADV 11, ADJ 6), 5 (NUM 27, ADJ 6, ADV 4), МНОГО (NUM 24, ADV 9), 20 (NUM 22, ADV 9, ADJ 7)

The 10 most frequent ambiguous types: 2 (NUM 50, ADV 21, ADJ 7), несколько (NUM 39, ADV 5), 1 (NUM 39, ADJ 27, ADV 17), 10 (NUM 37, ADJ 12, ADV 8), 4 (NUM 30, ADV 12, ADJ 10), три (NUM 25, ADV 1), 5 (NUM 27, ADJ 6, ADV 4), 3 (NUM 26, ADV 11, ADJ 6), 20 (NUM 22, ADV 9, ADJ 7), 16 (NUM 20, ADJ 14, ADV 1)

2
- NUM 50: Мощность – 2 МВт .
- ADV 21: Население Новогригоровки составляет более 2 - х тысяч человек .
- ADJ 7: Он умер в Каннах 2 февраля 1886 года .
несколько
- NUM 39: В городе имеется несколько университетов , музеев , картинных галерей .
- ADV 5: Естественная реакция на несколько медлительную стратегию черных – 3. е4 .
1
- NUM 39: На расстоянии в 1 км расположено село Поповка .
- ADJ 27: На 1 января 2007 года в деревне не числилось постоянных жителей .
- ADV 17: Награждён орденом Святой Анны 1 - й степени .
10
- NUM 37: Готовая фигурка покрывается золотом 999,9 - й пробы толщиной 10 микрон .
- ADJ 12: С 10 июня по 29 ноября 1940 года командовал учебной подлодкой U - 10 .
- ADV 8: С 10 июня по 29 ноября 1940 года командовал учебной подлодкой U - 10 .
4
- NUM 30: За сборную Аргентины он провёл 4 матча и забил 2 гола .
- ADV 12: В свою очередь , это выражение восходит к тексту 4 - го псалма .
- ADJ 10: Первый эпизод вышел 4 августа 2012 .
три
- NUM 25: Сериал продержался три сезона и транслировался каналом Sat. 1 .
- ADV 1: Иногда применяется , в неофициальной обстановке , сокращённое название `` кап - три '' .
5
- NUM 27: Фильмы на канале KkcTebou TV Channel выделяют 5 направлений :
- ADJ 6: 5 января 1942 года управление армии было переименовано в резервное управление в составе Московской зоны обороны .
- ADV 4: Остальные модификации предлагались с 5 - ступенчатыми ручными или 4 - ступенчатыми автоматическими коробками передач .
3
- NUM 26: Мы потратили на это 2 или 3 года .
- ADV 11: Свыше двух рот 3 - го батальона оказались в этой куче - мале .
- ADJ 6: Один из главных организаторов переворота 3 апреля 1984 года , член Военного комитета национального возрождения .
20
- NUM 22: В мире известно около 20 видов .
- ADV 9: Погиб при катастрофе самолёта АНТ - 20 `` Максим Горький '' .
- ADJ 7: Официальной датой выпуска альбома является 20 февраля 1983 года .
16
- NUM 20: Длина реки составляет 16 км , площадь водосборного бассейна 133 км2 .
- ADJ 14: Костомарове появилась 16 мая того же года .
- ADV 1: В числе погибших названы одна женщина , 77 - летний старик и 16 - летний подросток .

Morphology

The form / lemma ratio of NUM is 1.064062 (the average of all parts of speech is 1.576680).

The 1st highest number of forms (9) was observed with the lemma “ОДИН”: один, одна, одним, одно, одного, одной, одном, одному, одну.

The 2nd highest number of forms (5) was observed with the lemma “ДВА”: два, две, двум, двумя, двух.

The 3rd highest number of forms (5) was observed with the lemma “ОБА”: оба, обе, обеим, обеих, обоих.

NUM occurs with 6 features: ru-feat/NumType (1822; 100% instances), ru-feat/Case (1821; 100% instances), ru-feat/Animacy (906; 50% instances), ru-feat/Gender (537; 29% instances), ru-feat/Number (283; 16% instances), ru-feat/Degree (1; 0% instances)

NUM occurs with 15 feature-value pairs: Animacy=Anim, Animacy=Inan, Case=Acc, Case=Dat, Case=Gen, Case=Ins, Case=Loc, Case=Nom, Degree=Cmp, Gender=Fem, Gender=Masc, Gender=Neut, NumType=Card, Number=Plur, Number=Sing

NUM occurs with 80 feature combinations. The most frequent feature combination is Case=Nom|NumType=Card (424 tokens). Examples: 0, 5, 10, 16, 12, 15, 20, 11, 13, 7

Relations

NUM nodes are attached to their parents using 20 different relations: ru-dep/nummod:gov (763; 42% instances), ru-dep/nummod (576; 32% instances), ru-dep/root (71; 4% instances), ru-dep/conj (63; 3% instances), ru-dep/list (60; 3% instances), ru-dep/appos (56; 3% instances), ru-dep/compound (47; 3% instances), ru-dep/nmod (43; 2% instances), ru-dep/obl (36; 2% instances), ru-dep/amod (21; 1% instances), ru-dep/nsubj (20; 1% instances), ru-dep/goeswith (19; 1% instances), ru-dep/obj (15; 1% instances), ru-dep/parataxis (14; 1% instances), ru-dep/advmod (6; 0% instances), ru-dep/iobj (4; 0% instances), ru-dep/nsubj:pass (3; 0% instances), ru-dep/acl (2; 0% instances), ru-dep/orphan (2; 0% instances), ru-dep/ccomp (1; 0% instances)

Parents of NUM nodes belong to 11 different parts of speech: NOUN (1394; 77% instances), VERB (93; 5% instances), NUM (80; 4% instances), SYM (72; 4% instances), ROOT (71; 4% instances), PROPN (57; 3% instances), ADJ (26; 1% instances), ADV (19; 1% instances), ADP (5; 0% instances), PUNCT (3; 0% instances), PRON (2; 0% instances)

1405 (77%) NUM nodes are leaves.

229 (13%) NUM nodes have one child.

71 (4%) NUM nodes have two children.

117 (6%) NUM nodes have three or more children.

The highest child degree of a NUM node is 7.

Children of NUM nodes are attached using 22 different relations: ru-dep/punct (300; 37% instances), ru-dep/nmod (135; 17% instances), ru-dep/nsubj (71; 9% instances), ru-dep/case (58; 7% instances), ru-dep/advmod (57; 7% instances), ru-dep/conj (53; 7% instances), ru-dep/cc (28; 3% instances), ru-dep/discourse (25; 3% instances), ru-dep/cop (23; 3% instances), ru-dep/appos (11; 1% instances), ru-dep/goeswith (9; 1% instances), ru-dep/list (8; 1% instances), ru-dep/parataxis (8; 1% instances), ru-dep/nummod (7; 1% instances), ru-dep/amod (4; 0% instances), ru-dep/orphan (4; 0% instances), ru-dep/nummod:gov (3; 0% instances), ru-dep/advcl (2; 0% instances), ru-dep/compound (2; 0% instances), ru-dep/det (1; 0% instances), ru-dep/iobj (1; 0% instances), ru-dep/obj (1; 0% instances)

Children of NUM nodes belong to 14 different parts of speech: PUNCT (295; 36% instances), NOUN (189; 23% instances), NUM (80; 10% instances), ADP (62; 8% instances), ADV (57; 7% instances), CCONJ (26; 3% instances), PART (24; 3% instances), AUX (23; 3% instances), PROPN (12; 1% instances), PRON (11; 1% instances), SYM (11; 1% instances), ADJ (9; 1% instances), VERB (7; 1% instances), DET (5; 1% instances)

Treebank Statistics (UD_Russian-SynTagRus)

There are 1173 NUM lemmas (3%), 1259 NUM types (1%) and 14724 NUM tokens (1%). Out of 18 observed tags, the rank of NUM is: 6 in number of lemmas, 6 in number of types and 13 in number of tokens.

The 10 most frequent NUM lemmas: один, два, несколько, три, 10, 20, четыре, 15, много, пять

The 10 most frequent NUM types: один, несколько, два, три, одной, 10, двух, 20, больше, две

The 10 most frequent ambiguous lemmas: один (NUM 1775, ADJ 584, NOUN 2), несколько (NUM 684, ADV 85), много (ADV 418, NUM 214), мало (ADV 201, NUM 158), пол (NUM 76, NOUN 61, PROPN 18), 2005 (NUM 52, NOUN 1), i (NUM 22, PROPN 6, X 3), 2012 (NUM 20, NOUN 1), x (NUM 6, PUNCT 2, PROPN 1), v (NUM 5, PROPN 1)

The 10 most frequent ambiguous types: один (NUM 451, ADJ 96), несколько (NUM 481, ADV 79), одной (NUM 292, ADJ 77), 10 (NUM 298, ADJ 1), больше (ADV 321, NUM 209, ADJ 54), одного (NUM 183, ADJ 56), одна (NUM 140, ADJ 58), меньше (NUM 153, ADJ 41, ADV 23), одно (NUM 124, ADJ 51), одним (NUM 120, ADJ 25)

один
- NUM 451: Соревнования могут проводиться очные и заочные , в один или два тура .
- ADJ 96: ( А вдруг именно он один и был “ к чему “ ? . . )
несколько
- NUM 481: Хотел написать несколько песен о полетах .
- ADV 79: Проблемы , стоящие перед Ираком , несколько проще .
одной
- NUM 292: Траверс одной вершины не классифицируется .
- ADJ 77: Но ведь коррупция - удел не одной лишь госбюрократии .
10
- NUM 298: В Петербурге Институт им. Репина готовит от силы 10 человек в год .
- ADJ 1: Он первым опытным путём измерил плотность воздуха , которую Аристотель считал равной 1 / 10 плотности воды ; эксперимент Галилея дал значение 1 / 400 , что намного ближе к истинному значению ( около 1 / 770 ) .
больше
- ADV 321: Дальше больше .
- NUM 209: Впрочем , первым космонавтам досталось еще больше .
- ADJ 54: Разве по ногам отличишь : у парней они больше .
одного
- NUM 183: - Вы редактор одного из самых авторитетных наших научных журналов .
- ADJ 56: Из-за одного процента мы подозреваем все сто .
одна
- NUM 140: И тут еще одна его неразгаданная тайна .
- ADJ 58: А там одна слава “ удобства “ - вода сегодня идет , завтра нет _ .
меньше
- NUM 153: Зато другим везет куда меньше .
- ADJ 41: Но он по-прежнему примерно раз в пять меньше , чем был до 1992 года .
- ADV 23: А расходы на трансплантацию почки - в 4 раза меньше .
одно
- NUM 124: Вот одно из ее писем племяннице мужа :
- ADJ 51: Общеизвестно , что это далеко не одно и то же “ .
одним
- NUM 120: Мальчик очень любил учиться и стал одним из лучших учеников в классе .
- ADJ 25: Бойкот хорош только одним - возможностью напакостить .

Morphology

The form / lemma ratio of NUM is 1.073316 (the average of all parts of speech is 2.644632).

The 1st highest number of forms (11) was observed with the lemma “один”: один, одна, одни, одним, одними, одно, одного, одной, одном, одному, одну.

The 2nd highest number of forms (7) was observed with the lemma “оба”: оба, обе, обеим, обеими, обеих, обоим, обоих.

The 3rd highest number of forms (6) was observed with the lemma “три”: трем, тремя, трех, три, трём, трёх.

NUM occurs with 3 features: ru-feat/Case (5576; 38% instances), ru-feat/Gender (2671; 18% instances), ru-feat/Animacy (1314; 9% instances)

NUM occurs with 11 feature-value pairs: Animacy=Anim, Animacy=Inan, Case=Acc, Case=Dat, Case=Gen, Case=Ins, Case=Loc, Case=Nom, Gender=Fem, Gender=Masc, Gender=Neut

NUM occurs with 31 feature combinations. The most frequent feature combination is _ (9148 tokens). Examples: 10, 20, больше, 1, 15, 2, 5, 30, меньше, 3

Relations

NUM nodes are attached to their parents using 14 different relations: ru-dep/nummod (10224; 69% instances), ru-dep/nummod:gov (3347; 23% instances), ru-dep/nsubj (378; 3% instances), ru-dep/conj (298; 2% instances), ru-dep/root (230; 2% instances), ru-dep/advmod (121; 1% instances), ru-dep/orphan (62; 0% instances), ru-dep/nsubj:pass (24; 0% instances), ru-dep/advcl (11; 0% instances), ru-dep/parataxis (11; 0% instances), ru-dep/dep (9; 0% instances), ru-dep/acl:relcl (5; 0% instances), ru-dep/xcomp (3; 0% instances), ru-dep/acl (1; 0% instances)

Parents of NUM nodes belong to 18 different parts of speech: NOUN (11078; 75% instances), VERB (1445; 10% instances), NUM (1119; 8% instances), PROPN (413; 3% instances), ROOT (230; 2% instances), ADJ (212; 1% instances), PRON (72; 0% instances), ADV (47; 0% instances), _ (36; 0% instances), ADP (24; 0% instances), PUNCT (17; 0% instances), PART (9; 0% instances), CCONJ (6; 0% instances), SCONJ (6; 0% instances), DET (5; 0% instances), X (3; 0% instances), AUX (1; 0% instances), SYM (1; 0% instances)

9587 (65%) NUM nodes are leaves.

2753 (19%) NUM nodes have one child.

1709 (12%) NUM nodes have two children.

675 (5%) NUM nodes have three or more children.

The highest child degree of a NUM node is 13.

Children of NUM nodes are attached using 30 different relations: ru-dep/punct (2494; 29% instances), ru-dep/nmod (1728; 20% instances), ru-dep/advmod (1147; 13% instances), ru-dep/case (789; 9% instances), ru-dep/nummod (742; 9% instances), ru-dep/amod (312; 4% instances), ru-dep/conj (268; 3% instances), ru-dep/cc (210; 2% instances), ru-dep/nsubj (198; 2% instances), ru-dep/parataxis (171; 2% instances), ru-dep/nummod:gov (125; 1% instances), ru-dep/orphan (80; 1% instances), ru-dep/cop (76; 1% instances), ru-dep/_ (52; 1% instances), ru-dep/appos (43; 1% instances), ru-dep/mark (29; 0% instances), ru-dep/obl (24; 0% instances), ru-dep/acl:relcl (19; 0% instances), ru-dep/advcl (13; 0% instances), ru-dep/flat:foreign (8; 0% instances), ru-dep/fixed (5; 0% instances), ru-dep/root (5; 0% instances), ru-dep/acl (4; 0% instances), ru-dep/compound (3; 0% instances), ru-dep/xcomp (2; 0% instances), ru-dep/discourse (1; 0% instances), ru-dep/iobj (1; 0% instances), ru-dep/nsubj:pass (1; 0% instances), ru-dep/obj (1; 0% instances), ru-dep/obl:agent (1; 0% instances)

Children of NUM nodes belong to 17 different parts of speech: PUNCT (2494; 29% instances), NOUN (1960; 23% instances), NUM (1012; 12% instances), ADP (788; 9% instances), ADV (646; 8% instances), PART (469; 5% instances), ADJ (300; 4% instances), VERB (223; 3% instances), CCONJ (193; 2% instances), PRON (152; 2% instances), DET (99; 1% instances), PROPN (84; 1% instances), SCONJ (69; 1% instances), _ (52; 1% instances), AUX (8; 0% instances), SYM (2; 0% instances), X (1; 0% instances)

NUM in other languages: [am] [ar] [bg] [bxr] [ca] [ckb] [cop] [cs] [cu] [da] [de] [el] [en] [es] [et] [eu] [fa] [fi] [fo] [fr] [ga] [gl] [got] [grc] [he] [hi] [hr] [hu] [id] [it] [ja] [kk] [kmr] [ko] [la] [lv] [mr] [nl] [no] [pl] [pt] [ro] [ru] [sa] [sk] [sla] [sl] [so] [sr] [sv] [swl] [ta] [tr] [ug] [uk] [u] [urj] [ur] [vi] [yue] [zh]

NUM: numeral

Definition

Examples

Counterexamples

Border cases

Treebank Statistics (UD_Russian)

Morphology

Relations

Treebank Statistics (UD_Russian-SynTagRus)

Morphology

Relations

`NUM`: numeral