Treebank Statistics: UD_Czech: Features: Animacy
This feature is universal.
It occurs with 2 different values: Anim
, Inan
.
312931 tokens (21%) have a non-empty value of Animacy
.
62654 types (49%) occur at least once with a non-empty value of Animacy
.
28574 lemmas (49%) occur at least once with a non-empty value of Animacy
.
The feature is used with 8 part-of-speech tags: NOUN (163546; 11% instances), ADJ (75523; 5% instances), PROPN (48949; 3% instances), VERB (12708; 1% instances), DET (6987; 0% instances), PRON (3633; 0% instances), AUX (1282; 0% instances), NUM (303; 0% instances).
NOUN
163546 NOUN tokens (44% of all NOUN
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which NOUN
and Animacy
co-occurred: Gender=Masc (163546; 100%), Polarity=Pos (163534; 100%), Number=Sing (106848; 65%).
NOUN
tokens may have the following values of Animacy
:
Anim
(42328; 26% of non-emptyAnimacy
): lidí, ministr, předseda, lidé, ředitel, prezident, trenér, ministra, prezidenta, premiérInan
(121218; 74% of non-emptyAnimacy
): roku, roce, případě, zákona, rok, světa, trhu, zákon, zájem, státuEMPTY
(208820): korun, let, strany, procent, společnosti, době, firmy, Kč, práce, jednání
Paradigm člen | Anim | Inan |
---|---|---|
Case=Acc|Number=Sing | člena | |
Case=Acc|Number=Plur | členy | |
Case=Dat|Number=Sing | členu, členovi | |
Case=Dat|Number=Plur | členům | členům |
Case=Gen|Number=Sing | člena | |
Case=Gen|Number=Plur | členů | členů |
Case=Ins|Number=Sing | členem | ČLENEM |
Case=Ins|Number=Plur | členy | členy |
Case=Loc|Number=Sing | členu, členovi | |
Case=Loc|Number=Plur | členech | |
Case=Nom|Number=Sing | člen | člen |
Case=Nom|Number=Plur | členové |
Animacy
seems to be lexical feature of NOUN
. 99% lemmas (6947) occur only with one value of Animacy
.
ADJ
75523 ADJ tokens (40% of all ADJ
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which ADJ
and Animacy
co-occurred: Gender=Masc (73755; 98%), Polarity=Pos (70830; 94%), Degree=Pos (64638; 86%), Number=Sing (45495; 60%).
ADJ
tokens may have the following values of Animacy
:
Anim
(18900; 25% of non-emptyAnimacy
): další, bývalý, mnozí, domácí, první, generální, český, americký, českých, dalšíchInan
(56623; 75% of non-emptyAnimacy
): další, první, nový, českého, celý, český, velký, letošního, státního, minulýEMPTY
(113662): české, první, další, druhé, nové, možné, poslední, česká, třeba, státní
Paradigm český | Anim | Inan |
---|---|---|
Case=Acc|Number=Sing | českého | český |
Case=Acc|Number=Plur | české | české |
Case=Dat|Number=Sing | českému | českému |
Case=Dat|Number=Plur | českým, českých | českým |
Case=Gen|Number=Sing | českého | českého |
Case=Gen|Number=Plur | českých | českých |
Case=Ins|Number=Sing | českým | českým |
Case=Ins|Number=Plur | českými | českými |
Case=Loc|Number=Sing | českém | českém |
Case=Loc|Number=Plur | českých | českých |
Case=Nom|Number=Sing | český | český |
Case=Nom|Number=Plur | čeští | české |
PROPN
48949 PROPN tokens (58% of all PROPN
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which PROPN
and Animacy
co-occurred: Gender=Masc (48949; 100%), Polarity=Pos (48949; 100%), Abbr=EMPTY (45594; 93%), Number=Sing (41680; 85%), Case=Nom (27584; 56%).
PROPN
tokens may have the following values of Animacy
:
Anim
(37154; 76% of non-emptyAnimacy
): Jiří, J, Jan, Václav, Petr, Pavel, Josef, M, Vladimír, VInan
(11795; 24% of non-emptyAnimacy
): USA, York, Zlín, Liberec, FNM, SSSR, Hradec, Izrael, Londýn, YorkuEMPTY
(35082): Praha, ČR, Praze, LN, ODS, OSN, Evropy, Brno, Prahy, ODA
Paradigm York | Anim | Inan |
---|---|---|
Case=Acc|NameType=Geo | York | |
Case=Gen|NameType=Geo | Yorku | |
Case=Loc|NameType=Geo | Yorku, YORKU | |
Case=Loc|NameType=Sur | Yorku | |
Case=Nom|NameType=Geo | York, YORK | |
Case=Nom|NameType=Sur | YORK |
Animacy
seems to be lexical feature of PROPN
. 99% lemmas (10350) occur only with one value of Animacy
.
VERB
12708 VERB tokens (9% of all VERB
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which VERB
and Animacy
co-occurred: Mood=EMPTY (12708; 100%), VerbForm=Part (12708; 100%), Number=Plur (12708; 100%), Tense=Past (12708; 100%), Person=EMPTY (12708; 100%), Voice=Act (12708; 100%), Polarity=Pos (11594; 91%), Gender=Masc (8400; 66%).
VERB
tokens may have the following values of Animacy
:
Anim
(8400; 66% of non-emptyAnimacy
): měli, mohli, chtěli, začali, museli, dostali, získali, byli, rozhodli, přišliInan
(4308; 34% of non-emptyAnimacy
): měly, mohly, byly, začaly, objevily, dosáhly, získaly, neměly, staly, vedlyEMPTY
(122802): má, je, může, řekl, měl, mají, musí, jde, měla, jsou
Paradigm mít | Anim | Inan |
---|---|---|
Gender=Masc|Polarity=Neg | neměli | |
Gender=Masc|Polarity=Pos | měli | |
Gender=Fem,Masc|Polarity=Neg | neměly | |
Gender=Fem,Masc|Polarity=Pos | měly |
DET
6987 DET tokens (12% of all DET
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which DET
and Animacy
co-occurred: Gender=Masc (6987; 100%), Person=EMPTY (6602; 94%), Number[psor]=EMPTY (6602; 94%), Poss=EMPTY (6020; 86%), Case=Nom (4024; 58%), Number=Plur (3980; 57%).
DET
tokens may have the following values of Animacy
:
Anim
(3134; 45% of non-emptyAnimacy
): kteří, všichni, každý, ti, někteří, sami, naši, svého, každého, kteréhoInan
(3853; 55% of non-emptyAnimacy
): které, svůj, který, tento, tyto, každý, ty, některé, ten, všechnyEMPTY
(49478): to, jeho, které, který, která, jejich, své, tím, tom, této
Paradigm ten | Anim | Inan |
---|---|---|
Case=Acc|Number=Sing | toho | ten |
Case=Acc|Number=Plur | ty | ty |
Case=Nom|Number=Plur | ti | ty |
PRON
3633 PRON tokens (8% of all PRON
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which PRON
and Animacy
co-occurred: Variant=EMPTY (3633; 100%), Reflex=EMPTY (3633; 100%), PrepCase=EMPTY (3572; 98%), Person=EMPTY (3552; 98%), Number=EMPTY (3444; 95%), PronType=Int,Rel (2619; 72%), Case=Nom (2096; 58%), Gender=EMPTY (1832; 50%).
PRON
tokens may have the following values of Animacy
:
Anim
(1730; 48% of non-emptyAnimacy
): kdo, nikdo, někdo, oni, koho, komu, někoho, nikoho, nikomu, někomuInan
(1903; 52% of non-emptyAnimacy
): co, čím, čem, čeho, jež, čemu, veškeré, veškerý, ony, WASEMPTY
(41292): se, si, nás, je, nám, nich, což, mu, ji, ho
Paradigm on | Anim | Inan |
---|---|---|
oni | ony |
Animacy
seems to be lexical feature of PRON
. 91% lemmas (20) occur only with one value of Animacy
.
AUX
1282 AUX tokens (3% of all AUX
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which AUX
and Animacy
co-occurred: Mood=EMPTY (1282; 100%), VerbForm=Part (1282; 100%), Number=Plur (1282; 100%), Tense=Past (1282; 100%), Person=EMPTY (1282; 100%), Voice=Act (1282; 100%), Polarity=Pos (1151; 90%), Gender=Fem,Masc (878; 68%).
AUX
tokens may have the following values of Animacy
:
Anim
(404; 32% of non-emptyAnimacy
): byli, nebyli, bývali, staliInan
(878; 68% of non-emptyAnimacy
): byly, nebyly, bývaly, bývávalyEMPTY
(40111): je, by, jsou, bude, byl, být, jsem, jsme, bylo, byla
Paradigm být | Anim | Inan |
---|---|---|
Gender=Masc|Polarity=Neg | nebyli | |
Gender=Masc|Polarity=Pos | byli | |
Gender=Fem,Masc|Polarity=Neg | nebyly | |
Gender=Fem,Masc|Polarity=Pos | byly |
NUM
303 NUM tokens (1% of all NUM
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which NUM
and Animacy
co-occurred: NumType=Card (303; 100%), Case=Acc (303; 100%), Gender=Masc (303; 100%), Number=Sing (303; 100%), NumValue=1,2,3 (303; 100%), NumForm=Word (303; 100%).
NUM
tokens may have the following values of Animacy
:
Anim
(84; 28% of non-emptyAnimacy
): jednohoInan
(219; 72% of non-emptyAnimacy
): jedenEMPTY
(41204): 1, 2, 3, dva, tři, 4, 6, dvě, tisíc, 5
Paradigm jeden | Anim | Inan |
---|---|---|
jednoho | jeden |
Relations with Agreement in Animacy
The 10 most frequent relations where parent and child node agree in Animacy
:
NOUN –[amod]–> ADJ (62195; 97%),
PROPN –[flat]–> PROPN (11956; 99%),
PROPN –[nmod]–> NOUN (7249; 87%),
PROPN –[conj]–> PROPN (2936; 67%),
ADJ –[conj]–> ADJ (2221; 86%),
PROPN –[amod]–> ADJ (1851; 72%),
ADJ –[nsubj]–> NOUN (1755; 69%),
PROPN –[appos]–> NOUN (687; 77%),
NOUN –[nsubj]–> PROPN (278; 55%),
NOUN –[case]–> NOUN (250; 53%).