Treebank Statistics: UD_Czech: Features: Animacy
This feature is universal.
It occurs with 2 different values: Anim, Inan.
312931 tokens (21%) have a non-empty value of Animacy.
62654 types (49%) occur at least once with a non-empty value of Animacy.
28574 lemmas (49%) occur at least once with a non-empty value of Animacy.
The feature is used with 8 part-of-speech tags: NOUN (163546; 11% instances), ADJ (75523; 5% instances), PROPN (48949; 3% instances), VERB (12708; 1% instances), DET (6987; 0% instances), PRON (3633; 0% instances), AUX (1282; 0% instances), NUM (303; 0% instances).
NOUN
163546 NOUN tokens (44% of all NOUN tokens) have a non-empty value of Animacy.
The most frequent other feature values with which NOUN and Animacy co-occurred: Gender=Masc (163546; 100%), Polarity=Pos (163534; 100%), Number=Sing (106848; 65%).
NOUN tokens may have the following values of Animacy:
Anim(42328; 26% of non-emptyAnimacy): lidí, ministr, předseda, lidé, ředitel, prezident, trenér, ministra, prezidenta, premiérInan(121218; 74% of non-emptyAnimacy): roku, roce, případě, zákona, rok, světa, trhu, zákon, zájem, státuEMPTY(208820): korun, let, strany, procent, společnosti, době, firmy, Kč, práce, jednání
| Paradigm člen | Anim | Inan |
|---|---|---|
| Case=Acc|Number=Sing | člena | |
| Case=Acc|Number=Plur | členy | |
| Case=Dat|Number=Sing | členu, členovi | |
| Case=Dat|Number=Plur | členům | členům |
| Case=Gen|Number=Sing | člena | |
| Case=Gen|Number=Plur | členů | členů |
| Case=Ins|Number=Sing | členem | ČLENEM |
| Case=Ins|Number=Plur | členy | členy |
| Case=Loc|Number=Sing | členu, členovi | |
| Case=Loc|Number=Plur | členech | |
| Case=Nom|Number=Sing | člen | člen |
| Case=Nom|Number=Plur | členové |
Animacy seems to be lexical feature of NOUN. 99% lemmas (6947) occur only with one value of Animacy.
ADJ
75523 ADJ tokens (40% of all ADJ tokens) have a non-empty value of Animacy.
The most frequent other feature values with which ADJ and Animacy co-occurred: Gender=Masc (73755; 98%), Polarity=Pos (70830; 94%), Degree=Pos (64638; 86%), Number=Sing (45495; 60%).
ADJ tokens may have the following values of Animacy:
Anim(18900; 25% of non-emptyAnimacy): další, bývalý, mnozí, domácí, první, generální, český, americký, českých, dalšíchInan(56623; 75% of non-emptyAnimacy): další, první, nový, českého, celý, český, velký, letošního, státního, minulýEMPTY(113662): české, první, další, druhé, nové, možné, poslední, česká, třeba, státní
| Paradigm český | Anim | Inan |
|---|---|---|
| Case=Acc|Number=Sing | českého | český |
| Case=Acc|Number=Plur | české | české |
| Case=Dat|Number=Sing | českému | českému |
| Case=Dat|Number=Plur | českým, českých | českým |
| Case=Gen|Number=Sing | českého | českého |
| Case=Gen|Number=Plur | českých | českých |
| Case=Ins|Number=Sing | českým | českým |
| Case=Ins|Number=Plur | českými | českými |
| Case=Loc|Number=Sing | českém | českém |
| Case=Loc|Number=Plur | českých | českých |
| Case=Nom|Number=Sing | český | český |
| Case=Nom|Number=Plur | čeští | české |
PROPN
48949 PROPN tokens (58% of all PROPN tokens) have a non-empty value of Animacy.
The most frequent other feature values with which PROPN and Animacy co-occurred: Gender=Masc (48949; 100%), Polarity=Pos (48949; 100%), Abbr=EMPTY (45594; 93%), Number=Sing (41680; 85%), Case=Nom (27584; 56%).
PROPN tokens may have the following values of Animacy:
Anim(37154; 76% of non-emptyAnimacy): Jiří, J, Jan, Václav, Petr, Pavel, Josef, M, Vladimír, VInan(11795; 24% of non-emptyAnimacy): USA, York, Zlín, Liberec, FNM, SSSR, Hradec, Izrael, Londýn, YorkuEMPTY(35082): Praha, ČR, Praze, LN, ODS, OSN, Evropy, Brno, Prahy, ODA
| Paradigm York | Anim | Inan |
|---|---|---|
| Case=Acc|NameType=Geo | York | |
| Case=Gen|NameType=Geo | Yorku | |
| Case=Loc|NameType=Geo | Yorku, YORKU | |
| Case=Loc|NameType=Sur | Yorku | |
| Case=Nom|NameType=Geo | York, YORK | |
| Case=Nom|NameType=Sur | YORK |
Animacy seems to be lexical feature of PROPN. 99% lemmas (10350) occur only with one value of Animacy.
VERB
12708 VERB tokens (9% of all VERB tokens) have a non-empty value of Animacy.
The most frequent other feature values with which VERB and Animacy co-occurred: Mood=EMPTY (12708; 100%), VerbForm=Part (12708; 100%), Number=Plur (12708; 100%), Tense=Past (12708; 100%), Person=EMPTY (12708; 100%), Voice=Act (12708; 100%), Polarity=Pos (11594; 91%), Gender=Masc (8400; 66%).
VERB tokens may have the following values of Animacy:
Anim(8400; 66% of non-emptyAnimacy): měli, mohli, chtěli, začali, museli, dostali, získali, byli, rozhodli, přišliInan(4308; 34% of non-emptyAnimacy): měly, mohly, byly, začaly, objevily, dosáhly, získaly, neměly, staly, vedlyEMPTY(122802): má, je, může, řekl, měl, mají, musí, jde, měla, jsou
| Paradigm mít | Anim | Inan |
|---|---|---|
| Gender=Masc|Polarity=Neg | neměli | |
| Gender=Masc|Polarity=Pos | měli | |
| Gender=Fem,Masc|Polarity=Neg | neměly | |
| Gender=Fem,Masc|Polarity=Pos | měly |
DET
6987 DET tokens (12% of all DET tokens) have a non-empty value of Animacy.
The most frequent other feature values with which DET and Animacy co-occurred: Gender=Masc (6987; 100%), Person=EMPTY (6602; 94%), Number[psor]=EMPTY (6602; 94%), Poss=EMPTY (6020; 86%), Case=Nom (4024; 58%), Number=Plur (3980; 57%).
DET tokens may have the following values of Animacy:
Anim(3134; 45% of non-emptyAnimacy): kteří, všichni, každý, ti, někteří, sami, naši, svého, každého, kteréhoInan(3853; 55% of non-emptyAnimacy): které, svůj, který, tento, tyto, každý, ty, některé, ten, všechnyEMPTY(49478): to, jeho, které, který, která, jejich, své, tím, tom, této
| Paradigm ten | Anim | Inan |
|---|---|---|
| Case=Acc|Number=Sing | toho | ten |
| Case=Acc|Number=Plur | ty | ty |
| Case=Nom|Number=Plur | ti | ty |
PRON
3633 PRON tokens (8% of all PRON tokens) have a non-empty value of Animacy.
The most frequent other feature values with which PRON and Animacy co-occurred: Variant=EMPTY (3633; 100%), Reflex=EMPTY (3633; 100%), PrepCase=EMPTY (3572; 98%), Person=EMPTY (3552; 98%), Number=EMPTY (3444; 95%), PronType=Int,Rel (2619; 72%), Case=Nom (2096; 58%), Gender=EMPTY (1832; 50%).
PRON tokens may have the following values of Animacy:
Anim(1730; 48% of non-emptyAnimacy): kdo, nikdo, někdo, oni, koho, komu, někoho, nikoho, nikomu, někomuInan(1903; 52% of non-emptyAnimacy): co, čím, čem, čeho, jež, čemu, veškeré, veškerý, ony, WASEMPTY(41292): se, si, nás, je, nám, nich, což, mu, ji, ho
| Paradigm on | Anim | Inan |
|---|---|---|
| oni | ony |
Animacy seems to be lexical feature of PRON. 91% lemmas (20) occur only with one value of Animacy.
AUX
1282 AUX tokens (3% of all AUX tokens) have a non-empty value of Animacy.
The most frequent other feature values with which AUX and Animacy co-occurred: Mood=EMPTY (1282; 100%), VerbForm=Part (1282; 100%), Number=Plur (1282; 100%), Tense=Past (1282; 100%), Person=EMPTY (1282; 100%), Voice=Act (1282; 100%), Polarity=Pos (1151; 90%), Gender=Fem,Masc (878; 68%).
AUX tokens may have the following values of Animacy:
Anim(404; 32% of non-emptyAnimacy): byli, nebyli, bývali, staliInan(878; 68% of non-emptyAnimacy): byly, nebyly, bývaly, bývávalyEMPTY(40111): je, by, jsou, bude, byl, být, jsem, jsme, bylo, byla
| Paradigm být | Anim | Inan |
|---|---|---|
| Gender=Masc|Polarity=Neg | nebyli | |
| Gender=Masc|Polarity=Pos | byli | |
| Gender=Fem,Masc|Polarity=Neg | nebyly | |
| Gender=Fem,Masc|Polarity=Pos | byly |
NUM
303 NUM tokens (1% of all NUM tokens) have a non-empty value of Animacy.
The most frequent other feature values with which NUM and Animacy co-occurred: NumType=Card (303; 100%), Case=Acc (303; 100%), Gender=Masc (303; 100%), Number=Sing (303; 100%), NumValue=1,2,3 (303; 100%), NumForm=Word (303; 100%).
NUM tokens may have the following values of Animacy:
Anim(84; 28% of non-emptyAnimacy): jednohoInan(219; 72% of non-emptyAnimacy): jedenEMPTY(41204): 1, 2, 3, dva, tři, 4, 6, dvě, tisíc, 5
| Paradigm jeden | Anim | Inan |
|---|---|---|
| jednoho | jeden |
Relations with Agreement in Animacy
The 10 most frequent relations where parent and child node agree in Animacy:
NOUN –[amod]–> ADJ (62195; 97%),
PROPN –[flat]–> PROPN (11956; 99%),
PROPN –[nmod]–> NOUN (7249; 87%),
PROPN –[conj]–> PROPN (2936; 67%),
ADJ –[conj]–> ADJ (2221; 86%),
PROPN –[amod]–> ADJ (1851; 72%),
ADJ –[nsubj]–> NOUN (1755; 69%),
PROPN –[appos]–> NOUN (687; 77%),
NOUN –[nsubj]–> PROPN (278; 55%),
NOUN –[case]–> NOUN (250; 53%).