Statistics of PRON in UD

home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Czech-FicTree: POS Tags: `PRON`

There are 34 PRON lemmas (0%), 149 PRON types (1%) and 14106 PRON tokens (8%). Out of 16 observed tags, the rank of PRON is: 14 in number of lemmas, 8 in number of types and 4 in number of tokens.

The 10 most frequent PRON lemmas: se, on, já, co, ty, nic, něco, kdo, nikdo, někdo

The 10 most frequent PRON types: se, si, mi, co, mě, ho, já, mu, ji, nic

The 10 most frequent ambiguous lemmas: se (PRON 6110, ADP 1), co (PRON 788, ADV 48, PART 34, SCONJ 21), jenž (PRON 123, DET 23), což (PRON 42, PART 1), my (PRON 8, DET 1), copak (PART 11, PRON 6), být (AUX 6481, VERB 961, PRON 1), cože (INTJ 8, PRON 1)

The 10 most frequent ambiguous types: se (PRON 4448, ADP 185), si (PRON 1337, AUX 3, VERB 1), co (PRON 538, ADV 46, SCONJ 21, PART 17), je (AUX 619, VERB 244, PRON 228), ti (PRON 129, DET 31), ty (DET 66, PRON 65), ona (PRON 70, DET 2), my (PRON 38, DET 1), něčím (PRON 11, DET 1), copak (PART 1, PRON 1)

se
- PRON 4448: Syn se mě pevně držel za ruku , občas ke mně vzhlédl .
- ADP 185: Ještě je směšné , se svým užaslým pohledem .
si
- PRON 1337: Tuhle větu si připomínám léta .
- AUX 3: Já zapomněla , že ty si chytřejší a vzdělanější , “ odfrkla znechuceně .
- VERB 1: Průvodce totiž informoval o tom , jak je vesnička romantická , výhled velkolepý , jídlo znamenité a ceny tak nízké , že si dokonce vesnický blázen Mirco raději vybere minci v hodnotě čtvrt dináru , protože je na pohled větší než mince v hodnotě půl dináru .
co
- PRON 538: ” Ale tohle je jediný cenný klenot , co mám . “
- ADV 46: Žasl jsem , co jsem měl v životě těch příště .
- SCONJ 21: Jenže od chvíle , co jsem to měl doma , byl jsem rozčilený .
- PART 17: ” Co si to dovoluješ , kdo tě učí takhle mluvit , kdo , co ? “
je
- AUX 619: ” Že je pravdivý , vám ale budu moci snadno dokázat .
- VERB 244: Pak jsem si všiml , že na zadní straně obálky je ještě něco .
- PRON 228: Já jí je nedal .
ti
- PRON 129: ” Ještě je ti zle ? “ zeptala se Ilona .
- DET 31: A ti , kteří toto rajské období ničí , jsou krutí .
ty
- DET 66: Snad taky znáte ty oči okouzlujících starých dam .
- PRON 65: ” Dědečku , “ on na to , “ ale ty můžeš být nemocný nebo dokonce . . . “
ona
- PRON 70: Ale ona stáhla ze zápěstí tenhle náramek a podala mi ho .
- DET 2: On ji měl stále rád , ovšem přišla léta , kdy se u žen dostaví hormonální změny , myslím tím ona kritická léta po čtyřicítce .
my
- PRON 38: Jenže my proti nim nejsme bezbranní .
- DET 1: Každý večer vyplouvají naši blízcí na svá moře , do vln svých starostí a trýzní , každý večer čekají na světlo , které jim můžeme rozsvítit jen my .
něčím
- PRON 11: Syn má čtyři roky , každou chvíli nás něčím udiví .
- DET 1: Jenže dělat na něčem dlouho , dávat do toho všecko , co v člověku je , okouzlit , dokopat , zmanipulovat lidi , aby by do toho šli taky , a dokázat , že tomu taky uvěří a že se tomu taky upíšou , a pak najednou vidět , jak to zdechne na něčím psacím stole a provinilý hlas po telefonu , samozvaný cenzor a lhář , prostřednictvím překladatele či prostřednictvím úsměvu vám sdělí šmytec - tak tohle mě uvrhne do zimního spánku .
copak
- PART 1: Copak by dokázal , copak by vůbec mohl všechno opravit ?
- PRON 1: ” A copak tam budete dělat ? “

Morphology

The form / lemma ratio of PRON is 4.382353 (the average of all parts of speech is 1.966826).

The 1st highest number of forms (28) was observed with the lemma “on”: ho, je, jeho, jej, jemu, ji, jich, jim, jimi, jí, jím, mu, ni, nich, nim, nimi, ní, ním, ně, něho, něj, něm, němu, on, ona, oni, ono, ony.

The 2nd highest number of forms (20) was observed with the lemma “jenž”: jehož, jejž, jemuž, jenž, jež, jichž, jimiž, jimž, již, jímž, jíž, nichž, nimiž, niž, nímž, níž, něhož, němuž, němž, něž.

The 3rd highest number of forms (11) was observed with the lemma “ty”: Tys, tebe, tebou, ti, tobě, ty, tě, vy, vám, vámi, vás.

PRON occurs with 13 features: PronType (14106; 100% instances), Case (14074; 100% instances), Variant (8362; 59% instances), Number (6193; 44% instances), Reflex (6111; 43% instances), Person (5993; 42% instances), Gender (3610; 26% instances), Animacy (3127; 22% instances), PrepCase (916; 6% instances), Style (25; 0% instances), Polarity (5; 0% instances), Tense (5; 0% instances), Voice (5; 0% instances)

PRON occurs with 32 feature-value pairs: Animacy=Anim, Animacy=Inan, Case=Acc, Case=Dat, Case=Gen, Case=Ins, Case=Loc, Case=Nom, Case=Voc, Gender=Fem, Gender=Masc, Gender=Neut, Number=Plur, Number=Sing, Person=1, Person=2, Person=3, Polarity=Pos, PrepCase=Npr, PrepCase=Pre, PronType=Ind, PronType=Int,Rel, PronType=Neg, PronType=Prs, PronType=Rel, PronType=Tot, Reflex=Yes, Style=Arch, Style=Coll, Tense=Pres, Variant=Short, Voice=Act

PRON occurs with 238 feature combinations. The most frequent feature combination is Case=Acc|PronType=Prs|Reflex=Yes|Variant=Short (4451 tokens). Examples: se

Relations

PRON nodes are attached to their parents using 22 different relations: expl:pv (4577; 32% instances), obj (3486; 25% instances), obl (1864; 13% instances), nsubj (1509; 11% instances), iobj (960; 7% instances), obl:arg (589; 4% instances), expl:pass (350; 2% instances), nmod (223; 2% instances), discourse (121; 1% instances), root (96; 1% instances), conj (88; 1% instances), dep (81; 1% instances), advcl (54; 0% instances), ccomp (29; 0% instances), nsubj:pass (27; 0% instances), orphan (24; 0% instances), appos (11; 0% instances), xcomp (6; 0% instances), acl (5; 0% instances), csubj (3; 0% instances), vocative (2; 0% instances), det (1; 0% instances)

Parents of PRON nodes belong to 14 different parts of speech: VERB (13157; 93% instances), ADJ (307; 2% instances), NOUN (261; 2% instances), ADV (105; 1% instances), (96; 1% instances), DET (62; 0% instances), PRON (57; 0% instances), NUM (28; 0% instances), PART (17; 0% instances), PROPN (9; 0% instances), ADP (2; 0% instances), INTJ (2; 0% instances), PUNCT (2; 0% instances), AUX (1; 0% instances)

11529 (82%) PRON nodes are leaves.

2217 (16%) PRON nodes have one child.

181 (1%) PRON nodes have two children.

179 (1%) PRON nodes have three or more children.

The highest child degree of a PRON node is 9.

Children of PRON nodes are attached using 29 different relations: case (1819; 55% instances), punct (358; 11% instances), amod (159; 5% instances), xcomp (154; 5% instances), advmod:emph (124; 4% instances), conj (97; 3% instances), cc (78; 2% instances), nmod (77; 2% instances), cop (73; 2% instances), mark (61; 2% instances), nsubj (55; 2% instances), acl (52; 2% instances), dep (46; 1% instances), appos (36; 1% instances), orphan (34; 1% instances), advmod (27; 1% instances), det (19; 1% instances), det:numgov (11; 0% instances), nummod (10; 0% instances), nummod:gov (8; 0% instances), advcl (6; 0% instances), obl (6; 0% instances), discourse (5; 0% instances), parataxis (4; 0% instances), aux (3; 0% instances), det:nummod (2; 0% instances), ccomp (1; 0% instances), csubj (1; 0% instances), vocative (1; 0% instances)

Children of PRON nodes belong to 15 different parts of speech: ADP (1816; 55% instances), PUNCT (360; 11% instances), ADJ (204; 6% instances), NOUN (182; 5% instances), DET (145; 4% instances), VERB (115; 3% instances), CCONJ (99; 3% instances), PART (87; 3% instances), ADV (78; 2% instances), AUX (76; 2% instances), SCONJ (61; 2% instances), PRON (57; 2% instances), NUM (23; 1% instances), PROPN (22; 1% instances), INTJ (2; 0% instances)

Treebank Statistics: UD_Czech-FicTree: POS Tags: PRON

Morphology

Relations

Treebank Statistics: UD_Czech-FicTree: POS Tags: `PRON`