DET
: determiner
Definition
Determiners are words that modify nouns or noun phrases and express the reference of the noun phrase in context. Like adjectives, Italian determiners typically agree with the noun they modify for gender and number, e.g. questo libro “this book” (masculin singular), i libri “the books” (masculin plural), la carta “the paper” (feminine singular).
In Italian, usually a nominal allows for one DET modifier only, with the following exceptions:
- predeterminers (or addeterminers), which are also tagged
DET
. For example: Tutti gli amici “All the friends”. - possessive adjectives, which following the UD guidelines are also tagged as
DET
. For example: Mio padre “my father”, la mia macchina lit. “the my car”, la figlia mia lit. “the daughter my”
###Corresponding language-specific part-of-speech tags
RD: Definite article
RI: Indefinite article
DE: Exclamative determiner
DI: Indefinite determiner
DQ: Interrogative determiner
DR: Relative determiner
DD: Demonstrative determiner
T: Predeterminer
AP: Possessive adjective
Examples
- definite articles: il, lo, la, gli “the”
- indefinite articles: un, uno, una “a, an”
- demonstrative determiners: questo “this”, e.g. Ho visto questa macchina ieri. “I saw this car yesterday”
- interrogative determiners: quale “which”, e.g. Quale macchina ti piace? “Which car do you like?”
- relative determiners: quale “which”, e.g. Mi chiedo quale macchina ti piace. “I wonder which car you like”
- indefinite determiners: ogni “any”, tutti “all”, alcuni “some”, nessuno, nessuna “no”, e.g. Non abbiamo nessuna macchina disponibile “We have no car available”
- exclamative determiners: quale in Quale disastro! “What a mess!”
Treebank Statistics (UD_Italian)
There are 79 DET
lemmas (0%), 149 DET
types (1%) and 45958 DET
tokens (16%).
Out of 17 observed tags, the rank of DET
is: 10 in number of lemmas, 10 in number of types and 2 in number of tokens.
The 10 most frequent DET
lemmas: il, uno, suo, questo, quale, tutto, ogni, loro, che, alcuno
The 10 most frequent DET
types: il, la, i, l’, le, un, gli, una, lo, quale
The 10 most frequent ambiguous lemmas: il (DET 35874, PRON 9, NOUN 1), uno (DET 4396, PRON 209, NUM 41, ADJ 2), suo (DET 978, PRON 12), questo (DET 722, PRON 231), quale (DET 490, PRON 308, ADP 19, ADV 5, SCONJ 2), tutto (DET 403, PRON 221, ADJ 11, ADV 10, NOUN 4), loro (DET 257, PRON 77), che (PRON 2226, SCONJ 1230, DET 236, ADP 32, CCONJ 30), alcuno (DET 206, PRON 39), molto (DET 176, ADV 160, PRON 53, ADJ 2)
The 10 most frequent ambiguous types: la (DET 8350, PRON 122, X 2), i (DET 4236, ADJ 4, X 1, NOUN 1), l’ (DET 4078, PRON 90), le (DET 3627, PRON 100), un (DET 2284, NUM 15, PRON 1), gli (DET 1478, PRON 111), una (DET 1476, PRON 59, NUM 17, ADJ 2, NOUN 1), lo (DET 585, PRON 315), quale (DET 237, PRON 131, ADP 10, SCONJ 1), sua (DET 375, PRON 3)
- la
- DET 8350: Sorpresa in la sorpresa :
- PRON 122: C’ è gente nuova da ieri in pista , la copre veloce :
- X 2: È la scena madre ( o meglio , la scena di il concepimento ) di uno spettacolo di nuovo genere intitolato “ C’ est la vie “ e diretto da la regista Veronique Guillaud per il Lincoln Center , il tempio di le arti più prestigioso d’ America .
- i
- DET 4236: E i “ colleghi “ di Saxa Rubra ?
- ADJ 4: i ) orari , località di sosta intermedia e coincidenze ;
- X 1: Lo Stato ha legislazione esclusiva in le seguenti materie : a ) politica estera e rapporti internazionali di lo Stato ; rapporti di lo Stato con l’ Unione europea ; diritto di asilo e condizione giuridica di i cittadini di Stati non appartenenti a l’ Unione europea ; b ) immigrazione ; c ) rapporti tra la Repubblica e le confessioni religiose ; d ) difesa e Forze armate ; sicurezza di lo Stato ; armi , munizioni ed esplosivi ; e ) moneta , tutela di il risparmio e mercati finanziari ; tutela di la concorrenza ; sistema valutario ; sistema tributario e contabile di lo Stato ; perequazione di le risorse finanziarie ; f ) organi di lo Stato e relative leggi elettorali ; referendum statali ; elezione di il Parlamento europeo ; g ) ordinamento e organizzazione amministrativa di lo Stato e di gli enti pubblici nazionali ; h ) ordine pubblico e sicurezza , ad esclusione di la polizia amministrativa locale ; i ) cittadinanza , stato civile e anagrafi ; l ) giurisdizione e norme processuali ; ordinamento civile e penale ; giustizia amministrativa ; m ) determinazione di i livelli essenziali di le prestazioni concernenti i diritti civili e sociali che devono essere garantiti su tutto il territorio nazionale ; n ) norme generali su l’ istruzione ; o ) previdenza sociale ; p ) legislazione elettorale , organi di governo e funzioni fondamentali di Comuni , Province e Città metropolitane ; q ) dogane , protezione di i confini nazionali e profilassi internazionale ; r ) pesi , misure e determinazione di il tempo ; coordinamento informativo statistico e informatico di i dati di l’ amministrazione statale , regionale e locale ; opere di l’ ingegno ; s ) tutela di l’ ambiente , di l’ ecosistema e di i beni culturali .
- NOUN 1: Eppure i vari gruppi si sono affrettati a mettere i loro “ puntini su le i “ di il documento e la ripresa di l’ attività politica si annuncia come l’ ora di la verità su questo fronte come su quello più generale di il nodo elezioni sì elezioni no .
- l’
- le
- un
- DET 2284: gusto un po’ facile e appeal sicuro .
- NUM 15: A Baldas il gravissimo reato d’ opinione costerà un anno di purgatorio :
- PRON 1: Secondo James Shapiro studioso di Shakespeare , in il Giulio Cesare “ i vari elementi di politica , personaggio , introspezione , eventi contemporanei , persino le stesse riflessioni di Shakespeare su la scrittura , iniziano a sovrappor si l’ un l’ altro .
- gli
- una
- DET 1476: Abbiamo cercato di presentare una interpretazione diversa .
- PRON 59: Campione di rugby una di le vittime , un altro ha le gambe tranciate .
- NUM 17: una , due volte a il giorno .
- ADJ 2: La Repubblica , una e indivisibile , riconosce e promuove le autonomie locali ;
- NOUN 1: ” Sì , perché se qualcuno fa il furbo e non torna in caserma a l’ ora di chiusura di i cancelli , a mezzanotte e tre volte a il mese a l’ una , rischia di far si cogliere in fallo perché magari in il frattempo è stato messo in lista per uno straordinario .
- lo
- quale
- DET 237: In quale città è esplosa una lettera bomba ?
- PRON 131: A l’ età di 18 anni , sposò Anne Hathaway , con la quale ebbe 3 figli :
- ADP 10: Ciò , tuttavia , da isolano quale sono tengo a denunciare la scarsa attenzione prestata a la problematica di lo sviluppo insulare .
- SCONJ 1: Per il calcolo di il tasso annuo effettivo globale , si determina il costo totale di il credito a il consumatore quale è definito a l’ articolo 1 , paragrafo 2 , lettera d ) , escluse le spese seguenti :
- sua
Morphology
The form / lemma ratio of DET
is 1.886076 (the average of all parts of speech is 1.485733).
The 1st highest number of forms (10) was observed with the lemma “il”: gli, i, i1, il, l’, la, le, lo, lu, l’.
The 2nd highest number of forms (7) was observed with the lemma “quello”: quegli, quei, quel, quell’, quella, quelle, quello.
The 3rd highest number of forms (6) was observed with the lemma “molto”: molta, molte, molti, moltissime, moltissimi, molto.
DET
occurs with 5 features: it-feat/PronType (45942; 100% instances), it-feat/Number (45340; 99% instances), it-feat/Definite (40340; 88% instances), it-feat/Gender (39424; 86% instances), it-feat/Poss (1751; 4% instances)
DET
occurs with 15 feature-value pairs: Definite=Def
, Definite=Ind
, Gender=Fem
, Gender=Masc
, Number=Plur
, Number=Sing
, Poss=Yes
, PronType=Art
, PronType=Dem
, PronType=Exc
, PronType=Ind
, PronType=Int
, PronType=Prs
, PronType=Rel
, PronType=Tot
DET
occurs with 58 feature combinations.
The most frequent feature combination is Definite=Def|Gender=Masc|Number=Sing|PronType=Art
(12093 tokens).
Examples: il, lo, l’, l’, le, de, i1, lu
Relations
DET
nodes are attached to their parents using 8 different relations: it-dep/det (43768; 95% instances), it-dep/det:poss (1792; 4% instances), it-dep/det:predet (379; 1% instances), it-dep/conj (7; 0% instances), it-dep/fixed (5; 0% instances), it-dep/case (4; 0% instances), it-dep/dep (2; 0% instances), it-dep/nmod (1; 0% instances)
Parents of DET
nodes belong to 12 different parts of speech: NOUN (40697; 89% instances), PROPN (3021; 7% instances), NUM (1033; 2% instances), PRON (553; 1% instances), ADJ (294; 1% instances), VERB (156; 0% instances), SYM (79; 0% instances), ADV (70; 0% instances), ADP (31; 0% instances), X (17; 0% instances), PUNCT (5; 0% instances), DET (2; 0% instances)
45918 (100%) DET
nodes are leaves.
31 (0%) DET
nodes have one child.
8 (0%) DET
nodes have two children.
1 (0%) DET
nodes have three or more children.
The highest child degree of a DET
node is 3.
Children of DET
nodes are attached using 11 different relations: it-dep/advmod (9; 18% instances), it-dep/conj (9; 18% instances), it-dep/nmod (8; 16% instances), it-dep/punct (8; 16% instances), it-dep/cc (6; 12% instances), it-dep/advcl (4; 8% instances), it-dep/acl:relcl (2; 4% instances), it-dep/appos (1; 2% instances), it-dep/case (1; 2% instances), it-dep/mark (1; 2% instances), it-dep/nummod (1; 2% instances)
Children of DET
nodes belong to 12 different parts of speech: NOUN (11; 22% instances), ADV (9; 18% instances), PUNCT (8; 16% instances), CCONJ (6; 12% instances), VERB (6; 12% instances), PROPN (3; 6% instances), DET (2; 4% instances), ADJ (1; 2% instances), ADP (1; 2% instances), NUM (1; 2% instances), PRON (1; 2% instances), SCONJ (1; 2% instances)
Treebank Statistics (UD_Italian-ParTUT)
There are 50 DET
lemmas (1%), 96 DET
types (1%) and 7315 DET
tokens (17%).
Out of 15 observed tags, the rank of DET
is: 10 in number of lemmas, 9 in number of types and 2 in number of tokens.
The 10 most frequent DET
lemmas: il, uno, suo, questo, tale, tutto, alcuno, ogni, loro, nostro
The 10 most frequent DET
types: il, la, l’, i, le, un, gli, una, sua, suo
The 10 most frequent ambiguous lemmas: il (DET 5505, PRON 1), uno (DET 758, PRON 35), suo (DET 275, PRON 2), questo (DET 147, PRON 41), tale (DET 73, ADJ 2), tutto (DET 70, PRON 26), alcuno (DET 55, PRON 17), loro (DET 45, PRON 9), molto (DET 33, ADV 28, PRON 23), proprio (DET 31, ADV 8, ADJ 2)
The 10 most frequent ambiguous types: la (DET 1316, PRON 13, X 2), l’ (DET 710, PRON 5), le (DET 580, PRON 13), un (DET 373, PRON 1), gli (DET 273, PRON 13), una (DET 270, PRON 9), suo (DET 92, PRON 1), lo (DET 79, PRON 49), questo (DET 48, PRON 13), loro (DET 45, PRON 9)
- la
- l’
- le
- un
- DET 373: ( Il parlamento osserva un minuto di silenzio ) .
- PRON 1: Secondo James Shapiro studioso di Shakespeare , in il Giulio Cesare “ i vari elementi di politica , personaggio , introspezione , eventi contemporanei , persino le stesse riflessioni di Shakespeare su la scrittura , iniziano a sovrappor si l’ un l’ altro .
- gli
- una
- suo
- lo
- questo
- loro
Morphology
The form / lemma ratio of DET
is 1.920000 (the average of all parts of speech is 1.446672).
The 1st highest number of forms (7) was observed with the lemma “il”: gli, i, il, l’, la, le, lo.
The 2nd highest number of forms (5) was observed with the lemma “quello”: quegli, quei, quel, quella, quelle.
The 3rd highest number of forms (5) was observed with the lemma “questo”: quest’, questa, queste, questi, questo.
DET
occurs with 5 features: it-feat/PronType (7315; 100% instances), it-feat/Number (7245; 99% instances), it-feat/Gender (6323; 86% instances), it-feat/Definite (6276; 86% instances), it-feat/Poss (448; 6% instances)
DET
occurs with 14 feature-value pairs: Definite=Def
, Definite=Ind
, Gender=Fem
, Gender=Masc
, Number=Plur
, Number=Sing
, Poss=Yes
, PronType=Art
, PronType=Dem
, PronType=Ind
, PronType=Int
, PronType=Prs
, PronType=Rel
, PronType=Tot
DET
occurs with 38 feature combinations.
The most frequent feature combination is Definite=Def|Gender=Masc|Number=Sing|PronType=Art
(1665 tokens).
Examples: il, lo, l’
Relations
DET
nodes are attached to their parents using 7 different relations: it-dep/det (6786; 93% instances), it-dep/det:poss (454; 6% instances), it-dep/det:predet (68; 1% instances), it-dep/conj (3; 0% instances), it-dep/fixed (2; 0% instances), it-dep/nmod (1; 0% instances), it-dep/nsubj (1; 0% instances)
Parents of DET
nodes belong to 11 different parts of speech: NOUN (6610; 90% instances), PROPN (335; 5% instances), NUM (164; 2% instances), PRON (80; 1% instances), ADJ (42; 1% instances), SYM (32; 0% instances), VERB (27; 0% instances), X (14; 0% instances), ADP (6; 0% instances), ADV (3; 0% instances), DET (2; 0% instances)
7302 (100%) DET
nodes are leaves.
12 (0%) DET
nodes have one child.
1 (0%) DET
nodes have two children.
The highest child degree of a DET
node is 2.
Children of DET
nodes are attached using 5 different relations: it-dep/cc (4; 29% instances), it-dep/conj (4; 29% instances), it-dep/advmod (3; 21% instances), it-dep/nmod (2; 14% instances), it-dep/advcl (1; 7% instances)
Children of DET
nodes belong to 6 different parts of speech: CCONJ (4; 29% instances), ADV (3; 21% instances), NOUN (3; 21% instances), DET (2; 14% instances), PROPN (1; 7% instances), VERB (1; 7% instances)
DET in other languages: [am] [ar] [bg] [bxr] [ca] [ckb] [cop] [cs] [cu] [da] [de] [el] [en] [es] [et] [eu] [fa] [fi] [fo] [fr] [ga] [gl] [got] [grc] [he] [hi] [hr] [hu] [id] [it] [ja] [kk] [kmr] [ko] [la] [lv] [mr] [nl] [no] [pl] [pt] [ro] [ru] [sa] [sk] [sla] [sl] [so] [sr] [sv] [swl] [ta] [tr] [ug] [uk] [u] [urj] [ur] [vi] [yue] [zh]