POS tags

This file contains the used part-of-speech (POS)-tagsets for English, French and German. All used tags can also be found in usedPosTags.csv .

English

The English tagger uses the Penn Treebank POS tag set.

1.  CC  Coordinating conjunction
2.  CD  Cardinal number
3.  DT  Determiner
4.  EX  Existential there
5.  FW  Foreign word
6.  IN  Preposition or subordinating conjunction
7.  JJ  Adjective
8.  JJR     Adjective, comparative
9.  JJS     Adjective, superlative
10.     LS  List item marker
11.     MD  Modal
12.     NN  Noun, singular or mass
13.     NNS     Noun, plural
14.     NNP     Proper noun, singular
15.     NNPS    Proper noun, plural
16.     PDT     Predeterminer
17.     POS     Possessive ending
18.     PRP     Personal pronoun
19.     PRP$    Possessive pronoun
20.     RB  Adverb
21.     RBR     Adverb, comparative
22.     RBS     Adverb, superlative
23.     RP  Particle
24.     SYM     Symbol
25.     TO  to
26.     UH  Interjection
27.     VB  Verb, base form
28.     VBD     Verb, past tense
29.     VBG     Verb, gerund or present participle
30.     VBN     Verb, past participle
31.     VBP     Verb, non-3rd person singular present
32.     VBZ     Verb, 3rd person singular present
33.     WDT     Wh-determiner
34.     WP  Wh-pronoun
35.     WP$     Possessive wh-pronoun
36.     WRB     Wh-adverb

French

The French Tagger has been trained with the French Treebank corpus.

A (adjective)
Adv (adverb)
CC (coordinating conjunction)
Cl (weak clitic pronoun)
CS (subordinating conjunction)
D (determiner)
ET (foreign word)
I (interjection)
NC (common noun)
NP (proper noun)
P (preposition)
PREF (prefix)
PRO (strong pronoun)
V (verb)
PONCT (punctuation mark)

German

We use the Stuttgart-Tübingen-Tagset (STTS) that is used for the NEGRA Corpus.

ADJA    attributives Adjektiv                   [das] große [Haus]
ADJD    adverbiales oder                        [er fährt] schnell
                prädikatives Adjektiv                   [er ist] schnell

ADV     Adverb                                  schon, bald, doch

APPR    Präposition; Zirkumposition links       in [der Stadt], ohne [mich]
APPRART Präposition mit Artikel                 im [Haus], zur [Sache]
APPO    Postposition                            [ihm] zufolge, [der Sache] wegen
APZR    Zirkumposition rechts                   [von jetzt] an

ART     bestimmter oder                         der, die, das,
                unbestimmter Artikel                    ein, eine, ...

CARD    Kardinalzahl                            zwei [Männer], [im Jahre] 1994

FM      Fremdsprachliches Material              [Er hat das mit ``]
                                                                                                A big fish ['' übersetzt]

ITJ     Interjektion                            mhm, ach, tja

ORD     Ordinalzahl                             [der] neunte [August]

KOUI    unterordnende Konjunktion               um [zu leben],
                mit ``zu'' und Infinitiv                anstatt [zu fragen]
KOUS    unterordnende Konjunktion               weil, daß, damit,
                mit Satz                                wenn, ob
KON     nebenordnende Konjunktion               und, oder, aber
KOKOM   Vergleichskonjunktion                   als, wie

NN      normales Nomen                          Tisch, Herr, [das] Reisen
NE      Eigennamen                              Hans, Hamburg, HSV

PDS     substituierendes Demonstrativ-          dieser, jener
                pronomen
PDAT    attribuierendes Demonstrativ-           jener [Mensch]
                pronomen

PIS     substituierendes Indefinit-             keiner, viele, man, niemand
                pronomen
PIAT    attribuierendes Indefinit-              kein [Mensch],
                pronomen ohne Determiner                irgendein [Glas]
PIDAT   attribuierendes Indefinit-              [ein] wenig [Wasser],
                pronomen mit Determiner                 [die] beiden [Brüder]

PPER    irreflexives Personalpronomen           ich, er, ihm, mich, dir

PPOSS   substituierendes Possessiv-             meins, deiner
                pronomen
PPOSAT  attribuierendes Possessivpronomen       mein [Buch], deine [Mutter]

PRELS   substituierendes Relativpronomen        [der Hund ,] der
PRELAT  attribuierendes Relativpronomen         [der Mann ,] dessen [Hund]

PRF     reflexives Personalpronomen             sich, einander, dich, mir

PWS     substituierendes                        wer, was
                Interrogativpronomen
PWAT    attribuierendes                         welche [Farbe],
                Interrogativpronomen                    wessen [Hut]
PWAV    adverbiales Interrogativ-               warum, wo, wann,
                oder Relativpronomen                    worüber, wobei

PAV     Pronominaladverb                        dafür, dabei, deswegen, trotzdem

PTKZU   ``zu'' vor Infinitiv                    zu [gehen]
PTKNEG  Negationspartikel                       nicht
PTKVZ   abgetrennter Verbzusatz                 [er kommt] an, [er fährt] rad
PTKANT  Antwortpartikel                         ja, nein, danke, bitte
PTKA    Partikel bei Adjektiv                   am [schönsten],
                oder Adverb                             zu [schnell]

SGML    SGML Markup

SPELL   Buchstabierfolge                        S-C-H-W-E-I-K-L

TRUNC   Kompositions-Erstglied                  An- [und Abreise]

VVFIN   finites Verb, voll                      [du] gehst, [wir] kommen [an]
VVIMP   Imperativ, voll                         komm [!]
VVINF   Infinitiv, voll                         gehen, ankommen
VVIZU   Infinitiv mit ``zu'', voll              anzukommen, loszulassen
VVPP    Partizip Perfekt, voll                  gegangen, angekommen
VAFIN   finites Verb, aux                       [du] bist, [wir] werden
VAIMP   Imperativ, aux                          sei [ruhig !]
VAINF   Infinitiv, aux                          werden, sein
VAPP    Partizip Perfekt, aux                   gewesen
VMFIN   finites Verb, modal                     dürfen
VMINF   Infinitiv, modal                        wollen
VMPP    Partizip Perfekt, modal                 gekonnt, [er hat gehen] können

XY      Nichtwort, Sonderzeichen                3:7, H2O,
                enthaltend                              D2XW3

\$,     Komma                                   ,
\$.     Satzbeendende Interpunktion             . ? ! ; :
\$(     sonstige Satzzeichen; satzintern        - [,]()

Spanish

We use the simplified version of the tagset used in the AnCora treebank. The original AnCora part-of-speech tags were modeled after the EAGLES Spanish tagset: http://nlp.lsi.upc.edu/freeling/doc/tagsets/tagset-es.html The “simplification” consists of nulling out many of the final fields which don’t strictly belong in a part-of-speech tag. Therefore, the fields in the POS tags produced by the tagger correspond exactly to AnCora POS fields, but a lot of those fields will be null. For most practical purposes you’ll only need to look at the first 2–4 characters of the tag. The first character always indicates the broad POS category, and the second character indicates some kind of subtype.

a   adjective
c   conjunction
d   determiner
f   punctuation
i   interjection
n   noun    (c common  f feminine m masculine p plural s singular)
p   pronoun
r   adverb  (general negative)
s   preposition (c common p plural s singular)
v   verb
w   date    31_de_julio
z   number  2,74_por_ciento

Examples:

pd000000    esta
vsip000 es
di0000  una
nc0s000 oracion, prueba, escándalo
sp000   de
dd0000  Ese
vmis000 provocó
aq0000  amplios
nc0p000 cambios
np00000 Chris_Woodruff, El_Periódico_de_Cataluña
rg  no_obstante
nc00000 stock_options

Documentation:

http://clic.ub.edu/corpus/webfm_send/18

https://docs.google.com/document/d/1lI-ie4-GGx2IA6RJNc0PMb3CHDoNQMUa0gj0eQEDYQ0/