Annotations utilisées pour la BEFM
Format XML TEI
Les textes de la BEFM sont encodés au format XML TEI
Chaque mot est encadré par une balise w. Une recherche sur [word="aimeraient"] vous donnera accès à toutes les occurences du mot aimeraient
La balise w peut contenir les attributs suivants :
@lemma
L'attribut @lemma fournit le lemme du mot c'est à dire son entrée dans le dictionnaire
Par exemple <w lemma="dormir">dormiront</w> ou <w lemma="seul">seules</w>
Tous les mots des textes disposent d'une annotation @lemma
Une recherche sur [lemma="aimer"] vous donnera pour réponse toutes les occurences, dans le corpus, du mot aimer dans toutes les formes : aimera, Aimeront, aimerait,...
@pos
L'attribut @pos (pos pour Part Of Speech, partie du discours) correspond à la nature du mot : adverbe, nom, verbe, adjectif.
Tous les mots des textes qui constituent la BEFM disposent d'une balise @pos à l'exclusion des lettres euphoniques comme "t" dans "que cherche-t-on ?" ou "l'" dans "l'on est bien avancé !"
- Liste des valeurs possibles pour l'attribut @pos
- ADJ Adjectif. Il peut être précisé par un attribut @msd
- ADV Adverbe
- CON Conjonction. Elle peut être précisée par un attribut @msd
- DET Déterminant. Il peut être précisé par un attribut @msd
- ETR Locution ne figurant pas dans le dictionnaire, mot étranger
- INJ Interjection
- NOM Nom. Il peut être précisé par un attribut @msd
- PON Ponctuation. Elle peut être précisée par un attribut @msd
- PRE Préposition
- PRO Pronom. Il peut être précisé par un attribut @msd
- VER Verbe. Il peut être précisé par un attribut @msd
@msd
L'attribut @msd (morphosyntactic description ou description morphosyntactique en français) fournit des informations morphosyntactiques sur le mot. Il permet, si on le souhaite, de limiter la recherche à une catégorie plus précise
Par exemple la recherche [pos="VER"] retournera tous les verbes alors que [msd="fut"] retournera tous les verbes au futur.
- Liste des valeurs possibles pour l'attribut @msd associé à la valeur pos="ADJ"
- pur Adjectif "pur"
- ppa Participe passé dans un emploi « adjectivé »
- Liste des valeurs possibles pour l'attribut @msd associé à la valeur pos="CON"
- coo conjonction de coordination
- sub conjonction de subordination
- Liste des valeurs possibles pour l'attribut @msd associé à la valeur pos="DET"
- art Article (défini ou indéfini)
- num Numéral ou cardinal
- pos Possessif
- dem Démonstratif
- ind Indéfini
- Liste des valeurs possibles pour l'attribut @msd associé à la valeur pos="NOM"
- pro Nom propre (mot à majuscule initiale)
- mas Substantif masculin
- fem substantif feminin
- Liste des valeurs possibles pour l'attribut @msd associé à la valeur pos="PON"
- fbl Ponctuation mineure (interne à la phrase)
- frt Ponctuation majeure (délimitant la phrase)
- Liste des valeurs possibles pour l'attribut @msd associé à la valeur pos="PRO"
- per Pronom personnel (1, 2, 3)
- aut Pronom relatifs, réfléchis, interrogatifs, possessifs, etc.