La BEFM
  • Accéder à la bibliothèque avec TXM
  • Accéder directement à la bibliothèque
  • Aide
    Formuler une requête Valeurs pour pos & msd
  • Documentation
    Corpus de la BEFM Annotation de la BEFM Métadonnées Annotations Manuel d'utilisation

  • Contact

  • Administration
La BEFM est un projet porté par l'équipe du . le site est sous licence GNU GPL V3, les textes qui constituent le corpus sont soumis aux lois en vigueur
Formuler une requête

Pour interroger la BEFM vous devez utiliser des requêtes CQL (Corpus Query langage). Il s'agit de rechercher des valeurs pour les attributs associés à chaque mot :

  • word : le mot tel qu'il figure dans le texte.
  • lemma : l'entrée du dictionnaire correspondant à ce mot.
  • pos : la nature du mot : adverbe, nom, verbe, adjectif.
  • msd : informations sur la forme grammaticale du mot : temps pour un verbe, féminin ou masculin pour un nom,....

Les valeurs possibles pour pos et msd sont présentées dans la page d'aide "Valeurs pour pos & msd"

Exemples de formulation des requêtes avec le langage CQL

Requête Résultat
[word="je"] Retourne toutes les occurrences du mot je
[lemma="penser"] Retourne toutes occurrences de l'entrée de dictionnaire penser comme pense, pensera, ont pensé,...
[pos="VER"] retourne tous les verbes
[msd="fut"] Retourne tous les verbes au futur
[lemma="être" & pos="NOM"] retourne tous les mots être qui sont des noms
[lemma="être" & pos="VER"][pos="NOM] Retourne toutes les occurrences du verbe être suivi d'un nom
[word="Corneille.*"] Retourne toutes les occurrences du mot Corneille suivi ou non d'un suffixe
[word=".*Cyril"] Retourne toutes les occurrences du mot Cyril précédé ou non d'un préfixe
Valeurs possibles pour pos & msd

Format XML TEI

Les textes de la BEFM sont encodés au format XML TEI

Chaque mot est encadré par une balise w. Une recherche sur [word="aimeraient"] vous donnera accès à toutes les occurences du mot aimeraient

La balise w peut contenir les attributs suivants :

@lemma

L'attribut @lemma fournit le lemme du mot c'est à dire son entrée dans le dictionnaire

Par exemple <w lemma="dormir">dormiront</w> ou <w lemma="seul">seules</w>

Tous les mots des textes disposent d'une annotation @lemma

Une recherche sur [lemma="aimer"] vous donnera pour réponse toutes les occurences, dans le corpus, du mot aimer dans toutes les formes : aimera, Aimeront, aimerait,...

@pos

L'attribut @pos (pos pour Part Of Speech, partie du discours) correspond à la nature du mot : adverbe, nom, verbe, adjectif.

Tous les mots des textes qui constituent la BEFM disposent d'une balise @pos à l'exclusion des lettres euphoniques comme "t" dans "que cherche-t-on ?" ou "l'" dans "l'on est bien avancé !"

    Liste des valeurs possibles pour l'attribut @pos
  • ADJ Adjectif. Il peut être précisé par un attribut @msd
  • ADV Adverbe
  • CON Conjonction. Elle peut être précisée par un attribut @msd
  • DET Déterminant. Il peut être précisé par un attribut @msd
  • EPH Euphonème
  • ETR Locution ne figurant pas dans le dictionnaire, mot étranger
  • INJ Interjection
  • LOC Locution
  • NOM Nom. Il peut être précisé par un attribut @msd
  • PON Ponctuation. Elle peut être précisée par un attribut @msd
  • PRE Préposition
  • PRO Pronom. Il peut être précisé par un attribut @msd
  • VER Verbe. Il peut être précisé par un attribut @msd

@msd

L'attribut @msd (morphosyntactic description ou description morphosyntactique en français) fournit des informations sur la forme grammaticale du mot. Il permet, si on le souhaite, de limiter la recherche à une catégorie plus précise

Par exemple la recherche [pos="VER"] retournera tous les verbes alors que [msd="fut"] retournera tous les verbes au futur.

    Liste des valeurs possibles pour l'attribut @msd associé à la valeur pos="ADJ"
  • pur Adjectif "pur"
  • ppa Participe passé dans un emploi « adjectivé »
    Liste des valeurs possibles pour l'attribut @msd associé à la valeur pos="CON"
  • coo conjonction de coordination
  • sub conjonction de subordination
    Liste des valeurs possibles pour l'attribut @msd associé à la valeur pos="DET"
  • art Article (défini ou indéfini)
  • num Numéral ou cardinal
  • pos Possessif
  • dem Démonstratif
  • ind Indéfini
    Liste des valeurs possibles pour l'attribut @msd associé à la valeur pos="NOM"
  • pro Nom propre (mot à majuscule initiale)
  • mas Substantif masculin
  • fem substantif feminin
    Liste des valeurs possibles pour l'attribut @msd associé à la valeur pos="PON"
  • fbl Ponctuation mineure (interne à la phrase)
  • frt Ponctuation majeure (délimitant la phrase)
    Liste des valeurs possibles pour l'attribut @msd associé à la valeur pos="PRO"
  • per Pronom personnel (1, 2, 3)
  • aut Pronom relatifs, réfléchis, interrogatifs, possessifs, etc.
    Liste des valeurs possibles pour l'attribut @msd associé à la valeur pos="VER"
  • ppa participe passé
  • ppe participe présent
  • inf Infinitif
  • fut Futur
  • con Conditionnel
  • pst présent (indicatif, subjonctif, impératif)
  • ipf imparfait (indicatif et subjonctif)
  • psp passé simple