La langue française

Accueil > Dictionnaire > Définitions du mot « lemmatisation »

Lemmatisation

[lɑ̃matisasjɔ̃]
Ecouter

Définitions de « lemmatisation »

Lemmatisation - Nom commun

  • Processus consistant à réduire les mots à leur lemme, soit leur forme canonique ou de base, indépendamment des variations flexionnelles comme le genre, le nombre ou le temps.

    La lemmatisation consiste à trouver la racine des verbes fléchis et à ramener les mots pluriels et/ou féminins à la forme masculine singulier. Ainsi on ramène à la forme « chanter » les termes { chant, chantaient, chanté, chanteront } ; à « chanteur » les mots { chanteuse, chanteuses, chanteurs } et à la forme « chant » le mot { chants }.
    — Juan-Manuel Torres-Moreno, Résumé automatique de documents

Étymologie de « lemmatisation »

Dérivé du verbe lemmatiser avec le suffixe -tion.

Usage du mot « lemmatisation »

Évolution historique de l’usage du mot « lemmatisation » depuis 1800

Fréquence d'apparition du mot « lemmatisation » dans le journal Le Monde depuis 1945

Source : Gallicagram. Créé par Benjamin Azoulay et Benoît de Courson, Gallicagram représente graphiquement l’évolution au cours du temps de la fréquence d’apparition d’un ou plusieurs syntagmes dans les corpus numérisés de Gallica et de beaucoup d’autres bibliothèques.

Citations contenant le mot « lemmatisation »

  • 1. Recherche d’information : moteurs de recherche plein texte, lemmatisation, recherche vectorielle, ontologie et thesaurus automatisé.
    Nouvelles méthodes pour la fouille et l’analyse des corpus textuels (école d'été du 28 juin au 4 juillet 2020, villa Cynthia à Fréjus)
  • Techniquement, le logiciel Iramuteq opère ce que les linguistes nomment une "lemmatisation" du corpus : "les verbes sont ramenés a? l'infinitif, les noms au singulier et les adjectifs au masculin singulier. Iramuteq réalise la lemmatisation à partir de dictionnaires, sans désambiguïsation". (Manuel du logiciel, 2014).
    macommune.info — Municipale 2020 : les discours des candidats de Besançon passés au crible… • macommune.info
  • La lexicométrie exige tout d’abord de disposer d’un corpus documentaire un ensemble d’unité linguistique repérable dans un même texte. Le texte ne devra avoir connu aucune modification préalable. Ce corpus va être mis en forme de façon homogène. C’est la lemmatisation un processus de traitement qui consiste à ramener les verbes à l'infinitif, les noms au singulier et les adjectifs au masculin singulier. Cette opération permet d’opérer les liens en rapprochant les lexèmes entre eux.
    L’analyse sémantique automatisée, quel surplus de sens aux textes ? - Thot Cursus
  • Pour relier les articles les uns aux autres, et retracer la propagation d’un contenu, Neutral News recourt à la technique d’analyse lexicale, dite « lemmatisation ». Elle permet de donner une forme neutre à un mot. Par exemple, un verbe conjugué sera passé à l’infinitif.
    www.euractiv.fr — Comment Neutral news veut analyser la propagation des fake news – EURACTIV.fr

Traductions du mot « lemmatisation »

Langue Traduction
Anglais lemmatization
Espagnol lematización
Italien lemmatizzazione
Allemand lemmatisierung
Chinois 词形化
Arabe اللماتة
Portugais lematização
Russe лемматизации
Japonais レンマ化
Basque lemmatization
Corse lematizazione
Source : Google Translate API


Sources et ressources complémentaires

SOMMAIRE

Source : Google Books Ngram Viewer, application linguistique permettant d’observer l’évolution au fil du temps du nombre d'occurrences d’un ou de plusieurs mots dans les textes publiés.