La langue française

Lemmatisation

Sommaire

  • Définitions du mot lemmatisation
  • Étymologie de « lemmatisation »
  • Phonétique de « lemmatisation »
  • Citations contenant le mot « lemmatisation »
  • Traductions du mot « lemmatisation »

Définitions du mot lemmatisation

Trésor de la Langue Française informatisé

Lemmatisation, subst. fém.,lexicogr. ,,Opération consistant à regrouper les formes occurrentes d'un texte ou d'une liste sous des adresses lexicales`` (Mounin 1974). Une lemmatisation artisanale ayant pour base un listage de toutes les occurrences des mots rencontrés (G. Roques et N. Mussods Ét. de synt. du Moy. Fr., Paris, Klincksieck, 1978, p. 191).

Wiktionnaire

Nom commun

lemmatisation \lɛ.ma.ti.za.sjɔ̃\ féminin

  1. Fait de prendre le lemme (forme canonique) des mots.
    • La lemmatisation consiste à trouver la racine des verbes fléchis et à ramener les mots pluriels et/ou féminins à la forme masculine singulier. Ainsi on ramène à la forme « chanter » les termes { chant, chantaient, chanté, chanteront } ; à « chanteur » les mots { chanteuse, chanteuses, chanteurs } et à la forme « chant » le mot { chants }. — (Juan-Manuel Torres-Moreno, Résumé automatique de documents, 2011, ISBN 9782746232129, p. 200)

Nom commun

lemmatisation

  1. Variante de lemmatization.
Wiktionnaire - licence Creative Commons attribution partage à l’identique 3.0

Étymologie de « lemmatisation »

Dérivé de lemmatiser avec le suffixe -tion.
Wiktionnaire - licence Creative Commons attribution partage à l’identique 3.0

Phonétique du mot « lemmatisation »

Mot Phonétique (Alphabet Phonétique International) Prononciation
lemmatisation lɑ̃matisasjɔ̃

Citations contenant le mot « lemmatisation »

  • Techniquement, le logiciel Iramuteq opère ce que les linguistes nomment une "lemmatisation" du corpus : "les verbes sont ramenés a? l'infinitif, les noms au singulier et les adjectifs au masculin singulier. Iramuteq réalise la lemmatisation à partir de dictionnaires, sans désambiguïsation". (Manuel du logiciel, 2014). macommune.info, Municipale 2020 : les discours des candidats de Besançon passés au crible… • macommune.info
  • Une fois les unités repérées, il est possible de normaliser la forme des tokens en passant par une étape de lemmatisation. Elle consiste à attribuer à un mot sa forme neutre, appelée le lemme. En français, le lemme d’un nom est sa forme, lorsqu’elle existe, au masculin singulier. De même, le lemme d’un verbe correspond à son infinitif. Cette étape facilite la reconnaissance des mots d’une phrase, et le rapprochement des mots similaires. En effet, s’ils ne sont pas normalisés, un programme ne peut pas savoir que “sont”, “étiez” et “fussiez” sont trois formes dérivées du verbe “être”, alors qu’il peut être intéressant dans le cadre d’une analyse automatique du texte, de savoir qu’il y a 15 occurrences du verbe “être”, plutôt que 3 occurrences de “sont”, 6 occurrences de “étiez” et 6 occurrences de “fussiez”. Actu IA, Le TALN appliqué aux chatbots - Actu IA
  • 1. Recherche d’information : moteurs de recherche plein texte, lemmatisation, recherche vectorielle, ontologie et thesaurus automatisé. , Nouvelles méthodes pour la fouille et l’analyse des corpus textuels (école d'été du 28 juin au 4 juillet 2020, villa Cynthia à Fréjus)
  • Pour relier les articles les uns aux autres, et retracer la propagation d’un contenu, Neutral News recourt à la technique d’analyse lexicale, dite « lemmatisation ». Elle permet de donner une forme neutre à un mot. Par exemple, un verbe conjugué sera passé à l’infinitif. www.euractiv.fr, Comment Neutral news veut analyser la propagation des fake news – EURACTIV.fr
  • La lexicométrie exige tout d’abord de disposer d’un corpus documentaire un ensemble d’unité linguistique repérable dans un même texte. Le texte ne devra avoir connu aucune modification préalable. Ce corpus va être mis en forme de façon homogène. C’est la lemmatisation un processus de traitement qui consiste à ramener les verbes à l'infinitif, les noms au singulier et les adjectifs au masculin singulier. Cette opération permet d’opérer les liens en rapprochant les lexèmes entre eux. , L’analyse sémantique automatisée, quel surplus de sens aux textes ? - Thot Cursus
  • La machine ne traite pas les mots comme des données, mais elle en comprend le sens. Cela implique qu'elle dispose d'un dictionnaire de mots, qu'elle soit capable d'en analyser la structure (racine, suffixes, préfixes, déclinaisons, conjugaison...), dans un processus de lemmatisation (analyse lexicale), qui consiste à regrouper les différentes formes que peut revêtir un mot (masculin ou féminin, singulier ou pluriel, mode...). Bref d'être capable de faire la différence entre deux requêtes très proches, comme « un prêt pour une voiture » ou le « prêt d'une voiture ». Cela doit associer des compétences mathématiques et de compréhension fonctionnelle de la langue. La Tribune, 2016, l'année de l'intelligence artificielle ?

Traductions du mot « lemmatisation »

Langue Traduction
Anglais lemmatization
Espagnol lematización
Italien lemmatizzazione
Allemand lemmatisierung
Chinois 词形化
Arabe اللماتة
Portugais lematização
Russe лемматизации
Japonais レンマ化
Basque lemmatization
Corse lematizazione
Source : Google Translate API
Partager