Constitution d’un corpus d’articles scientifiques avec représentation sémantique - Télécom Paris Accéder directement au contenu
Communication Dans Un Congrès Année : 2018

Constitution d’un corpus d’articles scientifiques avec représentation sémantique

Résumé

Dans le cadre du projet SemBib, nous avons entrepris une représentation sémantique de la production scientifique de Télécom Paristech. Au delà des objectifs internes, ce corpus enrichi est une source d’expérimentation et une ressource pédagogique. ce travail repose sur l’utilisation de méthodes de fouilles de texte pour construire des graphes de connaissances, puis sur la production d’analyses à partir de ces graphes. La proposition principale exposée est la méthodologie de production de graphes disjoints, aux rôles bien identifiés, afin de permettre des utilisations différenciées, et en particulier la comparaison entre méthodes de production et d’exploitation des graphes. Cet article est avant tout une proposition méthodologique pour l’organisation de représentation sémantique de publications, en s’appuyant sur des méthodes de fouille de texte. La méthode proposée facilite des approches d’enrichissement progressifs des représentations avec possibilités d’évaluation à chaque étape

Mots clés

Fichier non déposé

Dates et versions

hal-02412392 , version 1 (15-12-2019)

Identifiants

  • HAL Id : hal-02412392 , version 1

Citer

Jean-Claude Moissinac. Constitution d’un corpus d’articles scientifiques avec représentation sémantique. TextMine'18, Jan 2018, Paris, France. ⟨hal-02412392⟩
25 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More