Fouille de motifs séquentiels pour la découverte de relations entre gènes et maladies rares - Université de Rennes Accéder directement au contenu
Article Dans Une Revue Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle Année : 2014

Sequential pattern mining in order to discover relations between genes and rares diseases

Fouille de motifs séquentiels pour la découverte de relations entre gènes et maladies rares

Peggy Cellier
Thierry Charnois

Résumé

Orphanet provides an international web-based knowledge portal for rare diseases including a collection of review articles. However, reviews and literature monitoring are manual. Thus, new documentation about a rare disease is a time-consuming process and automatically discovering knowledge from a large collection of texts is a crucial issue. This context represents a strong motivation to address the problem of extracting gene–rare diseases relationships from texts. In this paper, we tackle this issue with a cross-fertilization of information extraction and data mining techniques (sequential pattern mining under constraints). Experiments show the interest of the method for the documentation of rare diseases.
Orphanet est un organisme dont l'objectif est notamment de rassembler des collections d'articles traitant de maladies rares. Cependant, l'acquisition de nouvelles connaissances dans ce domaine est actuellement réalisée manuellement. Dès lors, obtenir de nouvelles informations relatives aux maladies rares est un processus chronophage. Permettre d'obtenir ces informations de manière automatique est donc un enjeu important. Dans ce contexte, nous proposons d'aborder la question de l'extraction de relations entre gènes et maladies rares en utilisant des approches de fouille de données, plus particulièrement de fouille de motifs séquentiels sous contraintes. Nos expérimentations montrent l'intérêt de notre approche pour l'extraction de relations entre gènes et maladies rares à partir de résumés d'articles de PubMed.
Fichier non déposé

Dates et versions

hal-01119525 , version 1 (23-02-2015)

Identifiants

  • HAL Id : hal-01119525 , version 1

Citer

Nicolas Béchet, Peggy Cellier, Thierry Charnois, Bruno Crémilleux. Fouille de motifs séquentiels pour la découverte de relations entre gènes et maladies rares. Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2014, 28/2-3, pp.245-270. ⟨hal-01119525⟩
328 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More