Construction de plongements de concepts médicaux sans textes - Conférences TALN RECITAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Embedding medical concepts without texts

Construction de plongements de concepts médicaux sans textes

Résumé

In the medical field, many TAL tools are now based on embeddings of concepts from the UMLS.Existing approaches to generate these embeddings require large amounts of medical data. Contraryto these approaches, we propose in this article to rely on Japanese translations of the concepts,more precisely in Kanjis, available in the UMLS to generate these embeddings. Tested on differentevaluation tasks proposed in the literature, our approach, which therefore requires no text, yields goodresults compared to the state of the art. Moreover, we show that it is interesting to combine them withexisting — contextual-based — embeddings.
Dans le domaine médical, beaucoup d’outils du TAL reposent désormais sur des plongements de concepts issus de l’UMLS. Les approches existantes pour générer ces plongements nécessitent de grandes quantités de documents médicaux. Au contraire des ces approches, nous proposons dans cet article de nous appuyer sur les traductions en japonais, plus précisément en kanjis, disponibles dans l’UMLS pour générer ces plongements. Testée sur différents jeux d’évaluation proposés dans la littérature, notre approche, qui ne requiert donc aucun texte, donne de bons résultats comparativement à l’état-de-l’art. De plus, nous montrons qu’il est intéressant de les combiner avec les plongements – contextuels – existants.
Fichier principal
Vignette du fichier
128.pdf (445.45 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02784766 , version 1 (07-06-2020)
hal-02784766 , version 2 (18-06-2020)
hal-02784766 , version 3 (23-06-2020)

Identifiants

  • HAL Id : hal-02784766 , version 3

Citer

Vincent Claveau. Construction de plongements de concepts médicaux sans textes. JEP/TALN/RECITAL 2020 - 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles, Jun 2020, Nancy, France. pp.181-188. ⟨hal-02784766v3⟩
175 Consultations
96 Téléchargements

Partager

Gmail Facebook X LinkedIn More