@InProceedings{Supelec387,
author = {Frederic Pennerath and Géraldine Polaillon and Amedeo Napoli},
title = {{Prétraitement des bases de données de réactions chimiques pour la fouille de schémas de réactions}},
year = {2008},
booktitle = {{Actes des 8èmes journées Extraction et Gestion des Connaissances, Sophia-Antipolis, France, 29 janvier au 1er février, 2 Volumes}},
publisher = {Cépaduès-Editions},
volume = {2},
number = {RNTI-E-11},
pages = {547-558},
month = {feb},
editor = {Fabrice Guillet and Brigitte Trousse},
series = {Revue des Nouvelles Technologies de l'Information},
abstract = {Un grand nombre de réactions chimiques sont aujourd'hui répertoriées dans des bases de données. Les chimistes aimeraient pouvoir fouiller les graphes moléculaires contenus dans ces données pour en extraire des schémas de réactions fréquents. Deux obstacles s'opposent à cela : d'une part la manière dont les chimistes représentent les réactions par des graphes ne permet pas aux techniques de fouille de graphes d'extraire les schémas de réactions fréquents. D'autre part les bases de données contiennent des descriptions de réactions souvent incomplètes, ambiguës ou erronées. Le présent article décrit un processus de prétraitement opérationnel qui permet de filtrer, compléter puis transformer le contenu d'une base de réactions en des données fiables constituées de graphes abstraits répondant au problème de la fouille de schémas de réactions. Le processus place ainsi les bases de réactions à portée des techniques de fouille de graphes comme en attestent les résultats expérimentaux.}
}