@PhdThesis{Supelec548,
author = {Frederic Pennerath},
title = {{Méthodes d'extraction de connaissances à partir de données modélisables par des graphes. Application à des problèmes de synthèse organique.}},
year = {2009},
month = {July},
school = {Nancy-Université},
url = {http://tel.archives-ouvertes.fr/tel-00436568/fr/},
abstract = {Des millions de réactions chimiques sont décrites dans des bases
de données sous la forme de transformations de graphes
moléculaires. Cette thèse propose différentes méthodes de fouille
de donnés pour extraire des motifs pertinents contenus dans ces
graphes et ainsi aider les chimistes à améliorer leurs
connaissances des réactions chimiques et des molécules. Ainsi on
commence par montrer comment le problème central de la recherche
des schémas de réactions fréquents peut se résoudre à l'aide de
méthodes existantes de recherche de sous-graphes fréquents.
L'introduction du modèle général des motifs les plus informatifs
permet ensuite de restreindre l'analyse de ces motifs fréquents à
un nombre réduit de motifs peu redondants et représentatifs des
données. Si l'application du modèle aux bases de réactions permet
d'identifier de grandes familles de réactions, le modèle est
inadapté pour extraire les schémas caractéristiques de méthodes
de synthèse (schémas CMS) dont la fréquence est trop faible. Afin
de surmonter cet obstacle, est ensuite introduite une méthode de
recherche heuristique fondée sur une contrainte d'intervalle
entre graphes et adaptée à l'extraction de motifs de très faible
fréquence. Cette méthode permet ainsi de déterminer à partir
d'exemples de réactions et sous certaines conditions le schéma
CMS sous-jacent à une réaction donnée. La même approche est
ensuite utilisée pour traiter le problème de la classification
supervisée de sommets ou d'arêtes fondée sur leurs environnements
puis exploitée pour évaluer la formabilité des liaisons d'une
molécule. Les résultats produits ont pu être analysés par des
experts de la synthèse organique et sont très encourageants.}
}