@InProceedings{Supelec771,
author = {Lucie Daubigney and Matthieu Geist and Olivier Pietquin},
title = {{Optimisation d'un tuteur intelligent à partir d'un jeu de données fixé}},
year = {2012},
booktitle = {{Actes des Journées d'Etudes de la Parole (JEP 2012)}},
pages = {241-248},
month = {June},
address = {Grenoble (France)},
url = {http://aclweb.org/anthology-new/F/F12/F12-1031.pdf},
abstract = {Dans cet article, nous présentons une méthode générale pour
optimiser un tuteur intelligent dans le domaine de
l’acquisition d’une seconde langue. Plus particulièrement, le
processus d’optimisation a pour but de trouver une stratégie
qui propose la meilleure séquence de phases d’évaluation et
d’enseignement afin de maximiser l’augmentation des
connaissances de l’apprenant. La principale caractéristique de
la méthode proposée est qu’elle est capable d’apprendre la
meilleure stratégie à partir d’un jeu fixe de données,
collectées à partir d’une stratégie définie à la main. Ainsi,
aucun modèle, ni cognitif ni probabiliste de l’apprenant, n’est
nécessaire. Seules sont requises des observations du
comportement de l’apprenant alors qu’il interagit avec un
système non-optimal. Pour ce faire, un algorithme de
programmation dynamique approchée en mode hors-ligne est
utilisé : l’algorithme LSPI (Least Square Policy Iteration).
Des résultats obtenus avec des données simulées semblent
prometteurs.}
}