Séminaire
Nom intervenant
Laure Sansonnet
Résumé
Dans cet exposé, on s'intéresse à un problème de classification multiclasse de processus de Hawkes multivariés. Les processus de Hawkes multivariés constituent une famille de processus ponctuels qui modélisent des interactions entre individus connectés au sein d'un réseau. En particulier, les classes sont ici discriminées par leurs intensité de base et matrice d'adjacence (représentant les interactions entre les individus). On dispose d'un jeu de données d'apprentissage constitué de processus de Hawkes multivariés indépendants et labellisés, observés sur un intervalle de temps fixé. Et on considère le cadre de la grande dimension : la dimension du réseau peut être grand par rapport au nombre d'observations. Cela nécessite d'imposer une hypothèse de parcimonie sur la matrice d'adjacence.
Après des rappels sur les processus de Hawkes et les outils classiques de classification, nous présenterons une nouvelle méthode en deux étapes : la reconstruction du support de la matrice d'adjacence, par classe, et une étape de classification usuelle basée sur les supports estimés. Pour estimer le support de la matrice d'adjacence, un estimateur de type Lasso est proposé, pour lequel nous établissons des vitesses de convergence. Ensuite, en tirant parti du support estimé, nous construisons une procédure de classification basée sur la minimisation d'un risque $L_2$. Notamment, les vitesses de convergence de notre procédure de classification sont fournies. Une étude numérique illustre ses résultats théoriques. Et une application en écologie sur la classification de sites (chasse ou transit) à partir de la surveillance de chauve-souris conclura cet exposé.
Ce travail est en collaboration avec Christophe Denis, Charlotte Dion-Blanc et Romain Lacoste.
Après des rappels sur les processus de Hawkes et les outils classiques de classification, nous présenterons une nouvelle méthode en deux étapes : la reconstruction du support de la matrice d'adjacence, par classe, et une étape de classification usuelle basée sur les supports estimés. Pour estimer le support de la matrice d'adjacence, un estimateur de type Lasso est proposé, pour lequel nous établissons des vitesses de convergence. Ensuite, en tirant parti du support estimé, nous construisons une procédure de classification basée sur la minimisation d'un risque $L_2$. Notamment, les vitesses de convergence de notre procédure de classification sont fournies. Une étude numérique illustre ses résultats théoriques. Et une application en écologie sur la classification de sites (chasse ou transit) à partir de la surveillance de chauve-souris conclura cet exposé.
Ce travail est en collaboration avec Christophe Denis, Charlotte Dion-Blanc et Romain Lacoste.
Lieu
Amphi A -1 (sous-sol)
Date du jour
Date de fin du Workshop