Generation of synthetic gait data: application to patients suffering from multiple sclerosis

Nom de l'orateur
Klervi Le Gall
Etablissement de l'orateur
LMJL
Date et heure de l'exposé
Lieu de l'exposé
Salle Eole

L'analyse de la marche est devenue un levier important dans la compréhension et le suivi médical de la sclérose en plaques. Le dispositif eGait (brevet en cours ; eGait, 2021) permet de construire un biomarqueur appelé Signature de Marche (SdM) qui caractérise la rotation de la hanche d'un individu au cours d'un cycle de marche moyen où les rotations sont représentées par des quaternions unitaires. L'IGP fournit une mesure quantitative de la marche à un moment donné. Une méthode de classification semi-supervisée a été développée (Drouin et al., 2022). Afin de tester cette méthode de clustering, nous avons besoin d'un grand volume de données, c'est pourquoi l'objectif de ce travail est de pouvoir générer des SdM synthétiques et leurs EDSS correspondants, indiscernables des données initiales. L'approche de génération de données synthétiques s'inspire de la méthode avatar (Guillaudeux et al., 2022) en l'adaptant aux séries temporelles de quaternions et aux données mixtes. Elle combine l'analyse en composantes principales fonctionnelles, l'ACP pour les données mixtes, et les distances entre les IGP observés. Nous appliquons cette méthode pour générer des patients synthétiques à partir des données de 27 patients atteints de sclérose en plaques issues d'une étude menée en collaboration avec l'équipe de neurologie du CHU de Nantes.

======================================================

Abstract: Gait analysis has become an important lever in the understanding and medical follow-up of multiple sclerosis. The eGait device (patent pending; eGait, 2021) allows to build a biomarker called Individual Gait Pattern (IGP) which characterizes the rotation of the hip of an individual during an average walking cycle where rotations are represented by unit quaternions. The IGP provides a quantitative measure of gait at a given time. A clustering method has been developed (Drouin et al., 2022). In order to test this clustering method, we need a large volume of data, which is why the objective of this work is to be able to generate synthetic IGPs and their corresponding EDSS, indistinguishable from the initial data. The synthetic data generation approach is inspired by the avatar method (Guillaudeux et al., 2022) by adapting it to quaternion time series and mixed data. It mixes Functional Principal Component Analysis, PCA for mixed data, and distances between observed IGPs. We apply this method to generate synthetic patient from the data of 27 multiple sclerosis patients from a study conducted in collaboration with the neurology team of the Nantes University Hospital.