Thèse de doctorat : « Simulation, optimisation et visualisation de données de transport »
Publié le 22 octobre 2020Télécom SudParis
L'Ecole doctorale : Ecole Doctorale de l'Institut Polytechnique de Paris
et le Laboratoire de recherche SAMOVAR - Services répartis, Architectures, MOdélisation, Validation, Administration des Réseaux présentent l’AVIS DE SOUTENANCE de Monsieur Dancho PANOVSKI
Autorisé à présenter ses travaux en vue de l’obtention du Doctorat de l'InstitutPolytechnique de Paris, préparé à Télécom SudParis en : Signal, Images, Automatique et robotique
« Simulation, optimisation et visualisation de données de transport »
le MERCREDI 4 NOVEMBRE 2020 à 14h30, salle H218 à Télécom SudParis - 9 Rue Charles Fourier - 9100 Évry
Membre du jury :
- M. Titus ZAHARIA, Professeur, Télécom SudParis, FRANCE - Directeur de thèse
- M. Danco DAVCEV, Professeur des Universités, Ss. Cyril and Methodius University in Skopje, MACEDOINE, EX-REPUBLIQUE YOUGOSLAVE DE - Rapporteur
- Mme Lydie NOUVELIERE, Maître de conférences, Université d'Évry, FRANCE - Rapporteur
- M. Ioan TABUS , Professeur des Universités, Tampere University (TAU) , FINLANDE - Rapporteur
- Mme Catherine ACHARD , Maître de conférences, Université Pierre et Marie Curie ISIR, FRANCE - Examinatrice
- Mme Anissa MOKRAOUI , Professeure des Universités, L2TI, Institut Galilée, Université Paris 13 Sorbonne Paris Cité , FRANCE - Examinatrice
Résumé :
Aujourd'hui, toutes les grandes métropoles de France, d'Europe et du reste du monde souffrent de graves problèmes de congestion et de saturation des infrastructures routières, qui concernent à la fois les transports individuels et publics. Les systèmes de transport actuels atteignent leurs limites de capacité et semblent incapables d'absorber l'augmentation des flux de passagers à l'avenir. Dans ce contexte, l'un des principaux défis à relever concerne la création de méthodologies dédiées pour l'analyse des données de transport géo-localisées pour le stockage instantané, l'analyse, la gestion et la diffusion de flux de données massives. Les algorithmes associés doivent être capables de gérer des listes d'événements de plusieurs dizaines de minutes pour calculer des trajectoires réelles, des occupations instantanées, des cycles de changement de feux de circulation ainsi que des prévisions de flux de circulation de véhicules.
Dans cette thèse, nous abordons deux différentes problématiques liées à ce sujet. Une première contribution concerne l'optimisation des systèmes de feux tricolores. L'objectif est de minimiser le temps de trajet total des véhicules présents dans une certaine partie d'une ville. Dans ce but, nous proposons une technique d’optimisation de type PSO (Particle Swarm Optimization). Les résultats expérimentaux obtenus montrent qu'une telle approche permet d'obtenir des gains importants (5.37% - 21.53%) en termes de temps de parcours moyen global des véhicules.
La deuxième partie de la thèse est consacrée à la problématique de la prédiction des flux de trafic. En particulier, nous nous concentrons sur la prédiction de l'heure d'arrivée des bus dans les différentes stations présentes sur un itinéraire donné. Ici, nos contributions concernent tout d'abord l'introduction d'un nouveau modèle de données, appelé TDM (Traffic Density Matrix), qui capture dynamiquement la situation du trafic tout au long d'un itinéraire de bus donné.
Ensuite, nous montrons comment différentes techniques d'apprentissage statistique peuvent exploiter une cette structure de données afin d'effectuer une prédiction efficace. L'analyse des résultats obtenus par les méthodes traditionnelles (régression linéaire, SVR avec différents noyaux…) montre que l'augmentation du niveau de non-linéarité permet d’obtenir des performances supérieures. En partant de ce constat, nous proposons différentes techniques de deep learning avec des réseaux conçus sur mesure, que nous avons spécifiquement adaptés à nos objectifs.
L'approche proposée inclut des réseaux de neurones récurrents, des approches de type LSTM (Long Short Time Memory), des réseaux entièrement connectés et enfin convolutionnels. L'analyse des résultats expérimentaux obtenus confirme notre intuition initiale et démontre que ces techniques hautement non-linéaires surpassent les approches traditionnelles et sont capables de prendre en compte les singularités qui apparaissent dans ce type de données et qui, dans notre cas, correspondent à des embouteillages localisés qui affectent globalement le comportement du système.
En raison du manque de disponibilité de ce type d'informations géo-localisées qui très sensibles et soumises à des réglementations variées, toutes les données prises en compte dans nos expériments ont été générées à l'aide du simulateur microscopique SUMO (Simulation of Urban Mobility). Nous montrons notamment comment SUMO peut être exploité pour construire des scénarios réalistes, proches de situations réelles et exploitables à des fins d'analyse. Enfin, une dernière contribution concerne l’élaboration et la mise en œuvre de deux applications de visualisation différentes, une première dédiée aux opérateurs et la seconde aux clients. Pour assurer le déploiement et la compatibilité de ces applications sur différents terminaux (PC, ordinateurs portables, smartphones, tablettes…), une solution scalable est proposée.