
Équipe Ingénierie des Données et des moDèles (IDD)
Les activités de recherche de l'équipe IDD s'inscrivent dans le domaine général de la Gestion de Données & de l’Intelligence Artificielle (IA). Les données cibles peuvent être des données sémantiques, des données multicapteurs, des données scientifiques/industrielles, des données complexes (graphes de connaissances), etc.
Expertises et savoir-faire
Les travaux de l’équipe couvrent les principales opérations des pipelines de la science des données visant à transformer des données brutes en informations compréhensibles et exploitables :
- Modélisation et Persistance : Collecte et préparation des données, Choix de modèles de données, Modélisation ontologique, Persistance des données/modèles, Représentation d’imperfections diverses des données.
- Stockage et Optimisation : Choix du système de stockage des données/connaissances, Structures d’optimisation adaptées au système final, Prise en compte des contraintes énergétiques.
- Interaction, Analyse et Valorisation : Exploitation multifacette des données massives, Détection d’anomalies, Extraction/découverte des valeurs/connaissances à partir des données massives, Méthodes d’Apprentissage.
Domaines d'application
- Transport, Aéronautique, Espace ;
- Énergie, Environnement, Villes intelligentes ;
- Domaine du patrimoine, Domaine de la santé.
Valeur ajoutée
- Meilleure qualité des données : Par le traitement explicite de trois dimensions clés de la qualité :
- Hétérogénéité des données issues de sources multiples (cadre formel utilisé les ontologies) ;
- Imperfections diverses (incertitude, imprécision, valeurs manquantes, etc.) des données du monde réel (cadre théorique utilisé l’intelligence Computationnelle) ;
- Volumétrie : l'une des caractéristiques distinctives de nos approches est leur passage à l’échelle et leur capacité de traiter de grandes masses de données tout en garantissant une Efficacité Energétique (EE) tant au niveau du stockage que du traitement.
- Forte fertilisation entre les domaines des Bases de Données et de l’Intelligence Artificielle (IA) : Intégration des méthodes et outils de l’IA, dans les solutions développées, dans chaque opération de la chaine de traitement des données.
- Réduction de l’empreinte carbone et de l’impact environnemental des algorithmes développés : En optimisant le critère EE via l’élaboration des modèles de coûts sophistiqués.
- Détection avancée d’anomalies dans les séries temporelles multivariées : Utilisation des outils de l’IA, notamment, dans le contexte des graphes et des images aériennes.
- Développement des solutions innovantes et robustes, tant sur le plan théorique que méthodologique, par l’intégration des thèmes récents de l’IA. Notamment, les modèles LLMs (pour l’aide à l'automatisation des tâches et la prise de décisions) et l’IA de confiance (pour l’explicabilité et la quantification de la fiabilité des résultats).
En résumé, les travaux de l'équipe couvrent l'ensemble de la chaîne de traitement des données pour le développement de systèmes innovants de gestion des données/connaissances massives. Ces systèmes interagissent à la fois avec les experts du domaine et les utilisateurs finaux.
Mots-clés : Sciences des Données, Données massives, Hétérogénéité, Imperfection, Passage à l’échelle, Efficacité énergétique, Détection d’anomalies, Intelligence Artificielle, Apprentissage.