Ce mois de février marque le début du second quadrimestre à la Haute École Européenne Ivy de Technologie (HEEIT). Mais au lieu d’une simple reprise de cours, nos laboratoires de recherche entament ce nouveau semestre avec une prise de conscience collective, née d’un “échec” méthodologique que nous considérons désormais comme notre opportunité la plus précieuse.
Nous lançons officiellement l’”Atelier de Données Synthétiques”, une initiative interne conçue pour résoudre un paradoxe qui frappe au cœur de l’innovation en IA : pour construire des systèmes fiables, nous avons besoin de données que nous ne pouvons (ou ne devrions) pas posséder.
Le contexte est simple. L’Europe, et notre institution en son cœur à Bruxelles, est à l’avant-garde de la protection des données (RGPD). Cela signifie que l’accès aux données réelles (médicales, financières, urbaines) pour entraîner nos IA est, à juste titre, massivement restreint. La solution, que tout le monde académique poursuit, est la “donnée synthétique” – des données générées par ordinateur qui imitent statistiquement le réel.
À la HEEIT, nous pensions maîtriser ce sujet. Nous avons même deux pôles d’excellence qui génèrent des données synthétiques. Et c’est là que nous avons découvert notre propre “angle mort”.
Notre premier pôle, l’EASA Lab (Ethical AI & Software Architecture), dirigé par le Dr. Annemieke Van Houtte, utilise des techniques (comme les GANs) pour créer des données synthétiques “propres”. L’objectif est de corriger les biais du monde réel, par exemple en générant des jeux de données équilibrés pour garantir l’équité des algorithmes.
Notre second pôle, le laboratoire de Cybersécurité, dirigé par le Dr. Eva Rostova, crée également des données synthétiques, mais dans un but radicalement opposé. Il génère du trafic réseau, des transactions ou des images “malveillantes”, conçues pour être adverses et attaquer nos systèmes afin de tester leur robustesse.
Fin 2024, lors d’une révision interne, nous avons réalisé une chose troublante : les deux laboratoires avaient tort.
Les modèles d’IA entraînés sur les données “éthiques” et “propres” du Dr. Van Houtte se sont avérés brillants en laboratoire, mais dangereusement naïfs et fragiles une fois confrontés au “désordre” du monde réel. Ils n’avaient jamais appris le “bruit” statistique.
Inversement, les modèles entraînés par le Dr. Rostova étaient paranoïaques et ultra-sécurisés, mais incapables de fonctionner dans un environnement normal, car ils traitaient chaque anomalie mineure comme une attaque hostile de niveau maximal.
Nous avions créé des IA “stériles” et des IA “paranoïaques”. Il nous manquait le “chaos réaliste” – l’imprévisibilité de l’erreur humaine, la friction des systèmes existants, le “bruit” de la vie quotidienne.
L’”Atelier de Données Synthétiques”, lancé ce mois-ci, est notre réponse à cet échec. C’est une initiative qui force ces two laboratoires, ces deux philosophies (l’une “constructive”, l’autre “destructive”), à collaborer sur un projet unique et très concret.
La mission de ce quadrimestre : créer le jeu de données synthétiques le plus réaliste et le plus complexe jamais tenté à la HEEIT, modélisant les flux de mobilité piétonne et les interactions de micro-mobilité (trottinettes, vélos) autour d’un carrefour complexe de Schaerbeek.
L’équipe du Dr. Van Houtte (IA) est chargée de modéliser les “comportements normaux” et les “intentions”. L’équipe du Dr. Rostova (Cyber) n’est pas chargée d’attaquer le modèle, mais d’y injecter des “anomalies non hostiles” : le touriste qui s’arrête net, le livreur qui grille une priorité, le bus qui bloque la vue d’un capteur.
Ce n’est pas un projet confortable. Les statisticiens et les “hackers éthiques” ne parlent pas le même langage. Les premières réunions ont été tendues, chacun défendant la pureté de sa méthode. Mais à la HEEIT, nous croyons que l’innovation véritable ne naît que de cette friction. Nous ne formons pas des ingénieurs pour le monde “propre” de nos laboratoires, mais pour le monde complexe et imparfait dans lequel ils devront réellement opérer.

Leave a Reply