Podcast « Modèles de machines à vecteurs de support basés sur l’IA explicable pour la prédiction CBR
imprégnée »
Question clé: Le sol sera-t-il suffisamment stable pour supporter la route ou le bâtiment ?
Le podcast de 6 minutes traite du « Modèles de machines à vecteurs de support basés sur l’IA explicable pour la prédiction CBR imprégnée » et se base sur une étude asiatique publiée en 2025. L’étude évalue neuf configurations de SVM pour prédire les valeurs CBR des sols. Le modèle cubique avec noyau quadratique s’est avéré le plus performant (RMSE = 0,701 ; R² = 0,916). Les analyses SHAP, LIME et PDP ont identifié le sable, l’argile et la limite liquide comme variables clés. Les SVM à noyau complexe capturent mieux les relations non linéaires, contrairement aux modèles linéaires, moins précis et interprétables.
Cet épisode est basé sur une étude scientifique qui s’appelle « Explainable AI Based Support Vector Machine Models for Soaked CBR » dans l’original.
« RecoRoute – Science » publie des podcasts en français sur des études scientifiques publiées. Celles-ci ont souvent été rédigées en anglais. Nous voulons rendre les connaissances qui en découlent disponibles en français dans un langage compréhensible pour un groupe cible plus large.
L’étude a été publiée 23 may 2025 sous https://doi.org/10.1007/s42947-025-00558-9
Les auteurs sont: M. K. Sachin Gowda, Yogesh Iyer Murthy, Aakash Gupta

Bienvenue à toutes et tous pour cette analyse approfondie. Aujourd’hui, on se penche sur une recherche toute récente, publiée en mai 2025. Elle utilise l’intelligence artificielle et plus précisément un type de modèle qu’on appelle machine à vecteur de support ou SVM. Pour prédire une propriété vraiment clé des sols, pour construire des routes, l’indice portant californien, le fameux CBR. Alors, pourquoi c’est intéressant ? Parce que tester ce CBR de manière classique, c’est long, ça coûte cher aussi. Et puis en laboratoire, c’est assez laborieux. Donc l’IA, ça pourrait être une alternative rapide, économique, pour aider à concevoir des routes plus stables, plus sûres. Des chercheurs ont testé ça en Inde et ils ont aussi utilisé ce qu’on appelle l’IA explicable. Oui, pour comprendre comment l’IA arrive à ses résultats. Exactement. Et c’est vrai que modéliser le comportement des sols, c’est un vrai défi. C’est complexe. L’enjeu, comme vous le disiez, ce n’est pas juste la prédiction, c’est de comprendre le pourquoi. Sans ça, les ingénieurs peuvent difficilement faire confiance au modèle. Pour ça, l’étude s’est basée sur des paramètres assez classiques du sol. Le pourcentage de sable, celui d’argile ou de limon. D’accord. La limite de liquidité, qu’on appelle LL, c’est en gros la teneur en eau où le sol devient liquide. L’indice de plasticité aussi, le PI, qui mesure son côté un peu argileux. Et puis des choses liées au compactage. La teneur en eau optimale, l’OMC, et la densité sèche maximale, la MDD. Ok. Donc avec toutes ces données sur les sols, ils ont comparé différentes versions de ces SVM. Si je comprends bien, c’est comme tester différents moteurs internes, c’est ça ? Les noyaux ? C’est tout à fait ça. Ils ont testé un noyau simple, dit linéaire, et puis d’autres plus sophistiqués. Quadratiques, cubiques et gaussiens. Ces derniers sont conçus pour capter des relations plus complexes dans les données. Et l’idée, c’était de voir lequel prédisait le mieux cet indice CBR. Exactement. Sur 200 échantillons de sol qui venaient d’Andra Pradesh en Inde. Et alors, les résultats ? Les résultats sont assez clairs, en fait. Il y a deux configurations qui sont vraiment sorties du lot. Le SVM avec un noyau quadratique s’est montré très, très performant. C’est-à-dire ? Il explique plus de 91% de la variation des résultats. Le R-square, comme on dit, est de 0,916. C’est excellent. C’est excellent. Et avec une marge d’erreur très faible. Un RMSE de 0,701. Le SVM avec un noyau gaussien a aussi très bien marché. Avec un R-square de 0,872. D’accord. Et le modèle simple, le linéaire ? Ah, lui, par contre, il a eu beaucoup plus de mal. Le R-carré était seulement de 0,582. Il n’arrivait pas à bien, disons, saisir les relations non linéaires. Les interactions complexes entre les propriétés du sol. Ok. Logique, vu la complexité du matériau au sol. Mais alors, la question cruciale, est-ce qu’on sait comment ces modèles plus performants arrivent à leur prédiction ? C’est là que l’IA explicable dont vous parliez entre en jeu, j’imagine ? Précisément. C’est tout l’intérêt. L’étude a utilisé des outils comme SHAP ou LIME. On peut les voir un peu comme des décodeurs pour l’IA. Ils permettent d’identifier les facteurs qui pèsent le plus dans la décision du modèle. Et qu’est-ce qui est ressorti ? Principalement trois choses. Le pourcentage de sable, le pourcentage d’argile, et la limite de liquidité, la LL. Ces trois-là sont vraiment déterminants. La densité sèche maximale, la MDD, a aussi montré une influence positive, claire et constante. L’avantage de ces outils, SHAPE, LIME, c’est qu’ils permettent de visualiser cet impact. Du coup, le modèle n’est plus une simple boîte noire. On comprend mieux son raisonnement. Ce qui est fondamental pour l’application pratique par les ingénieurs, bien sûr. Exactement. Ça renforce la confiance, et ça permet une utilisation plus éclairée. Alors concrètement, pour un ingénieur sur le terrain, qu’est-ce que ça change ? Qu’est-ce que ça apporte ? Potentiellement, ça ouvre la voie à des évaluations de sol plus rapides. Et peut-être moins chères aussi. Ça peut aider à mieux optimiser la conception des chaussées, par exemple. Ou à choisir les bons matériaux de stabilisation si le sol en a besoin. Et puis, à repérer très en amont les zones qui pourraient poser problème sur un tracé routier. Et ça confirme d’autres études ? Oui. L’étude compare ces résultats, et ils sont cohérents. Voir même un peu meilleurs en termes de précision que ce qu’on a vu dans d’autres travaux similaires utilisant l’IA pour le CBR. Donc, pour résumer, l’IA, et spécifiquement ses SVM avec des noyaux un peu avancés comme le quadratique, arrivent à prédire l’indice CBR des sols avec une précision assez impressionnante. C’est ça. Et l’IA explicable, c’est vraiment la clé pour que ce soit utilisable en confiance. On comprend que la texture du sol, sable, argile, sa réaction à l’eau via la limite de liquidité, et sa densité maximale sont cruciales. Tout à fait. Mais il faut quand même rester un peu prudent. C’est une étude qui porte sur 200 échantillons d’une région bien précise en Inde. Oui, la portée est limitée pour l’instant. Voilà. C’est une excellente base. Mais pour pouvoir dire que ces modèles sont généralisables partout, il faudrait les tester sur des jeux de données beaucoup plus larges. Et surtout plus variés. Avec différents types de sols, différents climats, etc. La généralisation, ça demande encore du travail. Bien sûr, c’est la prochaine étape logique. Et pour finir, peut-être une réflexion un peu plus large. Si on arrive non seulement à modéliser, mais aussi à comprendre ces interactions complexes dans le sol, grâce à une IA qui est transparente, interprétable, est-ce que cette capacité ne pourrait pas nous aider à relever des défis encore plus grands ? Je pense par exemple à la construction d’infrastructures plus résilientes face aux changements climatiques, ou sur des terrains de plus en plus variés et difficiles. Qu’en pensez-vous ?