Que se passe-t-il lorsqu’on produit des données grâce à l’IA, et qu’on les donne à d’autres IA pour étudier la cigarette électronique ?
IA bancale et science expérimentale
L’intelligence artificielle (IA) s’impose de plus en plus dans notre quotidien. Qu’il s’agisse d’améliorer notre productivité, de nous aider dans certaines tâches, ou encore de nous faciliter la vie, l’IA est désormais une composante sur laquelle il faut compter. Comme le reste des industries, la communauté scientifique n’échappe pas au développement de ces machines censées être capables de reproduire l’intelligence humaine. Et de plus en plus, ces dernières sont utilisées dans le cadre de recherches. C’est notamment le cas d’une récente étude1 publiée dans la revue médicale Nature, qui avait pour objectif de « prévenir les risques » du vapotage pour la santé.
À l’aide d’un réseau neuronal, les auteurs de la recherche ont tenté de prédire les transformations que subiraient 180 produits utilisés pour la conception des arômes d’e-liquides dans le cadre d’une réaction de pyrolyse. Ces produits étaient composés de 66 esters, 46 cétones/aldéhydes, 27 alcools/acétals, 26 aromatiques/hétérocycles/carbocycles, et 15 acides carboxyliques/amides.
La pyrolyse est la décomposition chimique de composés organiques induite par la chaleur. Autrement dit, il s’agit des nouveaux produits créés par un e-liquide lorsque celui-ci est chauffé dans le cadre du vapotage.
Des données produites par l’intelligence artificielle, données à de l’intelligence artificielle
Ainsi, à l’aide de l’intelligence artificielle et de « données expérimentales de spectrométrie de masse à impact électronique », les auteurs de la recherche ont pu prédire les transformations chimiques de chacun des 180 composés étudiés, et leurs produits associés. Une autre intelligence artificielle s’est ensuite chargée de leur donner un score de probabilité, c’est-à-dire les chances que chaque produit soit réellement créé suite à la pyrolyse du produit d’origine donc ils provenaient. Au total, les prévisions de l’IA ont montré que 7 307 produits seraient créés suite à la chauffe des 180 composés originaux. Un chiffre qui s’est établi à 4 524 une fois les doublons pour la même saveur éliminés.
Des données particulières ont ensuite été extraites des résultats puis une nouvelle fois introduites dans une IA afin de les fusionner avec d’autres « données expérimentales ». Cette procédure avait pour but d’identifier les produits de pyrolyse les plus probables pour chacun des 180 composés d’origine, puis de pouvoir leur attribuer des risques pour la santé.
Restait alors une question en suspens : quelle température faudrait-il pour que le phénomène de pyrolyse induisant la création de tous ces composés chimiques se produise réellement ? L’énergie d’activation, c’est-à-dire l’énergie minimale requise pour qu’une réaction se déroule, est un excellent moyen d’obtenir une première approximation des conditions thermiques requises pour que la pyrolyse se produise dans le cadre du vapotage, notent les chercheurs. Pourtant, comme ils l’expliquent, « la détermination des AE est expérimentalement très laborieuse et coûteuse en calcul, car elle nécessite des calculs de chimie quantique ».
Pour simplifier les choses, ils se sont donc, une nouvelle fois, servi de l’intelligence artificielle, ce qui a permis de déterminer les conditions qui seraient réellement nécessaires au phénomène de pyrolyse, puis la réalisation d’une fiche regroupant chacun des produits induits par cette réaction pour les 180 composés étudiés à l’origine, ainsi que leurs classifications de danger associées.
Dans leurs conclusions, les chercheurs notent que 24 % des composés détectés sont classés comme toxiques aigus ou dangereux pour la santé, et que si leurs résultats montrent qu’il existe des similitudes avec le tabagisme, « un profil significativement différent de composés dangereux émerge du vapotage ». La comparaison de la nocivité du vapotage, uniquement avec celle du tabagisme, serait donc susceptible de « donner un faux sentiment de sécurité, en particulier pour les jeunes non-fumeurs de tabac ». Ils préconisent également de « limiter strictement le nombre d’entités chimiques dans les e-liquides ».
IA par ci, IA par là
S’il est toujours intéressant de voir la science s’intéresser à la cigarette électronique, il convient toutefois de noter que cette étude comporte plusieurs limitations. D’abord, l’utilisation, voire la surutilisation de l’intelligence artificielle. Sachant que les connaissances de l’IA ne proviennent que des données dont elle a été nourrie, les risques de biais doivent être pris en compte.
Ensuite, le fait que pour être pris en compte par l’IA, les 180 composés d’origines ont dû être « transformés » en données qu’elle pouvait assimiler, sans aucune assurance que cette transformation n’ait pas déformée d’une manière ou d’une autre, les composés originaux.
L’intelligence artificielle a également été utilisée à plusieurs reprises successive. D’abord pour prédire les composés chimiques potentiels qui pourraient être créés, ensuite pour leur donner un score de probabilité d’être créés, et enfin pour fusionner le résultat à d’autres données décrites comme « expérimentales ». Dans de telles conditions, difficile de savoir ce qui reste réellement des données originales après avoir été traitées à l’IA autant de fois consécutives. En sachant que ces données ont été, encore, une dernière fois, données à une intelligence artificielle pour tenter de calculer les conditions qu’il faudrait réellement réunir pour que tout ça se produise.
Outre le fait que la totalité de ces résultats est pour le moins hasardeuse, notons, en plus, que chaque dispositif de vapotage fonctionne à des températures différentes, possède des résistances composées différemment, et qu’il existe des dizaines de milliers d’e-liquides sur le marché, tous ayant une composition différente. Autrement dit, quand bien même une partie des résultats de cette étude serait juste, ils ne correspondraient qu’à une infime partie des multiples combinaisons qu’il est possible de réaliser parmi le couple de cigarettes électroniques, e-liquide utilisé, résistance utilisée, température de chauffe utilisée, etc.
Certains scientifiques alertent sur l’IA
La communauté scientifique s’alarme d’ailleurs, elle aussi, de l’utilisation de l’intelligence artificielle pour des études. En mars dernier, deux chercheurs publiaient un article2 dans la même revue médicale que cette étude, alertant que l’IA pouvait « exploiter nos limites cognitives, nous rendant vulnérables aux illusions de compréhension dans lesquelles nous pensons comprendre mieux le monde que nous ne le faisons réellement ». Ils concluaient en indiquant que la prolifération des outils d’IA dans la science risquait « d’introduire une phase de recherche scientifique dans laquelle nous produisons plus mais comprenons moins ».
1 Kishimoto, A., Wu, D. & O’Shea, D.F. Forecasting vaping health risks through neural network model prediction of flavour pyrolysis reactions. Sci Rep 14, 9591 (2024). https://doi.org/10.1038/s41598-024-59619-x.
2 Messeri, L., Crockett, M.J. Artificial intelligence and illusions of understanding in scientific research. Nature 627, 49–58 (2024). https://doi.org/10.1038/s41586-024-07146-0.
Les dernières études sur la cigarette électronique