organisateur

RNM

Date et lieu

29 mars 2019-Paris

Télécharger

Franck Tancret-examples Franck Tancret Introduction of physical Coupling data mining

Le séminaire « Machine Learning » s’est tenu le 29 Mars 2019 à Paris. Evènement volontairement limité à 50 participants, celui-ci a été un grand succès.

Ce sujet est aujourd’hui la préoccupation de nombreux pays en effet les USA investissent massivement  dans le programme MGI (Materials Genome Initiative). Quand a la Chine elle fait de même avec son propre programme MGI (150 millions de dollars). Les publications sur le sujet sont en très forte expansion (plus de 600 articles/an, contre moins de 100 il y a 20 ans).

 

La journée fut ponctuée d’exposés de chercheurs et de représentants d’entreprises.

D’ores et déjà, un certain nombre d’enseignements peuvent être retirés :

  • il existe de nombreuses techniques de « machine learning », dont l’utilisation requiert une réelle expertise par leurs utilisateurs.
  • il est indispensable d’avoir une bonne connaissance scientifique du domaine concerné pour introduire les bonnes variables dans le modèle.
  • Certaines méthodes sont utilisées pour la classification des données en catégorie, et d’autres pour la modélisation. En conséquence, il est nécessaire de comprendre les données et éventuellement d’en faire le nettoyage et gérer les données incomplètes.
  • Certains algorithmes d’optimisation génèrent des « solutions candidates » en nombre limité, à partir d’un très grand nombre de « possibles », qui sont ensuite examinées « par l’œil de l’expert » qui identifiera les meilleures qui seront alors testées expérimentalement.

Le débat qui a clôturé le séminaire a fait apparaître quelques pistes de réflexions.

  • Personne ne maîtrise à la fois les données et les outils statistiques d’une part, et la métallurgie d’autres part, d’où l’embauche de « data scientists » par les entreprises industrielles. Ainsi on peut se poser la question de savoir si il serait possible de former des ingénieurs métallurgiques au « date mining ».
  • Egalement une autre question a été soulevée concernant la promotion de la formation de « data scientists » et les attirer vers le domaine de l’industrie.

A la suite de ce colloque, le RNM a décidé d’y donner une suite, et des décisions ont été prises :

  • Il est envisagé de renouveler ce séminaire une fois par an, ce pourrait être, par exemple, une thématique des journées SF2M.
  • Le CNRS a donné son accord pour la mise en place d’une Action Nationale de formation, comprenant une partie commune : « formation des chercheurs sur les données » et deux ateliers spécialisés l’un sur l’« alloy design » ; l’autre sur la classification des microstructures et des défauts.