Sciences des données - Stéphane Mallat

Collège de France

About

Traiter des données pour valider une hypothèse ou estimer des paramètres est longtemps resté du ressort exclusif des statistiques. Cependant, l'augmentation de leur dimension a fait exploser la combinatoire des possibles. Cette malédiction de la dimensionalité est une difficulté centrale de l'analyse de données, que ce soit des images, sons, textes, ou des mesures expérimentales comme en physique, biologie ou économie. Modéliser et représenter les structures cachées des données fait appel à diverses branches des mathématiques, mais aussi à l'informatique. Les algorithmes d'apprentissage statistique, comme les réseaux de neurones, sont configurés pour optimiser l'analyse des données à partir d'exemples. Ils sont à l'origine des résultats spectaculaires de l'intelligence artificielle. Les applications scientifiques, industrielles et sociétales sont considérables, et leurs performances progressent bien plus vite que notre maîtrise de leurs propriétés mathématiques.

La chaire propose un enseignement de mathématiques appliquées, qui tente de combler le fossé entre la jungle des nouveaux développements algorithmiques et la compréhension des principes généraux sous-jacents. Les applications couvrent tous les aspects du traitement du signal et de l'apprentissage statistique. Au-delà des statistiques et des probabilités, cela fait appel à l'analyse harmonique, à l'optimisation et à la géométrie. L'étude d'applications et de nouveaux algorithmes est proposée dans le cadre de challenges de données, qui sont organisés par la chaire.

L'équipe de recherche de Stéphane Mallat à l'ENS étudie les principes permettant de structurer l'analyse de données pour échapper à la malédiction de la dimensionalité. Elle développe notamment des modèles de réseaux de neurones, basés sur des principes de séparation d'échelles par ondelettes, de parcimonie et d'invariance. Les applications concernent aussi bien la reconnaissance d'images ou de sons que l'estimation de mesures physiques. Pour plus d'informations, on pourra consulter le site internet de l'équipe de recherche.

Available on

Community

200 episodes

Séminaire - Francis Bach : Une vision alternative des modèles de diffusion par débruitage

Stéphane Mallat Collège de France Science des données Année 2023-2024 Séminaire - Francis Bach : Une vision alternative des modèles de diffusion par débruitage

56m
Mar 13, 2024
08 - Apprentissage et génération par échantillonnage aléatoire

Stéphane Mallat Collège de France Science des données Année 2023-2024 08 - Apprentissage et génération par échantillonnage aléatoire

1h 0m
Mar 13, 2024
Séminaire - Christian Robert : Calculs bayésiens approximés (ABC) : d'un substitut élémentaire à une nouvelle forme d'inférence

Stéphane Mallat Collège de France Science des données Année 2023-2024 Séminaire - Christian Robert : Calculs bayésiens approximés (ABC) : d'un substitut élémentaire à une nouvelle forme d'inférence

1h 9m
Mar 06, 2024
07 - Apprentissage et génération par échantillonnage aléatoire

Stéphane Mallat Collège de France Science des données Année 2023-2024 07 - Apprentissage et génération par échantillonnage aléatoire

1h 25m
Mar 06, 2024
Séminaire - Randal Douc : Échantillonnage par distributions auxiliaires : de la téléportation à l'échantillonnage d'importance par chaîne de Markov

Stéphane Mallat Collège de France Science des données Année 2023-2024 Séminaire - Randal Douc : Échantillonnage par distributions auxiliaires : de la téléportation à l'échantillonnage d'importance par chaîne de Markov

1h 3m
Feb 28, 2024
06 - Apprentissage et génération par échantillonnage aléatoire

Stéphane Mallat Collège de France Science des données Année 2023-2024 06 - Apprentissage et génération par échantillonnage aléatoire

1h 36m
Feb 28, 2024
Séminaire - Michèle Sebag : Modèles causaux : les modèles génératifs en support à des interventions

Stéphane Mallat Collège de France Science des données Année 2023-2024 Séminaire - Michèle Sebag : Modèles causaux : les modèles génératifs en support à des interventions

59m
Feb 14, 2024
05 - Apprentissage et génération par échantillonnage aléatoire

Stéphane Mallat Collège de France Science des données Année 2023-2024 05 - Apprentissage et génération par échantillonnage aléatoire

1h 30m
Feb 14, 2024
Séminaire - Marylou Gabrié : Modèles génératifs pour la simulation de systèmes à l'équilibre

Stéphane Mallat Collège de France Science des données Année 2023-2024 Séminaire - Marylou Gabrié : Modèles génératifs pour la simulation de systèmes à l'équilibre

57m
Feb 07, 2024
04 - Apprentissage et génération par échantillonnage aléatoire

Stéphane Mallat Collège de France Science des données Année 2023-2024 04 - Apprentissage et génération par échantillonnage aléatoire

1h 35m
Feb 07, 2024
Séminaire - Stéphane Mallat : Présentations de gagnants des challenges 2023

Stéphane Mallat Collège de France Science des données Année 2023-2024 Séminaire - Stéphane Mallat : Présentations de gagnants des challenges 2023

53m
Jan 31, 2024
03 - Apprentissage et génération par échantillonnage aléatoire

Stéphane Mallat Collège de France Science des données Année 2023-2024 03 - Apprentissage et génération par échantillonnage aléatoire

1h 33m
Jan 31, 2024
Séminaire - Stéphane Mallat : Apprentissage et génération par échantillonnage aléatoire : Challenges de données 2

Stéphane Mallat Collège de France Science des données Année 2023-2024 Séminaire - Stéphane Mallat : Apprentissage et génération par échantillonnage aléatoire : Challenges de données 2

43m
Jan 24, 2024
02 - Apprentissage et génération par échantillonnage aléatoire

Stéphane Mallat Collège de France Science des données Année 2023-2024 02 - Apprentissage et génération par échantillonnage aléatoire

1h 31m
Jan 24, 2024
Séminaire - Stéphane Mallat : Apprentissage et génération par échantillonnage aléatoire : Challenges de données 1

Stéphane Mallat Collège de France Science des données Année 2023-2024 Séminaire - Stéphane Mallat : Apprentissage et génération par échantillonnage aléatoire : Challenges de données 1

46m
Jan 17, 2024
01 - Apprentissage et génération par échantillonnage aléatoire

Stéphane Mallat Collège de France Science des données Année 2023-2024 01 - Apprentissage et génération par échantillonnage aléatoire

1h 33m
Jan 17, 2024
Séminaire - Marc Mézard : Physique statistique et inférence : le défi des données structurées

Stéphane Mallat Collège de France Science des données Année 2022-2023 Modèles, information et physique statistique Séminaire - Marc Mézard : Physique statistique et inférence : le défi des données structurées Les cinq dernières décennies ont vu la construction d'une nouvelle branche de physique statistique qui étudie les systèmes fortement désordonnés. Partant de l'étude des verres de spin, ce champ s'est étendu et s'est intéressé à des systèmes complexes dans différentes branches de la science, allant de l'informatique à la biologie en passant par la théorie de l'information. Quatre obstacles principaux ont dû être surmontés pour développer la théorie des systèmes désordonnés en très grande dimension : étudier des ensembles statistiques d'échantillons, analyser quantitativement le désordre microscopique, explorer des paysages d'énergie complexes, comprendre leurs liens avec les propriétés dynamiques. Cet exposé proposera tout d'abord une vision synthétique de ces développements. Il décrira ensuite le nouveau défi posé par l'application de ces méthodes en apprentissage machine, celle du désordre structuré.

1h 0m
Mar 08, 2023
08 - Modèles, information et physique statistique

Stéphane Mallat Collège de France Science des données Année 2022-2023 Modèles, information et physique statistique Le cours introduit les outils mathématiques permettant de modéliser des données en grande dimension, en lien avec la physique statistique et la théorie de l'information. La physique statistique montre que les lois macroscopiques résultent de la statistique des interactions de particules microscopiques. La théorie de l'information relie cette perspective avec la modélisation de données, à travers les notions d'entropie, d'énergie de Gibbs et de dépendances locales. Les applications concernent l'inférence de modèles, la génération de nouvelles données ou la compression, ainsi que la résolution de problèmes inverses.

1h 40m
Mar 08, 2023
Séminaire - Erwan Allys : Modélisation et séparation statistiques de composantes en astrophysique

Stéphane Mallat Collège de France Science des données Année 2022-2023 Modèles, information et physique statistique Séminaire - Erwan Allys : Modélisation et séparation statistiques de composantes en astrophysique Un des défis de l'astrophysique et de la cosmologie est d'étudier des processus non linéaires complexes à partir d'un nombre souvent limité d'observations multicomposantes. Cette tâche est rendue d'autant plus difficile que la modélisation physique de ces processus n'est pas toujours achevée, ce qui implique de ne reposer que sur les observations disponibles, sans étape d'entraînement préalable. Dans ce séminaire, on étudiera comment construire des modèles performants en basse dimension prenant en compte le caractère physique et la régularité des processus étudiés. Ces modèles de maximum d'entropie, construit à partir de représentations de type scattering transforms, peuvent être construits directement à partir des données observationnelles. On discutera ensuite comment ces outils permettent de développer de nouveaux types de séparations de composantes, permettant notamment d'estimer les statistiques, et donc de construire un modèle, de processus inconnus à partir d'observations multicomposantes.

56m
Mar 01, 2023
07 - Modèles, information et physique statistique

Stéphane Mallat Collège de France Science des données Année 2022-2023 Modèles, information et physique statistique Le cours introduit les outils mathématiques permettant de modéliser des données en grande dimension, en lien avec la physique statistique et la théorie de l'information. La physique statistique montre que les lois macroscopiques résultent de la statistique des interactions de particules microscopiques. La théorie de l'information relie cette perspective avec la modélisation de données, à travers les notions d'entropie, d'énergie de Gibbs et de dépendances locales. Les applications concernent l'inférence de modèles, la génération de nouvelles données ou la compression, ainsi que la résolution de problèmes inverses.

1h 32m
Mar 01, 2023
Séminaire - Valentin De Bortoli : Synthèse d'images par maximum d'entropie

Stéphane Mallat Collège de France Science des données Année 2022-2023 Modèles, information et physique statistique Séminaire - Valentin De Bortoli : Synthèse d'images par maximum d'entropie Ces dernières années ont vu l'essor des techniques basées sur les réseaux de neurones pour la synthèse d'images. Ces méthodes reposent le plus souvent sur la minimisation d'une fonction, pour laquelle les minimiseurs sont supposés être les solutions du problème de synthèse. Dans cet exposé, nous étudions, à la fois théoriquement et expérimentalement, un autre cadre pour aborder ce problème en utilisant un schéma d'échantillonnage / minimisation alterné. Tout d'abord, nous utilisons des résultats de la géométrie de l'information afin de définir un problème de synthèse pour lequel la solution est une distribution d'entropie maximale sous contraintes d'espérance. Les échantillons de cette distribution représentent des images synthétiques. Ensuite, nous nous tournons vers l'analyse de notre méthode et nous montrons, en utilisant des résultats récents de la littérature sur les chaînes de Markov, que son erreur peut être explicitement bornée avec des constantes dépendantes de manière polynomiale de la dimension, même dans le cadre non convexe. Cela inclut le cas où les contraintes sont définies via un réseau de neurones différentiable.

56m
Feb 22, 2023
06 - Modèles, information et physique statistique

Stéphane Mallat Collège de France Science des données Année 2022-2023 Modèles, information et physique statistique Le cours introduit les outils mathématiques permettant de modéliser des données en grande dimension, en lien avec la physique statistique et la théorie de l'information. La physique statistique montre que les lois macroscopiques résultent de la statistique des interactions de particules microscopiques. La théorie de l'information relie cette perspective avec la modélisation de données, à travers les notions d'entropie, d'énergie de Gibbs et de dépendances locales. Les applications concernent l'inférence de modèles, la génération de nouvelles données ou la compression, ainsi que la résolution de problèmes inverses.

1h 30m
Feb 22, 2023
Séminaire - Bruno Loureiro : Physique statistique et réseaux de neurones

Stéphane Mallat Collège de France Science des données Année 2022-2023 Modèles, information et physique statistique Séminaire - Bruno Loureiro : Physique statistique et réseaux de neurones

51m
Feb 15, 2023
05 - Modèles, information et physique statistique

Stéphane Mallat Collège de France Science des données Année 2022-2023 Modèles, information et physique statistique Le cours introduit les outils mathématiques permettant de modéliser des données en grande dimension, en lien avec la physique statistique et la théorie de l'information. La physique statistique montre que les lois macroscopiques résultent de la statistique des interactions de particules microscopiques. La théorie de l'information relie cette perspective avec la modélisation de données, à travers les notions d'entropie, d'énergie de Gibbs et de dépendances locales. Les applications concernent l'inférence de modèles, la génération de nouvelles données ou la compression, ainsi que la résolution de problèmes inverses.

1h 34m
Feb 15, 2023
Séminaire - Giulio Biroli : Entropie et physique statistique

Stéphane Mallat Collège de France Science des données Année 2022-2023 Modèles, information et physique statistique Séminaire - Giulio Biroli : Entropie et physique statistique

49m
Feb 08, 2023
04 - Modèles, information et physique statistique

Stéphane Mallat Collège de France Science des données Année 2022-2023 Modèles, information et physique statistique Le cours introduit les outils mathématiques permettant de modéliser des données en grande dimension, en lien avec la physique statistique et la théorie de l'information. La physique statistique montre que les lois macroscopiques résultent de la statistique des interactions de particules microscopiques. La théorie de l'information relie cette perspective avec la modélisation de données, à travers les notions d'entropie, d'énergie de Gibbs et de dépendances locales. Les applications concernent l'inférence de modèles, la génération de nouvelles données ou la compression, ainsi que la résolution de problèmes inverses.

1h 30m
Feb 08, 2023
Séminaire - Modèles, information et physique statistique : Prix des challenges de la saison 2022

Stéphane Mallat Collège de France Science des données Année 2022-2023 Modèles, information et physique statistique Séminaire - Modèles, information et physique statistique : Prix des challenges de la saison 2022

1h 3m
Feb 01, 2023
03 - Modèles, information et physique statistique

Stéphane Mallat Collège de France Science des données Année 2022-2023 Modèles, information et physique statistique Le cours introduit les outils mathématiques permettant de modéliser des données en grande dimension, en lien avec la physique statistique et la théorie de l'information. La physique statistique montre que les lois macroscopiques résultent de la statistique des interactions de particules microscopiques. La théorie de l'information relie cette perspective avec la modélisation de données, à travers les notions d'entropie, d'énergie de Gibbs et de dépendances locales. Les applications concernent l'inférence de modèles, la génération de nouvelles données ou la compression, ainsi que la résolution de problèmes inverses.

1h 27m
Feb 01, 2023
Séminaire - Modèles, information et physique statistique : Challenge de données (2)

Stéphane Mallat Collège de France Science des données Année 2022-2023 Modèles, information et physique statistique Séminaire - Modèles, information et physique statistique : Challenge de données (2)

45m
Jan 25, 2023
02 - Modèles, information et physique statistique

Stéphane Mallat Collège de France Science des données Année 2022-2023 Modèles, information et physique statistique Le cours introduit les outils mathématiques permettant de modéliser des données en grande dimension, en lien avec la physique statistique et la théorie de l'information. La physique statistique montre que les lois macroscopiques résultent de la statistique des interactions de particules microscopiques. La théorie de l'information relie cette perspective avec la modélisation de données, à travers les notions d'entropie, d'énergie de Gibbs et de dépendances locales. Les applications concernent l'inférence de modèles, la génération de nouvelles données ou la compression, ainsi que la résolution de problèmes inverses.

1h 24m
Jan 25, 2023