Séminaire en science des données, 29 septembre 2022

La prochaine séance du séminaire en science des données aura lieu le jeudi 29 septembre 2022 à Nantes Université, UFR Sciences et Techniques, 14 h à l'amphi du bâtiment 34 du LS2N. Nous accueillerons Mohamed NADIF (PR Université de Paris, Centre Borelli).

Titre : L’évolution de la classification non supervisée de k-means à nos jours

Résumé : La classification non supervisée (ou clustering) est devenue incontournable dans le domaine de l’intelligence artificielle. Comme la réduction de la dimensionnalité, le clustering a vu son intérêt grandir dans divers domaines dont la bioinformatique, le traitement d’images, les systèmes de recommandation, l’analyse textuelle ou encore le traitement automatique du langage naturel.

Depuis k-means, une multitude d’algorithmes de clustering a vu le jour. Ces algorithmes ont été souvent motivés par de nombreuses applications générant des données de plus en plus volumineuses, de grande dimension, multi-sources, éparses ou pas. Ils dérivent, généralement, à partir de différentes approches y compris de l’apprentissage profond et chacun de ces algorithmes a ses forces et ses faiblesses. D’autre part, et contrairement à l’apprentissage supervisée, l’évaluation des résultats de tels algorithmes n’est pas toujours simple pour l’utilisateur. Afin de faire le point sur ces méthodes de clustering voire du coclustering, nous passons en revue les approches les plus populaires et identifions le potentiel de chaque algorithme pour l’obtention de partitions profitables.

Informations

Inscription obligatoire