Dans ce module, les étudiants seront placés dans le rôle d'un véritable
data scientist , chargé de résoudre un problème. Ils suivront les conseils de l'instructeur et suivront les étapes suivies par un data scientist - depuis l'obtention des données et la description du problème jusqu'à sa résolution.
Cette discipline, également connue sous le nom de science des données, est l’une des branches de l’informatique qui a prospéré au cours de la dernière décennie et sert de base à de nombreuses fonctionnalités offertes aujourd’hui par Internet. Il est étroitement lié à des concepts populaires tels que
l’intelligence artificielle, l’apprentissage automatique, le big data, les prédictions, l’apprentissage profond, etc. C'est un domaine dans lequel de grandes entreprises comme Google, Facebook, Amazon, Apple, IBM, Microsoft et d'autres investissent des sommes importantes.
À la fin du module, les étudiants
apprendront :- Diverses méthodes de structuration des données.
- Différents types de données avec leurs avantages et inconvénients.
- Comment explorer un ensemble de données et prendre en compte les critères pertinents.
- Algorithmes de prédiction simples (arbre de décision, Random Forest, SVM, KNN).
- Le concept de statistiques pour l'interprétation des résultats.
- Algorithmes de clustering/regroupement simples (K-Means, DBScan) avec leurs avantages et inconvénients.
- Façons de présenter les résultats et types de graphiques de base.
- Compétences générales : travailler avec des informations, gérer l'attention et comprendre son rôle dans un environnement de travail en équipe.