Data sciences
1. Table des matières
- Versions
- 1. La méthodologie de l'IA
- Analyse de données
- Formuler et tester des hypothèses
- Preprocessing
- Encoding
- Encodage ordinal sur 'diamonds'
- Encodage onehot sur 'mpg'
- Encodage sur 'tips'
- Encodage sur 'penguins'
- Encodage sur 'flights'
- Encodage sur 'exercise'
- Encodage sur 'taxis'
- Normalisation
- Feature Engineering (nouvelles variables)
- Nettoyage des outliers sur 'diamonds'
- Traitement des NaNs
- Feature Selection
- La Séquence de preprocessing
- Modélisation
- Modélisation dans 'iris'
- Linear Regression
- Logistic Regression
- Decision Tree
- K-Nearest Neighbors
- Évaluation
- Métriques de régression : MAE, MSE
- Métriques de régression : R2
- Métriques de Classification : Matrice de confusion dans 'make_moon'
- Pipeline avec Cross Validation dans Breast Cancer
- Intervalle de confiance
- Data Sets
- Anscombe (Seaborn)
- Tips (Seaborn)
- Health Expectancy (Seaborn)
- Iris (Sklearn)
- MPG - Miles per Galon (Seaborn)
- Analyse
- Tests d'hypothèse
- Encoding (OneHot)
- Feature Engineering (Polynomial Feature)
- Traitement des NaN (SimpleImputer, KNN Imputer)
- Pipeline Sklearn complet
- Diamonds (Seaborn)
- Encodage
- Normalisation
- Feature Engineering (Polynomial Feature)
- Outliers univariés (IQR)
- Séquence simple : Encoding -> Normalisation
- Pipeline Sklearn : Encoding -> Normalisation
- Penguins (Seaborn)
- Flights (Seaborn)
- Exercise (Seaborn)
- Taxis (Seaborn)
- Titanic (Seaborn)
- California Housing (Sklearn)
- Make Moons (Sklearn)
- Beast Cancer (Sklearn)
- Projets Kaggle