Data Mining 2009-2010
Renseignements pratiques
- Le cours a lieu pendant le semestre de printemps (SES/HEC)
- Les cours ont lieu le mardi (10-12h), Battelle A, S. 316-318 (2ème étage)
Responsable: Alexandros Kalousis.
- Séance d'exercices: mercredi 08-10h, Battelle A, S. 322-323 (2ème étage).
Responsable: .
Travaux pratiques
- Les étudiants peuvent accéder aux supports de cours
ici.
- Tout le matériel pour les exercices et les TP se trouveront progressivement
ici.
- Vous pourrez tester vos programmes sur les données qui se trouveront
ici.
- Les énoncés des projets seront publiés
ici.
- Si cela vous intéresse, vous pouvez voir la description de
l'Ontologie du Datamining ici ou l'explorer directement avec le
le navigateur de l'ontologie DMOP.
Contrôle des connaissances
- Exercices à proposer et à remettre en séance de TP.
- Un projet à développer
- L'examen final prend la forme d'une soutenance de projet, suivie de questions portant à la
fois sur le projet et le contenu du cours.
- La note finale est la moyenne pondérée des notes des exercices (40%),
et du projet (60%, soutenance comprise). Elle est arrondie au demi-point le plus proche.
Plan du cours provisoire
- Introduction au data mining
- L'apprentissage supervisé (classification, régression)
- Le partitionnement récursif : Arbres et règles de décision: C4.5, CART
- L'apprentissage par estimation de densité: méthodes bayésiennes, kNN, noyaux
- Approches numériques linéaires: discriminants linéaires, perceptrons, Winnow
- Approches numériques non linéaires: réseaux
de neurones artificiels, méthodes à base de noyaux (SVM)
- Techniques d'évaluation et d'expérimentation
- Mesures de performances et stratégies d'expérimentation
- Comparaison et sélection de modèles
- Techniques avancées d'apprentissage supervisé
- L'agrégation de modèles : Bagging, boosting, stacking
- Les arbres et règles de décision de premier ordre: programmation logique inductive
- L'apprentissage relationnel à base de noyaux
- Réduction des données
- Réduction de la dimensionnalité: sélection/transformation de variables
- L'apprentissage non supervisé (association, clustering ou regroupement des données)
- Les règles d'association
- Le clustering hiérarchique
- Le clustering partitionnel: centres mobiles, cartes auto-organisatrices (réseaux de Kohonen)
- L'apprentissage semi-supervisé
- La classification semi-supervisé (co-entraînement, transduction, etc.)
- Le clustering semi-supervisé (apprentissage de métriques)