Résumé du cours
   Le DATA MINING (fouille de données), raccourci de "Extraction de Connaissances à partir de Données" ("Knowledge Discovery in Databases" en anglais - KDD), est un domaine très en vogue. En réalité, le data mining emmène plusieurs points nouveaux qui sont loin d'être négligeables : (1) des techniques d'analyse qui ne sont pas dans la culture des statisticiens, en provenance de l'apprentissage automatique (Intelligence artificielle), de la reconnaissance de formes (pattern recognition) et des bases de données; (2) l'extraction de connaissances est intégrée dans le schéma organisationnel de l'entreprise. Ainsi, les données ne sont plus issues d'enquêtes ou de sondages mais proviennent d'entrepôts construits pour une exploitation aux fins d'analyse, le DATAWAREHOUSE (entrepôts de données). D'une part, une réorganisation du flux de données au sein de l'entreprise devient nécessaire (l'enchaînement des bases de production, le Datawarehouse et les Datamarts); d'autre part, la capacité des méthodes statistiques à traiter de gros volumes devient un élément clé; (3) un autre dernier élément important, le traitement des données sort de plus en plus des fichiers plats "individus x variables", vers des données sous forme non structurée, le texte, les images et la vidéo. On parle de fouille de données complexes. Cette orientation attribue une  place primordiale à la préparation des données.

   Ce cours est divisé en trois chapitres, le premier chapitre sur le Data Warehouse commencera par introduire les concepts fondamentaux de l'informatique décisionnelle, continuera par l'explication des méthodes de conception d'entrepôt de données , et terminera par une conclusion mentionnant les indicateurs d'une bonne conception d'entrepôt. Le deuxième chapitre présente le processus complet d'extraction de connaissances (KDD). Nous nous limitons au traitement de données structurées. Il n'est pas question ici de recherche dans des textes ou des images, mais uniquement à partir de données. S'il est possible d'extraire de l'information à partir de toute source de données, l'existence d'un entrepôt diminue le temps de réalisation d'un projet. Le troisième chapitre permet de comprendre les principes et la finalité du Data Mining (DM), Identifier les principales techniques du DM et leur cas d'utilisation, découvrir les méthodes prédictives et les méthodes descriptives du DM et connaître les principales étapes d'un projet Data Mining.

   Pour commencer, consultez la page du cours en tapant un mot de passe pour l’accès anonyme. Nous apprécions vos commentaires, si quelque chose est confus ou ne fonctionne pas, merci de le signaler. Veuillez utiliser l'espace de discussion pour vous présenter et nous faire savoir ce que vous faites.

   Le cours durera environ quatre à cinq heures par semaine pendant 14 semaines, y compris des cours magistraux, des travaux pratiques, d'autres lectures et des évaluations. La dernière semaine du cours concerne l'examen final.

   On va répondre à chaque question; donc SVP veuillez utiliser les forums de discussion pour partager des questions et des commentaires.

   Les devoirs du module représentent 40% de la note finale et l’examen final représente les 60% restants. Vous devez obtenir un taux de 50% pour réussir le module. 

   Pour obtenir un mot de passe, merci de me contacter à l'adresse amina.houari@univ-mascara.dz.  

Objectifs du cours

À l'issu de ce cours, l'étudiant pourra :

  • Définir et implémenter des algorithmes de fouilles de données.
  •  Utiliser les algorithmes disponibles dans les suites logicielles du marché (SQL Server, Oracle, BO...).
  •  Présenter les principes et les résultats aux utilisateurs terminaux.

PRE-REQUIS DU COURS

Ce cours comprend trois unités pédagogiques. Voici les pré-requis nécessaires au suivi de ce cours:

  • Systèmes d'informations.
  • SGBD.

Public cible : Master 2 Informatique, spécialité : Ingénierie des systèmes Informatiques.