Το μάθημα αυτό έχει ως στόχο να καλύψει ένα μεγάλο μέρος της εξόρυξης γνώσης από δεδομένα και της οργάνωσης και διαχείρισης αποθηκών δεδομένων. Γίνεται εκτενής αναφορά στις διαδικασίες κατηγοριοποίησης, συσταδοποίησης και ανακάλυψης κανόνων συσχέτισης αλλά και ειδικότερες παρουσιάσεις σε πιο εξειδικευμένα αντικείμενα όπως η ανίχνευσης εξαιρέσεων, η εξόρυξη γνώσης από κείμενα και η μείωση της διαστατικότητας. Το μάθημα πλαισιώνεται από εργαστήριο στο οποίο διδάσκονται όλα τα παραπάνω με ασκήσεις και πειραματικές μετρήσεις.
Τιμές και χαρακτηριστικά Σώματα δεδομένων Εγγραφές-Συναλλαγές-Γράφοι Θόρυβος και Εξαιρέσεις Δειγματοληψία Διαστατικότητα Αποστάσεις Διανυσμάτων
Δέντρα αποφάσεων Μετρητές ποιότητας διαχωρισμού Overfitting και Under Fitting Αποτίμηση μοντέλου Καμπύλες ROC Κανόνες Απόφασης Bayesian κατηγοριοποίηση Parzen Windows-Neural Networks Support Vector Machines Genetic Algorithms Ensemble Classifiers
Τύποι συστάδων K-means Hierarchical Clustering DBSCAN Expectation Maximization
Apriori FP-Growth Μέτρα αποτίμησης κανόνων Support-based pruning Κανόνες συσχέτισης πολλών επιπέδων
Ανίχνευση Εξαιρέσεων Latent Semantic Indexing-Text mining Feature Reduction- Singular Value Decomposition
Περιλαμβάνει δείγματα διαλέξεων από εργαστήριο που αφορά το συγκεκριμένο μάθημα.