Ψηφιακή επεξεργασία φωνής

Πανεπιστήμιο Κρήτης

Τμήμα Επιστήμης Υπολογιστών

Έτος: 2015

Διδάσκων: Ιωάννης Στυλιανού

Περιγραφή Μαθήματος

Ο ήχος και ειδικότερα η φωνή αποτελεί βασικό συστατικό ενός συστήματος πολυμέσων. Τέσσερα κυρίως θέματα καλύπτονται στο πλαίσιο του μαθήματος: κωδικοποίηση, ανάλυση, σύνθεση, και αναγνώριση φωνής. Ενδεικτικά θα καλυφθούν θέματα όπως: • Σύστημα παραγωγής φωνής • Τυποποιημένοι αλγόριθμοι κωδικοποίησης φωνής • Γραμμική πρόβλεψη • Κωδικοποίηση βασισμένη σε ανάλυση με σύνθεση • Ημιτονοειδή μοντέλα • Βελτίωση σήματος φωνής • Υπολογισμός τονικότητας • Αλλαγή χαρακτηριστικών φωνής • Συστήματα σύνθεσης φωνής • Συστήματα αναγνώρισης ομιλητή

Video-Διαλέξεις

Διάλεξη 01: Ψηφιακή επεξεργασία σήματος

Διάλεξη 02: Παραγωγή και ταξινόμηση σημάτων φωνής

Διάλεξη 03: Ακουστική ανάλυση παραγωγής φωνής

Διάλεξη 04: Ακουστική ανάλυση παραγωγής φωνής - Γραμμική πρόβλεψη: Ανάλυση και Σύνθεση

Διάλεξη 05: Γραμμική Πρόβλεψη: Ανάλυση και Σύνθεση

Διάλεξη 06: Ημιτονοειδής ανάλυση και τροποποίηση φωνής

Διάλεξη 07: Κωδικοποίηση φωνής

Διάλεξη 08: Βελτίωση φωνής

Διάλεξη 09: Αναγνώριση ομιλητή

Διάλεξη 10: Μοντέλα μείξης γκαουσιανών