Skip to content

Latest commit

 

History

History
13 lines (8 loc) · 1.03 KB

README.md

File metadata and controls

13 lines (8 loc) · 1.03 KB

DM_project_IBM

Preprocessing, clustering e sequential pattern mining della serie storica delle azioni IBM (open prices), con l'obiettivo di scoprire somigliaze tra gli andamenti annuali della serie, e trovare i pattern di oscillazione di prezzo più frequenti.

PREPROCESSING:

Data visualization e creazione delle matrici di distanza per DTW e CDM, creazione dei vettori feature-based.

CLUSTERING:

Divisione della serie storica in sottoserie annuali, per le quali è stato effettuato il clustering attraverso gli algoritmi DBSCAN e Hierarchical utilizzando DTW e CDM come misure di distanza. E' stato infine applicato K-Means con distanza euclidea sui vettori feature-based. I risultati migliori sono stati ottenuti con DTW.

SEQUENTIAL PATTERN MINING:

Divisione della serie storica in sottoserie mensili, che sono state discretizzate e formattate per poter essere importate all'interno del tool java SPMF. Attraverso l'algoritmo SPAM di SPMF si sono trovati i sequential pattern, che sono stati reimportati in Jupyter Notebook.