DM_project_IBM

Preprocessing, clustering e sequential pattern mining della serie storica delle azioni IBM (open prices), con l'obiettivo di scoprire somigliaze tra gli andamenti annuali della serie, e trovare i pattern di oscillazione di prezzo più frequenti.

PREPROCESSING:

Data visualization e creazione delle matrici di distanza per DTW e CDM, creazione dei vettori feature-based.

CLUSTERING:

Divisione della serie storica in sottoserie annuali, per le quali è stato effettuato il clustering attraverso gli algoritmi DBSCAN e Hierarchical utilizzando DTW e CDM come misure di distanza. E' stato infine applicato K-Means con distanza euclidea sui vettori feature-based. I risultati migliori sono stati ottenuti con DTW.

SEQUENTIAL PATTERN MINING:

Divisione della serie storica in sottoserie mensili, che sono state discretizzate e formattate per poter essere importate all'interno del tool java SPMF. Attraverso l'algoritmo SPAM di SPMF si sono trovati i sequential pattern, che sono stati reimportati in Jupyter Notebook.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

DM_project_IBM

PREPROCESSING:

CLUSTERING:

SEQUENTIAL PATTERN MINING:

Files

README.md

Latest commit

History

README.md

File metadata and controls

DM_project_IBM

PREPROCESSING:

CLUSTERING:

SEQUENTIAL PATTERN MINING: