Skip to content

Preprocessing, clustering and sequential pattern mining of IBM stock time series.

Notifications You must be signed in to change notification settings

fspinna/DM_project_IBM

Repository files navigation

DM_project_IBM

Preprocessing, clustering e sequential pattern mining della serie storica delle azioni IBM (open prices), con l'obiettivo di scoprire somigliaze tra gli andamenti annuali della serie, e trovare i pattern di oscillazione di prezzo più frequenti.

PREPROCESSING:

Data visualization e creazione delle matrici di distanza per DTW e CDM, creazione dei vettori feature-based.

CLUSTERING:

Divisione della serie storica in sottoserie annuali, per le quali è stato effettuato il clustering attraverso gli algoritmi DBSCAN e Hierarchical utilizzando DTW e CDM come misure di distanza. E' stato infine applicato K-Means con distanza euclidea sui vettori feature-based. I risultati migliori sono stati ottenuti con DTW.

SEQUENTIAL PATTERN MINING:

Divisione della serie storica in sottoserie mensili, che sono state discretizzate e formattate per poter essere importate all'interno del tool java SPMF. Attraverso l'algoritmo SPAM di SPMF si sono trovati i sequential pattern, che sono stati reimportati in Jupyter Notebook.

About

Preprocessing, clustering and sequential pattern mining of IBM stock time series.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published