Minería de datos 2020-2

Descripción

El desarrollo de la tecnología ha hecho que la mayoría de los datos almacenados de forma física ahora lo estén de forma digital. Esto ha permitido que mediante algoritmos computacionales podamos extraer información de estos datos, ya sea patrones, modelos de predicción o identificar anomalías. Minamos estos datos para obtener conocimiento. En este curso se espera enseñar todo el proceso para poder minar conjuntos de datos, también conocido como Descubrimiento de Conocimiento en Base de Datos (Knowledge Discovery in Databases o KDD).

Objetivo

El objetivo de este curso es proporcionar al alumno elementos que le permitan entender las principales teorías y prácticas de la emergente área de Minería de Datos. Al final del curso, el alumno debera tener un conocimiento teorico y práctico de las principales técnicas utilizadas actualmente en la creación de programas capaces de extraer conocimiento relevante y patrones desde distintas fuentes y bases de datos. Ademas, el alumno conocera algunas de las principales aplicaciones donde en la actualidad este tipo de técnicas están teniendo una amplia aceptacion, comprendiendo sus potencialidades y limitaciones.

Contenidos

Introducción: concepto y proceso de minería de datos, tipos de problemas relevantes.
Data Warehouse y OLAP: arquitecturas, implementaciones, aplicaciones en minería de datos.
Web scrapping: obtención de datasets de páginas web.
Preparacion de la información: datos ruidosos, datos faltantes, reducción de la dimensionalidad y transformaciones, integración e inconsistencias.
Reglas de Asociación: algoritmo Apriori, FP-growth.
Reducción de dimensionalidad: análisis de las componentes principales (PCA).
Regresión: regresión lineal con funciones de base polinomial y exponencial.
Clasificación: regresión logística, arboles de decisión y random forest, razonamiento en base a casos: KNN, KD-Trees. Naïve Bayes.
Métodos de evaluación de clasificadores: hold out, cross validation, bootstrapping, confusion matrix, recall, precision, F1-score.
Clustering: clustering particional: K-Means, Mean Shift, EM-GMM. Medidas de similaridad, clustering aglomerativo, clustering en subespacios. Evaluación de clustering.
Aplicaciones: visualizacion, detección de anomalías.
Aplicaciones avanzadas: recommender systems, deep learning, reinforcement learning.

Videos

Los videos de las clases se encuentran aquí.

Calendario

El calendario de clases se puede revisar aquí.

Name		Name	Last commit message	Last commit date
Latest commit History 89 Commits
Actividades		Actividades
Ayudantías		Ayudantías
Clases		Clases
Controles		Controles
Tareas		Tareas
proyecto		proyecto
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Minería de datos 2020-2

Descripción

Objetivo

Contenidos

Videos

Calendario

About

Releases

Packages

Contributors 6

Languages

IIC2433/Syllabus-2020-2

Folders and files

Latest commit

History

Repository files navigation

Minería de datos 2020-2

Descripción

Objetivo

Contenidos

Videos

Calendario

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 6

Languages

Packages