DataStreaming y servicios en la nube

Descripción del curso

En un mundo donde las aplicaciones móviles y el internet de las cosas han revolucionado la forma como generamos y compartimos información, vemos como cada vez es mas importante disponer de herramientas que nos permitan gestionar grandes cantidades de información que se generan cada vez mas rápido. Si logramos analizar dicha información, podemos tener una ventaja competitiva frente a nuestra competencia que nos permita liderar nuestro mercado. En ese contexto se enmarca el curso de DataStreaming y servicios en la nube, como una alternativa para analizar datos en tiempo real que nos permitan tomar la decisión correcta en el momento correcto. También se abordan temas relacionados con la computación en la nube como una alternativa para almacenar y procesar datos de forma económica y pagando solo por los servicios utilizados, sin necesidad de hacer grandes inversiones en equipos que en un par de años podrían quedar obsoletos.

DataStreaming

En las sesiones de DataStreaming aprenderemos sobre la serialización de los datos y los distintos formatos utilizados usualmente como lo son:

Json
Xml
Yaml Entraremos también a revisar otras alternativas como Protobuf y Apache Thrift. Entendiendo estos conceptos, vamos a revisar la forma como podemos procesar datos en Batch, en Streamin y en micro-batch.

Servicios en la nube

En las sesiones de Computación en la nube, revisaremos dos herramientas ampliamente utilizados hoy en día como lo son Databricks y AWS.

En Databricks trabajeremos cluster de Spark en los siguientes lenguajes

SQL
Python
R
Scala

En AWS vamos a conocer y operar los siguientes servicios

IAM
VPC
EC2
Cloud9
S3
EMR

Entregas

Las entregas del curso (informes, notebooks, etc.) se realizarán por correo electrónico. Los talleres se realizan en equipos de trabajo durante las sesiones marcadas como [TALLER], en cada sesión de taller se definirán las fechas de entrega.

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
local		local
slides		slides
01_Serialización_de_Datos.ipynb		01_Serialización_de_Datos.ipynb
03 - Quickstart Notebook.dbc		03 - Quickstart Notebook.dbc
04 - Empleados_SQL.dbc		04 - Empleados_SQL.dbc
05 - Delta Lake Primer - SparkR.dbc		05 - Delta Lake Primer - SparkR.dbc
06 - SanFranciscoFireCallsAnalysis.dbc		06 - SanFranciscoFireCallsAnalysis.dbc
07 - Datasets_Scala.dbc		07 - Datasets_Scala.dbc
08 - Batch y Streaming.dbc		08 - Batch y Streaming.dbc
10 - Accidentalidad_EMR.ipynb		10 - Accidentalidad_EMR.ipynb
11 - Machine Learning.ipynb		11 - Machine Learning.ipynb
README.md		README.md
init.py		init.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

DataStreaming y servicios en la nube

Descripción del curso

DataStreaming

Servicios en la nube

Entregas

About

Releases

Packages

Contributors 3

Languages

UDEA-Esp-Analitica-y-Ciencia-de-Datos/EACD-08-CLOUD

Folders and files

Latest commit

History

Repository files navigation

DataStreaming y servicios en la nube

Descripción del curso

DataStreaming

Servicios en la nube

Entregas

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages