En este repositorio puedes encontrar una panorámica general de Spark y su aplicación para manipulación de big data mediante los lenguajes de Python y SQL. Se explicará la arquitectura computacional de Spark y algunos ejemplo utilizando databricks.
-
Ingresa al notebook Introducción_PySpark.ipynb
-
El notebook fue realizado en la herramienta de Google Colab. Cuando ingresas al notebook puedes hacer click en el botón Open in Colab y te lleva directamente al notebook para que puedas usarlo.
Nota: Si vas a correrlo o modificarlo te recomendamos que crees una copia en tu drive y sigas las instrucciones en el notebook.
Si tienes alguna duda o comentario respecto a la charla puedes contactarnos por redes, nos encuentras como @valearizag y @lauralpezb
Hecho con amor 💜