- Carolene Bertoldi
- Henrique Braga
- Igor Chaves
- Marco Antônio Bonamichi
Este projeto visa demonstrar uma análise exploratória dos dados de corrida em NY e aplicar um algoritmo de predição de resultados.
O projeto contém todas as análises em arquivos R
markdown, juntamente com uma aplicação Shiny.
Para rodar o projeto, são necessários instalar os pacotes:
install.packages("shinydashboard")
install.packages("dplyr")
install.packages("readr")
install.packages("ggmap")
install.packages("rgl")
install.packages("manipulate")
Também recomendamos utilizar o RStudio
para as análises.
Coloque o arquivo train.csv
na pasta markdowns/data
-
Para rodar uma aplicação shiny, é necessário criar os arquivos
.html
executando o comandoknit
do RStudio. Isso porque queríamos disponibilizar já pronto, porém devido o tamanho de alguns arquivos gerados(alguns mais de 100MB devido aos plots presentes na análise) acabou não sendo possível. O nome ao salvar deve ser o mesmo domarkdown
. -
Coloque os arquivos
.html
gerados na pastawww
-
Abra o arquivo
ui.R
e execute comrun
. Isso deverá subir uma aplicação web no localhost para visualização das análises. Todos os arquivosRmd
contém as análises exploratórias e predições.
A predição encontra-se no arquivo predicao.Rmd
, porém é necessário executar o arquivo enriquecimento.Rmd
previamente para o enriquecimento dos dados e execução do modelo.
- Algoritmos de predição: Não conseguimos testar as variáveis e validar possíveis modelos, bem como reduções possíveis para gerar um modelo com boa predição. Acabamos gastando mais tempo na análise exploratória em si.