-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Feedback #1
base: feedback
Are you sure you want to change the base?
Feedback #1
Conversation
…e.html Merge branch 'main' of https://github.com/DiploDatosUNAB/informe-grupo-14 # Conflicts: # informe.html
…dar. Rangos max y min.
…dar. Rangos max y min.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Ahí les dejé comentarios.
Lo principales es que tienen bastante redundancia; cosas que ponen dos veces. No pongan números copiados y pegados; todo tiene que salir del código.
informe.Rmd
Outdated
library(readr) | ||
library(dplyr) | ||
library(naniar) | ||
library(visdat) |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
No veo que hayan usado ninguna función de esta librería.
informe.Rmd
Outdated
[1] "pais" "nombre" "puntos" "precio" "provincia" | ||
[6] "region_1" "region_2" "variedad" "vina" "titulo_resena" | ||
|
||
Codigo | ||
```{r} | ||
names(vinos) #La función names() por su parte, nos devuelve los nombres de las variables |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Esto es redundante. Dejen uno o el otro. (Y si dejan el primero, quizás con mejor formato, tipo una lista).
informe.Rmd
Outdated
```{r} | ||
length(vinos) # La funcion lengrh devuelve el tamaño de un elemento | ||
``` | ||
|
||
```{r} | ||
ncol(vinos) # también podríamos utilizar la función ncol, devuelve el número de columnas de una matriz. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Esto también es redundante.
informe.Rmd
Outdated
- ¿Cuál es su valor medio y desvío estándard? | ||
- ¿Cuál es su rango (valor máximo y valor mínimo)? | ||
- ¿Hay alguna anomalía que sugiera que hay datos incorrectos? Valores imposibles (como valores negativos en una variable que sólo puede ser positiva) o poco creíbles. | ||
- ¿Cuántas observaciones hay por cada grupo? ¿Cuántos valores faltantes? ¿Hay diferencias? | ||
|
||
Esta sección sí tiene que tener código de R. | ||
|
||
Los resultados del código tienen que estar acompañados de un texto que los describa y que elabore sobre los mismos. | ||
Es decir, no sólo repetir lo que se ve, sino también comentar sobre su significado en el contexto de estos datos. | ||
No hace falta que sean párrafos largos; cada uno no debería tener más de 5-6 frases. | ||
|
||
**Todos** los resultados presentados deben tener su código correspondiente. | ||
Cualquier respuesta/resultado presentado sin el correspondiente código R que generó el resultado no se considerará. | ||
Para ser claros: no reporten cosas en el documento que calcularon a mano o miraron por fuera de R (por ejemplo, si cuentan la cantidad de filas, tiene que estar elcódigo que cuenta la cantidad de filas). | ||
|
||
Es muy posible que tengan ganas de hacer algún cálculo y que no sepan cómo hacerlo en R. | ||
¡En ese caso es mejor que consulten en el foro en vez de quedarse con las ganas! |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Borren las instrucciones.
informe.Rmd
Outdated
Valor medio: 35.36339 | ||
Desvio estandar: 41.02222 | ||
```{r} | ||
summarise(vinos, valor_medio = mean(precio,na.rm = TRUE)) | ||
|
||
``` | ||
|
||
```{r} | ||
summarise(vinos, desvio_std = sd(precio,na.rm = TRUE)) | ||
``` |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Esto también es redundante.
informe.Rmd
Outdated
-Cantidad de observaciones por la variable REGION_1 | ||
|
||
```{r} | ||
vinos|> | ||
group_by(region_1)|> | ||
summarise(n=n()) | ||
|
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Hicieron las cuentas para todas las variables pero faltaría interpretar los resultados. De la cantidad de observaciones por país se puede ver si hay algún sesgo en los datos o cómo es la distribución. ¿Qué sacan de la cantidad de observaciones por region_1 o provincia, etc.?
informe.Rmd
Outdated
```{r} | ||
vinos|> | ||
group_by(titulo_resena)|> | ||
summarise(n=n()) | ||
``` |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Yo acá veo algo interesante. Yo habría pensado que abría una única observación por reseña, pero acá se ve que hay reseñas que aparecen más de una vez. ¿Por qué es esto? ¿Cuáles son? Pueden filtrar las reseñas con más de una observación y ordenar de mayor a menor para tener mejor interpretabilidad.
informe.Rmd
Outdated
|
||
¿Hay diferencias? Si existen diferencias. Donde más datos faltantes hay es en la variable 'nombre' y 'region_1'. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
region_2
tiene más datos faltantes.
Qué significan estos datos faltantes? Son todos datos que "deberían estar pero no fueron registrados" o algunos representan otra cosa?
informe.Rmd
Outdated
# Agregá más bloques según sea necesario | ||
sum(is.na(vinos$pais)) | ||
``` | ||
```{r} | ||
sum(is.na(vinos$nombre)) |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Esto res redundante.
informe.Rmd
Outdated
```{r} | ||
vinos|> | ||
group_by(puntos)|> | ||
summarise(n=n()) |> | ||
arrange(desc(puntos)) | ||
|
||
``` | ||
- Cantidad de observaciones por PAIS, ordenado en forma decreciente para saber que país tiene más observaciones. | ||
|
||
```{r} | ||
vinos|> | ||
group_by(pais)|> | ||
summarise(n=n())|> | ||
arrange(desc(n)) | ||
``` |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Esto repite tablas que hicieron arriba pero sin ordenar. Quédense con esto.
…le Puntos usando geom_col().
… cada nombre. Se arregla un poco el informe.
👋! GitHub Classroom created this pull request as a place for your teacher to leave feedback on your work. It will update automatically. Don’t close or merge this pull request, unless you’re instructed to do so by your teacher.
In this pull request, your teacher can leave comments and feedback on your code. Click the Subscribe button to be notified if that happens.
Click the Files changed or Commits tab to see all of the changes pushed to
main
since the assignment started. Your teacher can see this too.Notes for teachers
Use this PR to leave feedback. Here are some tips:
main
since the assignment started. To leave comments on specific lines of code, put your cursor over a line of code and click the blue + (plus sign). To learn more about comments, read “Commenting on a pull request”.main
. Click a commit to see specific changes.For more information about this pull request, read “Leaving assignment feedback in GitHub”.
Subscribed: @valerialopez07 @Jorge-Alvarez-23