Skip to content

Commit

Permalink
added a few R examples
Browse files Browse the repository at this point in the history
  • Loading branch information
alexsanchezpla committed Nov 11, 2024
1 parent 62d5881 commit f300d30
Show file tree
Hide file tree
Showing 28 changed files with 491 additions and 250 deletions.
178 changes: 144 additions & 34 deletions 05-grandesMuestras.Rmd
Original file line number Diff line number Diff line change
@@ -1,25 +1,68 @@
# Grandes muestras

:::: {.calloutBox .important}

Este capítulo está pendiente de revisión, para corregir posibles problemas derivados de la importación, desde la antigua version en HTML, a la versión actual.
## Introducción: Aproximaciones asintóticas

Estos problemas siempre serán _estéticos y no conceptuales_, por lo que la lectura del texto en su estado actual no inducirá a errores conceptuales en ningún caso.
En estadística y teoría de la probabilidad, el estudio de las grandes muestras juega un papel crucial debido a su relevancia tanto en la definición frecuentista de probabilidad como en la construcción de estimadores en la práctica estadística.

La primera sección, además, está pendiente de ser introducida en los apuntes.
- Desde la perspectiva de la probabilidad frecuentista, la probabilidad se define como el límite de la frecuencia relativa de un evento cuando el número de ensayos tiende a infinito.

La versión actualizada estará disponible en el momento de inicio de la actividad, durante el semestre actual (2024-25-S1).
- En el contexto de la estadística, las grandes muestras sirven como base para muchas aproximaciones importantes, como las distribuciones de muestreo, las estimaciones de parámetros y la validación de inferencias.

::::
La ley de los grandes números y el teorema central del límite son ejemplos clave de teoremas que se fundamentan en el comportamiento de las muestras grandes, proporcionando las bases para muchos de los métodos estadísticos utilizados en la inferencia moderna.

## Ley de los Grandes Números (Ley débil)

## Introducción: Aproximaciones asintóticas
La **ley de los grandes números** establece que, a medida que el tamaño de la muestra aumenta, la media muestral se aproxima a la media de la población.

Formalmente, la ley de los grandes números en su versión débil se enuncia de la siguiente manera:

Sea \(X_1, X_2, \dots, X_n\) una secuencia de variables aleatorias independientes e idénticamente distribuidas (i.i.d.) con esperanza \( \mu = \mathbb{E}[X_i] \) y varianza \( \sigma^2 = \text{Var}(X_i) \), entonces para cualquier \( \epsilon > 0 \),

\[
\lim_{n \to \infty} P \left( \left| \frac{1}{n} \sum_{i=1}^n X_i - \mu \right| \geq \epsilon \right) = 0.
\]

Esto significa que, con alta probabilidad, la media muestral \( \frac{1}{n} \sum_{i=1}^n X_i \) se aproxima a \( \mu \) a medida que \(n\) crece.

### Ejemplo

Imaginemos un dado equilibrado. Sabemos que la esperanza de cada lanzamiento es el valor promedio de los números en el dado, que es

\[
\mu = \frac{1+2+3+4+5+6}{6} = 3.5.
\]

### Convergencia de variables aleatorias
Ahora, supongamos que lanzamos el dado repetidamente y calculamos la media de los resultados. Al principio, con pocos lanzamientos, la media puede estar alejada de 3.5, pero a medida que aumentan los lanzamientos, la media se acercará más y más a 3.5, como lo predice la ley de los grandes números. Es decir, a medida que lanzamos más veces el dado, la probabilidad de que la media de los resultados se aleje de 3.5 por más de una cantidad arbitraria disminuye.

Podemos ilustrarlo con el siguiente código de R

## Leyes de los grandes números
```{r}
# Definir la función para simular lanzamientos de un dado
simular_dado <- function(max_n) {
medias <- numeric(max_n) # Vector para almacenar las medias muestrales
for (n in 1:max_n) {
lanzamientos <- sample(1:6, n, replace = TRUE) # Lanzar el dado n veces
medias[n] <- mean(lanzamientos) # Calcular la media de los lanzamientos
}
return(medias)
}
# Simular para un tamaño máximo de muestra de 10000 lanzamientos
max_n <- 10000
medias <- simular_dado(max_n)
# Graficar las medias muestrales a medida que n aumenta
plot(1:max_n, medias, type = "l", col = "blue", lwd = 2,
xlab = "Número de lanzamientos (n)", ylab = "Media muestral",
main = "Ley de los Grandes Números\n Media de los lanzamientos de un dado", cex.main=0.7)
abline(h = 3.5, col = "red", lwd = 2, lty = 2) # Línea horizontal en 3.5
```



Este comportamiento es una manifestación intuitiva de la ley débil de los grandes números, ya que nos garantiza que la media muestral se acercará a la media poblacional a medida que el número de observaciones aumente.


## El teorema central del límite
Expand Down Expand Up @@ -58,15 +101,15 @@ $$

Así pues, la sucesión de variables aleatorias lleva asociada una secuencia paralela de funciones de distribución.

En los ejemplos se presentan sumas de variables aleatorias de diferentes tipos.
<!-- En los ejemplos se presentan sumas de variables aleatorias de diferentes tipos. -->

#### Presentación de los ejemplos
<!-- #### Presentación de los ejemplos -->

1. Ejemplo 1: sumas de variables binomiales.
2. Ejemplo 2: sumas de variables Poisson.
3. Ejemplo 3: sumas de $n$ puntuaciones de dados.
4. Ejemplo 4: sumas de variables uniformes.
5. Ejemplo 5: sumas de variables exponenciales.
<!-- 1. Ejemplo 1: sumas de variables binomiales. -->
<!-- 2. Ejemplo 2: sumas de variables Poisson. -->
<!-- 3. Ejemplo 3: sumas de $n$ puntuaciones de dados. -->
<!-- 4. Ejemplo 4: sumas de variables uniformes. -->
<!-- 5. Ejemplo 5: sumas de variables exponenciales. -->

### Definición de convergencia en ley

Expand All @@ -87,13 +130,13 @@ El significado de la definición es que, al aumentar arbitrariamente $n$, las su

En los ejemplos se presentan gráficamente algunas situaciones donde diferentes sucesiones de variables aleatorias convergen en ley a una variable aleatoria normal.

#### Representación gráfica de la convergencia
<!-- #### Representación gráfica de la convergencia -->

1. Ejemplo 1: primeros elementos de una sucesión de sumas de variables binomiales.
2. Ejemplo 2: primeros elementos de una sucesión de sumas de variables Poisson.
3. Ejemplo 3: primeros elementos de una sucesión de sumas de variables discretas.
4. Ejemplo 4: primeros elementos de una sucesión de sumas de variables uniformes.
5. Ejemplo 5: primeros elementos de una sucesión de sumas de variables exponenciales.
<!-- 1. Ejemplo 1: primeros elementos de una sucesión de sumas de variables binomiales. -->
<!-- 2. Ejemplo 2: primeros elementos de una sucesión de sumas de variables Poisson. -->
<!-- 3. Ejemplo 3: primeros elementos de una sucesión de sumas de variables discretas. -->
<!-- 4. Ejemplo 4: primeros elementos de una sucesión de sumas de variables uniformes. -->
<!-- 5. Ejemplo 5: primeros elementos de una sucesión de sumas de variables exponenciales. -->

### Enunciado del teorema central del límite

Expand Down Expand Up @@ -124,13 +167,80 @@ El teorema anterior tiene dos importantes corolarios:
3. El TCL presenta el comportamiento de sumas infinitas de variables aleatorias. Veremos posteriormente como interpretar el resultado para valores finitos.
4. Existen otras versiones del TCL dónde se relajan las condiciones de la versión de Lindeberg y Lévy, que, como se ha visto, obliga a las variables aleatorias a tener idénticas medias y varianzas. Dichas versiones del TCL necesitan el conocimiento de conceptos matemáticos que exceden el nivel al que se orienta Statmedia, y por esta razón se omite su enunciado.

### Aplicación del TCL a los ejemplos
### Algunos ejemplos de aplicación del TCL

#### Normalidad asintótica de la Binomial.

```{r}
# Parámetros de la distribución binomial
n <- 1000 # Número de ensayos
p <- 0.5 # Probabilidad de éxito
size <- 10000 # Número de simulaciones
# Generar una variable aleatoria binomial
binomial_sample <- rbinom(size, n, p)
# Estimación de la media y la desviación estándar de la distribución binomial
mean_binom <- n * p
sd_binom <- sqrt(n * p * (1 - p))
# Generar la distribución normal aproximada
normal_sample <- rnorm(size, mean = mean_binom, sd = sd_binom)
# Graficar los histogramas de la binomial y la normal
par(mfrow = c(1, 2)) # Organizar gráficos en dos paneles
# Histograma de la muestra binomial
hist(binomial_sample, breaks = 50, probability = TRUE,
col = rgb(0, 0, 1, 0.5), xlim = c(0, n),
main = "Distribución Binomial", xlab = "Valor",
ylab = "Densidad")
lines(density(binomial_sample), col = "blue", lwd = 2)
# Histograma de la distribución normal aproximada
hist(normal_sample, breaks = 50, probability = TRUE,
col = rgb(1, 0, 0, 0.5), xlim = c(0, n),
main = "Distribución Normal Aproximada", xlab = "Valor",
ylab = "Densidad")
lines(density(normal_sample), col = "red", lwd = 2)
```

#### Normalidad asintótica de la suma de puntuaciones de un dado

```{r}
# Parámetros de la simulación
num_simulaciones <- 10000 # Número de simulaciones
num_lanzamientos <- c(10, 100, 1000, 10000) # Diferentes tamaños de muestra
# Función para simular la suma de las puntuaciones de un dado
simular_suma_dado <- function(n) {
suma <- rowSums(matrix(sample(1:6, n * num_simulaciones, replace = TRUE),
ncol = n)) # Simulación de las sumas
return(suma)
}
# Graficar las distribuciones de las sumas para diferentes tamaños de muestra
par(mfrow = c(2, 2)) # Organizar gráficos en 2x2
for (n in num_lanzamientos) {
suma_dado <- simular_suma_dado(n)
# Histograma de la suma de las puntuaciones del dado
hist(suma_dado, breaks = 50, probability = TRUE,
col = rgb(0, 0, 1, 0.5), xlim = c(min(suma_dado), max(suma_dado)),
main = paste("Suma de", n, "lanzamientos de un dado"),
xlab = "Suma de puntuaciones", ylab = "Densidad")
# Superponer la curva de densidad normal (aproximación asintótica)
mean_dado <- 3.5 * n # Media esperada de la suma (media de un dado es 3.5)
sd_dado <- sqrt(n * (35 / 12)) # Desviación estándar de la suma (varianza de un dado es 35/12)
curve(dnorm(x, mean = mean_dado, sd = sd_dado),
col = "red", lwd = 2, add = TRUE)
}
```

- Ejemplo 1: normalidad asintótica de la Binomial.
- Ejemplo 2: normalidad asintótica de la Poisson.
- Ejemplo 3: normalidad asintótica de la suma de puntuaciones de un dado.
- Ejemplo 4: normalidad asintótica de la suma de uniformes.
- Ejemplo 5: normalidad asintótica de la suma de exponenciales.
<!-- - Ejemplo 4: normalidad asintótica de la suma de uniformes. -->
<!-- - Ejemplo 5: normalidad asintótica de la suma de exponenciales. -->


### Casos particulares más notables
Expand Down Expand Up @@ -169,13 +279,13 @@ El TCL permite aproximar funciones de distribución, independientemente del car

Finalmente, es conveniente mencionar que existen resultados teóricos que permiten estudiar la velocidad de convergencia de una suma de variables aleatorias a la normal, sin embargo la dificultad técnica que conllevan trasciende el nivel marcado para el conjunto de documentos marcado para Statmedia.

### Aproximaciones y errores numéricos
<!-- ### Aproximaciones y errores numéricos -->

- Ejemplo 1: error en la aproximación de la binomial.
- Ejemplo 2: error en la aproximación de la Poisson.
- Ejemplo 3: error en la aproximación de la suma de puntuaciones de un dado.
- Ejemplo 4: error en la aproximación de la suma de uniformes.
- Ejemplo 5: error en la aproximación de la suma de exponenciales.
<!-- - Ejemplo 1: error en la aproximación de la binomial. -->
<!-- - Ejemplo 2: error en la aproximación de la Poisson. -->
<!-- - Ejemplo 3: error en la aproximación de la suma de puntuaciones de un dado. -->
<!-- - Ejemplo 4: error en la aproximación de la suma de uniformes. -->
<!-- - Ejemplo 5: error en la aproximación de la suma de exponenciales. -->


### Acerca de las variables aproximadamente normales
Expand Down
Binary file added _main_files/figure-html/unnamed-chunk-13-1.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added _main_files/figure-html/unnamed-chunk-14-1.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added _main_files/figure-html/unnamed-chunk-15-1.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added _main_files/figure-latex/unnamed-chunk-13-1.pdf
Binary file not shown.
Binary file added _main_files/figure-latex/unnamed-chunk-14-1.pdf
Binary file not shown.
Binary file added _main_files/figure-latex/unnamed-chunk-15-1.pdf
Binary file not shown.
11 changes: 5 additions & 6 deletions docs/404.html
Original file line number Diff line number Diff line change
Expand Up @@ -344,21 +344,20 @@
</ul></li>
<li class="chapter" data-level="5" data-path="grandes-muestras.html"><a href="grandes-muestras.html"><i class="fa fa-check"></i><b>5</b> Grandes muestras</a>
<ul>
<li class="chapter" data-level="5.1" data-path="grandes-muestras.html"><a href="grandes-muestras.html#introducción-aproximaciones-asintóticas"><i class="fa fa-check"></i><b>5.1</b> Introducción: Aproximaciones asintóticas</a>
<li class="chapter" data-level="5.1" data-path="grandes-muestras.html"><a href="grandes-muestras.html#introducción-aproximaciones-asintóticas"><i class="fa fa-check"></i><b>5.1</b> Introducción: Aproximaciones asintóticas</a></li>
<li class="chapter" data-level="5.2" data-path="grandes-muestras.html"><a href="grandes-muestras.html#ley-de-los-grandes-números-ley-débil"><i class="fa fa-check"></i><b>5.2</b> Ley de los Grandes Números (Ley débil)</a>
<ul>
<li class="chapter" data-level="5.1.1" data-path="grandes-muestras.html"><a href="grandes-muestras.html#convergencia-de-variables-aleatorias"><i class="fa fa-check"></i><b>5.1.1</b> Convergencia de variables aleatorias</a></li>
<li class="chapter" data-level="5.2.1" data-path="grandes-muestras.html"><a href="grandes-muestras.html#ejemplo-3"><i class="fa fa-check"></i><b>5.2.1</b> Ejemplo</a></li>
</ul></li>
<li class="chapter" data-level="5.2" data-path="grandes-muestras.html"><a href="grandes-muestras.html#leyes-de-los-grandes-números"><i class="fa fa-check"></i><b>5.2</b> Leyes de los grandes números</a></li>
<li class="chapter" data-level="5.3" data-path="grandes-muestras.html"><a href="grandes-muestras.html#el-teorema-central-del-límite"><i class="fa fa-check"></i><b>5.3</b> El teorema central del límite</a>
<ul>
<li class="chapter" data-level="5.3.1" data-path="grandes-muestras.html"><a href="grandes-muestras.html#sumas-de-variables-aleatorias"><i class="fa fa-check"></i><b>5.3.1</b> Sumas de variables aleatorias</a></li>
<li class="chapter" data-level="5.3.2" data-path="grandes-muestras.html"><a href="grandes-muestras.html#definición-de-convergencia-en-ley"><i class="fa fa-check"></i><b>5.3.2</b> Definición de convergencia en ley</a></li>
<li class="chapter" data-level="5.3.3" data-path="grandes-muestras.html"><a href="grandes-muestras.html#enunciado-del-teorema-central-del-límite"><i class="fa fa-check"></i><b>5.3.3</b> Enunciado del teorema central del límite</a></li>
<li class="chapter" data-level="5.3.4" data-path="grandes-muestras.html"><a href="grandes-muestras.html#aplicación-del-tcl-a-los-ejemplos"><i class="fa fa-check"></i><b>5.3.4</b> Aplicación del TCL a los ejemplos</a></li>
<li class="chapter" data-level="5.3.4" data-path="grandes-muestras.html"><a href="grandes-muestras.html#algunos-ejemplos-de-aplicación-del-tcl"><i class="fa fa-check"></i><b>5.3.4</b> Algunos ejemplos de aplicación del TCL</a></li>
<li class="chapter" data-level="5.3.5" data-path="grandes-muestras.html"><a href="grandes-muestras.html#casos-particulares-más-notables"><i class="fa fa-check"></i><b>5.3.5</b> Casos particulares más notables</a></li>
<li class="chapter" data-level="5.3.6" data-path="grandes-muestras.html"><a href="grandes-muestras.html#interpretación-del-teorema-central-del-límite"><i class="fa fa-check"></i><b>5.3.6</b> Interpretación del teorema central del límite</a></li>
<li class="chapter" data-level="5.3.7" data-path="grandes-muestras.html"><a href="grandes-muestras.html#aproximaciones-y-errores-numéricos"><i class="fa fa-check"></i><b>5.3.7</b> Aproximaciones y errores numéricos</a></li>
<li class="chapter" data-level="5.3.8" data-path="grandes-muestras.html"><a href="grandes-muestras.html#acerca-de-las-variables-aproximadamente-normales"><i class="fa fa-check"></i><b>5.3.8</b> Acerca de las variables aproximadamente normales</a></li>
<li class="chapter" data-level="5.3.7" data-path="grandes-muestras.html"><a href="grandes-muestras.html#acerca-de-las-variables-aproximadamente-normales"><i class="fa fa-check"></i><b>5.3.7</b> Acerca de las variables aproximadamente normales</a></li>
</ul></li>
</ul></li>
<li class="chapter" data-level="6" data-path="introducción-a-la-inferencia-estadística.html"><a href="introducción-a-la-inferencia-estadística.html"><i class="fa fa-check"></i><b>6</b> Introducción a la inferencia estadística</a>
Expand Down
Binary file modified docs/_main.pdf
Binary file not shown.
Loading

0 comments on commit f300d30

Please sign in to comment.