Skip to content

Commit

Permalink
Jhan - TBM
Browse files Browse the repository at this point in the history
  • Loading branch information
salazarjhan95 committed Sep 26, 2023
1 parent 22f0018 commit c0107b5
Show file tree
Hide file tree
Showing 3 changed files with 10 additions and 1 deletion.
6 changes: 6 additions & 0 deletions 07-tbm.Rmd
Original file line number Diff line number Diff line change
Expand Up @@ -11,6 +11,12 @@ Para construir un árbol de regresión se hacen los siguientes dos pasos:
1) Se dividen los predictores en conjuntos de valores posibles para $X_{1}$, $X_{2}$,...,$X_{p}$, en *J* regiones distintas que no se sobrelapan, $R_{1}$, $R_{2}$,...,$R_{j}$.
2) Para cada observación que cae en la $R_{j}$, hacemos la misma predicción, la cual es la media de la respuesta para las observaciones de entrenamiento en $R_{j}$.

Del mismo modo, para contruir estos árboles, en teoría, las regiones pueden tomar cualquier forma. Sin embargo, podemos dividir los predictores en en *cajas* de altas dimensiones, esto para simplificar la interpretabilidad de los resultados del modelo. El objetivo de esto es encontrar las cajas $R_{1}$,...,$R_{j}$ que minimicen el RSS, esto está dado por

$$\sum_{j=1}^{J}\sum_{i\epsilon R_{j}}(y_{i}-\hat{y}_{R_{j}})^2$$
Donde $\hat{y}_{R_{j}}$ es la media de la respuesta para las observaciones de entrenamiento dentro de la *j*ésima caja.


## Decision trees
## Boosting and bagging

Expand Down
3 changes: 3 additions & 0 deletions docs/métodos-basados-en-árboles-jhan.html
Original file line number Diff line number Diff line change
Expand Up @@ -253,6 +253,9 @@ <h2><span class="header-section-number">7.1</span> Árboles de regresión<a href
<li>Se dividen los predictores en conjuntos de valores posibles para <span class="math inline">\(X_{1}\)</span>, <span class="math inline">\(X_{2}\)</span>,…,<span class="math inline">\(X_{p}\)</span>, en <em>J</em> regiones distintas que no se sobrelapan, <span class="math inline">\(R_{1}\)</span>, <span class="math inline">\(R_{2}\)</span>,…,<span class="math inline">\(R_{j}\)</span>.</li>
<li>Para cada observación que cae en la <span class="math inline">\(R_{j}\)</span>, hacemos la misma predicción, la cual es la media de la respuesta para las observaciones de entrenamiento en <span class="math inline">\(R_{j}\)</span>.</li>
</ol>
<p>Del mismo modo, para contruir estos árboles, en teoría, las regiones pueden tomar cualquier forma. Sin embargo, podemos dividir los predictores en en <em>cajas</em> de altas dimensiones, esto para simplificar la interpretabilidad de los resultados del modelo. El objetivo de esto es encontrar las cajas <span class="math inline">\(R_{1}\)</span>,…,<span class="math inline">\(R_{j}\)</span> que minimicen el RSS, esto está dado por</p>
<p><span class="math display">\[\sum_{j=1}^{J}\sum_{i\epsilon R_{j}}(y_{i}-\hat{y}_{R_{j}})^2\]</span>
Donde <span class="math inline">\(\hat{y}_{R_{j}}\)</span> es la media de la respuesta para las observaciones de entrenamiento dentro de la <em>j</em>ésima caja.</p>
</div>
<div id="decision-trees" class="section level2 hasAnchor" number="7.2">
<h2><span class="header-section-number">7.2</span> Decision trees<a href="métodos-basados-en-árboles-jhan.html#decision-trees" class="anchor-section" aria-label="Anchor link to header"></a></h2>
Expand Down
2 changes: 1 addition & 1 deletion docs/search_index.json

Large diffs are not rendered by default.

0 comments on commit c0107b5

Please sign in to comment.