Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Feedback from previous years #1

Open
1 of 18 tasks
KevCaz opened this issue Feb 28, 2020 · 1 comment
Open
1 of 18 tasks

Feedback from previous years #1

KevCaz opened this issue Feb 28, 2020 · 1 comment
Labels
bug Something isn't working documentation Improvements or additions to documentation enhancement New feature or request

Comments

@KevCaz
Copy link
Member

KevCaz commented Feb 28, 2020

  • L'atelier nécessite un serieuse réorganisation
  • La présentation n'est abolument pas linéaire. Le script ne suit pas nécessairement la présentation. Il serait intéressant d'utiliser des données simulées pour le GLMM, car le modèle devient très complexes et difficile à communiquer.
  • add par(mfrow=c(1,1) after plot in intro part that shows the parameters of a
    normal distribution
  • Add script for ROCR library, shown in the prezi but not included in the script. Louis-Étienne’s script for ROCR:
library(ROCR)
Predict.T <- logit.reg$fitted.values
Actual.T <- mites$pa
pred.T <- ROCR::prediction(Predict.T, Actual.T)
perf.T <- performance(pred.T,"tpr",fpr") ## ROC PLOTS + AUC statistic
auc.T <-performance(pred.T,"auc")
aucMEAN.T <- round(mean(unlist([email protected])),2)
print(aucMEAN.T) 
plot(perf.T)
  • Add library(lattice) before dotplot() function is used in GLMM section in poisson GLM section the distribution parameter is called 'mu', in intro section ‘lambda'
  • L'exercice 3 (fin de l'atelier) manquait d'étapes, et en pratique le détail est un peu contre-intuitif : tester un lm, ensuite un glm, etc... sans initialement regarder la distribution ou le type de données (ce que tout le monde fait pour sélectionner une distribution au final), puis quitte à commencer par un lm j'aurais rappelé les codes de diagnostic des suppositions de base.
  • Je trouve que c'était assez non-intuitif, j'aurais plus vu
    1-sélection de la distribution en regardant les données,
    2-décision quant à inclure des effets aléatoires, en tester la structure,
    3-élaboration des modèles avec différents effets fixes et sélection de modèles,
    4-vérifications (surdispersion dans ce cas-ci),
    5-ajustement.
  • Some of the material was quite technical in its statistics, without as much actual coding as I think the participants were expecting more challenges and coding examples, less theory. This maybe specific to workshop 7, but I think the final section could be greatly condensed, since they have already learn mixed models in workshop 6. Alternatively, eliminate the final section, and flip workshops 6 and 7, so that the progression goes: LM -> GLM (no mixed models) -> GLMM. I think this would be more logical and less confusing.
  • Certaines sections sont peut-être trop théoriques et moins hands-in, des sections sont redondantes.
  • This workshop would benefit from less content and more challenges, to make it more interactive and actually more like a workshop.
  • Too much information and not sufficient time for coding.

Problèmes généraux mais faciles à fixer:

  • incongruences entre wiki, script et présentation R markdown (ex. librairies utilisées parfois)
  • fautes d’orthographe dans le wiki, script et présentation R markdown
  • paramètre lambda de la distribution Poisson : parfois mentionné comme étant lambda, d’autre fois par la lettre grecque mu… confus!

Problèmes script:

  • ligne 290 : changer requête à « family » pour method.args=list(family-"binomial")
  • ligne 485 : changer panel.margin par panel.spacing
  • ligne 633 : il faut charger la librairie lattice pour que dotplot() fonctionne
    package binomTools ne peut pas être installé pour les versions plus récentes de R. Si sur le CRAN ça ne fonctionne pas, il faut télécharger le package via ce lien https://r-forge.r-project.org/R/?group_id=1011
  • package coefplot2 : ne peut être installé que APRÈS avoir installé coda et reshape et SEULEMENT via install.packages("coefplot2",
    repos="http://www.math.mcmaster.ca/bolker/R",type="source")

Problème plus important:

Dans l’exemple GLMM, pour régler le problème de « over dispersion », on suggère d’utiliser une distribution Poisson log-normale où en fait on ajoute un effet aléatoire pour chaque observation. Apparemment, c’est une solution possible, mais pour Dalal, Vincent et moi ça équivaut quasiment à du « over fitting »… mais bon, ça se discute!

@KevCaz
Copy link
Member Author

KevCaz commented Feb 28, 2020

Other comments I added myself

  • it is common to use capital letters for random variables (X, Y or Z) and lowercase letters for observations (a.k.a. random variates)

@pedrohbraga pedrohbraga added bug Something isn't working documentation Improvements or additions to documentation enhancement New feature or request labels Mar 5, 2020
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working documentation Improvements or additions to documentation enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

2 participants