Skip to content

Commit e950214

Browse files
committed
Correction in C00La_refresh learnr
1 parent ef56e7c commit e950214

File tree

5 files changed

+28
-23
lines changed

5 files changed

+28
-23
lines changed

DESCRIPTION

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
Package: BioDataScience3
2-
Version: 2023.1.0
2+
Version: 2023.1.1
33
Title: A Series of Learnr Documents for Biological Data Science 3
44
Description: Interactive documents using learnr for studying biological data science (second course).
55
Authors@R: c(

NEWS.md

Lines changed: 5 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,8 +1,12 @@
1+
# BioDataScience3 2023.1.1
2+
3+
- Correction in **C00La_refresh** relative to the interpretation of the ACP.
4+
15
# BioDataScience3 2023.1.0
26

37
- Revision of datasets and documentation of datasets.
48

5-
- Revision of **C00La_refresh** for academic year 2023-2024.
9+
- Revision of **C00La_refresh**, **C01La_confusion** et **C01Lb_ml1** for academic year 2023-2024.
610

711
# BioDataScience3 2023.0.0
812

inst/tutorials/C00La_refresh/C00La_refresh.Rmd

Lines changed: 3 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -276,7 +276,7 @@ chart(data = ___, ___ ~ ___ %___=% ___ ) |>
276276
crabs <- read("crabs", package = "MASS")
277277
# Graphique
278278
chart(data = crabs, length ~ ___ %fill=% ___ ) |>
279-
gg$geom_box___
279+
Sgg$geom_box___
280280
281281
#### ATTENTION: Hint suivant = solution !####
282282
```
@@ -733,8 +733,8 @@ grade_code("Vous avez correctement réalisé les trois graphiques demandés. Ré
733733
```{r qu_acp}
734734
question("Sélectionnez les affirmations correctes (plusieurs choix possibles).",
735735
answer("L'ACP permet de séparer les deux espèces. Les rapports longueur/largeur sont plus importants pour les crabes oranges.", correct = TRUE),
736-
answer("Le premier axe reprend 63.5% de la variance totale. Cet axe est corrélé avec les ratios longueur/largeur, profondeur/largeur et taille du lobe frontal/largeur.", correct = TRUE),
737-
answer("Le second axe représente 27.7% de la variance totale. Cet axe est inversément correlé avec le ratio largueur à l'arrière/largeur.",correct = TRUE),
736+
answer("Le premier axe reprend 63.5% de la variance totale. Cet axe est corrélé (directement ou inversément) avec les ratios longueur/largeur, profondeur/largeur et taille du lobe frontal/largeur.", correct = TRUE),
737+
answer("Le second axe représente 27.7% de la variance totale. Cet axe est correlé (directement ou inversément) avec le ratio largueur à l'arrière/largeur.", correct = TRUE),
738738
answer("Les ratios longueur/largeur et épaisseur/largeur sont directement corrélés.", correct = TRUE),
739739
answer("Le ratio épaisseur/largeur est inversément corrélé avec le ratio largeur à l'arrière/largeur.", correct = FALSE),
740740
answer( "Le ratio largeur à l'arrière/largeur permet de distinguer la plupart des individus mâles des femelles et les crabes bleus on une carapace plus compacte (rapport longueur - largeur) que les crabes oranges.", correct = TRUE),

inst/tutorials/C01La_confusion/C01La_confusion.Rmd

Lines changed: 3 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -29,12 +29,12 @@ BioDataScience3::learnr_server(input, output, session)
2929

3030
## Objectifs
3131

32-
Il est possible de créer une multitude de classifieurs différents à partir d'un même jeu de données. Afin de déterminer le classifieur le plus adapté, nous avons besoin d'évaluer la qualité de chacun d'eux. Pour ce faire, nous utilisons des métriques comme le taux de reconnaissance globale, la précision, le rappel.... Ces métriques se calculent sur base d'une matrice de confusion.
32+
Il est possible de créer une multitude de classifieurs différents à partir d'un même jeu de données. Afin de déterminer le classifieur le plus adapté, nous avons besoin d'évaluer la qualité de chacun d'eux. Pour ce faire, nous utilisons des métriques comme le taux de reconnaissance globale, la précision, le rappel.... La plupart de ces métriques se calculent sur base d'une matrice de confusion.
3333

3434
Ce tutoriel a pour objectifs :
3535

36-
- Apprendre à choisir la bonne métrique
3736
- Appréhender les matrices de confusion
37+
- Apprendre à choisir la bonne métrique
3838
- Calculer les principales métriques à partir d'une matrice de confusion 2 x 2
3939

4040
## Choix des métriques
@@ -275,7 +275,7 @@ grade_result(
275275

276276
## Conclusion
277277

278-
Ces calculs de métriques à la main peuvent vous sembler simplistes. Ils vous ont permis de les comprendre un peu mieux. Ce sont des éléments cruciaux dans l'évaluation d'un classifieur. À chaque fois que vous devrez déterminer la qualité d'un classifieur, commencez par définir les métriques les plus pertinentes par rapport à vos objectifs.
278+
Ces calculs de métriques devraient vous avoir permis de les comprendre un peu mieux. Ce sont des éléments cruciaux dans l'évaluation d'un classifieur. À chaque fois que vous devrez déterminer la qualité d'un classifieur, commencez par définir les métriques les plus pertinentes par rapport à vos objectifs. Dans les exercices que vous ferez plus loin, vous utiliserez ces métriques pour évaluer les performances de vos classifieurs et vous vous rendrez compte de leur intérêt en pratique.
279279

280280
```{r comm_noscore, echo=FALSE}
281281
question_text(

inst/tutorials/C01Lb_ml1/C01Lb_ml1.Rmd

Lines changed: 16 additions & 15 deletions
Original file line numberDiff line numberDiff line change
@@ -14,24 +14,23 @@ runtime: shiny_prerendered
1414

1515
```{r setup, include=FALSE}
1616
BioDataScience3::learnr_setup()
17-
SciViews::R("ml", "explore")
17+
SciViews::R("ml", "explore", lang = "fr")
1818
19-
# exercice preparation --------
2019
read("biometry", package = "BioDataScience") %>.%
21-
select(., gender, weight, height, wrist) %>.%
22-
drop_na(.) %->%
20+
sselect(., gender, weight, height, wrist) %>.%
21+
sdrop_na(.) ->
2322
bio
2423
25-
## Prepare train and test sets
24+
# Prepare train and test sets
2625
set.seed(164)
2726
bio_split <- initial_split(bio, prop = 2/3)
2827
bio_train <- training(bio_split)
2928
bio_test <- testing(bio_split)
3029
31-
## Create an LDA model
30+
# Create an LDA model
3231
bio_lda <- mlLda(data = bio_train, gender ~ .)
3332
34-
## Confusion
33+
# Confusion
3534
bio_conf <- confusion(predict(bio_lda, bio_test), bio_test$gender)
3635
bio_conf_tab <- summary(bio_conf)
3736
```
@@ -63,6 +62,7 @@ L'élaboration d'un classifieur requiert de suivre une série d'étapes :
6362
- Préparer le set d'apprentissage et le set de test
6463
- Entraîner un classifieur (choisir l'algorithme, l'ajuster sur le set d'apprentissage...)
6564
- Évaluer la qualité du classifieur à l'aide des métriques pertinentes
65+
- Optimiser le classifieur en ajustant ses paramètres
6666
- Déployer le classifieur afin de prédire les classes dans un gros jeu de données non encore classé manuellement.
6767

6868
L'objectif de ce tutoriel est de vous permettre de découvrir l'analyse discriminante linéaire. Vous devez être bien conscient de toutes les étapes ci-dessus et vous devrez les mettre en œuvre dans le cadre de vos projets plus tard. Cependant, pour rendre cette première approche de la classification supervisée plus abordable, nous ne détaillerons pas toutes ces étapes, mais seulement les quelques unes qui mènent à un classifieur ADL fonctionnel.
@@ -78,11 +78,11 @@ Le calcul de l'indice de masse corporelle (IMC) a déjà fait l'objet de plusieu
7878
Vous avez à votre disposition le tableau de données suivant que l'on réduit à quatre variables :
7979

8080
- le genre `gender`, que l'on cherchera à prédire, une variable `factor` à deux niveaux `M` pour homme et `W` pour femme, et
81-
- trois variables quantitatives rencontrées dans les diverses formules d'IMC, soit la masse `weight` en kg, la taille `height`, et le tour de poignet `wrist` en mm.
81+
- trois variables quantitatives rencontrées dans les diverses formules d'IMC, soit la masse `weight` en kg, la taille `height` en cm, et le tour de poignet `wrist` en mm.
8282

8383
```{r, echo=TRUE}
8484
read("biometry", package = "BioDataScience",lang = "fr") %>.%
85-
sselect(., gender, weight, height, wrist) %->%
85+
sselect(., gender, weight, height, wrist) ->
8686
bio
8787
```
8888

@@ -106,14 +106,14 @@ combine_charts(list(a, b))
106106

107107
```{r qu_explo}
108108
question("Sélectionnez les éléments pertinents de l'analyse exploratoire réalisée ci-dessus.",
109-
answer("Le tableau de données comprend quatre variables numériques et une variable facteur ordonnée."),
109+
answer("Le tableau de données contient quatre variables numériques et une variable facteur ordonnée."),
110110
answer("La répartition entre les hommes (M) et les femmes (W) est proche de 50/50", correct = TRUE),
111-
answer("On observe la présence de valeurs manquantes pour la variable de la circomférence du poignets.", correct = TRUE),
112-
answer("Toutes les variables sont complètes. Il n'y a pas de valeurs manquantes dans ce tableau."),
111+
answer("On observe la présence de valeurs manquantes pour la variable tour de poignet.", correct = TRUE),
112+
answer("Toutes les variables sont complètes. Il n'y a pas de valeurs manquantes dans ce jeu de données."),
113113
answer("L'ACP permet de séparer en grande partie les hommes des femmes. Les hommes ont tendance à être plus grands et plus lourds.", correct = TRUE),
114114
allow_retry = TRUE, random_answer_order = TRUE,
115115
correct = "Vous avez sélectionné les éléments corrects.",
116-
incorrect = "Attention, Ce n'est pas complet. Intéressez-vous avec plus d'attention à la description du tableau et à l'ACP.",
116+
incorrect = "Attention, Ce n'est pas complet. Intéressez-vous avec plus d'attention à la description du jeu de données et à l'ACP.",
117117
submit_button = "Soumettre une réponse",
118118
try_again_button = "Resoumettre une réponse")
119119
```
@@ -123,7 +123,8 @@ question("Sélectionnez les éléments pertinents de l'analyse exploratoire réa
123123
Suite à la phase exploratoire de l'analyse, il en est ressorti que des valeurs manquantes devaient être filtrées.
124124

125125
```{r, echo=TRUE}
126-
bio <- sdrop_na(bio, wrist) # Filtrer les valeurs manquantes en spécifiant la colonne concernée
126+
# Filtrer les valeurs manquantes en spécifiant la colonne concernée
127+
bio <- sdrop_na(bio, wrist)
127128
```
128129

129130
Utilisez les fonctions `initial_split()`, `training()` et `testing()` pour définir votre set d'apprentissage et votre set de test. Votre set d'apprentissage va se nommer `bio_train` et votre set de test sera `bio_test`. Il vous est demandé de réaliser un set d'apprentissage contenant 3/4 des observations et en conservant les mêmes proportions qu'au départ pour le genre.
@@ -185,7 +186,7 @@ summary(bio_lda)
185186
```
186187

187188
```{r lda1_h2-check}
188-
grade_code("Voici donc votre premier classifieur ADL. Voyons maintenant quoi en faire...", "Avez-vous bien écrit la formule sous sa forme condensée ?")
189+
grade_code("Voici donc votre premier classifieur ADL. Voyons quoi en faire...", "Avez-vous bien écrit la formule sous sa forme condensée ?")
189190
```
190191

191192
## Performances du classifieur

0 commit comments

Comments
 (0)