Skip to content

Commit 5263d88

Browse files
committed
Module 7 learnrs ready
1 parent 1ca7e9a commit 5263d88

File tree

5 files changed

+28
-22
lines changed

5 files changed

+28
-22
lines changed

DESCRIPTION

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
Package: BioDataScience1
2-
Version: 2024.6.0
2+
Version: 2024.7.0
33
Title: A Series of Learnr Documents for Biological Data Science 1
44
Description: Interactive documents using learnr and shiny applications for studying biological data science.
55
Authors@R: c(

NEWS.md

Lines changed: 4 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -1,3 +1,7 @@
1+
# BioDataScience1 2024.7.0
2+
3+
- Learnrs **A07La_distri2**, **A07Lb_chi2** and **A07Lc_chi2b** revised.
4+
15
# BioDataScience1 2024.6.0
26

37
- Learnrs **A06La_proba**, **A06Lb_distri** and **A06Lc_correlation** revised.

inst/tutorials/A07La_distri2/A07La_distri2.Rmd.inactivated renamed to inst/tutorials/A07La_distri2/A07La_distri2.Rmd

Lines changed: 9 additions & 7 deletions
Original file line numberDiff line numberDiff line change
@@ -1,10 +1,10 @@
11
---
2-
title: "Distributions discrètes"
2+
title: "Distributions (suite)"
33
author: "Guyliann Engels & Philippe Grosjean"
44
description: "**SDD I Module 7** Distributions binomiale de Poisson, log-normale et graphique quantile-quantile."
55
tutorial:
66
id: "A07La_distri2"
7-
version: 2.1.1/11
7+
version: 2.2.0/11
88
output:
99
learnr::tutorial:
1010
progressive: true
@@ -32,15 +32,17 @@ BioDataScience1::learnr_server(input, output, session)
3232

3333
Une loi de distribution statistique généralise le calcul des probabilités dans une situation bien définie. Elle permet de calculer la probabilité que des évènements se produisent d'un point de vue théorique. La distribution binomiale et celle de Poisson concernent des variables quantitatives à deux modalités, c'est-à-dire que seulement deux évènements disjoints peuvent se produire.
3434

35+
Parmi les distributions continues, la distribution log-normale est une variante de la distribution normale où les quantiles ne peuvent être que nuls ou positifs. Le graphique quantile-quantile est un outil graphique permettant de comparer la distribution d'un échantillon à une distribution théorique.
36+
3537
Ce tutoriel est une auto-évaluation de vos connaissances pour :
3638

3739
- Vérifier vos connaissances relatives à la loi de distribution des probabilités binomiale
3840

3941
- Vous assurer d'avoir bien compris la distribution de Poisson
4042

41-
- Être certain de bien comprendre le graphique quantile-quantile et l'utiliser pour décider si la distribution d'un échantillon suit une distribution normale ou log-nermale
43+
- Être certain de bien comprendre le graphique quantile-quantile et l'utiliser pour décider si la distribution d'un échantillon suit une distribution normale ou log-normale
4244

43-
Vous devez avoir étudié le contenu du [module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/proba.html) du cours SDD I, et en particulier les sections relatives à la [distribution binomiale](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/distribution-binomiale.html) et à la [distribution de Poisson](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/distribution-de-poisson.html), à la distribution log-normale et au graphique quantile-quantile. Enfin, cette matière nécessite que vous soyez à l'aise avec le calcul des probabilités, et que vous l'ayez vérifié via le tutoriel précédent `BioDataScience1::run("A06La_proba")`.
45+
Vous devez avoir étudié le contenu du [module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/districhi2.html) du cours SDD I, et en particulier les sections relatives à la [distribution binomiale](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/distribution-binomiale.html) et à la [distribution de Poisson](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/distribution-de-poisson.html), à la [distribution log-normale](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/distribution-log-normale.html) et au [graphique quantile-quantile](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/graphique-quantile-quantile.html). Enfin, cette matière nécessite que vous soyez à l'aise avec le calcul des probabilités, et que vous l'ayez vérifié via un tutoriel précédent `BioDataScience1::run("A06La_proba")`.
4446

4547
## Distribution binomiale
4648

@@ -206,7 +208,7 @@ quiz(
206208
)
207209
```
208210

209-
Utilisez R pour représentez la table de probabilités lié à l'exercice ci-dessus avec les fonctions p/q/r/d.
211+
Utilisez R pour représenter la table de probabilités liée à l'exercice ci-dessus avec les fonctions p/q/r/d.
210212

211213
<!-- 💬 **Ce code correspond au snippet `.iptable`** [`.ip` = (d)`i`stribution: `p`oisson]. -->
212214

@@ -236,7 +238,7 @@ Représentez le graphique de densité cumulée de la distribution de Poisson pou
236238

237239
<!-- 💬 **Ce code correspond au snippet `.ipdens`.** -->
238240

239-
```{r poisson2_h2, exercise = TRUE}
241+
```{r poisson2_h2, exercise=TRUE}
240242
poi <- ___(lambda = ___)
241243
___$___(___) +
242244
ylab("Densité de probabilité cumulée")
@@ -302,7 +304,7 @@ car::qqPlot(crabs[["length"]], distribution = "norm",
302304
```
303305

304306
```{r qqnorm1_h2-check}
305-
grade_code("Rappelez-vous de la syntaxe `DF$VAR` pour se référer à la variable nommée `VAR` dans le dataframe `DF`. Vous voyez ici que `length` suit une distribution normale parce que tous les points (ou quasi-tous dans d'autres situations) sont à l'intérieur de l'enveloppe de confiance à 95% représenté par les courbes en pointillés bleus.")
307+
grade_code("Rappelez-vous de la syntaxe `DF$VAR` pour se référer à la variable nommée `VAR` dans le dataframe `DF`. Vous voyez ici que `length` suit une distribution normale parce que tous les points (ou quasi-tous dans d'autres situations) sont à l'intérieur de l'enveloppe de confiance à 95% représentée par les courbes en pointillés bleus.")
306308
```
307309

308310
Est-ce que la longueur de carapace suit une distribution log-normale chez ces mêmes crabes ?

inst/tutorials/A07Lb_chi2/A07Lb_chi2.Rmd.inactivated renamed to inst/tutorials/A07Lb_chi2/A07Lb_chi2.Rmd

Lines changed: 8 additions & 8 deletions
Original file line numberDiff line numberDiff line change
@@ -35,7 +35,7 @@ La loi de distribution du $\chi^2$ représente de manière théorique la probabi
3535

3636
- Appréhender le test d'hypothèse du $\chi^2$ univarié
3737

38-
Vous devez avoir assimilé la matière du [module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/chi2.html) du cours, en particulier la [section 8.2](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/test-dhypoth%25C3%25A8se.html), et vous devez avoir compris les différentes notions vue au [module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/proba.html) relatives au calcul de probabilités et aux lois de distribution statistiques. Ce learnr vous sert à auto-évaluer vos acquis relatifs à la distribution $\chi^2$ et au test $\chi^2$ univarié.
38+
Vous devez avoir assimilé la matière du [module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/districhi2.html) du cours, en particulier la [section 7.5](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/chi2.html), et vous devez avoir compris les différentes notions vues au [module 6](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/probacorr.html) relatives au calcul de probabilités et aux lois de distribution statistiques. Ce learnr vous sert à autoévaluer vos acquis relatifs à la distribution $\chi^2$ et au test $\chi^2$ univarié.
3939

4040
## Distribution du $\chi^2$
4141

@@ -158,7 +158,7 @@ Donc, pour notre expérience de préférences alimentaires des chimpanzés, nous
158158
knitr::kable(chimp)
159159
```
160160

161-
Or, sous H~0~ de non préférences alimentaires, nous nous attendions à observer à peu près le même nombre de premiers choix pour chaque fruit. Ces écarts sont-ils révélateurs de préférences marquées, ou peuvent-il être obtenus par le hasard ? Pour le vérifier, nous avions calculé la valeur du $\chi^2_{obs}$ comme étant 7.601.
161+
Or, sous H~0~ de non-préférences alimentaires, nous nous attendions à observer à peu près le même nombre de premiers choix pour chaque fruit. Ces écarts sont-ils révélateurs de préférences marquées, ou peuvent-il être obtenus par le hasard ? Pour le vérifier, nous avions calculé la valeur du $\chi^2_{obs}$ comme étant 7.601.
162162

163163
Cette valeur doit maintenant être confrontée à la distribution théorique du $\chi^2$ à deux degrés de liberté (nombre de niveaux de la variable qualitative `fruit` moins un, donc ici (3 - 1) = 2) représentée ci-dessous.
164164

@@ -199,15 +199,15 @@ pchisq(7.601, df = 2, lower.tail = FALSE)
199199
grade_code("Cette probabilité est appelée valeur P du test d'hypothèse.")
200200
```
201201

202-
Pour tirer une conclusion avec le **test d'hypothèse** du $\chi^2$ univarié, vous comparez la valeur *P* ainsi obtenue au seuil $\alpha$ que vous avez fixé préalablement (choix réalisé *avant* de faire le test pour ne pas être influencé par le résultat). Souvent, on prend $\alpha$ = 5% en biologie. Les hypothèse (H~0~ = hypothèse nulle et H~1~ ou H~A~ = hypothèse alternative) du test $\chi^2$ univarié sont :
202+
Pour tirer une conclusion avec le **test d'hypothèse** du $\chi^2$ univarié, vous comparez la valeur *P* ainsi obtenue au seuil $\alpha$ que vous avez fixé préalablement (choix réalisé *avant* de faire le test pour ne pas être influencé par le résultat). Souvent, on prend $\alpha$ = 5% en biologie. Les hypothèses (H~0~ = hypothèse nulle et H~1~ ou H~A~ = hypothèse alternative) du test $\chi^2$ univarié sont :
203203

204204
- H~0~ : $a_i = \alpha_i$ pour tout $i$
205205
- H~1~ : $a_i \neq \alpha_i$ pour au moins un $i$
206206

207207
Les règles pour décider si nous rejetons ou non H~0~ sont :
208208

209-
- Valeur *P* \< $\alpha$ =\> rejet de H~0~
210-
- Valeur *P* ≥ $\alpha$ =\> non rejet de H~0~
209+
- Valeur *p* \< $\alpha$ =\> rejet de H~0~
210+
- Valeur *p* ≥ $\alpha$ =\> non rejet de H~0~
211211

212212
Sur base de tout ceci, tirez des conclusions concernant l'expérience de préférence alimentaire chez le chimpanzé.
213213

@@ -302,13 +302,13 @@ chisq.test(chimp2, p = c(Pomme = 1/3, Banane = 1/3, Orange = 1/3), rescale.p = F
302302
```
303303

304304
```{r chi_test2_h3-check}
305-
grade_code("Le valeur du chi^2^obs est beaucoup plus grande ici et la valeur P est plus petite.")
305+
grade_code("La valeur du chi^2 obs est beaucoup plus grande ici et la valeur *p* est plus petite.")
306306
```
307307

308-
Plus l'échantillon a une taille *N* importante, plus nous avons des données à disposition et nous pourrons donc rejeter H~0~ si elle est fausse même si l'écart entre les $a_i$ et les $\alpha_i$ est très petit. Par contre, si cet écart est très grand, un plus petit nombre d'observations suffira pour rejeter H~0~. A cause de cet effet de *N*, nous ne dirons *jamais* que nous **acceptons** H~1~, mais nous dirons que nous **ne rejetons pas H~0~**. Car, dans cette situation, deux cas sont possibles :
308+
Plus l'échantillon a une taille *N* importante, plus nous avons des données à disposition et nous pourrons donc rejeter H~0~ si elle est fausse même si l'écart entre les $a_i$ et les $\alpha_i$ est très petit. Par contre, si cet écart est très grand, un plus petit nombre d'observations suffira pour rejeter H~0~. À cause de cet effet de *N*, nous ne dirons *jamais* que nous **acceptons** H~1~, mais nous dirons que nous **ne rejetons pas H~0~**. Car, dans cette situation, deux cas sont possibles :
309309

310310
1. H~0~ est effectivement vraie
311-
2. H~0~ est fausse mais *N* est trop petit pour détecter l'écart entre les fréquences observées et théorique (relativement faible)
311+
2. H~0~ est fausse mais *N* est trop petit pour détecter l'écart entre les fréquences observées et théoriques (relativement faible)
312312

313313
A l'inverse, lorsque l'on travaille avec une taille d'échantillon *N* extrêmement grande, on peut être amené à rejeter H~0~ pour des écarts entre $a_i$ et $\alpha_i$ tellement faibles qu'ils ne signifient plus rien, biologiquement parlant. **C'est pour cette raison qu'il faut toujours comparer les fréquences observées et les fréquences théoriques en cas de rejet de H~0~**, afin de se faire une idée de l'**amplitude des écarts** et des niveaux qu'ils concernent.
314314

inst/tutorials/A07Lc_chi2b/A07Lc_chi2b.Rmd.inactivated renamed to inst/tutorials/A07Lc_chi2b/A07Lc_chi2b.Rmd

Lines changed: 6 additions & 6 deletions
Original file line numberDiff line numberDiff line change
@@ -35,7 +35,7 @@ La loi de distribution du $\chi^2$ peut être utilisée pour étudier si des dé
3535

3636
- Interpréter correctement un tel test
3737

38-
Vous devez avoir assimilé la matière du [module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/chi2.html) du cours, en particulier la [section 7.2](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/test-dhypoth%25C3%25A8se.html). Vous devez avoir réalisé le tutoriel `BioDataScience1::run("A07Lb_chi2")` préalablement. Ce learnr vous sert à auto-évaluer vos acquis relatifs au test $\chi^2$ d'indépendance.
38+
Vous devez avoir assimilé la matière du [module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/districhi2.html) du cours, en particulier la [section 7.5](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/chi2.html). Vous devez avoir réalisé le tutoriel `BioDataScience1::run("A07Lb_chi2")` préalablement. Ce learnr vous sert à autoévaluer vos acquis relatifs au test $\chi^2$ d'indépendance.
3939

4040
## Fumeurs
4141

@@ -142,12 +142,12 @@ quiz(
142142
allow_retry = TRUE,
143143
incorrect = "Recommencez afin de trouver la bonne réponse",
144144
correct = "Oui, ici nous pouvons rejeter H0 au seuil alpha de 5%."),
145-
question("Toujours au seuil alpha de 5%, y-a-t'il dépendance ou indépendance des deux variables ?",
145+
question("Toujours au seuil alpha de 5%, y a-t-il dépendance ou indépendance des deux variables ?",
146146
answer("Dépendance des deux variables", correct = TRUE),
147147
answer("Indépendance des deux variables"),
148148
allow_retry = TRUE,
149149
incorrect = "Recommencez afin de trouver la bonne réponse",
150-
correct = "Très bien. Lorsque vous rejetez H0, cela signifie ici dépendance entre le genre et la prévalence du tabagisme chez ces adolescents, en l'occurence, les garçons ont plus tendance à fumer que les filles (vous comparez les fréquences observées par rapport aux fréquences attendues sous H0 pour le déduire).")
150+
correct = "Très bien. Lorsque vous rejetez H0, cela signifie ici dépendance entre le genre et la prévalence du tabagisme chez ces adolescents, en l'occurrence, les garçons ont plus tendance à fumer que les filles (vous comparez les fréquences observées par rapport aux fréquences attendues sous H0 pour le déduire).")
151151
)
152152
```
153153

@@ -219,7 +219,7 @@ chart(usa, aes(long, lat, group = group)) +
219219
coord_quickmap()
220220
```
221221

222-
Voici les résultats de cette étude sur un échantillon aléatoire de la population (notez l'utilisation de `xtabs()` ici en avant dernière ligne pour créer le tableau de contingence à double entrée à partir des fréquences.
222+
Voici les résultats de cette étude sur un échantillon aléatoire de la population (notez l'utilisation de `xtabs()` ici en avant-dernière ligne pour créer le tableau de contingence à double entrée à partir des fréquences.
223223

224224
<!-- et qui correspond au snippet `.ectable2f`) : -->
225225

@@ -236,7 +236,7 @@ knitr::kable(blood_table)
236236

237237
Les distributions des groupes sanguins sont-elles identiques dans les trois états étudiés ?
238238

239-
Avant de réalisez votre test $\chi^2$ d'indépendance avec R, veuillez indiquer le nombre de degré de liberté de la distribution $\chi^2$ théorique associée.
239+
Avant de réalisez votre test $\chi^2$ d'indépendance avec R, veuillez indiquer le nombre de degrés de liberté de la distribution $\chi^2$ théorique associée.
240240

241241
```{r qu_ddl}
242242
question("Nombre de degré de liberté de la distribution du $\\chi^2$.",
@@ -304,7 +304,7 @@ quiz(
304304

305305
## Conclusion
306306

307-
A l'issue de cette série d'exercices, vous devriez être à l'aise avec l'utilisation de la distribution du $\chi^2$ et de ses tests d'hypothèse univarié et d'indépendance. Vous pouvez maintenant passer à des applications concrètes (projets GitHub).
307+
À l'issue de cette série d'exercices, vous devriez être à l'aise avec l'utilisation de la distribution du $\chi^2$ et de ses tests d'hypothèse univarié et d'indépendance. Vous pouvez maintenant passer à des applications concrètes (projets GitHub).
308308

309309
```{r comm_noscore, echo=FALSE}
310310
question_text(

0 commit comments

Comments
 (0)