You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Une loi de distribution statistique généralise le calcul des probabilités dans une situation bien définie. Elle permet de calculer la probabilité que des évènements se produisent d'un point de vue théorique. La distribution binomiale et celle de Poisson concernent des variables quantitatives à deux modalités, c'est-à-dire que seulement deux évènements disjoints peuvent se produire.
34
34
35
+
Parmi les distributions continues, la distribution log-normale est une variante de la distribution normale où les quantiles ne peuvent être que nuls ou positifs. Le graphique quantile-quantile est un outil graphique permettant de comparer la distribution d'un échantillon à une distribution théorique.
36
+
35
37
Ce tutoriel est une auto-évaluation de vos connaissances pour :
36
38
37
39
- Vérifier vos connaissances relatives à la loi de distribution des probabilités binomiale
38
40
39
41
- Vous assurer d'avoir bien compris la distribution de Poisson
40
42
41
-
- Être certain de bien comprendre le graphique quantile-quantile et l'utiliser pour décider si la distribution d'un échantillon suit une distribution normale ou log-nermale
43
+
- Être certain de bien comprendre le graphique quantile-quantile et l'utiliser pour décider si la distribution d'un échantillon suit une distribution normale ou log-normale
42
44
43
-
Vous devez avoir étudié le contenu du [module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/proba.html) du cours SDD I, et en particulier les sections relatives à la [distribution binomiale](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/distribution-binomiale.html) et à la [distribution de Poisson](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/distribution-de-poisson.html), à la distribution log-normale et au graphique quantile-quantile. Enfin, cette matière nécessite que vous soyez à l'aise avec le calcul des probabilités, et que vous l'ayez vérifié via le tutoriel précédent `BioDataScience1::run("A06La_proba")`.
45
+
Vous devez avoir étudié le contenu du [module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/districhi2.html) du cours SDD I, et en particulier les sections relatives à la [distribution binomiale](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/distribution-binomiale.html) et à la [distribution de Poisson](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/distribution-de-poisson.html), à la [distribution log-normale](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/distribution-log-normale.html) et au [graphique quantile-quantile](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/graphique-quantile-quantile.html). Enfin, cette matière nécessite que vous soyez à l'aise avec le calcul des probabilités, et que vous l'ayez vérifié via un tutoriel précédent `BioDataScience1::run("A06La_proba")`.
44
46
45
47
## Distribution binomiale
46
48
@@ -206,7 +208,7 @@ quiz(
206
208
)
207
209
```
208
210
209
-
Utilisez R pour représentez la table de probabilités lié à l'exercice ci-dessus avec les fonctions p/q/r/d.
211
+
Utilisez R pour représenter la table de probabilités liée à l'exercice ci-dessus avec les fonctions p/q/r/d.
@@ -236,7 +238,7 @@ Représentez le graphique de densité cumulée de la distribution de Poisson pou
236
238
237
239
<!-- 💬 **Ce code correspond au snippet `.ipdens`.** -->
238
240
239
-
```{r poisson2_h2, exercise = TRUE}
241
+
```{r poisson2_h2, exercise=TRUE}
240
242
poi <- ___(lambda = ___)
241
243
___$___(___) +
242
244
ylab("Densité de probabilité cumulée")
@@ -302,7 +304,7 @@ car::qqPlot(crabs[["length"]], distribution = "norm",
302
304
```
303
305
304
306
```{r qqnorm1_h2-check}
305
-
grade_code("Rappelez-vous de la syntaxe `DF$VAR` pour se référer à la variable nommée `VAR` dans le dataframe `DF`. Vous voyez ici que `length` suit une distribution normale parce que tous les points (ou quasi-tous dans d'autres situations) sont à l'intérieur de l'enveloppe de confiance à 95% représenté par les courbes en pointillés bleus.")
307
+
grade_code("Rappelez-vous de la syntaxe `DF$VAR` pour se référer à la variable nommée `VAR` dans le dataframe `DF`. Vous voyez ici que `length` suit une distribution normale parce que tous les points (ou quasi-tous dans d'autres situations) sont à l'intérieur de l'enveloppe de confiance à 95% représentée par les courbes en pointillés bleus.")
306
308
```
307
309
308
310
Est-ce que la longueur de carapace suit une distribution log-normale chez ces mêmes crabes ?
Copy file name to clipboardExpand all lines: inst/tutorials/A07Lb_chi2/A07Lb_chi2.Rmd
+8-8Lines changed: 8 additions & 8 deletions
Original file line number
Diff line number
Diff line change
@@ -35,7 +35,7 @@ La loi de distribution du $\chi^2$ représente de manière théorique la probabi
35
35
36
36
- Appréhender le test d'hypothèse du $\chi^2$ univarié
37
37
38
-
Vous devez avoir assimilé la matière du [module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/chi2.html) du cours, en particulier la [section 8.2](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/test-dhypoth%25C3%25A8se.html), et vous devez avoir compris les différentes notions vue au [module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/proba.html) relatives au calcul de probabilités et aux lois de distribution statistiques. Ce learnr vous sert à auto-évaluer vos acquis relatifs à la distribution $\chi^2$ et au test $\chi^2$ univarié.
38
+
Vous devez avoir assimilé la matière du [module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/districhi2.html) du cours, en particulier la [section 7.5](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/chi2.html), et vous devez avoir compris les différentes notions vues au [module 6](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/probacorr.html) relatives au calcul de probabilités et aux lois de distribution statistiques. Ce learnr vous sert à autoévaluer vos acquis relatifs à la distribution $\chi^2$ et au test $\chi^2$ univarié.
39
39
40
40
## Distribution du $\chi^2$
41
41
@@ -158,7 +158,7 @@ Donc, pour notre expérience de préférences alimentaires des chimpanzés, nous
158
158
knitr::kable(chimp)
159
159
```
160
160
161
-
Or, sous H~0~ de nonpréférences alimentaires, nous nous attendions à observer à peu près le même nombre de premiers choix pour chaque fruit. Ces écarts sont-ils révélateurs de préférences marquées, ou peuvent-il être obtenus par le hasard ? Pour le vérifier, nous avions calculé la valeur du $\chi^2_{obs}$ comme étant 7.601.
161
+
Or, sous H~0~ de non-préférences alimentaires, nous nous attendions à observer à peu près le même nombre de premiers choix pour chaque fruit. Ces écarts sont-ils révélateurs de préférences marquées, ou peuvent-il être obtenus par le hasard ? Pour le vérifier, nous avions calculé la valeur du $\chi^2_{obs}$ comme étant 7.601.
162
162
163
163
Cette valeur doit maintenant être confrontée à la distribution théorique du $\chi^2$ à deux degrés de liberté (nombre de niveaux de la variable qualitative `fruit` moins un, donc ici (3 - 1) = 2) représentée ci-dessous.
grade_code("Cette probabilité est appelée valeur P du test d'hypothèse.")
200
200
```
201
201
202
-
Pour tirer une conclusion avec le **test d'hypothèse** du $\chi^2$ univarié, vous comparez la valeur *P* ainsi obtenue au seuil $\alpha$ que vous avez fixé préalablement (choix réalisé *avant* de faire le test pour ne pas être influencé par le résultat). Souvent, on prend $\alpha$ = 5% en biologie. Les hypothèse (H~0~ = hypothèse nulle et H~1~ ou H~A~ = hypothèse alternative) du test $\chi^2$ univarié sont :
202
+
Pour tirer une conclusion avec le **test d'hypothèse** du $\chi^2$ univarié, vous comparez la valeur *P* ainsi obtenue au seuil $\alpha$ que vous avez fixé préalablement (choix réalisé *avant* de faire le test pour ne pas être influencé par le résultat). Souvent, on prend $\alpha$ = 5% en biologie. Les hypothèses (H~0~ = hypothèse nulle et H~1~ ou H~A~ = hypothèse alternative) du test $\chi^2$ univarié sont :
203
203
204
204
- H~0~ : $a_i = \alpha_i$ pour tout $i$
205
205
- H~1~ : $a_i \neq \alpha_i$ pour au moins un $i$
206
206
207
207
Les règles pour décider si nous rejetons ou non H~0~ sont :
208
208
209
-
- Valeur *P* \< $\alpha$ =\> rejet de H~0~
210
-
- Valeur *P* ≥ $\alpha$ =\> non rejet de H~0~
209
+
- Valeur *p*\< $\alpha$ =\> rejet de H~0~
210
+
- Valeur *p* ≥ $\alpha$ =\> non rejet de H~0~
211
211
212
212
Sur base de tout ceci, tirez des conclusions concernant l'expérience de préférence alimentaire chez le chimpanzé.
213
213
@@ -302,13 +302,13 @@ chisq.test(chimp2, p = c(Pomme = 1/3, Banane = 1/3, Orange = 1/3), rescale.p = F
302
302
```
303
303
304
304
```{r chi_test2_h3-check}
305
-
grade_code("Le valeur du chi^2^obs est beaucoup plus grande ici et la valeur P est plus petite.")
305
+
grade_code("La valeur du chi^2obs est beaucoup plus grande ici et la valeur *p* est plus petite.")
306
306
```
307
307
308
-
Plus l'échantillon a une taille *N* importante, plus nous avons des données à disposition et nous pourrons donc rejeter H~0~ si elle est fausse même si l'écart entre les $a_i$ et les $\alpha_i$ est très petit. Par contre, si cet écart est très grand, un plus petit nombre d'observations suffira pour rejeter H~0~. A cause de cet effet de *N*, nous ne dirons *jamais* que nous **acceptons** H~1~, mais nous dirons que nous **ne rejetons pas H~0~**. Car, dans cette situation, deux cas sont possibles :
308
+
Plus l'échantillon a une taille *N* importante, plus nous avons des données à disposition et nous pourrons donc rejeter H~0~ si elle est fausse même si l'écart entre les $a_i$ et les $\alpha_i$ est très petit. Par contre, si cet écart est très grand, un plus petit nombre d'observations suffira pour rejeter H~0~. À cause de cet effet de *N*, nous ne dirons *jamais* que nous **acceptons** H~1~, mais nous dirons que nous **ne rejetons pas H~0~**. Car, dans cette situation, deux cas sont possibles :
309
309
310
310
1. H~0~ est effectivement vraie
311
-
2. H~0~ est fausse mais *N* est trop petit pour détecter l'écart entre les fréquences observées et théorique (relativement faible)
311
+
2. H~0~ est fausse mais *N* est trop petit pour détecter l'écart entre les fréquences observées et théoriques (relativement faible)
312
312
313
313
A l'inverse, lorsque l'on travaille avec une taille d'échantillon *N* extrêmement grande, on peut être amené à rejeter H~0~ pour des écarts entre $a_i$ et $\alpha_i$ tellement faibles qu'ils ne signifient plus rien, biologiquement parlant. **C'est pour cette raison qu'il faut toujours comparer les fréquences observées et les fréquences théoriques en cas de rejet de H~0~**, afin de se faire une idée de l'**amplitude des écarts** et des niveaux qu'ils concernent.
Copy file name to clipboardExpand all lines: inst/tutorials/A07Lc_chi2b/A07Lc_chi2b.Rmd
+6-6Lines changed: 6 additions & 6 deletions
Original file line number
Diff line number
Diff line change
@@ -35,7 +35,7 @@ La loi de distribution du $\chi^2$ peut être utilisée pour étudier si des dé
35
35
36
36
- Interpréter correctement un tel test
37
37
38
-
Vous devez avoir assimilé la matière du [module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/chi2.html) du cours, en particulier la [section 7.2](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/test-dhypoth%25C3%25A8se.html). Vous devez avoir réalisé le tutoriel `BioDataScience1::run("A07Lb_chi2")` préalablement. Ce learnr vous sert à auto-évaluer vos acquis relatifs au test $\chi^2$ d'indépendance.
38
+
Vous devez avoir assimilé la matière du [module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/districhi2.html) du cours, en particulier la [section 7.5](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/chi2.html). Vous devez avoir réalisé le tutoriel `BioDataScience1::run("A07Lb_chi2")` préalablement. Ce learnr vous sert à autoévaluer vos acquis relatifs au test $\chi^2$ d'indépendance.
39
39
40
40
## Fumeurs
41
41
@@ -142,12 +142,12 @@ quiz(
142
142
allow_retry = TRUE,
143
143
incorrect = "Recommencez afin de trouver la bonne réponse",
144
144
correct = "Oui, ici nous pouvons rejeter H0 au seuil alpha de 5%."),
145
-
question("Toujours au seuil alpha de 5%, y-a-t'il dépendance ou indépendance des deux variables ?",
145
+
question("Toujours au seuil alpha de 5%, ya-t-il dépendance ou indépendance des deux variables ?",
146
146
answer("Dépendance des deux variables", correct = TRUE),
147
147
answer("Indépendance des deux variables"),
148
148
allow_retry = TRUE,
149
149
incorrect = "Recommencez afin de trouver la bonne réponse",
150
-
correct = "Très bien. Lorsque vous rejetez H0, cela signifie ici dépendance entre le genre et la prévalence du tabagisme chez ces adolescents, en l'occurence, les garçons ont plus tendance à fumer que les filles (vous comparez les fréquences observées par rapport aux fréquences attendues sous H0 pour le déduire).")
150
+
correct = "Très bien. Lorsque vous rejetez H0, cela signifie ici dépendance entre le genre et la prévalence du tabagisme chez ces adolescents, en l'occurrence, les garçons ont plus tendance à fumer que les filles (vous comparez les fréquences observées par rapport aux fréquences attendues sous H0 pour le déduire).")
151
151
)
152
152
```
153
153
@@ -219,7 +219,7 @@ chart(usa, aes(long, lat, group = group)) +
219
219
coord_quickmap()
220
220
```
221
221
222
-
Voici les résultats de cette étude sur un échantillon aléatoire de la population (notez l'utilisation de `xtabs()` ici en avantdernière ligne pour créer le tableau de contingence à double entrée à partir des fréquences.
222
+
Voici les résultats de cette étude sur un échantillon aléatoire de la population (notez l'utilisation de `xtabs()` ici en avant-dernière ligne pour créer le tableau de contingence à double entrée à partir des fréquences.
223
223
224
224
<!-- et qui correspond au snippet `.ectable2f`) : -->
225
225
@@ -236,7 +236,7 @@ knitr::kable(blood_table)
236
236
237
237
Les distributions des groupes sanguins sont-elles identiques dans les trois états étudiés ?
238
238
239
-
Avant de réalisez votre test $\chi^2$ d'indépendance avec R, veuillez indiquer le nombre de degré de liberté de la distribution $\chi^2$ théorique associée.
239
+
Avant de réalisez votre test $\chi^2$ d'indépendance avec R, veuillez indiquer le nombre de degrés de liberté de la distribution $\chi^2$ théorique associée.
240
240
241
241
```{r qu_ddl}
242
242
question("Nombre de degré de liberté de la distribution du $\\chi^2$.",
@@ -304,7 +304,7 @@ quiz(
304
304
305
305
## Conclusion
306
306
307
-
A l'issue de cette série d'exercices, vous devriez être à l'aise avec l'utilisation de la distribution du $\chi^2$ et de ses tests d'hypothèse univarié et d'indépendance. Vous pouvez maintenant passer à des applications concrètes (projets GitHub).
307
+
À l'issue de cette série d'exercices, vous devriez être à l'aise avec l'utilisation de la distribution du $\chi^2$ et de ses tests d'hypothèse univarié et d'indépendance. Vous pouvez maintenant passer à des applications concrètes (projets GitHub).
0 commit comments