Statistique théorique et appliquée - Tome 2
Utilisation de R pour les exemples 7.4.2 et 8.4.2
| Exemple 7.4.2 |
| Exemple 8.4.2 |
par Emmanuel Nowak
Exemple 7.4.2. Comparaison de deux méthodes d'échantillonnage du sol : comparaison des variances
Il s'agit ici de comparer les teneurs en K2O obtenues à l'aide de deux méthodes. Il faut tout d'abord importer les données fournies dans le fichier 's2e07042.txt', en tenant compte qu'elles sont présentées sous la forme de deux colonnes de longueurs différentes, et diviser les données par 10 afin d'obtenir des valeurs en parts par million :
| s2e07042 <- read.table("C:/Dagnelie/st2donn/txt.2/s2e07042.txt",sep="\t",header=T,fill=T) s2e07042 <- s2e07042/10 summary(s2e07042) |
Indiv Moyen
Min. : 8.00 Min. : 9.60
1st Qu.: 9.20 1st Qu.:10.40
Median :12.60 Median :10.80
Mean :12.96 Mean :10.92
3rd Qu.:14.90 3rd Qu.:11.40
Max. :22.00 Max. :12.80
NA's :10.00
|
Etant donné les modes d'obtention des échantillons, on peut s'attendre à ce que le rapport des variances soit égal à 25. C'est l'hypothèse qui est testée ci-dessous, le résultat étant assorti d'une estimation et des limites de confiance du rapport des variances :
| attach(s2e07042) var.test(Indiv,Moyen,ratio=25) |
F test to compare two variances
data: Indiv and Moyen
F = 0.6884, num df = 19, denom df = 9, p-value = 0.4704
alternative hypothesis: true ratio of variances is not equal to 25
95 percent confidence interval:
4.672124 49.562847
sample estimates:
ratio of variances
17.20901
|
Les résultats obtenus correspondent bien à ceux du livre puisqu'il faut ici comparer 0,47 à 0,05 au lieu de comparer 0,24 (en arrondissant) à 0,025 dans le livre. Le calcul des limites de confiance effectué dans l'édition de 1998 a fait l'objet d'une correction. La valeur de F est l'inverse de celle du livre, cela n'ayant aucune incidence puisque les degrés de liberté sont également inversés.
Le problème est ici de savoir si les deux méthodes présentées dans l'exemple 7.4.2 donnent, en moyenne, des résultats identiques. Les données ont déjà été importées ci-dessus afin d'étudier le rapport des variances, qui doit être considéré comme différent de l'unité. On va donc comparer les deux moyennes à l'aide du test de Welch, qui correspond à l'option par défaut du test t de Student dans R, et déterminer les limites de confiance de leur différence :
| t.test(Indiv,Moyen) |
Welch Two Sample t-test
data: Indiv and Moyen
t = 2.1629, df = 23.017, p-value = 0.04118
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.08895913 3.99104087
sample estimates:
mean of x mean of y
12.96 10.92
|
Le test de Student, supposant les variances égales, aurait donné des résultats très différents :
| t.test(Indiv,Moyen,var.equal=T) |
Two Sample t-test
data: Indiv and Moyen
t = 1.58, df = 28, p-value = 0.1253
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.604792 4.684792
sample estimates:
mean of x mean of y
12.96 10.92
|
Avant de traiter d'autres exemples, ne pas oublier de détacher le fichier de travail :
| detach(s2e07042) |
| Haut de la page |
| Autres illustrations avec R |
Dernière mise à jour : août 2006