Statistique théorique et appliquée - Tome 2
Utilisation de R pour les exemples 7.4.1 et 8.4.1
| Exemple 7.4.1 |
| Exemple 8.4.1 |
par Emmanuel Nowak
Il s'agit ici d'étudier les hauteurs des arbres observés dans les deux premiers types de hêtraies de l'exemple 2.3.1. Il faut tout d'abord importer les données fournies dans le fichier 's2e02031.txt', puis diviser les données par 10 afin d'obtenir des valeurs en mètres, supprimer les données correspondant au troisième type et, pour être rigoureux mais ce n'est pas indispensable, déclarer la variable 'Types' comme facteur :
| s2e02031 <- read.table("C:/Dagnelie/st2donn/txt.2/s2e02031.txt",sep="\t",header=T) s2e02031$Haut <- s2e02031$Haut/10 s2e07041 <- s2e02031[s2e02031$Types!=3,] s2e07041$Types <- factor(s2e07041$Types) summary(s2e07041) |
Types Haut
1:13 Min. :22.50
2:14 1st Qu.:24.45
Median :26.20
Mean :25.67
3rd Qu.:26.85
Max. :28.50
|
La normalité et l'absence d'observations aberrantes ayant été vérifiées (exemples 3.3.1, 3.3.3, 3.4.1 et 3.5.1), on peut réaliser le test de Fisher permettant de comparer la variance des hauteurs dans les deux types de hêtraies :
| attach(s2e07041) var.test(Haut~Types)$p.value |
[1] 0.3647079 |
Le résultat obtenu correspond bien à celui du livre puisqu'il faut ici comparer 0,36 à 0,05 au lieu de comparer 0,18 à 0,025 dans le livre.
Le problème traité ici est la comparaison des hauteurs d'arbres moyennes dans les deux premiers types de hêtraies de l'exemple 2.3.1. Les données ont déjà été importées pour l'exemple 7.4.1 ci-dessus, afin de tester l'hypothèse d'égalité des variances. La normalité et l'absence d'observations aberrantes ont fait l'objet des exemples 3.3.1, 3.3.3, 3.4.1 et 3.5.1. On peut alors effectuer la comparaison des deux moyennes à l'aide du test t de Student avec variances supposées égales, et déterminer les limites de confiance de leur différence :
| t.test(Haut~Types,var.equal=T) |
Two Sample t-test
data: Haut by Types
t = 0.9542, df = 25, p-value = 0.3491
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.6759945 1.8430275
sample estimates:
mean in group 1 mean in group 2
25.96923 25.38571
|
Le test de Welch, qui ne suppose pas que les variances sont égales et qui constitue l'option par défaut dans R, aurait donné des résultats très proches :
| t.test(Haut~Types) |
Welch Two Sample t-test
data: Haut by Types
t = 0.9638, df = 24.168, p-value = 0.3447
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.6656157 1.8326487
sample estimates:
mean in group 1 mean in group 2
25.96923 25.38571
|
Avant de traiter d'autres exemples, ne pas oublier de détacher le fichier de travail :
| detach(s2e07041) |
| Haut de la page |
| Autres illustrations avec R |
Dernière mise à jour : août 2006