Statistique théorique et appliquée - Tome 2
Utilisation de R pour les exemples 5.4.1, 5.4.2 et 5.4.4 (édition 1998)
| Exemple 5.4.1 |
| Exemple 5.4.2 |
| Exemple 5.4.4 |
par Emmanuel Nowak
Le but est de comparer la sensibilité de deux races à une maladie donnée : la trypanosomiase. Les bêtes infectées et non infectées ont été dénombrées dans chacun des deux groupes, à l'issue d'une même période d'élevage.
Pour un test bilatéral, le logiciel R utilise une autre méthode que celle présentée dans le livre. Il permet de calculer les probabilités d'occurrence, quand l'hypothèse nulle est vraie, des différentes répartitions possibles, et de sommer toutes celles qui sont inférieures ou égales à la probabilité de la répartition réellement observée :
| tableau <- matrix(c(14,0,5,31),ncol=2) fisher.test(tableau)$p.value |
[1] 1.239863e-08 |
Le degré de signification pour un test bilatéral vaut donc exactement p = 0,000000012 à comparer à α = 0,05. Cette valeur de p est la même que pour le test unilatéral du fait de la dissymétrie de la loi hypergéométrique utilisée ainsi que de sa discontinuité.
La méthode présentée dans le livre consiste, pour un test bilatéral, à calculer le degré de signification pour le test unilatéral adéquat et à le comparer à α/2 = 0,025. Cela revient à le multiplier par deux et à le comparer à α = 0,05. Cette façon de faire peut conduire à un degré de signification jusqu'à deux fois trop grand, ce qui est le cas ici, d'où la controverse mentionnée dans le livre.
Le test approché, appliqué aux données de l'exemple 5.4.1, peut être réalisé avec ou sans correction de continuité. L'option par défaut de R est d'utiliser la correction de Yates :
| tableau <- matrix(c(14,0,5,31),ncol=2) prop.test(tableau)$p.value |
[1] 1.108014e-07 |
Sans correction de continuité, on obtient :
| prop.test(tableau,correct=F)$p.value |
[1] 1.776076e-08 |
Ce dernier résultat correspond au test présenté dans le livre.
Remarque: un message d'avertissement se serait affiché si le produit des deux effectifs marginaux les plus petits n'était pas au moins cinq fois plus grand que l'effectif total (approximation normale non satisfaisante dans ce cas).
Il faut être attentif ici à la disposition des données à l'intérieur du tableau de contingence : le logiciel considère en effet que les fréquences de succès et d'Èchec se trouvent en colonnes.
| tableau <- matrix(c(14,0,5,31),ncol=2) tableau |
[,1] [,2] [1,] 14 5 [2,] 0 31 |
Par défaut, le logiciel utilise une correction de continuité pour calculer les limites de confiance de la différence :
| prop.test(tableau) |
2-sample test for equality of proportions with continuity correction data: tableau X-squared = 28.1754, df = 1, p-value = 1.108e-07 alternative hypothesis: two.sided 95 percent confidence interval: 0.4963966 0.9772876 sample estimates: prop 1 prop 2 0.7368421 0.0000000 |
Les limites de confiance ainsi obtenues sont 0,50 et 0,98.
Sans correction de continuité, on retrouve les résultats du livre :
| prop.test(tableau,correct=F)$conf.int |
[1] 0.5388414 0.9348428 |
| Haut de la page |
| Autres illustrations avec R |
Dernière mise à jour : juin 2006