LCDP-Mathématiques appliquées, jeudi 16 décembre 2010.
Mise à jour: dimanche 23 janvier 2011
Selon les résultats du premier tour publiés par le CEP le 7 décembre 2010, malgré le faible écart de 6845 voix qui sépare les candidats Jude Célestin et Michel Martelly, classés deuxième et troisième respectivement, loin derrière la candidate Mirlande Manigat, classée première, la statistique mathématique ne permet pas de considérer que les candidats Célestin et Martelly soient à égalité.
Aux élections présidentielles 2010, le nombre d’électeurs potentiels est, selon le CEP, estimé à 4 712 693. C’est la taille de la population considérée dans cet article. Nous la désignerons par N.
Au premier tour des élections réalisé le 28 novembre 2010, selon les données du CEP, 1 074 056 électeurs ont voté pour les 19 candidats à la présidence. Ces électeurs constituent un échantillon de taille n = 1 074 056 tiré au hasard de la population de taille N. Le taux de participation s’est donc établi à environ 23%.
Les trois candidats arrivant en tête et se démarquant des 16 autres, sont :
- Mirlande Manigat, 1ère, avec X1= 336 878 voix, ou en proportion p1 = X1/n = 0,3137.
- Jude Célestin, 2eme, avec X2 = 241 462 voix, ou en proportion p2 = X2/n = 0,2248.
- Michel Martelly, 3eme, avec X3 = 234 617, ou en proportion p3 = X3/n = 0,2184.
Soient P1, P2, P3 les proportions réelles (nombres inconnus qui le resteront à jamais, du point de vue de la statistique) des électeurs qui auraient voté pour Mirlande Manigat, Jude Célestin et Michel Martelly, respectivement, si toute la population de taille N = 4,7 millions avait voté le 28 novembre 2010.
Les proportions inconnues P1, P2 et P3 sont des paramètres (fixes, le jour du scrutin, et inconnus). Les quantités p1, p2 et p3, estimateurs de P1, P2 et P3, suivent des lois binomiales, comme les quantités X1, X2 et X3 qui ont servis à les définir.
Le candidat Michel Martelly étant classé troisième au premier tour n’est pas admis à concourir au deuxième tour des élections présidentielles. Il proteste en dénonçant les fraudes qui ont été commises le jour du scrutin par les partisans du candidat du pouvoir Jude Célestin, apparemment moins populaire que lui à travers le pays.
De plus, l’écart entre Martelly et Célestin est de 6 845 voix, soit 0,64%.
Les partisans de Michel Martelly ont protesté pendant plusieurs jours contre l’élimination de leur candidat par le CEP, obéissant selon eux aux ordres du pouvoir. Michel Martelly, selon ses partisans, aurait dû terminer 2eme, au premier tour, devant le candidat du pouvoir Jude Célestin.
Sous les pressions de la Rue et des pays amis d'Haïti, le CEP a accepté de procéder à un recomptage des voix pour les trois candidats qui sont arrivés en tête du classement.
Le recomptage des voix déterminera quel est le candidat qui ira au second tour en face de la favorite, Mirlande Manigat, le 16 janvier 2010.
En attendant, plusieurs secteurs suggèrent que le second tour soit organisé avec les trois premiers candidats : Manigat, Martelly et Célestin, considérant que l’écart entre Célestin et Martelly est tellement faible que l’on peut les considérer comme ex aequo. La France est pour un second tour à trois.
Selon Madame Mirlande Manigat, constitutionnaliste, le second tour à trois est inconstitutionnel, même si la loi électorale le permet, car la loi électorale ne peut être au-dessus de la Constitution.
Martelly et Célestin sont-ils vraiment à égalité ?
Du point de vue de la statistique mathématique, peut-on dire que les deux candidats Martelly et Célestin sont à égalité sur la base des résultats publiés le 7 décembre (avant recomptage)?
En d’autres termes, sur la base des résultats du premier tour publiés le 7 décembre 2010, et moyennant un niveau de confiance acceptable (95%, 99%, 99,9%, ou 99.99%), peut-on accepter pour vraie l’hypothèse nulle :
H0 : P2 = P3
Et rejeter l’hypothèse alternative :
H1 : P2 ≠ P3 ?
Nous allons voir que, quel que soit le choix du niveau de confiance parmi ceux mentionnés ci-dessus, l’hypothèse nulle H0 : P2 = P3 est rejetée. Par conséquent on devrait accepter l’hypothèse alternative H1 : P2 ≠ P3.
Sur la base de ces calculs, Michel Martelly devrait donc être écarté du second tour.
Montrons que l’hypothèse H0 : P2 = P3 est fausse.
L’échantillon de taille n peut être considéré comme tiré aléatoirement de la population de taille N. La taille de l’échantillon aléatoire étant grand, on peut supposer que les estimateurs p1, p2 et p3 suivent approximativement la loi normale. Les variables X2 et X3 (nombre d'électeurs ayant voté pour Célestin et Martelly respectivement) sont tirées du même échantillon qui lui-même provient de la même population. Dans le cas qui nous intéresse ici, la comparaison de P2 et P3, les variables X2 et X3 sont tirées du même échantillon taille n provenant de la même population de taille N. Les variables X2 et X3 ne sont donc pas indépendantes et leur covariance n'est pas nulle. Nous en tiendrons compte ici en utilisant le test d'hypothèse de l'égalité des deux proportions P2 et P3 tirées de la même population.
Lorsque les paramètres P2 et P3 sont associés à deux populations différentes, leurs estimateurs p2 et p3 sont des variables aléatoires indépendantes et la variance de leur différence (p2-p3) est égale à la somme des variances de p2 et de p3, soit:
Var(p2-p3) = p2(1-p2)/n2 + p3(1-p3)/n3, n2 et n3 étant les tailles des échantillons d'où proviennent p2 et p3 respectivement.
Lorsque les paramètres P2 et P3 sont associés à la même population, leurs estimateurs p2 et p3 provenant d'un même échantillon de taille n tiré de la population, ne sont pas des variables aléatoires indépendantes et la variance de leur différence (p2-p3) est (voir par exemple, Kish(1965), Scott et Seber(1983)):
Var(p2-p3) = [p2 + p3 - (p2 - p3)^2]/n, avec p^2 = pxp (et dans le cas qui nous occupe, n est grand (plus d'un million)).
Ce résultat intéressant s'obtient après avoir établi que la covariance de p2 et p3 est donnée par: Cov(p2, p3) = -p2xp3/n.
La variable aléatoire:
Z = (p2-p3)/racine carrée de Var (p2-p3) = (p2-p3)/(racine carrée de [(p2+p3)-(p2-p3)^2]/n)
suit approximativement la loi normale de moyenne zéro et de variance 1 : N(0; 1).
Par conséquent, dans le cas qui nous intéresse (P2 et P3 associés à la même population), si l’hypothèse H0 : P2=P3 est vraie, en posant P2 = P3 = P, la variable aléatoire Z telle que :
Z = (p2-p3)/racine carrée de Var (p2-p3) = (p2-p3)/racine carrée de [(p2+p3)/n]
suit approximativement la loi normale de moyenne zéro et de variance 1 : N(0; 1).
Un estimateur de P est :
p = (X2+X3)/(2n)
La statistique du test de l'hypothèse H0 : P2 = P3 est alors :
Z0 = (p2-p3)/racine carrée de [(2p/n)]
Soit α l’erreur de première espèce ou la probabilité de rejeter l’hypothèse H0 : P2 = P3, alors qu’elle est vraie.
Donc la probabilité d’accepter l’hypothèse H0 : P2 = P3, alors qu’elle est vraie est (1- α).
En pourcentage, 100(1- α)% représente le niveau de confiance du test.
Il s’agit ici d’un test bilatéral. Pour un α spécifié, on définit à l’aide des tables de la loi normale, les limites -Zα/2 et Zα/2 de l’intervalle à l’intérieur duquel doit se situer Z0 pour que l’hypothèse H0 : P2 = P3 soit vraie.
Par conséquent, si Z0 supérieur à Zα/2 , ou Z0 inférieur à -Zα/2 , l’hypothèse H0 : P2 = P3 est rejetée.
Résultats du test dans le cas de Célestin et Martelly.-
Estimateur de P : p= 0,2216
Écart entre les deux estimateurs : p2 – p3 = 0,0064
Statistique Z0 = 9,92
1) Pour 100α% = 5%, ou 100(1- α) = 95%, on a Zα/2 = 1,96, et H0 est rejetée;
2) Pour 100α% = 1%, ou 100(1- α) = 99%, on a Zα/2 = 2,57, et H0 est rejetée;
3) Pour 100α% = 0,27%, ou 100(1- α) = 99,73%, on a Zα/2 = 3,00, et H0 est rejetée;
4) Pour 100α% = 0,1%, ou 100(1- α) = 99.9%, on a Zα/2 = 3,29, et H0 est rejetée;
5) Pour 100α% = 0,01%, ou 100(1- α) = 99.99%, on a Zα/2 = 3,89, et H0 est rejetée;
6) Pour 100α% = 1,33E-13 %, ou 100(1- α) =100%, on a Zα/2 = 8, et H0 est rejetée;
On rejette l’hypothèse H0 : P2 = P3 pratiquement à tous les coups.
On ne peut dire que les candidats Martelly et Célestin sont à égalité sur la base des résultats publiés.
Cependant, on peut s’étonner d’un pareil résultats des urnes : élimination de Martelly et passage de Célestin au second tour, étant donné la faible popularité du candidat du pouvoir sur le terrain par rapport à celle de Martelly, si l’on oublie un moment les fraudes en faveur du candidat du pouvoir.
Au recomptage qui aura lieu sous peu, si les voix en faveur de Célestin ne changent pas et que l’écart entre Célestin et Martelly diminue pour passer de 6845 voix à une valeur de l'ordre de 1826 voix, par exemple, alors Z0 passerait au-dessous de la valeur 3,00 (2,65 plus exactement) et l’hypothèse H0 : P2 = P3 ne pourrait plus être rejetée avec un niveau de confiance de 99,73% (99,2% plus exactement).
La figure ci-après montre la situation des trois candidats Manigat, Célestin et Martelly construite par LCDP-Maths appliquées à partir des résultats du premier tour et avant recomptage.
Sur un axe gradué en pourcentages entre 21,5% et 32%, on montre les fonctions de densité de probabilités des variables aléatoires p1, p2 et p3 approximées par la loi normale.
À l'extrême droite se trouve la fonction de densité de p1 associée à la candidate Mirlande Manigat. C'est une courbe normale de moyenne 31,37% et d'écart-type 0,045%.
À l'extrême gauche se trouve la courbe normale de p3 associée au candidat Michel Martelly, de moyenne 21,84% et d'écart-type 0,040%.
Entre les deux extrêmes se situe la courbe normale de p2 associée au candidat du pouvoir Jude Célestin, de moyenne 22,48% et d'écart-type 0,040%.
On voit que les courbes de densité de Martelly et de Célestin n'accusent aucun chevauchement (pour des densités non nulles), ce qui corrobore en quelque sorte, graphiquement, le rejet de l'hypothèse H0: P2 = P3 obtenue ci-dessus.
L'écart entre Manigat et Célestin est de 95 416 voix, soit 8,89% comme l'illustre la figure. L'écart entre Célestin et Martelly est de 6845 voix, soit 0,64% comme le montre la figure.
Si, au recomtage, l'écart entre Célestin et Martelly rétrécissait à 1826 voix et que Célestin ne bougeait pas, alors l'écart en pourcentages entre ces deux candidats serait de 0,17%. Cette situation hypothétique est illustrée sur la figure ci-dessus par la courbe en pointillés (courbe en rouge) dont la pointe droite (+3 écarts-types) passe en avant de la pointe gauche (-3 écarts-types) de la coube de Célestin. Dans une telle situation l'hypothèse H0: P2 = P3 ne pourrait être rejetée avec un niveau de confiance de 99,2%.
Le niveau de confiance à partir duquel il faudrait considérer que les candidats Martelly et Célestin sont ex aequo est une décision qui relèvra du CEP qui est seul habilité à appliquer la loi électorale, tout en respectant l'esprit de la constitution. Peut-être tiendra-t-il compte aussi de l'avis des candidats en lice, des électeurs qui veulent que leur vote compte, et, des amis d'Haïti ?
_________________________________
(1) Remarque.-
La comparison des deux proportions P2 et P3 provenant de la même population peut se faire aussi rigoureusement de la manière suivante. On peut en effet proposer de comparer indépendamment et séparément chacune des proportions P2 et P3 à une même valeur spécifiée P0, fixée une fois pour toutes à 0,2216.
Alors le problème revient à tester séparément les deux séries d'hypothèses:
A)Cas de Célestin.-
Sur la base des résultats du premier tour publiés le 7 décembre 2010, et moyennant un niveau de confiance acceptable (95%, 99%, 99,9%, ou 99.99%), peut-on accepter pour vraie l’hypothèse nulle :
H0' : P2 = P0 (P0 = 0,2216)
Et rejeter l’hypothèse alternative :
H1' : P2 supérieur à P0 ?
B)Cas de Martelly.-
Sur la base des résultats du premier tour publiés le 7 décembre 2010, et moyennant un niveau de confiance acceptable (95%, 99%, 99,9%, ou 99.99%), peut-on accepter pour vraie l’hypothèse nulle :
H0'' : P3 = P0 (P0 = 0,2216)
Et rejeter l’hypothèse alternative :
H1 : P3 inférieur à P0 ?
Dans l'un ou l'autre cas, la statistique du test de l'hypothèse H0' est Z0' et celle du test H0'' est Z0''. On a:
Z0' = (p2-P0)/racine carrée de (p2(1-p2)(1/n))
Z0'' = (p3-P0)/racine carrée de (p3(1-p3)(1/n))
Dans le cas qui nous occupe, on a:
Z0' = 7,95
Z0'' = -7,95
Pour un niveau de confiance 100(1- α)% donné, si Z0' est supérieur à Zα , l'hypothèse H0': P2 = P0 est rejetée; de même si Z0'' est inférieur à -Zα, l’hypothèse H0'': P3 = P0 est rejetée.
A) Dans le cas de Célestin, on trouve:
Statistique Z0 = 7,95
A1) Pour 100α% = 5%, ou 100(1 - α) = 95%, on a Zα = 1,645, et H0' est rejetée;
A2) Pour 100α% = 2,5%, ou 100(1 - α) = 97,5%, on a Zα = 1,96, et H0' est rejetée;
A3) Pour 100α% = 1,0%, ou 100(1 - α) = 99,0%, on a Zα = 2,33, et H0' est rejetée;
A4) Pour 100α% = 0,27%, ou 100(1 - α) = 99.73%, on a Zα = 2,78, et H0' est rejetée;
A5) Pour 100α% = 0,1%, ou 100(1 - α) = 99.90%, on a Zα = 3,10, et H0' est rejetée;
A6) Pour 100α% = 0,01%, ou 100(1 - α) = 99,99%, on a Zα = 3,72, et H0' est rejetée;
B) Dans le cas de Martelly, on trouve:
Statistique Z0 = -7,95
B1) Pour 100α% = 5%, ou 100(1 - α) = 95%, on a -Zα = -1,645, et H0'' est rejetée;
B2) Pour 100α% = 2,5%, ou 100(1 - α) = 97,5%, on a -Zα = -1,96, et H0'' est rejetée;
B3) Pour 100α% = 1,0%, ou 100(1 - α) = 99,0%, on a -Zα = -2,33, et H0'' est rejetée;
B4) Pour 100α% = 0,27%, ou 100(1 - α) = 99.73%, on a -Zα = -2,78, et H0'' est rejetée;
B5) Pour 100α% = 0,1%, ou 100(1 - α) = 99.90%, on a -Zα = -3,10, et H0'' est rejetée;
B6) Pour 100α% = 0,01%, ou 100(1 - α) = 99,99%, on a -Zα = -3,72, et H0'' est rejetée;
On conclut donc que les hypothèses H1' et H1'' sont simultanément et indépendamment vraies: P2 est supérieur à P0= 0,2216 et P3 est inférieur à P0=0,2216 pour chacun des six niveaux de confiance spécifiés ci-dessus. Par conséquent P2 n'est statistiquement pas égal à P3, comme l'a aussi montré le test sur la différence des deux propostions développé dans le corps du texte en estimant la variance de (p2-p3), p2 et p3 n'étant pas indépendantes.
_________________________
Références:
(1) Kish, Leslie (1965), SURVEY SAMPLING, John Wiley and Sons, 643 pages.
(2) Scott, A.J. and Seber, G.A.F. (1983), Difference of Proportions From the Same Survey, The American Statistician, Vol. 37, No. 4, pp 319-320.
______________________________________________
Mises à jour: 30 décembre 2010, 31 décembre 2010, 23 janvier 2011.
LCDP-Mathémathiques appliquées remercie M. Patrick Ambroise pour ses remarques.