Les outils statistiques pour les laborantins2

Les outils statistiques pour les laborantins (suite)

Z-Test sur les moyennes de deux populations (variances connues et non identiques)

Objectif: pour étudier l'importance de la différence entre les moyennes x̄1 et x̄2 de deux populations.

Contraintes: connaître la variance des deux populations σ1² et σ2², les distributions doivent être normales.

Problème: dans un laboratoire d'analyse chimique, une solution d'étalon d'ammonium E1 présente dans son certificat une dispersion plus importante que l'étalon E2.

La variance σ1² de E1 est de 0,001025 ppm et la variance σ2² de E2 est de 0,000485 ppm.

Les moyennes respectives obtenues après analyse sur chaque étalon sont x̄1=12,08 ppm avec 13 analyses et x̄2=12,03 ppm avec 10 analyses.

Existe-t-il une différence entre les deux étalons vis-à-vis des moyennes obtenues?

Hypothèses et alternatives:

Scénario N°1 H0: µ1-µ2=µ0et H1: µ1-µ2≠µ0 (hypothèse bilatérale)

Scénario N°2 H0: µ1-µ2=µ0 et H1: µ1-µ2>µ0 (hypothèse unilatérale)

Prise de risque: α = 0,05 (unilatérale et bilatérale:0,025)

La Table des valeurs critiques pour une distribution normale donne pour α = 0,05: Z = 1,64 (unilatérale) et α = 0,05: Z = 1,96 (bilatérale)

Test statistique:

On considère deux populations avec des moyennes µ1 et µ2 et des variances σ1² et σ2² Des échantillons aléatoires indépendants de taille n1 et n2 sont prélevés et les moyennes d'échantillonnage x̄1 et x̄2 sont calculées.

µ1-µ2=µ0=0 et Z = 4,43

Conclusion:

Quel que soit le scénario, l'hypothèse nulle H0 doit être réfutée, seule l'alternative H1 reste valable et on peut en conclure qu'il existe bien une différence entre les moyennes des étalons.

Z-Test sur les moyennes de deux populations (variances connues et identiques)

Objectif: pour étudier l'importance de la différence entre les moyennes x̄1 et x̄2 de deux populations.

Contraintes: les deux populations doivent avoir la même variance connue σ², les distributions doivent être normales.

Problème: dans un laboratoire d'analyse, deux équipements sont comparés pour vérifier si l'étalonnage de chacun des appareils pourrait conduire à un meilleur résultat.

13 analyses d'un étalon réalisées avec le premier équipement donnent un résultat de x̄1=12,5 ppm et 10 analyses réalisées avec le second équipement donnent x̄2=12,0 ppm.

Les écarts-types entre les analyses sont identiques et σ=0,696 ppm.

Existe-t-il une différence entre les deux équipements vis-à-vis des moyennes obtenues?

Hypothèses et alternatives:

Scénario N°1 H0: µ1-µ2=0 et H1: µ1-µ2≠0 (hypothèse bilatérale)

Scénario N°2 H0: µ1-µ2=0 et H1: µ1-µ2>0 (hypothèse unilatérale)

Prise de risque: α = 0,05 (unilatérale et bilatérale:0,025)

La Table des valeurs critiques pour une distribution normale donne pour α = 0,05: Z = 1,64 (unilatérale) et α = 0,05: Z = 1,96 (bilatérale)

Test statistique:

On considère deux populations avec des moyennes µ1 et µ2. Des échantillons aléatoires indépendants de taille n1 et n2 sont prélevés et les moyennes d'échantillonnage x̄1 et x̄2 sont calculées.

µ1-µ2=µ0=0 et Z = 1,7

Conclusion:

Pour le scénario 1 (distribution bilatérale), Le Z-test est compris entre -1,96 et + 1,96, l'hypothèse nulle H0 ne peut pas être rejetée et il fort probable qu'avec plus de prélèvements, la moyenne x̄2 se rapprocherait de x̄1.

Pour le scénario 2 (distribution unilatérale), le Z-test est supérieur à 1,64 et l'hypothèse nulle H0 doit être réfutée, seule l'alternative H1 reste valable et les moyennes obtenues entre les deux équipements sont différentes.

Z-test pour comparer deux comptages (distribution de Poisson)

Objectif: pour étudier l'importance de la différence entre deux comptages.

Contraintes: le test est assez approximatif et suppose que l'échantillonnage doit être de grande taille (distribution normale).

Problème: un laboratoire est équipé de deux analyseurs automatiques qui réalisent respectivement n1=485 analyses en t1=120 min et n2=595 analyses en t2=135 min.

Que peut-on penser de la fréquence de chaque équipement?

Hypothèses et alternatives:

Scénario N°1 H0: R1=R2et H1:R1≠R2 (hypothèse bilatérale)

Prise de risque: α = 0,025 bilatérale

La Table des valeurs critiques pour une distribution normale donne pour α = 0,05: Z = 1,96 (bilatérale)

Test statistique:

On considère deux comptages n1 et n2 et les fréquences associées par rapport au temps t1 et t2: R1=n1/t1 et R2=n2/t2.

R1=4,04 R2=4,41 Z = -1,43

Conclusion:

Le Z-test est compris entre -1,96 et + 1,96, l'hypothèse nulle H0 ne peut pas être rejetée et les fréquences de chaque équipement ne peuvent pas être considérées comme différentes.

t-Test sur les moyennes de deux populations (variances inconnues et identiques)

Objectif: pour étudier l'importance de la différence entre les moyennes de deux populations.

Contraintes: les distributions doivent être normales.

Problème: deux balances automatiques (1 et 2) équipent un analyseur de gaz dans les métaux, la pesée standard est habituellement de 5 grammes.

On prélève aléatoirement n1=n2=12 prises d'essais sur chacune des balances, ce qui donne une moyenne x̄1=4,95 grammes avec une somme au carré des écarts de s1²=0,05 et x̄2=5,16 grammes avec une somme au carré des écarts de s2²=0,08.

Que peut-on dire des balances par rapport aux poids mesurés?

Hypothèses et alternatives:

Scénario N°1 H0: µ1-µ2=0 et H1: µ1-µ2≠0 (hypothèse bilatérale)

Prise de risque: α = 0,05 (bilatérale:0,025)

La Table des valeurs critiques pour une distribution de Student donne pour α = 0,05 et ν=n1+n2-2=12+12-2=22 degrés de liberté donc t22;0.025=±2,07.

Test statistique:

la meilleure estimation de la variance de la population est donnée par:

s = 0,255

µ1-µ2=0 et t = -2,02

Conclusion:

Le t est compris entre -2,07 et +2,07 et l'hypothèse nulle H0 ne peut pas être rejetée, les balances ne présentent pas de différence entre leurs pesées.

t-Test sur les moyennes de deux populations (variances inconnues et non identiques)

Objectif: pour étudier l'importance de la différence entre les moyennes de deux populations.

Contraintes: le test est approximatif si les distributions sont normales et si l'échantillonnage est trop important, le test doit seulement être utilisé sur l'hypothèse µ1=µ2.

Problème: Un laboratoire doit acquérir un nouvel équipement mais il manque de place. Possédant deux anciens équipements identiques E1 et E2, il va falloir mettre au rebut l'un de ses deux équipements.

Afin de préciser son choix, le laboratoire décide de réaliser 2000 analyses sur un blanc (solution ne contenant rien) sur chaque équipement et de quantifier chaque valeur qui dépasse un certain seuil fixé par le laboratoire et qui correspond à une valeur erronée et aléatoire lors des mesures.

L'équipement E1 présente 8 valeurs hors seuil avec une moyenne x̄1 = 35 ppm et une variance s1²= 100 ppm.

L'équipement E2 présente 5 valeurs hors seuil avec une moyenne x̄2 = 15 ppm et une variance s2²= 200 ppm.

Hypothèses et alternatives:

Scénario N°1 H0: µ1=µ2 et H1: µ1≠µ2 (hypothèse bilatérale)

Prise de risque: α = 0,05

La Table des valeurs critiques pour une distribution de Student donne pour α = 0,05 et ν=6,5 degrés de liberté donc t6.5;0.025=±2,41.

Test statistique:

t= 2,76

Le t n'est pas compris entre -2,41 et +2,41 et l'hypothèse nulle H0 doit être rejetée et il est préférable de mettre l'équipement E1 au rebut.

t-Test sur les moyennes de deux populations (Méthode de comparaison par paire ou appariée)

Objectif: Pour étudier l'importance de la différence entre deux moyennes µ1 et µ2 de deux populations.

Contraintes: les observations pour les deux échantillons doivent être obtenues par paires. Outre les différences de population, les observations de chaque paire doivent être effectuées dans des conditions identiques, ou presque identiques.

Le test est précis si les populations sont distribuées normalement.

Problème: dans un laboratoire d'analyse chimique, on dose un sel dilué dans une solution par gravimétrie après précipitation et séchage. Pour effectuer cette opération, le Laboratoire dispose de deux solutions complexantes E1 et E2.

Le laboratoire teste chaque produit E1 et E2 sur n=10 échantillons de sels dilués en mesurant le taux de sel récupéré après séchage en mg.

Les moyennes respectives obtenues après séchage sur chaque échantillon sont x̄1= 50,3 mg et x̄2= 53,0 mg.

La différence entre chaque paire de mesurage est donnée par x1-x2, la variance entre les deux échantillons est donnée par:

s =1,11

Existe-t-il une différence entre les deux solutions E1 et E2 à partir des moyennes obtenues?

Hypothèses et alternatives:

Scénario N°1 H0: µd=0 et H1: µd≠0 (hypothèse bilatérale)

Scénario N°2 H0: µd=0 et H1: µd>0(hypothèse unilatérale)

Prise de risque: α = 0,05 (unilatérale et bilatérale:0,025)

La Table des valeurs critiques pour une distribution de Student donne pour α = 0,05: t = 1,83 (unilatérale) et α = 0,05: t = 2,26 (bilatérale)

Test statistique:

On considère deux populations avec des moyennes x̄1 et x̄2 et la variance s².

d̄ = x̄1-x̄2= 50,3 - 53 = -2,7, µd=0 et t = -0,77

Conclusion:

Quel que soit le scénario, l'hypothèse nulle H0 ne peut pas être rejetée et on peut en conclure qu'il n'existe pas de différence entre les deux solutions.

Table des valeurs critiques pour une distribution normale

Table des valeurs critiques pour une distribution de student