Intervalle de confiance. ABC des statistiques médicales

Souvent, l'expert doit analyser le marché immobilier du segment dans lequel se situe l'objet d'expertise. Si le marché est développé, il peut être difficile d'analyser l'ensemble des objets présentés, par conséquent, un échantillon d'objets est utilisé pour l'analyse. Cet échantillon n'est pas toujours homogène, il faut parfois le débarasser des extrêmes - offres de marché trop hautes ou trop basses. A cet effet, il est appliqué Intervalle de confiance. Le but de cette étude est de mener une analyse comparative de deux méthodes de calcul de l'intervalle de confiance et de choisir la meilleure option de calcul lorsque l'on travaille avec différents échantillons dans le système estimatica.pro.

Intervalle de confiance - calculé sur la base de l'échantillon, l'intervalle de valeurs de la caractéristique qui, avec une probabilité connue, contient le paramètre estimé de la population générale.

Le sens du calcul de l'intervalle de confiance est de construire un tel intervalle basé sur les données de l'échantillon afin qu'il puisse être affirmé avec une probabilité donnée que la valeur du paramètre estimé se trouve dans cet intervalle. En d'autres termes, l'intervalle de confiance avec une certaine probabilité contient la valeur inconnue de la quantité estimée. Plus l'intervalle est large, plus l'imprécision est élevée.

Il existe différentes méthodes pour déterminer l'intervalle de confiance. Dans cet article, nous considérerons 2 façons :

  • par la médiane et l'écart type ;
  • par la valeur critique de la statistique t (coefficient de Student).

Etapes d'une analyse comparative des différentes méthodes de calcul de l'IC :

1. former un échantillon de données ;

2. nous la traitons avec des méthodes statistiques : nous calculons la valeur moyenne, la médiane, la variance, etc. ;

3. nous calculons l'intervalle de confiance de deux manières ;

4. Analysez les échantillons nettoyés et les intervalles de confiance obtenus.

Étape 1. Échantillonnage des données

L'échantillon a été formé à l'aide du système estimatica.pro. L'échantillon comprenait 91 offres pour la vente d'appartements d'une pièce dans la 3ème zone de prix avec le type de planification "Khrouchtchev".

Tableau 1. Échantillon initial

Le prix de 1 m², u.c.

Fig. 1. Échantillon initial



Étape 2. Traitement de l'échantillon initial

Le traitement des échantillons par des méthodes statistiques nécessite le calcul des valeurs suivantes :

1. Moyenne arithmétique

2. Médiane - un nombre qui caractérise l'échantillon : exactement la moitié des éléments de l'échantillon sont supérieurs à la médiane, l'autre moitié est inférieure à la médiane

(pour un échantillon avec un nombre impair de valeurs)

3. Plage - la différence entre les valeurs maximales et minimales de l'échantillon

4. Variance - utilisé pour estimer plus précisément la variation des données

5. L'écart type de l'échantillon (ci-après dénommé RMS) est l'indicateur le plus courant de la dispersion des valeurs d'ajustement autour de la moyenne arithmétique.

6. Coefficient de variation - reflète le degré de dispersion des valeurs d'ajustement

7. coefficient d'oscillation - reflète la fluctuation relative des valeurs extrêmes des prix dans l'échantillon autour de la moyenne

Tableau 2. Indicateurs statistiques de l'échantillon initial

Le coefficient de variation, qui caractérise l'homogénéité des données, est de 12,29 %, mais le coefficient d'oscillation est trop grand. Ainsi, nous pouvons affirmer que l'échantillon d'origine n'est pas homogène, passons donc au calcul de l'intervalle de confiance.

Etape 3. Calcul de l'intervalle de confiance

Méthode 1. Calcul par la médiane et l'écart type.

L'intervalle de confiance est déterminé comme suit : la valeur minimale - l'écart type est soustrait de la médiane ; la valeur maximale - l'écart type est ajouté à la médiane.

Ainsi, l'intervalle de confiance (47179 CU ; 60689 CU)

Riz. 2. Valeurs dans l'intervalle de confiance 1.



Méthode 2. Construction d'un intervalle de confiance à travers la valeur critique de la statistique t (coefficient de Student)

SV Gribovsky dans le livre "Méthodes mathématiques pour évaluer la valeur d'une propriété" décrit une méthode de calcul de l'intervalle de confiance via le coefficient de Student. Lors du calcul par cette méthode, l'estimateur lui-même doit fixer le niveau de signification ∝, qui détermine la probabilité avec laquelle l'intervalle de confiance sera construit. Des niveaux de signification de 0,1 sont couramment utilisés ; 0,05 et 0,01. Ils correspondent à des probabilités de confiance de 0,9 ; 0,95 et 0,99. Avec cette méthode, les vraies valeurs de l'espérance mathématique et de la variance sont considérées comme pratiquement inconnues (ce qui est presque toujours vrai lors de la résolution de problèmes d'évaluation pratiques).

Formule d'intervalle de confiance :

n - taille de l'échantillon ;

La valeur critique des statistiques t (distributions de Student) avec un niveau de signification ∝, le nombre de degrés de liberté n-1, qui est déterminé par des tableaux statistiques spéciaux ou à l'aide de MS Excel (→"Statistique"→ STUDRASPOBR) ;

∝ - seuil de signification, on prend ∝=0.01.

Riz. 2. Valeurs comprises dans l'intervalle de confiance 2.

Étape 4. Analyse des différentes manières de calculer l'intervalle de confiance

Deux méthodes de calcul de l'intervalle de confiance - par la médiane et le coefficient de Student - ont conduit à des valeurs différentes des intervalles. En conséquence, deux échantillons purifiés différents ont été obtenus.

Tableau 3. Indicateurs statistiques pour trois échantillons.

Indice

Échantillon initial

1 option

Option 2

Valeur moyenne

Dispersion

Coef. variantes

Coef. oscillations

Nombre d'objets retirés, pcs.

Sur la base des calculs effectués, nous pouvons dire que les valeurs des intervalles de confiance obtenues par différentes méthodes se croisent, vous pouvez donc utiliser l'une des méthodes de calcul à la discrétion de l'évaluateur.

Cependant, nous pensons que lorsque vous travaillez dans le système estimatica.pro, il est conseillé de choisir une méthode de calcul de l'intervalle de confiance, en fonction du degré de développement du marché :

  • si le marché n'est pas développé, appliquer la méthode de calcul par la médiane et l'écart-type, car le nombre d'objets retirés dans ce cas est faible ;
  • si le marché est développé, appliquer le calcul à travers la valeur critique de la statistique t (coefficient de Student), puisqu'il est possible de constituer un large échantillon initial.

Dans la préparation de l'article ont été utilisés:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Méthodes mathématiques d'évaluation de la valeur d'un bien. Moscou, 2014

2. Données du système estimatica.pro

Mise à jour : 3 mars 2020
Exemple de fichier

Construisons un intervalle de confiance dans MS EXCEL pour estimer la valeur moyenne de la distribution dans le cas d'une valeur connue de la variance.

Bien sûr le choix niveau de confiance dépend entièrement de la tâche à accomplir. Ainsi, le degré de confiance du passager aérien dans la fiabilité de l'avion devrait bien entendu être supérieur au degré de confiance de l'acheteur dans la fiabilité de l'ampoule.

Formulation des tâches

Supposons qu'à partir de population avoir pris goûter taille n.m. Il est entendu que écart-type cette répartition est connue. Nécessaire sur la base de cela échantillonsévaluer l'inconnu moyenne de distribution(μ, ) et construisons les bilatéralIntervalle de confiance .

Estimation ponctuelle

Comme on le sait depuis statistiques(appelons-le X cf) est estimation impartiale de la moyenne ce population et a la loi N(μ;σ 2 /n).

Note : Que faire si vous avez besoin de construire Intervalle de confiance dans le cas de la distribution, qui n'est pasnormal? Dans ce cas, vient à la rescousse, qui dit qu'avec une taille suffisamment grande échantillons n de distribution non-normal , distribution d'échantillonnage des statistiques Х moy sera environ correspondre distribution normale de paramètres N(μ;σ 2 /n).

Donc, estimation ponctuellemilieuvaleurs de distribution nous avons est moyenne de l'échantillon, c'est à dire. X cf. Maintenant, occupons-nous Intervalle de confiance.

Construire un intervalle de confiance

Habituellement, connaissant la distribution et ses paramètres, on peut calculer la probabilité qu'une variable aléatoire prenne une valeur dans un intervalle donné. Faisons maintenant le contraire : trouvez l'intervalle dans lequel la variable aléatoire tombe avec une probabilité donnée. Par exemple, à partir de propriétés distribution normale on sait qu'avec une probabilité de 95%, une variable aléatoire répartie sur loi normale, tombera dans l'intervalle d'environ +/- 2 à partir de valeur moyenne(voir article à propos). Cet intervalle servira de prototype pour Intervalle de confiance .

Voyons maintenant si nous connaissons la distribution , calculer cet intervalle? Pour répondre à la question, il faut préciser la forme de distribution et ses paramètres.

Nous savons que la forme de distribution est distribution normale(rappelez-vous que nous parlons de distribution d'échantillonnagestatistiquesX cf).

Le paramètre μ nous est inconnu (il suffit de l'estimer à l'aide de Intervalle de confiance), mais nous avons son estimation X cf, calculé sur la base goûter, qui peut être utilisé.

Le deuxième paramètre est échantillon moyenne écart-typesera connu, il est égal à σ/√n.

Parce que on ne connaît pas μ, alors on va construire l'intervalle +/- 2 écarts types Pas de valeur moyenne, mais d'après son estimation connue X cf. Ceux. lors du calcul Intervalle de confiance nous ne supposerons PAS que X cf tombera dans l'intervalle +/- 2 écarts types de μ avec une probabilité de 95%, et nous supposerons que l'intervalle est de +/- 2 écarts types depuis X cf avec une probabilité de 95% couvrira μ - la moyenne de la population générale,à partir duquel goûter. Ces deux énoncés sont équivalents, mais le second nous permet de construire Intervalle de confiance .

De plus, on affine l'intervalle : une variable aléatoire distribuée sur loi normale, avec une probabilité de 95 % tombe dans l'intervalle +/- 1,960 écarts-types, pas +/- 2 écarts types. Cela peut être calculé en utilisant la formule \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. exemple de fichier Espacement des feuilles .

Nous pouvons maintenant formuler un énoncé probabiliste qui nous servira à former Intervalle de confiance: "La probabilité que population signifie situé à partir de moyenne de l'échantillonà moins de 1.960" écarts-types de la moyenne de l'échantillon", est égal à 95 %.

La valeur de probabilité mentionnée dans la déclaration a un nom spécial , qui est associé à niveau de signification α (alpha) par une simple expression Niveau de confiance = 1 . Dans notre cas niveau de signification α =1-0,95=0,05 .

Maintenant, sur la base de cette déclaration probabiliste, nous écrivons une expression pour calculer Intervalle de confiance :

où Zα/2 standarddistribution normale(telle une valeur d'une variable aléatoire z , Quoi P (z >= Zα/2 )=α/2).

Note : Quantile α/2 supérieur définit la largeur Intervalle de confiance V écarts typesmoyenne de l'échantillon. Quantile α/2 supérieur standarddistribution normale est toujours supérieur à 0, ce qui est très pratique.

Dans notre cas, à α=0,05, quantile α/2 supérieur est égal à 1,960. Pour les autres niveaux de signification α (10 % ; 1 %) quantile α/2 supérieurZα/2 peut être calculé à l'aide de la formule \u003d NORM.ST.OBR (1-α / 2) ou si connu Niveau de confiance , =NORM.ST.OBR((1+niveau de confiance)/2) .

Généralement lors de la construction intervalles de confiance pour estimer la moyenne utiliser seulement α supérieur /2- quantile et ne pas utiliser α inférieur /2- quantile. Ceci est possible car standarddistribution normale symétrique par rapport à l'axe des x ( densité de sa distribution symétrique par rapport à moyen, c'est-à-dire 0) . Il n'est donc pas nécessaire de calculer quantile α/2 inférieur(on l'appelle simplement α /2-quantile), parce que c'est égal α supérieur /2- quantile avec un signe moins.

Rappelons que, quelle que soit la forme de la distribution de x, la variable aléatoire correspondante X cf distribué environBien N(μ;σ 2 /n) (voir article à propos). Par conséquent, en général, l'expression ci-dessus pour Intervalle de confiance n'est qu'approximatif. Si x est distribué sur loi normale N(μ;σ 2 /n), alors l'expression de Intervalle de confiance est exact.

Calcul de l'intervalle de confiance dans MS EXCEL

Résolvons le problème. Le temps de réponse d'un composant électronique à un signal d'entrée est une caractéristique importante d'un appareil. Un ingénieur souhaite tracer un intervalle de confiance pour le temps de réponse moyen à un niveau de confiance de 95 %. Par expérience, l'ingénieur sait que l'écart type du temps de réponse est de 8 ms. On sait que l'ingénieur a fait 25 mesures pour estimer le temps de réponse, la valeur moyenne était de 78 ms.

Solution: Un ingénieur veut connaître le temps de réponse d'un appareil électronique, mais il comprend que le temps de réponse n'est pas fixe, mais une variable aléatoire qui a sa propre distribution. Le mieux qu'il puisse espérer est donc de déterminer les paramètres et la forme de cette distribution.

Malheureusement, d'après l'état du problème, nous ne connaissons pas la forme de la distribution du temps de réponse (il n'est pas nécessaire normal). , cette distribution est également inconnue. Lui seul est connu écart-typeσ=8. Par conséquent, même si nous ne pouvons pas calculer les probabilités et construire Intervalle de confiance .

Cependant, bien que nous ne connaissions pas la distribution tempsréponse séparée, on sait que d'après CPT , distribution d'échantillonnagetemps de réponse moyen est d'environ normal(on supposera que les conditions CPT sont effectués, car taille échantillons assez grand (n=25)) .

De plus, moyenne cette distribution est égale à valeur moyenne distributions de réponse unitaire, c'est-à-dire μ. UN écart-type de cette distribution (σ/√n) peut être calculée à l'aide de la formule =8/ROOT(25) .

On sait également que l'ingénieur a reçu estimation ponctuelle paramètre µ égal à 78 ms (X cf). Par conséquent, nous pouvons maintenant calculer les probabilités, car nous connaissons la forme de distribution ( normal) et ses paramètres (Х ср et σ/√n).

L'ingénieur veut savoir valeur attendueμ de la distribution des temps de réponse. Comme indiqué ci-dessus, ce μ est égal à espérance de la distribution de l'échantillon du temps de réponse moyen. Si nous utilisons distribution normale N(X cf; σ/√n), alors le μ souhaité sera dans la plage +/-2*σ/√n avec une probabilité d'environ 95 %.

Niveau de signification est égal à 1-0,95=0,05.

Enfin, trouvez la bordure gauche et droite Intervalle de confiance. Bordure gauche : \u003d 78-NORM.ST.INR (1-0.05 / 2) * 8 / RACINE (25) = 74,864 Bordure droite : \u003d 78 + NORM ST.OBR (1-0,05 / 2) * 8 / RACINE (25) \u003d 81,136

Bordure gauche : =NORM.INV(0.05/2, 78, 8/SQRT(25)) Bordure droite : =NORM.INV(1-0.05/2, 78, 8/SQRT(25))

Répondre : Intervalle de confianceà Niveau de confiance de 95 % et σ =8 msecéquivaut à 78+/-3.136ms

DANS fichier exemple sur feuille Sigma connu créé un formulaire pour le calcul et la construction bilatéralIntervalle de confiance pour arbitraire échantillons avec un σ donné et niveau de signification .

Fonction CONFIANCE.NORM()

Si les valeurs échantillons sont dans la gamme B20:B79 , UN niveau de significationégal à 0,05 ; puis la formule MS EXCEL : =MOYENNE(B20:B79)-CONFIANCE(0.05,σ, COMPTE(B20:B79)) renverra la bordure gauche Intervalle de confiance .

La même limite peut être calculée à l'aide de la formule : =MOYENNE(B20:B79)-NORM.ST.INV(1-0.05/2)*σ/SQRT(COUNT(B20:B79))

Note: La fonction TRUST.NORM() est apparue dans MS EXCEL 2010. Les versions antérieures de MS EXCEL utilisaient la fonction TRUST().

Probabilités, reconnus comme suffisants pour juger en toute confiance des paramètres généraux basés sur les caractéristiques de l'échantillon, sont appelés fiduciaire .

Habituellement, les valeurs de 0,95 sont choisies comme probabilités de confiance ; 0,99 ; 0,999 (ils sont généralement exprimés en pourcentage - 95 %, 99 %, 99,9 %). Plus la mesure de responsabilité est élevée, plus le niveau de confiance est élevé : 99 % ou 99,9 %.

Un niveau de confiance de 0,95 (95%) est considéré comme suffisant dans la recherche scientifique dans le domaine de la culture physique et du sport.

L'intervalle dans lequel se trouve la moyenne arithmétique de l'échantillon de la population générale avec une probabilité de confiance donnée est appelé Intervalle de confiance .

Niveau d'importance de l'évaluation est un petit nombre α, dont la valeur implique la probabilité qu'il soit en dehors de l'intervalle de confiance. Conformément aux probabilités de confiance : α 1 = (1-0,95) = 0,05 ; α 2 \u003d (1 - 0,99) \u003d 0,01, etc.

Intervalle de confiance pour la moyenne (espérance) un distribution normale:

,

où est la fiabilité (probabilité de confiance) de l'estimation ; - moyenne de l'échantillon ; s - écart type corrigé ; n est la taille de l'échantillon ; t γ est la valeur déterminée à partir du tableau de distribution de Student (voir annexe, tableau 1) pour n et γ donnés.

Pour trouver les bornes de l'intervalle de confiance de la valeur moyenne de la population générale, il faut :

1. Calculer et s.

2. Il est nécessaire de fixer la probabilité de confiance (fiabilité) γ de l'estimation 0,95 (95%) ou le niveau de signification α 0,05 (5%)

3. Selon le tableau t - Distributions de Student (Annexe, Tableau 1) trouvez les valeurs limites de t γ .

Comme la distribution t est symétrique par rapport au point zéro, il suffit de connaître uniquement la valeur positive de t. Par exemple, si la taille de l'échantillon est n=16, alors le nombre de degrés de liberté (degrés de liberté, df) t– distributions df=16 - 1=15 . D'après le tableau 1 application t 0,05 = 2,13 .

4. On trouve les bornes de l'intervalle de confiance pour α = 0,05 et n=16 :

Limites de confiance :

Pour les échantillons de grande taille (n ≥ 30) t – La distribution de Student devient normale. Par conséquent, l'intervalle de confiance pour pour n ≥ 30 s'écrit :

tu sont les points de pourcentage de la distribution normale normalisée.

Pour les probabilités de confiance standard (95 %, 99 % ; 99,9 %) et les niveaux de signification, les valeurs α ( tu) sont données dans le tableau 8.

Tableau 8

Valeurs pour les niveaux de confiance standard α

α tu
0,05 1,96
0,01 2,58
0,001 3,28

Sur la base des données de l'exemple 1, nous définissons les limites des 95 % Intervalle de confiance (α = 0,05) pour le résultat moyen d'un saut depuis l'endroit. Dans notre exemple, la taille de l'échantillon est n = 65, alors les recommandations pour une grande taille d'échantillon peuvent être utilisées pour déterminer les limites de l'intervalle de confiance.

Konstantin Krawchik explique clairement ce qu'est un intervalle de confiance dans la recherche médicale et comment l'utiliser

"Katren-Style" continue de publier un cycle de Konstantin Kravchik sur les statistiques médicales. Dans deux articles précédents, l'auteur a abordé l'explication de concepts tels que et.

Constantin Kravchik

Mathématicien-analyste. Spécialiste dans le domaine de la recherche statistique en médecine et en sciences humaines

Ville de Moscou

Très souvent, dans les articles sur les essais cliniques, vous pouvez trouver une phrase mystérieuse : « intervalle de confiance » (IC à 95 % ou IC à 95 % - intervalle de confiance). Par exemple, un article pourrait dire : "Le test t de Student a été utilisé pour évaluer la signification des différences, avec un intervalle de confiance à 95 % calculé."

Quelle est la valeur de "l'intervalle de confiance à 95 %" et pourquoi le calculer ?

Qu'est-ce qu'un intervalle de confiance ? - Il s'agit de la plage dans laquelle se situent les vraies valeurs moyennes de la population. Et quoi, il y a des moyennes "fausses" ? Dans un sens, oui, ils le font. Dans nous avons expliqué qu'il est impossible de mesurer le paramètre d'intérêt dans l'ensemble de la population, les chercheurs se contentent donc d'un échantillon limité. Dans cet échantillon (par exemple, en poids corporel), il existe une valeur moyenne (un certain poids), par laquelle nous jugeons la valeur moyenne dans l'ensemble de la population générale. Cependant, il est peu probable que le poids moyen dans l'échantillon (en particulier un petit échantillon) coïncide avec le poids moyen dans la population générale. Par conséquent, il est plus correct de calculer et d'utiliser la fourchette des valeurs moyennes de la population générale.

Par exemple, supposons que l'intervalle de confiance à 95 % (IC à 95 %) pour l'hémoglobine se situe entre 110 et 122 g/L. Cela signifie qu'avec une probabilité de 95  %, la véritable valeur moyenne de l'hémoglobine dans la population générale se situera entre 110 et 122 g/L. En d'autres termes, nous ne connaissons pas l'hémoglobine moyenne dans la population générale, mais nous pouvons indiquer la plage de valeurs pour cette caractéristique avec une probabilité de 95 %.

Les intervalles de confiance sont particulièrement pertinents pour la différence de moyennes entre les groupes, ou ce qu'on appelle la taille de l'effet.

Supposons que nous comparions l'efficacité de deux préparations de fer : une qui est sur le marché depuis longtemps et une qui vient d'être homologuée. Après le traitement, la concentration d'hémoglobine dans les groupes de patients étudiés a été évaluée et le programme statistique a calculé pour nous que la différence entre les valeurs moyennes des deux groupes avec une probabilité de 95% est comprise entre 1,72 à 14,36 g/l (tableau 1).

Languette. 1. Critère pour les échantillons indépendants
(les groupes sont comparés par le taux d'hémoglobine)

Ceci doit être interprété comme suit : chez une partie des patients de la population générale qui prennent un nouveau médicament, l'hémoglobine sera plus élevée en moyenne de 1,72 à 14,36 g/l que chez ceux qui ont pris un médicament déjà connu.

En d'autres termes, dans la population générale, la différence des valeurs moyennes de l'hémoglobine dans les groupes avec une probabilité de 95% se situe dans ces limites. Ce sera au chercheur de juger si c'est beaucoup ou peu. Le point de tout cela est que nous ne travaillons pas avec une valeur moyenne, mais avec une plage de valeurs, par conséquent, nous estimons de manière plus fiable la différence d'un paramètre entre les groupes.

Dans les progiciels statistiques, à la discrétion du chercheur, on peut indépendamment réduire ou élargir les limites de l'intervalle de confiance. En abaissant les probabilités de l'intervalle de confiance, nous rétrécissons l'éventail des moyennes. Par exemple, à un IC à 90 %, la fourchette des moyennes (ou des différences moyennes) sera plus étroite qu'à un IC à 95 %.

Inversement, augmenter la probabilité à 99 % élargit la plage de valeurs. Lorsque l'on compare des groupes, la limite inférieure de l'IC peut franchir le zéro. Par exemple, si nous avons étendu les limites de l'intervalle de confiance à 99  %, alors les limites de l'intervalle allaient de -1 à 16 g/L. Cela signifie que dans la population générale, il existe des groupes dont la différence entre les moyennes pour le trait étudié est de 0 (M = 0).

Les intervalles de confiance peuvent être utilisés pour tester des hypothèses statistiques. Si l'intervalle de confiance croise la valeur zéro, alors l'hypothèse nulle, qui suppose que les groupes ne diffèrent pas dans le paramètre étudié, est vraie. Un exemple est décrit ci-dessus, lorsque nous avons étendu les limites à 99 %. Quelque part dans la population générale, nous avons trouvé des groupes qui ne différaient en rien.

Intervalle de confiance à 95 % de la différence d'hémoglobine, (g/l)


La figure montre l'intervalle de confiance à 95 % de la différence d'hémoglobine moyenne entre les deux groupes sous la forme d'une ligne. La ligne passe le zéro, donc, il y a une différence entre les moyennes égale à zéro, ce qui confirme l'hypothèse nulle que les groupes ne diffèrent pas. La différence entre les groupes varie de -2 à 5 g/l, ce qui signifie que l'hémoglobine peut soit diminuer de 2 g/l, soit augmenter de 5 g/l.

L'intervalle de confiance est un indicateur très important. Grâce à lui, vous pouvez voir si les différences dans les groupes étaient vraiment dues à la différence des moyennes ou à un grand échantillon, car avec un grand échantillon, les chances de trouver des différences sont plus grandes qu'avec un petit.

En pratique, cela pourrait ressembler à ceci. Nous avons pris un échantillon de 1000 personnes, mesuré le taux d'hémoglobine et constaté que l'intervalle de confiance pour la différence des moyennes se situe entre 1,2 et 1,5 g/L. Le niveau de signification statistique dans ce cas p

Nous voyons que la concentration d'hémoglobine a augmenté, mais presque imperceptiblement, par conséquent, la signification statistique est apparue précisément en raison de la taille de l'échantillon.

Les intervalles de confiance peuvent être calculés non seulement pour les moyennes, mais aussi pour les proportions (et les risques relatifs). Par exemple, nous nous intéressons à l'intervalle de confiance des proportions de patients qui ont obtenu une rémission tout en prenant le médicament développé. Supposons que l'IC à 95 % pour les proportions, c'est-à-dire pour la proportion de ces patients, se situe entre 0,60 et 0,80. Ainsi, on peut dire que notre médicament a un effet thérapeutique dans 60 à 80% des cas.

Le calcul de l'intervalle de confiance est basé sur l'erreur moyenne du paramètre correspondant. Intervalle de confiance montre dans quelles limites avec probabilité (1-a) se trouve la vraie valeur du paramètre estimé. Ici a est le niveau de signification, (1-a) est aussi appelé niveau de confiance.

Dans le premier chapitre, nous avons montré que, par exemple, pour la moyenne arithmétique, la vraie moyenne de la population se situe à moins de 2 erreurs moyennes de la moyenne environ 95 % du temps. Ainsi, les limites de l'intervalle de confiance à 95 % pour la moyenne seront à partir de la moyenne de l'échantillon de deux fois l'erreur moyenne de la moyenne, c'est-à-dire nous multiplions l'erreur moyenne de la moyenne par un facteur qui dépend du niveau de confiance. Pour la moyenne et la différence des moyennes, le coefficient de Student (la valeur critique du critère de Student) est pris, pour la part et la différence des parts, la valeur critique du critère z. Le produit du coefficient et de l'erreur moyenne peut être appelé l'erreur marginale de ce paramètre, c'est-à-dire le maximum que nous pouvons obtenir lors de son évaluation.

Intervalle de confiance pour moyenne arithmétique : .

Voici la moyenne de l'échantillon ;

Erreur moyenne de la moyenne arithmétique ;

s-écart-type de l'échantillon ;

n

f = n-1 (coefficient de Student).

Intervalle de confiance pour différence des moyennes arithmétiques :

Ici, est la différence entre les moyennes de l'échantillon ;

- l'erreur moyenne de la différence des moyennes arithmétiques ;

s 1 ,s 2 -échantillons d'écarts types ;

n1,n2

Valeur critique du critère de Student pour un niveau de signification a donné et le nombre de degrés de liberté f=n1 +n2-2 (coefficient de Student).

Intervalle de confiance pour actions :

.

Ici d est la part de l'échantillon ;

– erreur de partage moyenne;

n– taille de l'échantillon (taille du groupe) ;

Intervalle de confiance pour partager les différences :

Ici, est la différence entre les parts de l'échantillon ;

est l'erreur moyenne de la différence entre les moyennes arithmétiques ;

n1,n2– taille des échantillons (nombre de groupes) ;

La valeur critique du critère z à un niveau de signification donné a ( , , ).

En calculant les intervalles de confiance de la différence d'indicateurs, on voit d'abord directement les valeurs possibles de l'effet, et pas seulement son estimation ponctuelle. Deuxièmement, nous pouvons tirer une conclusion sur l'acceptation ou la réfutation de l'hypothèse nulle et, troisièmement, nous pouvons tirer une conclusion sur la puissance du critère.

Lors du test d'hypothèses à l'aide d'intervalles de confiance, la règle suivante doit être suivie :

Si l'intervalle de confiance de 100(1-a) pour cent de la différence moyenne ne contient pas zéro, alors les différences sont statistiquement significatives au niveau de signification a ; au contraire, si cet intervalle contient zéro, alors les différences ne sont pas statistiquement significatives.

En effet, si cet intervalle contient zéro, alors, cela signifie que l'indicateur comparé peut être soit plus ou moins dans l'un des groupes par rapport à l'autre, c'est-à-dire les différences observées sont aléatoires.

Par l'endroit où zéro se situe dans l'intervalle de confiance, on peut juger de la puissance du critère. Si zéro est proche de la limite inférieure ou supérieure de l'intervalle, alors peut-être qu'avec un plus grand nombre de groupes comparés, les différences atteindraient une signification statistique. Si zéro est proche du milieu de l'intervalle, cela signifie que l'augmentation et la diminution de l'indicateur dans le groupe expérimental sont également probables et, probablement, qu'il n'y a vraiment aucune différence.

Exemples:

Pour comparer la mortalité chirurgicale lors de l'utilisation de deux types d'anesthésie différents : 61 personnes ont été opérées en utilisant le premier type d'anesthésie, 8 sont décédées, en utilisant le second - 67 personnes, 10 sont décédées.

d 1 \u003d 8/61 \u003d 0,131; d 2 \u003d 10/67 \u003d 0,149; d1-d2 = - 0,018.

La différence de létalité des méthodes comparées sera de l'ordre de (-0,018 - 0,122 ; -0,018 + 0,122) ou (-0,14 ; 0,104) avec une probabilité de 100(1-a) = 95 %. L'intervalle contient zéro, c'est-à-dire l'hypothèse d'une même létalité avec deux types d'anesthésie différents ne peut être rejetée.

Ainsi, la mortalité peut et va diminuer à 14% et augmenter à 10,4% avec une probabilité de 95%, c'est-à-dire zéro est approximativement au milieu de l'intervalle, on peut donc affirmer que, très probablement, ces deux méthodes ne diffèrent pas vraiment en termes de létalité.

Dans l'exemple considéré plus tôt, le temps de tapotement moyen a été comparé dans quatre groupes d'étudiants différant dans leurs résultats aux examens. Calculons les intervalles de confiance du temps de pressage moyen pour les étudiants qui ont réussi l'examen pour 2 et 5 et l'intervalle de confiance pour la différence entre ces moyennes.

Les coefficients de Student sont trouvés à partir des tableaux de distribution de Student (voir annexe) : pour le premier groupe : = t(0,05;48) = 2,011 ; pour le second groupe : = t(0.05;61) = 2.000. Ainsi, les intervalles de confiance pour le premier groupe : = (162,19-2,011 * 2,18 ; 162,19 + 2,011 * 2,18) = (157,8 ; 166,6) , pour le second groupe (156,55- 2,000*1,88 ; 156,55+2,000*1,88) = (152,8 ; 160.3). Ainsi, pour ceux qui ont réussi l'examen pour 2, le temps de pressage moyen varie de 157,8 ms à 166,6 ms avec une probabilité de 95%, pour ceux qui ont réussi l'examen pour 5 - de 152,8 ms à 160,3 ms avec une probabilité de 95% .

Vous pouvez également tester l'hypothèse nulle à l'aide d'intervalles de confiance pour les moyennes, et pas seulement pour la différence entre les moyennes. Par exemple, comme dans notre cas, si les intervalles de confiance des moyennes se chevauchent, alors l'hypothèse nulle ne peut pas être rejetée. Afin de rejeter une hypothèse à un niveau de signification choisi, les intervalles de confiance correspondants ne doivent pas se chevaucher.

Trouvons l'intervalle de confiance pour la différence de temps de pressage moyen dans les groupes qui ont réussi l'examen pour 2 et 5. La différence dans les moyennes : 162,19 - 156,55 = 5,64. Coefficient de Student : \u003d t (0,05 ; 49 + 62-2) \u003d t (0,05 ; 109) \u003d 1,982. Les écarts-types de groupe seront égaux à : ; . On calcule l'erreur moyenne de la différence entre les moyennes : . Intervalle de confiance : \u003d (5,64-1,982 * 2,87 ; 5,64 + 1,982 * 2,87) \u003d (-0,044 ; 11,33).

Ainsi, la différence de temps de pressage moyen dans les groupes ayant réussi l'examen à 2 et à 5 sera comprise entre -0,044 ms et 11,33 ms. Cet intervalle comprend zéro, c'est-à-dire le temps de pressage moyen pour ceux qui ont réussi l'examen avec d'excellents résultats peut à la fois augmenter et diminuer par rapport à ceux qui ont réussi l'examen de manière insatisfaisante, c'est-à-dire l'hypothèse nulle ne peut être rejetée. Mais zéro étant très proche de la limite inférieure, le temps de pressing est beaucoup plus susceptible de diminuer pour les excellents passeurs. Ainsi, nous pouvons conclure qu'il existe encore des différences dans le temps de clic moyen entre ceux qui sont passés par 2 et par 5, nous n'avons tout simplement pas pu les détecter pour un changement donné du temps moyen, de la propagation du temps moyen et des tailles d'échantillon.

La puissance du test est la probabilité de rejeter une hypothèse nulle incorrecte, c'est-à-dire trouver les différences là où elles sont vraiment.

La puissance du test est déterminée en fonction du niveau de signification, de l'ampleur des différences entre les groupes, de la répartition des valeurs dans les groupes et de la taille de l'échantillon.

Pour le test t de Student et l'analyse de la variance, vous pouvez utiliser des graphiques de sensibilité.

La puissance du critère peut être utilisée dans la détermination préliminaire du nombre requis de groupes.

L'intervalle de confiance indique dans quelles limites se situe la vraie valeur du paramètre estimé avec une probabilité donnée.

À l'aide d'intervalles de confiance, vous pouvez tester des hypothèses statistiques et tirer des conclusions sur la sensibilité des critères.

LITTÉRATURE.

Glantz S. - Chapitre 6.7.

Rebrova O.Yu. - p.112-114, p.171-173, p.234-238.

Sidorenko E.V. - pp. 32-33.

Questions pour l'auto-examen des étudiants.

1. Quelle est la puissance du critère ?

2. Dans quels cas faut-il évaluer la puissance des critères ?

3. Méthodes de calcul de la puissance.

6. Comment tester une hypothèse statistique à l'aide d'un intervalle de confiance ?

7. Que peut-on dire de la puissance du critère lors du calcul de l'intervalle de confiance ?

Tâches.