Interval de încredere. ABC al statisticilor medicale

De multe ori evaluatorul trebuie să analizeze piața imobiliară a segmentului în care se află obiectul de evaluare. Dacă piața este dezvoltată, poate fi dificil să se analizeze întregul set de obiecte prezentate, prin urmare, pentru analiză se folosește un eșantion de obiecte. Acest eșantion nu este întotdeauna omogen, uneori este necesar să îl curățați de extreme - oferte de piață prea mari sau prea scăzute. În acest scop, se aplică interval de încredere. Scopul acestui studiu este de a efectua o analiză comparativă a două metode de calculare a intervalului de încredere și de a alege cea mai bună opțiune de calcul atunci când se lucrează cu diferite eșantioane în sistemul estimatica.pro.

Interval de încredere - calculat pe baza eșantionului, intervalul de valori ale caracteristicii, care, cu o probabilitate cunoscută, conține parametrul estimat al populației generale.

Sensul calculării intervalului de încredere este de a construi un astfel de interval pe baza datelor eșantionului, astfel încât să se poată afirma cu o probabilitate dată că valoarea parametrului estimat se află în acest interval. Cu alte cuvinte, intervalul de încredere cu o anumită probabilitate conține valoarea necunoscută a cantității estimate. Cu cât intervalul este mai larg, cu atât este mai mare inexactitatea.

Există diferite metode pentru determinarea intervalului de încredere. În acest articol, vom lua în considerare 2 moduri:

  • prin abaterea mediană și standard;
  • prin valoarea critică a statisticii t (coeficientul Student).

Etapele unei analize comparative a diferitelor metode de calcul al CI:

1. formați un eșantion de date;

2. o procesăm cu metode statistice: calculăm valoarea medie, mediana, varianța etc.;

3. calculăm intervalul de încredere în două moduri;

4. Analizați probele curățate și intervalele de încredere obținute.

Etapa 1. Eșantionarea datelor

Eșantionul a fost format folosind sistemul estimatica.pro. Eșantionul a inclus 91 de oferte pentru vânzarea de apartamente cu 1 cameră în zona de preț a 3-a cu tipul de planificare „Hrușciov”.

Tabelul 1. Proba inițială

Pretul de 1 mp, c.u.

Fig.1. Proba inițială



Etapa 2. Prelucrarea probei initiale

Prelucrarea probelor prin metode statistice necesită calcularea următoarelor valori:

1. Media aritmetică

2. Mediană - un număr care caracterizează eșantionul: exact jumătate dintre elementele eșantionului sunt mai mari decât mediana, cealaltă jumătate este mai mică decât mediana

(pentru un eșantion cu un număr impar de valori)

3. Interval - diferența dintre valorile maxime și minime din eșantion

4. Varianta - folosit pentru a estima mai precis variatia datelor

5. Abaterea standard pentru eșantion (denumită în continuare RMS) este cel mai comun indicator al dispersării valorilor de ajustare în jurul mediei aritmetice.

6. Coeficient de variație – reflectă gradul de dispersie a valorilor de ajustare

7. coeficient de oscilație - reflectă fluctuația relativă a valorilor extreme ale prețurilor din eșantion în jurul mediei

Tabelul 2. Indicatori statistici ai eșantionului inițial

Coeficientul de variație, care caracterizează omogenitatea datelor, este de 12,29%, dar coeficientul de oscilație este prea mare. Astfel, putem afirma că eșantionul original nu este omogen, deci să trecem la calcularea intervalului de încredere.

Etapa 3. Calculul intervalului de încredere

Metoda 1. Calculul prin mediană și abaterea standard.

Intervalul de încredere se determină astfel: valoarea minimă - abaterea standard se scade din mediană; valoarea maximă - la mediană se adaugă abaterea standard.

Astfel, intervalul de încredere (47179 CU; 60689 CU)

Orez. 2. Valori în intervalul de încredere 1.



Metoda 2. Construirea unui interval de încredere prin valoarea critică a statisticilor t (coeficientul studentului)

S.V. Gribovsky în cartea „Metode matematice pentru evaluarea valorii proprietății” descrie o metodă de calcul a intervalului de încredere prin coeficientul Student. La calcularea prin această metodă, estimatorul însuși trebuie să stabilească nivelul de semnificație ∝, care determină probabilitatea cu care se va construi intervalul de încredere. Nivelurile de semnificație de 0,1 sunt utilizate în mod obișnuit; 0,05 și 0,01. Ele corespund probabilităților de încredere de 0,9; 0,95 și 0,99. Cu această metodă, adevăratele valori ale așteptării și varianței matematice sunt considerate practic necunoscute (ceea ce este aproape întotdeauna adevărat atunci când se rezolvă probleme practice de evaluare).

Formula intervalului de încredere:

n - dimensiunea eșantionului;

Valoarea critică a t-statisticilor (distribuții Student) cu un nivel de semnificație ∝, numărul de grade de libertate n-1, care este determinat de tabele statistice speciale sau folosind MS Excel (→„Statistice”→ STUDRASPOBR);

∝ - nivelul de semnificație, luăm ∝=0,01.

Orez. 2. Valori în intervalul de încredere 2.

Pasul 4. Analiza diferitelor moduri de calculare a intervalului de încredere

Două metode de calcul a intervalului de încredere - prin mediană și coeficientul Student - au condus la valori diferite ale intervalelor. În consecință, au fost obținute două probe purificate diferite.

Tabelul 3. Indicatori statistici pentru trei eșantioane.

Index

Proba inițială

1 opțiune

Opțiunea 2

Rău

Dispersia

Coef. variatii

Coef. oscilații

Număr de obiecte retrase, buc.

Pe baza calculelor efectuate, putem spune că valorile intervalelor de încredere obținute prin diferite metode se intersectează, astfel încât puteți utiliza oricare dintre metodele de calcul la discreția evaluatorului.

Considerăm însă că atunci când lucrăm în sistemul estimatica.pro, este indicat să alegeți o metodă de calcul a intervalului de încredere, în funcție de gradul de dezvoltare a pieței:

  • dacă piața nu este dezvoltată, aplicați metoda de calcul prin mediană și deviația standard, deoarece numărul de obiecte retrase în acest caz este mic;
  • dacă piața este dezvoltată, aplicați calculul prin valoarea critică a t-statisticilor (coeficientul Student), deoarece este posibil să se formeze un eșantion inițial mare.

La pregătirea articolului s-au folosit:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Metode matematice de apreciere a valorii proprietatii. Moscova, 2014

2. Date din sistemul estimatica.pro

Actualizat: 3 martie 2020
Fișier exemplu

Să construim un interval de încredere în MS EXCEL pentru estimarea valorii medii a distribuției în cazul unei valori cunoscute a varianței.

Desigur alegerea nivelul de încredere depinde complet de sarcina la îndemână. Astfel, gradul de încredere al pasagerului aerian în fiabilitatea aeronavei, desigur, ar trebui să fie mai mare decât gradul de încredere al cumpărătorului în fiabilitatea becului.

Formularea sarcinilor

Să presupunem că de la populatia luând probă marimea n. Se presupune că deviație standard această distribuţie este cunoscută. Necesar pe baza acestui fapt mostre evalua necunoscutul mijloc de distribuție(μ, ) și construiți corespunzătoare bilateralinterval de încredere .

Estimarea punctului

După cum se știe din statistici(să-i spunem X cf) este estimare imparțială a mediei acest populatiași are distribuția N(μ;σ 2 /n).

Notă : Ce se întâmplă dacă trebuie să construiești interval de încredereîn cazul distribuţiei, care nu estenormal?În acest caz, vine în ajutor, care spune că cu o dimensiune suficient de mare mostre n din distribuție non-normal , distribuţia prin eşantionare a statisticilor Х av va fi aproximativ corespund distributie normala cu parametrii N(μ;σ 2 /n).

Asa de, estimare punctualămijlocvalorile de distribuție avem este eșantion mediu, adică X cf. Acum hai să ne ocupăm interval de încredere.

Construirea unui interval de încredere

De obicei, cunoscând distribuția și parametrii acesteia, putem calcula probabilitatea ca o variabilă aleatorie să ia o valoare dintr-un interval dat. Acum să facem invers: găsim intervalul în care variabila aleatoare se încadrează cu o probabilitate dată. De exemplu, din proprietăți distributie normala se ştie că, cu o probabilitate de 95%, o variabilă aleatoare distribuită peste legea normală, se va încadra în intervalul de aproximativ +/- 2 de la Valoarea medie(vezi articolul despre). Acest interval va servi drept prototip pentru interval de încredere .

Acum să vedem dacă știm distribuția , pentru a calcula acest interval? Pentru a răspunde la întrebare, trebuie să precizăm forma de distribuție și parametrii acesteia.

Știm că este forma de distribuție distributie normala(rețineți că vorbim despre distribuția eșantionuluistatisticiX cf).

Parametrul μ ne este necunoscut (trebuie doar estimat folosind interval de încredere), dar avem estimarea ei X cf, calculat pe baza probă, care poate fi folosit.

Al doilea parametru este abaterea standard medie a probeivor fi cunoscute, este egal cu σ/√n.

pentru că nu știm μ, atunci vom construi intervalul +/- 2 abateri standard nu de la Valoarea medie, dar din estimarea sa cunoscută X cf. Acestea. la calcul interval de încredere NU vom presupune că X cf se va încadra în intervalul +/- 2 abateri standard de la μ cu o probabilitate de 95% și vom presupune că intervalul este +/- 2 abateri standard din X cf cu o probabilitate de 95% va acoperi μ - media populației generale, de la care probă. Aceste două afirmații sunt echivalente, dar a doua declarație ne permite să construim interval de încredere .

În plus, rafinăm intervalul: o variabilă aleatoare distribuită peste legea normală, cu o probabilitate de 95% se încadrează în intervalul +/- 1.960 abateri standard, nu +/- 2 abateri standard. Aceasta poate fi calculată folosind formula \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. fișier exemplu Spațiere între foi .

Acum putem formula o afirmație probabilistică care ne va servi să formăm interval de încredere: „Probabilitatea ca media populatiei situat din medie a probeiîn termen de 1.960" abaterile standard ale mediei eșantionului", este egal cu 95%.

Valoarea probabilității menționată în declarație are o denumire specială , care este asociat cu nivelul de semnificație α (alfa) printr-o expresie simplă nivel de încredere = 1 . În cazul nostru nivelul de semnificație α =1-0,95=0,05 .

Acum, pe baza acestei afirmații probabilistice, scriem o expresie pentru calcul interval de încredere :

unde Zα/2 standarddistributie normala(o astfel de valoare a unei variabile aleatoare z , ce P (z >= Zα/2 )=α/2).

Notă : α/2-quantila superioară definește lățimea interval de încredereîn abateri standardeșantion mediu. α/2-quantila superioară standarddistributie normala este întotdeauna mai mare decât 0, ceea ce este foarte convenabil.

În cazul nostru, la α=0,05, α/2-quantila superioară este egal cu 1.960. Pentru alte niveluri de semnificație α (10%; 1%) α/2-quantila superioarăZα/2 poate fi calculat folosind formula \u003d NORM.ST.OBR (1-α / 2) sau dacă se cunoaște nivel de încredere , =NORM.ST.OBR((1+nivel de încredere)/2) .

De obicei, la construirea intervale de încredere pentru estimarea mediei utilizați numai α superioară /2- cuantilăși nu folosiți mai mic α /2- cuantilă. Acest lucru este posibil pentru că standarddistributie normala simetric față de axa x ( densitatea distribuției sale simetric despre medie, adică 0) . Prin urmare, nu este nevoie să se calculeze α/2-cuantilă mai mică(se numește pur și simplu α /2-quantila), deoarece este egal α superioară /2- cuantilă cu semnul minus.

Reamintim că, indiferent de forma distribuției lui x, variabila aleatoare corespunzătoare X cf distribuite aproximativamenda N(μ;σ 2 /n) (vezi articolul despre). Prin urmare, în general, expresia de mai sus pentru interval de încredere este doar aproximativă. Dacă x este distribuit peste legea normală N(μ;σ 2 /n), apoi expresia pentru interval de încredere este exactă.

Calculul intervalului de încredere în MS EXCEL

Să rezolvăm problema. Timpul de răspuns al unei componente electronice la un semnal de intrare este o caracteristică importantă a unui dispozitiv. Un inginer dorește să traseze un interval de încredere pentru timpul mediu de răspuns la un nivel de încredere de 95%. Din experiența anterioară, inginerul știe că abaterea standard a timpului de răspuns este de 8 ms. Se știe că inginerul a făcut 25 de măsurători pentru a estima timpul de răspuns, valoarea medie a fost de 78 ms.

Soluţie: Un inginer vrea să știe timpul de răspuns al unui dispozitiv electronic, dar înțelege că timpul de răspuns nu este fix, ci o variabilă aleatorie care are propria sa distribuție. Deci, cel mai bun lucru la care poate spera este să determine parametrii și forma acestei distribuții.

Din păcate, din starea problemei, nu cunoaștem forma distribuției timpului de răspuns (nu trebuie să fie normal). , această distribuție este de asemenea necunoscută. Numai el este cunoscut deviație standardσ=8. Prin urmare, în timp ce nu putem calcula probabilitățile și construi interval de încredere .

Cu toate acestea, deși nu cunoaștem distribuția timprăspuns separat, știm că conform CPT , distribuția eșantionuluitimpul mediu de răspuns este de aproximativ normal(vom presupune că condițiile CPT sunt efectuate, deoarece marimea mostre suficient de mare (n=25)) .

În plus, in medie această distribuţie este egală cu Valoarea medie distribuții de răspuns unitare, de ex. μ. DAR deviație standard a acestei distribuții (σ/√n) poate fi calculată folosind formula =8/ROOT(25) .

De asemenea, se știe că inginerul a primit estimare punctuală parametrul μ egal cu 78 ms (X cf). Prin urmare, acum putem calcula probabilitățile, deoarece cunoaștem forma de distribuție ( normal) și parametrii săi (Х ср și σ/√n).

Inginerul vrea să știe valorea estimataμ din distribuția timpului de răspuns. După cum sa menționat mai sus, acest μ este egal cu așteptarea distribuției eșantionului a timpului mediu de răspuns. Dacă folosim distributie normala N(X cf; σ/√n), atunci μ dorit va fi în intervalul +/-2*σ/√n cu o probabilitate de aproximativ 95%.

Nivel de semnificație este egal cu 1-0,95=0,05.

În cele din urmă, găsiți chenarul din stânga și din dreapta interval de încredere. Chenarul din stânga: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / ROOT (25) = 74,864 Chenarul din dreapta: \u003d 78 + NORM. ST. OBR (1-0,05 / 2) * 8 / ROOT (25) \u003d 81,136

Chenarul din stânga: =NORM.INV(0,05/2, 78, 8/SQRT(25)) Chenarul din dreapta: =NORM.INV(1-0,05/2, 78, 8/SQRT(25))

Răspuns : interval de încredere la Nivel de încredere de 95% și σ =8 msec egală 78+/-3,136 ms

LA exemplu de fișier pe foaia Sigma cunoscut a creat o formă de calcul și construcție bilateralinterval de încredere pentru arbitrar mostre cu un σ dat și nivelul de semnificație .

Funcția CONFIDENCE.NORM().

Dacă valorile mostre sunt în gamă B20:B79 , A nivelul de semnificație egal cu 0,05; apoi formula MS EXCEL: =MEDIE(B20:B79)-ÎNCREDERE(0,05,σ, NUMĂRĂ(B20:B79)) va întoarce marginea stângă interval de încredere .

Aceeași limită poate fi calculată folosind formula: =MEDIE(B20:B79)-NORM.ST.INV(1-0,05/2)*σ/SQRT(NUMĂRĂ(B20:B79))

Notă: Funcția TRUST.NORM() a apărut în MS EXCEL 2010. Versiunile anterioare ale MS EXCEL foloseau funcția TRUST().

Probabilități, recunoscute ca fiind suficiente pentru a judeca cu încredere parametrii generali pe baza caracteristicilor eșantionului, sunt numite fiduciar .

De obicei, valorile de 0,95 sunt alese ca probabilități de încredere; 0,99; 0,999 (de obicei sunt exprimate ca procent - 95%, 99%, 99,9%). Cu cât este mai mare măsura responsabilității, cu atât este mai mare nivelul de încredere: 99% sau 99,9%.

Un nivel de încredere de 0,95 (95%) este considerat suficient în cercetarea științifică în domeniul culturii fizice și sportului.

Intervalul în care se găsește media aritmetică a eșantionului a populației generale cu o probabilitate de încredere dată se numește interval de încredere .

Nivelul de semnificație al evaluării este un număr mic α, a cărui valoare implică probabilitatea ca acesta să fie în afara intervalului de încredere. În conformitate cu probabilitățile de încredere: α 1 = (1-0,95) = 0,05; α 2 \u003d (1 - 0,99) \u003d 0,01 etc.

Interval de încredere pentru medie (așteptări) A distributie normala:

,

unde este fiabilitatea (probabilitatea de încredere) a estimării; - medie eșantionului; s - abaterea standard corectată; n este dimensiunea eșantionului; t γ este valoarea determinată din tabelul de distribuție a lui Student (vezi Anexa, Tabelul 1) pentru n și γ dat.

Pentru a găsi limitele intervalului de încredere a valorii medii a populației generale, este necesar:

1. Calculați și s.

2. Este necesar să se stabilească probabilitatea de încredere (fiabilitatea) γ a estimării 0,95 (95%) sau nivelul de semnificație α 0,05 (5%)

3. Conform tabelului t - Distribuțiile lui Student (Anexă, Tabelul 1) găsiți valorile la limită ale lui t γ .

Deoarece distribuția t este simetrică față de punctul zero, este suficient să cunoaștem doar valoarea pozitivă a lui t. De exemplu, dacă dimensiunea eșantionului este n=16, atunci numărul de grade de libertate (grade de libertate, df) t– distribuții df=16 - 1=15 . Conform tabelului 1 aplicare t 0,05 = 2,13 .

4. Găsim limitele intervalului de încredere pentru α = 0,05 și n=16:

Limitele încrederii:

Pentru dimensiuni mari ale eșantionului (n ≥ 30) t – Distribuția elevului devine normală. Prin urmare, intervalul de încredere pentru pentru n ≥ 30 poate fi scris după cum urmează:

Unde u sunt punctele procentuale ale distribuției normale normalizate.

Pentru probabilitățile standard de încredere (95%, 99%; 99,9%) și nivelurile de semnificație valori α ( u) sunt date în tabelul 8.

Tabelul 8

Valori pentru nivelurile de încredere standard α

α u
0,05 1,96
0,01 2,58
0,001 3,28

Pe baza datelor din exemplul 1, definim limitele celor 95% interval de încredere (α = 0,05) pentru rezultatul mediu al săriturii în sus de la fața locului.În exemplul nostru, dimensiunea eșantionului este n = 65, apoi recomandările pentru o dimensiune mare a eșantionului pot fi utilizate pentru a determina limitele intervalului de încredere.

Konstantin Krawchik explică clar ce este un interval de încredere în cercetarea medicală și cum să-l folosească

„Katren-Style” continuă să publice un ciclu al lui Konstantin Kravchik despre statisticile medicale. În două articole anterioare, autorul a atins explicația unor concepte precum și.

Constantin Kravcik

Matematician-analist. Specialist în domeniul cercetării statistice în medicină și științe umaniste

Orașul Moscova

Foarte des în articolele despre studiile clinice poți găsi o frază misterioasă: „interval de încredere” (95% CI sau 95% CI - interval de încredere). De exemplu, un articol ar putea spune: „Testul studentului a fost folosit pentru a evalua semnificația diferențelor, cu un interval de încredere de 95% calculat”.

Care este valoarea „intervalului de încredere 95%” și de ce să-l calculăm?

Ce este un interval de încredere? - Acesta este intervalul în care se încadrează adevăratele valori medii în populație. Și ce, există medii „neadevărate”? Într-un fel, da, o fac. În am explicat că este imposibil să se măsoare parametrul de interes în întreaga populație, așa că cercetătorii se mulțumesc cu un eșantion limitat. În această probă (de exemplu, după greutatea corporală) există o valoare medie (o anumită greutate), după care judecăm valoarea medie în întreaga populație generală. Cu toate acestea, este puțin probabil ca ponderea medie în eșantion (în special una mică) să coincidă cu ponderea medie în populația generală. Prin urmare, este mai corect să se calculeze și să se utilizeze intervalul de valori medii ale populației generale.

De exemplu, să presupunem că intervalul de încredere de 95% (IC 95%) pentru hemoglobină este între 110 și 122 g/L. Aceasta înseamnă că, cu o probabilitate de 95 %, adevărata valoare medie a hemoglobinei în populația generală va fi în intervalul de la 110 la 122 g/L. Cu alte cuvinte, nu cunoaștem hemoglobina medie în populația generală, dar putem indica intervalul de valori pentru această caracteristică cu o probabilitate de 95%.

Intervalele de încredere sunt deosebit de relevante pentru diferența de medii dintre grupuri sau ceea ce se numește mărimea efectului.

Să presupunem că am comparat eficacitatea a două preparate de fier: unul care este pe piață de mult timp și unul care tocmai a fost înregistrat. După cursul terapiei, a fost evaluată concentrația de hemoglobină în grupurile studiate de pacienți, iar programul statistic a calculat pentru noi că diferența dintre valorile medii ale celor două grupuri cu o probabilitate de 95% este în intervalul de la 1,72 până la 14,36 g/l (Tabelul 1).

Tab. 1. Criteriu pentru probe independente
(grupurile sunt comparate în funcție de nivelul hemoglobinei)

Acest lucru ar trebui interpretat după cum urmează: la o parte dintre pacienții din populația generală care iau un medicament nou, hemoglobina va fi mai mare în medie cu 1,72-14,36 g/l decât la cei care au luat un medicament deja cunoscut.

Cu alte cuvinte, în populația generală, diferența dintre valorile medii ale hemoglobinei în grupuri cu o probabilitate de 95% se află în aceste limite. Va rămâne la latitudinea cercetătorului să judece dacă este mult sau puțin. Ideea tuturor acestor lucruri este că nu lucrăm cu o valoare medie, ci cu o gamă de valori, prin urmare, estimăm mai fiabil diferența unui parametru între grupuri.

În pachetele statistice, la discreția cercetătorului, se pot îngusta sau extinde în mod independent granițele intervalului de încredere. Scăzând probabilitățile intervalului de încredere, restrângem intervalul de medii. De exemplu, la 90% IC, intervalul de medii (sau diferențele medii) va fi mai restrâns decât la 95% IC.

În schimb, creșterea probabilității la 99% mărește gama de valori. Când se compară grupuri, limita inferioară a CI poate depăși marcajul zero. De exemplu, dacă am extins limitele intervalului de încredere la 99 %, atunci limitele intervalului au variat între –1 și 16 g/L. Aceasta înseamnă că în populația generală există grupuri, diferența dintre mediile dintre care pentru trăsătura studiată este 0 (M=0).

Intervalele de încredere pot fi folosite pentru a testa ipotezele statistice. Dacă intervalul de încredere depășește valoarea zero, atunci ipoteza nulă, care presupune că grupurile nu diferă în parametrul studiat, este adevărată. Un exemplu este descris mai sus, când am extins limitele la 99%. Undeva în populația generală, am găsit grupuri care nu diferă în niciun fel.

Interval de încredere de 95% al ​​diferenței de hemoglobină, (g/l)


Figura arată intervalul de încredere de 95% al ​​diferenței medii de hemoglobină dintre cele două grupuri ca o linie. Linia trece de marcajul zero, prin urmare, există o diferență între medii egală cu zero, ceea ce confirmă ipoteza nulă că grupurile nu diferă. Diferența dintre grupuri variază de la -2 la 5 g/l, ceea ce înseamnă că hemoglobina poate fie să scadă cu 2 g/l, fie să crească cu 5 g/l.

Intervalul de încredere este un indicator foarte important. Datorită acesteia, puteți vedea dacă diferențele dintre grupuri s-au datorat într-adevăr diferenței de medii sau datorită unui eșantion mare, deoarece la un eșantion mare, șansele de a găsi diferențe sunt mai mari decât la unul mic.

În practică, ar putea arăta așa. Am luat un eșantion de 1000 de persoane, am măsurat nivelul hemoglobinei și am constatat că intervalul de încredere pentru diferența de medii este de la 1,2 la 1,5 g/L. Nivelul semnificației statistice în acest caz p

Vedem că concentrația de hemoglobină a crescut, dar aproape imperceptibil, prin urmare, semnificația statistică a apărut tocmai datorită dimensiunii eșantionului.

Intervalele de încredere pot fi calculate nu numai pentru medii, ci și pentru proporții (și rapoarte de risc). De exemplu, ne interesează intervalul de încredere al proporțiilor de pacienți care au obținut remisie în timp ce luau medicamentul dezvoltat. Să presupunem că IC de 95% pentru proporții, adică pentru proporția de astfel de pacienți, este în intervalul 0,60-0,80. Astfel, putem spune că medicamentul nostru are un efect terapeutic în 60 până la 80% din cazuri.

Calculul intervalului de încredere se bazează pe eroarea medie a parametrului corespunzător. Interval de încredere arată în ce limite cu probabilitate (1-a) este valoarea adevărată a parametrului estimat. Aici a este nivelul de semnificație, (1-a) se mai numește și nivelul de încredere.

În primul capitol, am arătat că, de exemplu, pentru media aritmetică, adevărata medie a populației se află în 2 erori medii ale mediei aproximativ 95% din timp. Astfel, limitele intervalului de încredere de 95% pentru medie vor fi de la media eșantionului de două ori mai mare decât eroarea medie a mediei, i.e. înmulțim eroarea medie a mediei cu un factor care depinde de nivelul de încredere. Pentru medie și diferența de medii se ia coeficientul Student (valoarea critică a criteriului Student), pentru ponderea și diferența cotelor, valoarea critică a criteriului z. Produsul coeficientului și eroarea medie poate fi numit eroarea marginală a acestui parametru, adică. maximul pe care îl putem obține atunci când îl evaluăm.

Interval de încredere pentru medie aritmetică : .

Iată media eșantionului;

Eroarea medie a mediei aritmetice;

s- abaterea standard a probei;

n

f = n-1 (Coeficientul elevului).

Interval de încredere pentru diferența de medii aritmetice :

Aici este diferența dintre mediile eșantionului;

- eroarea medie a diferenţei de medii aritmetice;

s 1 ,s 2 - abateri standard ale probei;

n1,n2

Valoarea critică a criteriului Studentului pentru un anumit nivel de semnificație a și numărul de grade de libertate f=n1 +n2-2 (Coeficientul elevului).

Interval de încredere pentru acțiuni :

.

Aici d este cota eșantionului;

– eroare medie de cotă;

n– dimensiunea eșantionului (mărimea grupului);

Interval de încredere pentru împărtășește diferențele :

Iată diferența dintre acțiunile eșantionului;

este eroarea medie a diferenței dintre mediile aritmetice;

n1,n2– dimensiunile eșantionului (număr de grupuri);

Valoarea critică a criteriului z la un nivel de semnificație dat a ( , , ).

Prin calcularea intervalelor de încredere pentru diferența de indicatori, în primul rând, vedem direct valorile posibile ale efectului, și nu doar estimarea punctuală a acestuia. În al doilea rând, putem trage o concluzie despre acceptarea sau infirmarea ipotezei nule și, în al treilea rând, putem trage o concluzie despre puterea criteriului.

La testarea ipotezelor folosind intervale de încredere, trebuie respectată următoarea regulă:

Dacă intervalul de încredere de 100(1-a)-procent al diferenței medii nu conține zero, atunci diferențele sunt semnificative statistic la nivelul de semnificație; dimpotrivă, dacă acest interval conține zero, atunci diferențele nu sunt semnificative statistic.

Într-adevăr, dacă acest interval conține zero, atunci înseamnă că indicatorul comparat poate fi fie mai mult, fie mai puțin într-unul dintre grupuri în comparație cu celălalt, i.e. diferențele observate sunt aleatorii.

După locul în care se află zero în intervalul de încredere, se poate judeca puterea criteriului. Dacă zero este aproape de limita inferioară sau superioară a intervalului, atunci poate cu un număr mai mare de grupuri comparate, diferențele ar ajunge la semnificație statistică. Dacă zero este aproape de mijlocul intervalului, înseamnă că atât creșterea, cât și scăderea indicatorului în grupul experimental sunt la fel de probabile și, probabil, chiar nu există diferențe.

Exemple:

Pentru a compara mortalitatea chirurgicală la utilizarea a două tipuri diferite de anestezie: 61 de persoane au fost operate folosind primul tip de anestezie, 8 au murit, folosind al doilea - 67 de persoane, 10 au murit.

d 1 \u003d 8/61 \u003d 0,131; d 2 \u003d 10/67 \u003d 0,149; d1-d2 = - 0,018.

Diferența de letalitate a metodelor comparate va fi în intervalul (-0,018 - 0,122; -0,018 + 0,122) sau (-0,14; 0,104) cu o probabilitate de 100(1-a) = 95%. Intervalul conține zero, adică. nu poate fi respinsă ipoteza aceleiaşi letităţi cu două tipuri diferite de anestezie.

Astfel, mortalitatea poate și va scădea la 14% și crește la 10,4% cu o probabilitate de 95%, adică. zero este aproximativ la mijlocul intervalului, deci se poate argumenta că, cel mai probabil, aceste două metode nu diferă într-adevăr în ceea ce privește letalitatea.

În exemplul considerat mai devreme, timpul mediu de atingere a fost comparat în patru grupuri de studenți care diferă în ceea ce privește scorurile la examen. Să calculăm intervalele de încredere ale timpului mediu de apăsare pentru studenții care au promovat examenul pentru 2 și 5 și intervalul de încredere pentru diferența dintre aceste medii.

Coeficienții lui Student se regăsesc din tabelele de distribuție a lui Student (vezi Anexa): pentru prima grupă: = t(0,05;48) = 2,011; pentru a doua grupă: = t(0,05;61) = 2,000. Astfel, intervale de încredere pentru primul grup: = (162,19-2,011 * 2,18; 162,19 + 2,011 * 2,18) = (157,8; 166,6) , pentru al doilea grup (156,55- 2,000*2,000*1,88..; 8 = 1,88..; 8) ; 160,3). Deci, pentru cei care au promovat examenul pentru 2, timpul mediu de apăsare variază de la 157,8 ms la 166,6 ms cu o probabilitate de 95%, pentru cei care au promovat examenul pentru 5 - de la 152,8 ms la 160,3 ms cu o probabilitate de 95% .

De asemenea, puteți testa ipoteza nulă folosind intervale de încredere pentru medii și nu doar pentru diferența dintre medii. De exemplu, ca și în cazul nostru, dacă intervalele de încredere pentru medii se suprapun, atunci ipoteza nulă nu poate fi respinsă. Pentru a respinge o ipoteză la un nivel de semnificație ales, intervalele de încredere corespunzătoare nu trebuie să se suprapună.

Să aflăm intervalul de încredere pentru diferența în timpul mediu de presare la grupele care au promovat examenul pentru 2 și 5. Diferența mediilor: 162,19 - 156,55 = 5,64. Coeficientul studentului: \u003d t (0,05; 49 + 62-2) \u003d t (0,05; 109) \u003d 1,982. Abaterile standard de grup vor fi egale cu: ; . Calculăm eroarea medie a diferenței dintre medii: . Interval de încredere: \u003d (5,64-1,982 * 2,87; 5,64 + 1,982 * 2,87) \u003d (-0,044; 11,33).

Așadar, diferența de timp mediu de presare în grupele care au promovat examenul la 2 și la 5 va fi în intervalul de la -0,044 ms la 11,33 ms. Acest interval include zero, adică timpul mediu de presare pentru cei care au promovat examenul cu rezultate excelente poate să crească și să scadă în comparație cu cei care au promovat examenul nesatisfăcător, adică. ipoteza nulă nu poate fi respinsă. Dar zero este foarte aproape de limita inferioară, timpul de apăsare este mult mai probabil să scadă pentru trecătorii excelenți. Astfel, putem concluziona că există încă diferențe în timpul mediu de clic între cei care au trecut cu 2 și cu 5, pur și simplu nu le-am putut detecta pentru o anumită modificare a timpului mediu, a răspândirii timpului mediu și a dimensiunilor eșantionului.

Puterea testului este probabilitatea de a respinge o ipoteză nulă incorectă, i.e. găsiți diferențele acolo unde sunt cu adevărat.

Puterea testului este determinată pe baza nivelului de semnificație, a mărimii diferențelor dintre grupuri, a răspândirii valorilor în grupuri și a mărimii eșantionului.

Pentru testul t Student și analiza varianței, puteți utiliza diagrame de sensibilitate.

Puterea criteriului poate fi utilizată în determinarea preliminară a numărului necesar de grupuri.

Intervalul de încredere arată în ce limite se află valoarea adevărată a parametrului estimat cu o probabilitate dată.

Cu ajutorul intervalelor de încredere, puteți testa ipoteze statistice și puteți trage concluzii despre sensibilitatea criteriilor.

LITERATURĂ.

Glantz S. - Capitolul 6.7.

Rebrova O.Yu. - p.112-114, p.171-173, p.234-238.

Sidorenko E. V. - p. 32-33.

Întrebări pentru autoexaminarea studenților.

1. Care este puterea criteriului?

2. În ce cazuri este necesară evaluarea puterii criteriilor?

3. Metode de calcul al puterii.

6. Cum se testează o ipoteză statistică folosind un interval de încredere?

7. Ce se poate spune despre puterea criteriului la calcularea intervalului de încredere?

Sarcini.