Interval povjerenja. Abeceda medicinske statistike

Često procjenitelj mora analizirati tržište nekretnina segmenta u kojem se nekretnina koja se procjenjuje nalazi. Ako je tržište razvijeno, može biti teško analizirati cijeli skup prikazanih objekata, pa se za analizu koristi uzorak objekata. Ovaj uzorak se ne pokaže uvijek homogenim, ponekad ga je potrebno očistiti od ekstremnih tačaka – previsokih ili preniskih tržišnih ponuda. U tu svrhu se koristi interval povjerenja. Svrha ovog istraživanja je da se izvrši komparativna analiza dvije metode za izračunavanje intervala povjerenja i izbor optimalne opcije proračuna pri radu sa različitim uzorcima u sistemu estimatica.pro.

Interval pouzdanosti je interval vrijednosti atributa koji se izračunava na osnovu uzorka, koji sa poznatom vjerovatnoćom sadrži procijenjeni parametar opće populacije.

Smisao izračunavanja intervala povjerenja je da se takav interval konstruiše na osnovu podataka uzorka tako da se sa datom vjerovatnoćom može konstatovati da je vrijednost procijenjenog parametra u ovom intervalu. Drugim riječima, interval povjerenja sadrži nepoznatu vrijednost procijenjene vrijednosti sa određenom vjerovatnoćom. Što je interval širi, to je veća nepreciznost.

Postoje različite metode za određivanje intervala pouzdanosti. U ovom članku ćemo pogledati 2 metode:

  • kroz medijanu i standardnu ​​devijaciju;
  • kroz kritičnu vrijednost t-statistike (Studentov koeficijent).

Faze uporedne analize različitih metoda za izračunavanje CI:

1. formirati uzorak podataka;

2. obrađujemo statističkim metodama: izračunavamo prosječnu vrijednost, medijan, varijansu itd.;

3. izračunati interval pouzdanosti na dva načina;

4. analizirati očišćene uzorke i rezultirajuće intervale pouzdanosti.

Faza 1. Uzorkovanje podataka

Uzorak je formiran pomoću sistema estimatica.pro. Uzorak je uključivao 91 ponudu za prodaju jednosobnih stanova u 3. zoni cijena sa tipom rasporeda „Hruščov“.

Tabela 1. Početni uzorak

Cijena 1 m2, jed

Fig.1. Početni uzorak



Faza 2. Obrada početnog uzorka

Obrada uzorka pomoću statističkih metoda zahtijeva izračunavanje sljedećih vrijednosti:

1. Aritmetička sredina

2. Medijan - broj koji karakteriše uzorak: tačno polovina elemenata uzorka je veća od medijane, druga polovina je manja od medijane

(za uzorak s neparnim brojem vrijednosti)

3. Raspon - razlika između maksimalne i minimalne vrijednosti u uzorku

4. Varijanca – koristi se za precizniju procjenu varijacije podataka

5. Standardna devijacija uzorka (u daljem tekstu - SD) je najčešći indikator disperzije vrednosti podešavanja oko aritmetičke sredine.

6. Koeficijent varijacije - odražava stepen rasipanja vrednosti podešavanja

7. koeficijent oscilacije - odražava relativnu fluktuaciju ekstremnih vrijednosti cijene u uzorku oko prosjeka

Tabela 2. Statistički pokazatelji originalnog uzorka

Koeficijent varijacije, koji karakteriše homogenost podataka, iznosi 12,29%, ali je koeficijent oscilacije previsok. Dakle, možemo reći da originalni uzorak nije homogen, pa prijeđimo na izračunavanje intervala povjerenja.

Faza 3. Proračun intervala povjerenja

Metoda 1. Proračun korištenjem medijane i standardne devijacije.

Interval pouzdanosti se određuje na sljedeći način: minimalna vrijednost - standardna devijacija se oduzima od medijane; maksimalna vrijednost - standardna devijacija se dodaje medijani.

Dakle, interval povjerenja (47179 CU; 60689 CU)

Rice. 2. Vrijednosti koje spadaju u interval pouzdanosti 1.



Metoda 2. Izrada intervala povjerenja korištenjem kritične vrijednosti t-statistike (Student koeficijent)

S.V. Gribovsky u svojoj knjizi “Matematičke metode za procjenu vrijednosti svojstva” opisuje metodu za izračunavanje intervala povjerenja preko Studentovog koeficijenta. Prilikom izračunavanja pomoću ove metode, procjenitelj mora sam postaviti nivo značajnosti ∝, koji određuje vjerovatnoću sa kojom će se konstruirati interval povjerenja. Obično se koriste nivoi značajnosti od 0,1; 0,05 i 0,01. Oni odgovaraju vjerovatnoći pouzdanosti od 0,9; 0,95 i 0,99. Ovom metodom se pretpostavlja da su prave vrijednosti matematičkog očekivanja i varijanse praktički nepoznate (što je gotovo uvijek tačno kada se rješavaju praktični problemi procjene).

Formula intervala povjerenja:

n - veličina uzorka;

Kritična vrijednost t-statistike (Studentova distribucija) sa nivoom značajnosti ∝, brojem stupnjeva slobode n-1, koji se utvrđuje iz posebnih statističkih tabela ili korištenjem MS Excel-a (→"Statistički"→ STUDIST);

∝ - nivo značajnosti, uzmite ∝=0,01.

Rice. 2. Vrijednosti koje spadaju u interval pouzdanosti 2.

Faza 4. Analiza različitih metoda za izračunavanje intervala povjerenja

Dvije metode izračunavanja intervala povjerenja - kroz medijanu i Studentov koeficijent - dovele su do različitih vrijednosti intervala. Shodno tome, dobili smo dva različita očišćena uzorka.

Tabela 3. Statistika za tri uzorka.

Indeks

Početni uzorak

1 opcija

Opcija 2

Prosječna vrijednost

Disperzija

Coef. varijacije

Coef. oscilacije

Broj penzionisanih objekata, kom.

Na osnovu izvršenih proračuna, možemo reći da se vrijednosti intervala povjerenja dobivene različitim metodama ukrštaju, tako da možete koristiti bilo koju od metoda proračuna prema nahođenju procjenitelja.

Međutim, smatramo da je pri radu u sistemu estimatica.pro preporučljivo odabrati metodu za izračunavanje intervala povjerenja u zavisnosti od stepena razvijenosti tržišta:

  • ako je tržište nerazvijeno, koristite metodu obračuna koristeći medijanu i standardnu ​​devijaciju, jer je broj penzionisanih objekata u ovom slučaju mali;
  • ako je tržište razvijeno, proračun primijeniti kroz kritičnu vrijednost t-statistike (Studentov koeficijent), jer je moguće formirati veliki početni uzorak.

U pripremi članka korišteno je sljedeće:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matematičke metode za procjenu vrijednosti imovine. Moskva, 2014

2. Sistemski podaci estimatica.pro

Ažurirano: 3. marta 2020
Primjer fajla

Konstruirajmo interval pouzdanosti u MS EXCEL-u da bismo procijenili srednju vrijednost distribucije u slučaju poznate vrijednosti disperzije.

Naravno izbor nivo poverenja potpuno zavisi od problema koji se rešava. Dakle, stepen povjerenja putnika u pouzdanost aviona nesumnjivo bi trebao biti veći od stepena povjerenja kupca u pouzdanost električne sijalice.

Formulacija problema

Pretpostavimo da od stanovništva oduzeto uzorak veličina n. Pretpostavlja se da standardna devijacija ova distribucija je poznata. Na osnovu ovoga je neophodno uzorci proceniti nepoznato srednja distribucija(μ, ) i konstruisati odgovarajuće dvostranointerval povjerenja .

Tačka procjena

Kao što je poznato iz statistika(označimo ga X avg) je nepristrasna procjena srednje vrijednosti ovo stanovništva i ima distribuciju N(μ;σ 2 /n).

Bilješka : Šta učiniti ako trebate graditi interval povjerenja u slučaju distribucije koja nijenormalno? U ovom slučaju dolazi u pomoć, koji navodi da je s dovoljno velikom veličinom uzorci n iz distribucije ne bitinormalno , uzorak distribucije statistike X prosće otprilike dopisivati ​​se normalna distribucija sa parametrima N(μ;σ 2 /n).

dakle, tačka procjeneprosjekvrijednosti distribucije imamo - ovo srednja vrijednost uzorka, tj. X avg. Hajdemo sada interval povjerenja.

Izgradnja intervala povjerenja

Obično, poznavajući distribuciju i njene parametre, možemo izračunati vjerovatnoću da će slučajna varijabla uzeti vrijednost iz intervala koji odredimo. Sada uradimo suprotno: pronađite interval u koji će slučajna varijabla pasti sa datom vjerovatnoćom. Na primjer, iz svojstava normalna distribucija poznato je da je sa vjerovatnoćom od 95% slučajna varijabla raspoređena po normalan zakon, pasti će u raspon od približno +/- 2 od prosječna vrijednost(vidi članak o). Ovaj interval će nam poslužiti kao prototip interval povjerenja .

Sada da vidimo da li znamo distribuciju , izračunati ovaj interval? Da bismo odgovorili na pitanje, moramo navesti oblik distribucije i njene parametre.

Znamo oblik distribucije - to je normalna distribucija(zapamtite da govorimo o distribucija uzorkovanjastatistikaX avg).

Parametar μ nam je nepoznat (samo ga treba procijeniti pomoću interval povjerenja), ali imamo procjenu toga X prosječno, izračunato na osnovu uzorci, koji se mogu koristiti.

Drugi parametar - standardna devijacija srednje vrijednosti uzorkasmatraćemo to poznatim, jednako je σ/√n.

Jer ne znamo μ, onda ćemo izgraditi interval +/- 2 standardne devijacije ne od prosječna vrijednost, i iz njegove poznate procjene X avg. One. prilikom izračunavanja interval povjerenja to NEĆEMO pretpostaviti X avg spada u raspon +/- 2 standardne devijacije od μ sa vjerovatnoćom od 95%, a pretpostavićemo da je interval +/- 2 standardne devijacije od X avg sa vjerovatnoćom od 95% će pokriti μ – prosek opšte populacije, odakle je uzeta uzorak. Ove dvije izjave su ekvivalentne, ali nam druga izjava omogućava konstruiranje interval povjerenja .

Uz to, razjasnimo interval: slučajna varijabla raspoređena po normalan zakon, sa vjerovatnoćom od 95% spada u interval +/- 1.960 standardne devijacije, ne +/- 2 standardne devijacije. Ovo se može izračunati pomoću formule =NORM.ST.REV((1+0,95)/2), cm. primjer datoteke Sheet Interval .

Sada možemo da formulišemo probabilistički iskaz koji će nam poslužiti za formiranje interval povjerenja: „Vjerovatnoća da srednja populacija nalazi se od prosek uzorka unutar 1,960 " standardne devijacije srednje vrijednosti uzorka", jednako 95%".

Vrijednost vjerovatnoće spomenuta u izjavi ima poseban naziv , koji je povezan sa nivo značajnosti α (alfa) jednostavnim izrazom nivo poverenja = 1 . U našem slučaju nivo značajnosti α =1-0,95=0,05 .

Sada, na osnovu ove vjerovatnoće, pišemo izraz za izračunavanje interval povjerenja :

gdje je Z α/2 standardnormalna distribucija(ova vrijednost slučajne varijable z , Šta P (z >= Z α/2 )=α/2).

Bilješka : Gornji α/2-kvantil definiše širinu interval povjerenja V standardne devijacijesrednja vrijednost uzorka. Gornji α/2-kvantil standardnormalna distribucija uvijek veće od 0, što je vrlo zgodno.

U našem slučaju, sa α=0,05, gornji α/2-kvantil iznosi 1.960. Za druge nivoe značajnosti α (10%; 1%) gornji α/2-kvantilZ α/2 može se izračunati pomoću formule =NORM.ST.REV(1-α/2) ili, ako je poznato nivo poverenja , =NORM.ST.OBR((1+nivo povjerenja)/2) .

Obično prilikom izgradnje intervali povjerenja za procjenu srednje vrijednosti koristiti samo gornji α /2- kvantil i nemojte koristiti niži α /2- kvantil. Ovo je moguće jer standardnormalna distribucija simetrično oko x ose ( njegova gustina distribucije simetrično oko prosjek, tj. 0) . Stoga nema potrebe za kalkulacijom niži α/2-kvantil(jednostavno se zove α /2-kvantil), jer jednako je gornji α /2- kvantil sa znakom minus.

Podsjetimo da je, uprkos obliku distribucije vrijednosti x, odgovarajuća slučajna varijabla X avg distribuirano otprilikeU redu N(μ;σ 2 /n) (vidi članak o). Stoga, općenito, gornji izraz za interval povjerenja je samo aproksimacija. Ako je vrijednost x raspoređena po normalan zakon N(μ;σ 2 /n), zatim izraz za interval povjerenja je tačno.

Izračunavanje intervala pouzdanosti u MS EXCEL-u

Hajde da rešimo problem. Vrijeme odziva elektronske komponente na ulazni signal je važna karakteristika uređaja. Inženjer želi da konstruiše interval pouzdanosti za prosečno vreme odgovora na nivou pouzdanosti od 95%. Iz prethodnog iskustva, inženjer zna da je standardna devijacija vremena odziva 8 ms. Poznato je da je za procjenu vremena odziva inženjer izvršio 25 mjerenja, prosječna vrijednost bila je 78 ms.

Rješenje: Inženjer želi znati vrijeme odziva elektronskog uređaja, ali razumije da vrijeme odziva nije fiksna vrijednost, već slučajna varijabla koja ima svoju distribuciju. Dakle, najbolje čemu se može nadati je da odredi parametre i oblik ove distribucije.

Nažalost, iz uslova problema ne znamo oblik distribucije vremena odziva (ne mora biti normalno). , ova distribucija je također nepoznata. Samo on je poznat standardna devijacijaσ=8. Stoga, dok ne možemo izračunati vjerovatnoće i konstruirati interval povjerenja .

Međutim, uprkos činjenici da ne znamo distribuciju vrijemeodvojen odgovor, znamo da prema CPT , distribucija uzorkovanjaprosječno vrijeme odgovora je približno normalno(pretpostavićemo da su uslovi CPT se sprovode, jer veličina uzorci prilično velika (n=25)) .

Štaviše, prosjek ova distribucija je jednaka prosječna vrijednost distribucija jednog odgovora, tj. μ. A standardna devijacija ove distribucije (σ/√n) može se izračunati pomoću formule =8/ROOT(25) .

Takođe je poznato da je inženjer primio tačka procjene parametar μ jednak 78 ms (X pros.). Dakle, sada možemo izračunati vjerovatnoće, jer znamo oblik distribucije ( normalno) i njegove parametre (X avg i σ/√n).

Inženjer želi da zna očekivanu vrijednostμ distribucije vremena odziva. Kao što je gore navedeno, ovaj μ je jednak matematičko očekivanje distribucije uzorka prosječnog vremena odgovora. Ako koristimo normalna distribucija N(X avg; σ/√n), tada će željeni μ biti u opsegu +/-2*σ/√n sa vjerovatnoćom od približno 95%.

Nivo značaja jednako 1-0,95=0,05.

Konačno, pronađimo lijevu i desnu granicu interval povjerenja. Lijeva granica: =78-NORM.ST.REV(1-0,05/2)*8/ROOT(25) = 74,864 Desna granica: =78+NORM.ST.INV(1-0,05/2)*8/ROOT(25)=81,136

Lijeva granica: =NORM.REV(0,05/2; 78; 8/ROOT(25)) Desna granica: =NORM.REV(1-0,05/2; 78; 8/KORIJEN(25))

Odgovori : interval povjerenja at 95% nivo pouzdanosti i σ =8 msec jednaki 78+/-3,136 ms.

IN primjer datoteke na Sigma listu poznat, kreirao obrazac za obračun i konstrukciju dvostranointerval povjerenja za proizvoljno uzorci sa datim σ i nivo značaja .

CONFIDENCE.NORM() funkcija

Ako vrijednosti uzorci su u dometu B20:B79 , A nivo značajnosti jednako 0,05; zatim MS EXCEL formula: =PROSJEČNO(B20:B79)-POVJERENJE.NORMA(0,05;σ; BROJ(B20:B79))će vratiti lijevu ivicu interval povjerenja .

Ista granica se može izračunati pomoću formule: =PROSJEK(B20:B79)-NORM.ST.REV(1-0,05/2)*σ/ROOT(BROJ(B20:B79))

Bilješka: Funkcija CONFIDENCE.NORM() pojavila se u MS EXCEL-u 2010. U ranijim verzijama MS EXCEL-a, korištena je funkcija TRUST().

Vjerovatnoće, koji su prepoznati kao dovoljni za pouzdano prosuđivanje opštih parametara na osnovu karakteristika uzorka, nazivaju se pouzdan .

Obično se vrijednosti od 0,95 biraju kao vjerovatnoće povjerenja; 0,99; 0,999 (obično se izražavaju u procentima - 95%, 99%, 99,9%). Što je veća mera odgovornosti, to je veći nivo poverenja: 99% ili 99,9%.

Nivo pouzdanosti od 0,95 (95%) smatra se dovoljnim u naučnim istraživanjima u oblasti fizičkog vaspitanja i sporta.

Interval u kojem leži uzorkovana aritmetička sredina opće populacije sa datom vjerovatnoćom povjerenja naziva se interval povjerenja .

Nivo značaja procjene– mali broj α, čija vrijednost ukazuje na vjerovatnoću da je izvan intervala povjerenja. U skladu sa verovatnoćama poverenja: α 1 = (1-0,95) = 0,05; α 2 = (1 – 0,99) = 0,01, itd.

Interval povjerenja za srednju vrijednost (matematičko očekivanje) a normalna distribucija:

,

gdje je pouzdanost (vjerovatnoća pouzdanosti) procjene; - prosjek uzorka; s - korigovana standardna devijacija; n – veličina uzorka; t γ je vrijednost određena iz Studentove tabele raspodjele (vidi Dodatak, Tabela 1) za date n i γ.

Da biste pronašli granice intervala povjerenja srednje vrijednosti populacije, trebate:

1. Izračunajte i s.

2. Trebali biste postaviti nivo pouzdanosti (pouzdanosti) γ procjene na 0,95 (95%) ili nivo značajnosti α na 0,05 (5%)

3. Koristeći tabelu t-Studentove raspodjele (Dodatak, Tabela 1), pronađite granične vrijednosti t γ.

Pošto je t raspodjela simetrična oko nulte tačke, dovoljno je znati samo pozitivnu vrijednost t. Na primjer, ako je veličina uzorka n=16, tada je broj stupnjeva slobode df) t– distribucije df=16 - 1=15 . Prema tabeli 1 aplikacija t 0,05 = 2,13 .

4. Odrediti granice intervala pouzdanosti za α = 0,05 i n = 16:

Granice povjerenja:

Za velike veličine uzoraka (n ≥ 30) t – Studentova distribucija postaje normalna. Dakle, interval pouzdanosti za za n ≥ 30 može se napisati na sljedeći način:

Gdje u- procentni poeni normalizovane normalne distribucije.

Za standardne vjerovatnoće pouzdanosti (95%, 99%; 99,9%) i nivoe značajnosti α vrijednosti ( u) date su u tabeli 8.

Tabela 8

Vrijednosti za standardne nivoe pouzdanosti α

α u
0,05 1,96
0,01 2,58
0,001 3,28

Na osnovu podataka iz primjera 1 odredit ćemo granice 95% interval povjerenja (α = 0,05) za prosječan rezultat skoka iz mjesta. U našem primjeru, veličina uzorka je n = 65, tada se preporuke za veliku veličinu uzorka mogu koristiti za određivanje granica intervala povjerenja.

Konstantin Kravčik jasno objašnjava šta je interval poverenja u medicinskim istraživanjima i kako ga koristiti

"Katren-Style" nastavlja izdavanje serije Konstantina Kravčika o medicinskoj statistici. U dva prethodna članka autor se bavio objašnjenjem pojmova kao što su i.

Konstantin Kravchik

Matematičar-analitičar. Specijalista za statistička istraživanja u medicini i humanističkim naukama

Moskva grad

Vrlo često u člancima o kliničkim studijama možete pronaći misterioznu frazu: “interval pouzdanosti” (95 % CI ili 95 % CI - interval pouzdanosti). Na primjer, članak bi mogao napisati: „Da bi se procijenila značajnost razlika, korišćen je Studentov t-test za izračunavanje intervala pouzdanosti od 95 %.“

Koja je vrijednost “95 % intervala pouzdanosti” i zašto je izračunati?

Šta je interval pouzdanosti? - Ovo je raspon unutar kojeg prava populacija znači laž. Postoje li “neistiniti” prosjeci? U određenom smislu, da, imaju. Objasnili smo da je nemoguće izmjeriti parametar od interesa u cijeloj populaciji, pa se istraživači zadovoljavaju ograničenim uzorkom. U ovom uzorku (na primjer, na osnovu tjelesne težine) postoji jedna prosječna vrijednost (određena težina), po kojoj prosuđujemo prosječnu vrijednost u cijeloj populaciji. Međutim, malo je vjerovatno da će se prosječna težina u uzorku (posebno malom) poklapati sa prosječnom težinom u općoj populaciji. Stoga je ispravnije izračunati i koristiti raspon prosječnih vrijednosti populacije.

Na primjer, zamislite da je interval pouzdanosti od 95% (95% CI) za hemoglobin 110 do 122 g/L. To znači da postoji 95% šanse da će prava srednja vrijednost hemoglobina u populaciji biti između 110 i 122 g/L. Drugim riječima, ne znamo prosječnu vrijednost hemoglobina u populaciji, ali možemo sa vjerovatnoćom od 95 % ukazati na raspon vrijednosti za ovu osobinu.

Intervali pouzdanosti su posebno relevantni za razlike u srednjim vrijednostima između grupa, ili veličinama efekta kako se nazivaju.

Recimo da smo uporedili efikasnost dva preparata gvožđa: jednog koji je već duže vreme na tržištu i jednog koji je tek registrovan. Nakon završene terapije vršili smo procenu koncentracije hemoglobina u ispitivanim grupama pacijenata, a statističkim programom je izračunato da je razlika između prosečnih vrednosti dve grupe sa verovatnoćom od 95 % u rasponu od 1,72 do 14,36 g/l (Tabela 1).

Table 1. Test za nezavisne uzorke
(grupe se porede po nivou hemoglobina)

Ovo treba tumačiti na sljedeći način: kod nekih pacijenata u općoj populaciji koji uzimaju novi lijek, hemoglobin će u prosjeku biti viši za 1,72–14,36 g/l nego kod onih koji su uzimali već poznati lijek.

Drugim riječima, u općoj populaciji razlika u prosječnim vrijednostima hemoglobina između grupa je u ovim granicama sa vjerovatnoćom od 95%. Na istraživaču će biti da proceni da li je to mnogo ili malo. Poenta svega je da ne radimo sa jednom prosječnom vrijednošću, već s rasponom vrijednosti, pa stoga pouzdanije procjenjujemo razliku u parametru između grupa.

U statističkim paketima, prema diskreciji istraživača, možete samostalno suziti ili proširiti granice intervala povjerenja. Smanjenjem vjerovatnoće intervala povjerenja, sužavamo raspon srednjih vrijednosti. Na primjer, pri 90 % CI raspon srednjih vrijednosti (ili razlika u srednjim vrijednostima) će biti uži nego kod 95 %.

Suprotno tome, povećanje vjerovatnoće na 99 % proširuje raspon vrijednosti. Prilikom poređenja grupa, donja granica CI može preći nultu oznaku. Na primjer, ako smo proširili granice intervala povjerenja na 99 %, onda su granice intervala bile u rasponu od –1 do 16 g/l. To znači da u opštoj populaciji postoje grupe čija je razlika u srednjim vrednostima za karakteristiku koja se proučava jednaka 0 (M = 0).

Koristeći interval pouzdanosti, možete testirati statističke hipoteze. Ako interval pouzdanosti prelazi nultu vrijednost, tada je tačna nulta hipoteza, koja pretpostavlja da se grupe ne razlikuju po parametru koji se proučava. Gore je opisan primjer gdje smo proširili granice na 99 %. Negdje u opštoj populaciji našli smo grupe koje se ni po čemu nisu razlikovale.

95% interval pouzdanosti razlike u hemoglobinu, (g/l)


Na slici je prikazan interval pouzdanosti od 95% za razliku srednjih vrijednosti hemoglobina između dvije grupe. Prava prolazi kroz nultu oznaku, stoga postoji razlika između srednjih vrijednosti nule, što potvrđuje nultu hipotezu da se grupe ne razlikuju. Raspon razlika između grupa je od –2 do 5 g/L. To znači da se hemoglobin može smanjiti za 2 g/L ili povećati za 5 g/L.

Interval pouzdanosti je veoma važan indikator. Zahvaljujući njemu možete vidjeti da li su razlike u grupama zaista nastale zbog razlike u srednjim vrijednostima ili zbog velikog uzorka, jer su kod velikog uzorka šanse za pronalaženje razlika veće nego kod malog.

U praksi bi to moglo izgledati ovako. Uzeli smo uzorak od 1000 ljudi, izmjerili nivoe hemoglobina i ustanovili da se interval pouzdanosti za razliku u srednjim vrijednostima kretao od 1,2 do 1,5 g/l. Nivo statističke značajnosti u ovom slučaju str

Vidimo da je koncentracija hemoglobina porasla, ali gotovo neprimjetno, pa se statistička značajnost pojavila upravo zbog veličine uzorka.

Intervali povjerenja mogu se izračunati ne samo za sredstva, već i za proporcije (i omjere rizika). Na primjer, zanima nas interval povjerenja proporcija pacijenata koji su postigli remisiju uzimajući razvijeni lijek. Pretpostavimo da se CI od 95 % za proporcije, odnosno za udio takvih pacijenata, nalazi u rasponu od 0,60–0,80. Dakle, možemo reći da naš lijek ima terapeutski učinak u 60 do 80 % slučajeva.

Izračunavanje intervala pouzdanosti zasniva se na prosječnoj grešci odgovarajućeg parametra. Interval povjerenja pokazuje u kojim granicama sa vjerovatnoćom (1-a) leži prava vrijednost procijenjenog parametra. Ovdje je a nivo značajnosti, (1-a) se također naziva vjerovatnoća povjerenja.

U prvom poglavlju smo pokazali da, na primjer, za aritmetičku sredinu, prava populacijska sredina u otprilike 95% slučajeva leži unutar 2 standardne greške srednje vrijednosti. Dakle, granice 95% intervala povjerenja za srednju vrijednost će biti odvojene od srednje vrijednosti uzorka dvostrukom srednjom greškom srednje vrijednosti, tj. množimo prosečnu grešku srednje vrednosti sa određenim koeficijentom u zavisnosti od nivoa pouzdanosti. Za prosek i razliku proseka uzima se Student koeficijent (kritična vrednost Studentovog testa), za udeo i razliku udela kritična vrednost z kriterijuma. Umnožak koeficijenta i prosječne greške može se nazvati maksimalnom greškom datog parametra, tj. maksimum koji možemo dobiti kada ga procjenjujemo.

Interval pouzdanosti za aritmetička sredina : .

Evo srednje vrijednosti uzorka;

Prosječna greška aritmetičke sredine;

s – standardna devijacija uzorka;

n

f = n-1 (Studentov koeficijent).

Interval pouzdanosti za razlike aritmetičkih sredina :

Evo razlike između srednjih vrijednosti uzorka;

- prosječna greška razlike aritmetičkih sredina;

s 1 , s 2 – uzorak standardnih devijacija;

n1,n2

Kritična vrijednost Studentovog testa za dati nivo značajnosti a i broj stupnjeva slobode f=n 1 +n 2-2 (Studentov koeficijent).

Interval pouzdanosti za dionice :

.

Ovdje je d frakcija uzorka;

– prosječna frakciona greška;

n– veličina uzorka (veličina grupe);

Interval pouzdanosti za razlika u udjelima :

Evo razlike u udjelima uzorka;

– prosječna greška razlike aritmetičkih sredina;

n1,n2– zapremine uzoraka (broj grupa);

Kritična vrijednost z kriterija na datom nivou značajnosti a ( , , ).

Izračunavajući intervale povjerenja za razliku između indikatora, mi, prvo, direktno vidimo moguće vrijednosti efekta, a ne samo njegovu procjenu tačke. Drugo, možemo izvući zaključak o prihvatanju ili odbacivanju nulte hipoteze i, treće, možemo izvući zaključak o snazi ​​testa.

Kada testirate hipoteze koristeći intervale pouzdanosti, morate se pridržavati sljedećeg pravila:

Ako 100(1-a) postotni interval pouzdanosti razlike u srednjim vrijednostima ne sadrži nulu, tada su razlike statistički značajne na nivou značajnosti a; naprotiv, ako ovaj interval sadrži nulu, onda razlike nisu statistički značajne.

Zaista, ako ovaj interval sadrži nulu, to znači da indikator koji se poredi može biti veći ili manji u jednoj od grupa u odnosu na drugu, tj. uočene razlike su rezultat slučajnosti.

Snaga testa može se procijeniti po lokaciji nule unutar intervala povjerenja. Ako je nula blizu donje ili gornje granice intervala, onda je moguće da bi sa većim brojem grupa koje se porede razlike dostigle statističku značajnost. Ako je nula blizu sredine intervala, onda to znači da su i povećanje i smanjenje indikatora u eksperimentalnoj grupi podjednako vjerojatni i, vjerojatno, zaista nema razlika.

primjeri:

Da uporedimo hirurški mortalitet pri upotrebi dve različite vrste anestezije: 61 osoba je operisana sa prvom vrstom anestezije, 8 je umrlo, sa drugom vrstom – 67 osoba, 10 umrlo.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Razlika u letalnosti upoređenih metoda biće u rasponu (-0,018 - 0,122; -0,018 + 0,122) ili (-0,14; 0,104) sa verovatnoćom od 100(1-a) = 95%. Interval sadrži nulu, tj. hipoteza o jednakoj smrtnosti s dvije različite vrste anestezije ne može se odbaciti.

Dakle, stopa mortaliteta može i hoće da se smanji na 14% i da poraste na 10,4% sa verovatnoćom od 95%, tj. nula je otprilike u sredini intervala, pa se može tvrditi da se ove dvije metode, najvjerovatnije, zaista ne razlikuju po smrtnosti.

U primjeru o kojem smo ranije govorili, prosječno vrijeme pritiskanja tokom testa tapkanja upoređeno je u četiri grupe studenata koji su se razlikovali u rezultatima ispita. Izračunajmo intervale povjerenja za prosječno vrijeme presinga za studente koji su položili ispit sa ocjenama 2 i 5 i interval povjerenja za razliku između ovih prosjeka.

Studentovi koeficijenti se nalaze pomoću Studentovih tablica raspodjele (vidi prilog): za prvu grupu: = t(0,05;48) = 2,011; za drugu grupu: = t(0,05;61) = 2.000. Dakle, intervali povjerenja za prvu grupu: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), za drugu grupu (156,55- 2,000*1,88 ; 156,08) (+1,08) 160.3). Dakle, za one koji su položili ispit sa 2, prosečno vreme pritiskanja se kreće od 157,8 ms do 166,6 ms sa verovatnoćom od 95%, za one koji su položili ispit sa 5 – od 152,8 ms do 160,3 ms sa verovatnoćom od 95% .

Također možete testirati nultu hipotezu koristeći intervale povjerenja za srednje vrijednosti, a ne samo za razliku u srednjim vrijednostima. Na primjer, kao u našem slučaju, ako se intervali povjerenja za srednje vrijednosti preklapaju, tada se nulta hipoteza ne može odbaciti. Da bi se odbacila hipoteza na odabranom nivou značajnosti, odgovarajući intervali pouzdanosti ne smiju se preklapati.

Nađimo interval povjerenja za razliku u prosječnom vremenu presovanja u grupama koje su položile ispit sa ocjenama 2 i 5. Razlika prosjeka: 162,19 – 156,55 = 5,64. Studentov koeficijent: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Grupne standardne devijacije će biti jednake: ; . Izračunavamo prosječnu grešku razlike između srednjih vrijednosti: . Interval pouzdanosti: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Dakle, razlika u prosečnom vremenu pritiskanja u grupama koje su položile ispit sa 2 i 5 biće u rasponu od -0,044 ms do 11,33 ms. Ovaj interval uključuje nulu, tj. Prosječno vrijeme presinga za one koji su dobro položili ispit može se povećati ili smanjiti u odnosu na one koji su ispit položili nezadovoljavajuće, tj. nulta hipoteza se ne može odbaciti. Ali nula je vrlo blizu donje granice, a vrijeme presinga je mnogo vjerojatnije da će se smanjiti za one koji su dobro prošli. Dakle, možemo zaključiti da još uvijek postoje razlike u prosječnom vremenu presovanja između onih koji su prošli 2 i 5, samo ih nismo mogli uočiti s obzirom na promjenu prosječnog vremena, širenja prosječnog vremena i veličine uzorka.

Moć testa je vjerovatnoća odbacivanja netačne nulte hipoteze, tj. pronaći razlike tamo gdje one zaista postoje.

Snaga testa se određuje na osnovu nivoa značajnosti, veličine razlika između grupa, širenja vrednosti u grupama i veličine uzoraka.

Za Studentov t test i analizu varijanse mogu se koristiti dijagrami osjetljivosti.

Snaga kriterija se može koristiti za preliminarno određivanje potrebnog broja grupa.

Interval pouzdanosti pokazuje unutar kojih granica leži prava vrijednost procijenjenog parametra sa datom vjerovatnoćom.

Koristeći intervale povjerenja, možete testirati statističke hipoteze i izvući zaključke o osjetljivosti kriterija.

LITERATURA.

Glanz S. – Poglavlje 6,7.

Rebrova O.Yu. – str.112-114, str.171-173, str.234-238.

Sidorenko E.V. – str.32-33.

Pitanja za samotestiranje učenika.

1. Koja je snaga kriterija?

2. U kojim slučajevima je potrebno vrednovati snagu kriterijuma?

3. Metode za proračun snage.

6. Kako testirati statističku hipotezu koristeći interval pouzdanosti?

7. Šta se može reći o snazi ​​kriterija pri izračunavanju intervala povjerenja?

Zadaci.