Luottamusväli. Lääketieteellisten tilastojen ABC

Usein arvioijan on analysoitava sen segmentin kiinteistömarkkinoita, jossa arviointikohde sijaitsee. Jos markkinat ovat kehittyneet, voi olla vaikeaa analysoida koko esitettävien objektien joukkoa, joten analyysiin käytetään objektien otosta. Tämä näyte ei ole aina homogeeninen, joskus se on puhdistettava äärimmäisistä - liian korkeista tai liian alhaisista markkinatarjouksista. Tätä tarkoitusta varten sitä sovelletaan luottamusväli. Tämän tutkimuksen tarkoituksena on tehdä vertaileva analyysi kahdesta menetelmästä luottamusvälin laskemiseksi ja valita paras laskentavaihtoehto työskennellessäsi eri näytteiden kanssa estimatica.pro-järjestelmässä.

Luottamusväli - lasketaan otoksen perusteella, ominaisuuden arvoväli, joka tunnetulla todennäköisyydellä sisältää yleisen populaation arvioidun parametrin.

Luottamusvälin laskemisen tarkoitus on rakentaa sellainen intervalli näytetietojen perusteella, jotta voidaan tietyllä todennäköisyydellä väittää, että estimoidun parametrin arvo on tällä välillä. Toisin sanoen luottamusväli tietyllä todennäköisyydellä sisältää arvioidun suuren tuntemattoman arvon. Mitä leveämpi väli, sitä suurempi on epätarkkuus.

Luottamusvälin määrittämiseen on erilaisia ​​menetelmiä. Tässä artikkelissa tarkastelemme kahta tapaa:

  • mediaanin ja keskihajonnan kautta;
  • t-tilaston kriittisen arvon (Student's-kerroin) kautta.

Erilaisten CI:n laskentamenetelmien vertailevan analyysin vaiheet:

1. muodostaa tietonäyte;

2. käsittelemme sen tilastollisilla menetelmillä: laskemme keskiarvon, mediaanin, varianssin jne.;

3. laskemme luottamusvälin kahdella tavalla;

4. Analysoi puhdistetut näytteet ja saadut luottamusvälit.

Vaihe 1. Datan otanta

Otos muodostettiin käyttämällä estimatica.pro-järjestelmää. Otokseen sisältyi 91 tarjousta 1-huoneen asuntojen myyntiin kolmannella hintavyöhykkeellä suunnittelutyypillä "Hruštšov".

Taulukko 1. Ensimmäinen näyte

Hinta 1 neliömetri, c.u.

Kuva 1. Alkuperäinen näyte



Vaihe 2. Alkunäytteen käsittely

Näytteen käsittely tilastollisilla menetelmillä edellyttää seuraavien arvojen laskemista:

1. Aritmeettinen keskiarvo

2. Mediaani - otosta kuvaava luku: tasan puolet otoselementeistä on suurempia kuin mediaani, toinen puoli on pienempi kuin mediaani

(näytteelle, jossa on pariton määrä arvoja)

3. Alue - ero näytteen enimmäis- ja vähimmäisarvojen välillä

4. Varianssi - käytetään tietojen vaihtelun tarkempaan arvioimiseen

5. Otoksen keskihajonta (jäljempänä RMS) on yleisin säätöarvojen hajaantumisen osoitin aritmeettisen keskiarvon ympärillä.

6. Variaatiokerroin - heijastaa säätöarvojen hajonta-astetta

7. värähtelykerroin - heijastaa otoksessa olevien hintojen ääriarvojen suhteellista vaihtelua keskiarvon ympärillä

Taulukko 2. Alkuperäisen otoksen tilastolliset indikaattorit

Aineiston homogeenisuutta kuvaava variaatiokerroin on 12,29 %, mutta värähtelykerroin on liian suuri. Näin ollen voidaan todeta, että alkuperäinen näyte ei ole homogeeninen, joten siirrytään luottamusvälin laskemiseen.

Vaihe 3. Luottamusvälin laskenta

Menetelmä 1. Laskenta mediaanin ja keskihajonnan avulla.

Luottamusväli määritetään seuraavasti: minimiarvo - keskihajonta vähennetään mediaanista; maksimiarvo - keskihajonta lisätään mediaaniin.

Siten luottamusväli (47179 CU; 60689 CU)

Riisi. 2. Arvot luottamusvälillä 1.



Menetelmä 2. Luottamusvälin rakentaminen t-tilaston kriittisen arvon (opiskelijakerroin) avulla

S.V. Gribovsky kirjassa "Matemaattiset menetelmät omaisuuden arvon arvioimiseksi" kuvaa menetelmän luottamusvälin laskemiseksi Studentin kertoimen avulla. Tällä menetelmällä laskettaessa estimaattorin on itse asetettava merkitsevyystaso ∝, joka määrittää todennäköisyyden, jolla luottamusväli rakennetaan. Yleisesti käytetään merkitsevyystasoja 0,1; 0,05 ja 0,01. Ne vastaavat luottamustodennäköisyyksiä 0,9; 0,95 ja 0,99. Tällä menetelmällä matemaattisen odotuksen ja varianssin todelliset arvot katsotaan käytännössä tuntemattomiksi (mikä on lähes aina totta käytännön arviointiongelmia ratkaistaessa).

Luottamusvälin kaava:

n - näytteen koko;

t-tilaston (opiskelijajakaumien) kriittinen arvo merkitsevyystasolla ∝, vapausasteiden lukumäärä n-1, joka määritetään erityisillä tilastotaulukoilla tai MS Excelillä (→"Statistical"→ STUDRASPOBR);

∝ - merkitsevyystaso, otamme ∝=0,01.

Riisi. 2. Arvot luottamusvälillä 2.

Vaihe 4. Luottamusvälin laskemistapojen analyysi

Kaksi luottamusvälin laskentamenetelmää - mediaanin ja Studentin kertoimen kautta - johtivat intervallien erilaisiin arvoihin. Vastaavasti saatiin kaksi erilaista puhdistettua näytettä.

Taulukko 3. Kolmen otoksen tilastolliset indikaattorit.

Indeksi

Alkuperäinen näyte

1 vaihtoehto

Vaihtoehto 2

Keskiarvo

Dispersio

Coef. muunnelmat

Coef. värähtelyjä

Vanhojen kohteiden lukumäärä, kpl.

Tehtyjen laskelmien perusteella voidaan sanoa, että eri menetelmillä saatujen luottamusvälien arvot leikkaavat toisiaan, joten voit käyttää mitä tahansa laskentamenetelmiä arvioijan harkinnan mukaan.

Uskomme kuitenkin, että estimatica.pro-järjestelmässä työskennellessä on suositeltavaa valita menetelmä luottamusvälin laskentaan markkinoiden kehitysasteesta riippuen:

  • jos markkinat eivät ole kehittyneet, käytä laskentamenetelmää mediaanin ja keskihajonnan kautta, koska käytöstä poistettujen kohteiden määrä on tässä tapauksessa pieni;
  • jos markkinat kehittyvät, käytä laskentaa t-tilaston kriittisen arvon (Student's-kertoimen) kautta, koska on mahdollista muodostaa suuri alkuotos.

Artikkelin valmistelussa käytettiin:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matemaattiset menetelmät omaisuuden arvon määrittämiseen. Moskova, 2014

2. Tiedot estimatica.pro-järjestelmästä

Päivitetty: 3.3.2020
Esimerkkitiedosto

Rakennetaan MS EXCEL:iin luottamusväli jakauman keskiarvon arvioimiseksi, jos varianssin arvo on tunnettu.

Tietysti valinta luottamuksen taso riippuu täysin käsillä olevasta tehtävästä. Siten lentomatkustajan luottamuksen asteen lentokoneen luotettavuuteen tulee tietysti olla korkeampi kuin ostajan luottamus hehkulampun luotettavuuteen.

Tehtävän muotoilu

Oletetaan, että alkaen väestö otettuaan näyte koko n. Oletetaan, että keskihajonta tämä jakauma tunnetaan. Tämän perusteella tarpeellista näytteet arvioi tuntematonta jakelun keskiarvo(μ, ) ja muodosta vastaava kahdenvälinenluottamusväli .

Piste-arvio

Kuten tiedetään tilastot(kutsutaanko sitä X vrt) On puolueeton arvio keskiarvosta Tämä väestö ja sen jakauma on N(μ;σ 2/n).

Huomautus : Entä jos pitää rakentaa luottamusväli jakelun tapauksessa mikä ei olenormaalia? Tässä tapauksessa tulee apuun, joka sanoo, että riittävän suurella koolla näytteet n jakelusta ei-normaali , tilastojen otantajakauma Х av tahtoa suunnilleen vastaavat normaalijakauma parametreilla N(μ;σ 2/n).

Niin, pistearviokeskelläjakeluarvot meillä on näytteen keskiarvo, eli X vrt. Nyt ollaan kiireisiä luottamusväli.

Luottamusvälin rakentaminen

Yleensä jakauman ja sen parametrien tuntemalla voimme laskea todennäköisyyden, että satunnaismuuttuja ottaa arvon tietystä intervallista. Tehdään nyt päinvastoin: etsitään väli, johon satunnaismuuttuja osuu annetulla todennäköisyydellä. Esimerkiksi kiinteistöistä normaalijakauma tiedetään, että 95 %:n todennäköisyydellä satunnaismuuttuja jakautuu normaali laki, putoaa noin +/- 2 väliin keskiarvo(katso artikkeli aiheesta). Tämä aikaväli toimii prototyyppinä luottamusväli .

Katsotaan nyt tiedämmekö jakelun , laskea tämä väli? Vastataksemme kysymykseen meidän on määritettävä jakelumuoto ja sen parametrit.

Tiedämme jakelumuodon normaalijakauma(muista, että puhumme näytteiden jakelutilastotX vrt).

Parametri μ on meille tuntematon (se täytyy vain arvioida käyttämällä luottamusväli), mutta meillä on sen arvio X vrt., perusteella laskettu näyte, joita voidaan käyttää.

Toinen parametri on näytteen keskimääräinen standardipoikkeamatullaan tiedoksi, se on yhtä suuri kuin σ/√n.

Koska emme tiedä μ:tä, niin rakennamme välin +/- 2 standardipoikkeamat ei alkaen keskiarvo, mutta sen tunnetun arvion perusteella X vrt. Nuo. laskettaessa luottamusväli emme oleta sitä X vrt putoaa väliin +/- 2 standardipoikkeamatμ:stä 95 %:n todennäköisyydellä ja oletetaan, että väli on +/- 2 standardipoikkeamat alkaen X vrt 95 %:n todennäköisyydellä kattaa μ - väestön keskiarvo, josta näyte. Nämä kaksi lausetta ovat samanarvoisia, mutta toinen lause antaa meille mahdollisuuden rakentaa luottamusväli .

Lisäksi tarkennamme väliä: satunnaismuuttuja, joka on jakautunut normaali laki, osuu 95 %:n todennäköisyydellä väliin +/- 1,960 standardipoikkeamat, ei +/- 2 standardipoikkeamat. Tämä voidaan laskea kaavalla \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. esimerkkitiedosto Sheet Spacing .

Nyt voimme muotoilla todennäköisyyslaskennan, joka auttaa meitä muodostamaan luottamusväli: "Todennäköisyys, että väestön keskiarvo sijaitsee alkaen näytteen keskiarvo 1,960" sisällä näytteen keskiarvon standardipoikkeama", on yhtä suuri kuin 95 %.

Lausunnossa mainitulla todennäköisyysarvolla on erityinen nimi , joka liittyy merkitsevyystaso α (alfa) yksinkertaisella lausekkeella luottamustaso = 1 . Meidän tapauksessamme merkitsevyystaso α =1-0,95=0,05 .

Nyt tämän todennäköisyyslausekkeen perusteella kirjoitamme lausekkeen laskemista varten luottamusväli :

missä Zα/2 standardinormaalijakauma(sellainen satunnaismuuttujan arvo z , Mitä P (z >= Zα/2 )=α/2).

Huomautus : Ylempi α/2-kvantiili määrittää leveyden luottamusväli V standardipoikkeamatnäytteen keskiarvo. Ylempi α/2-kvantiili standardinormaalijakauma on aina suurempi kuin 0, mikä on erittäin kätevää.

Meidän tapauksessamme, kun α = 0,05, ylempi α/2-kvantiili on 1,960. Muille merkitsevyystasoille α (10 %; 1 %) ylempi α/2-kvantiiliZα/2 voidaan laskea kaavalla \u003d NORM.ST.OBR (1-α / 2) tai jos tiedossa luottamustaso , =NORM..ST.OBR((1+luottamustaso)/2) .

Yleensä rakentamisen yhteydessä luottamusvälit keskiarvon arvioimiseksi vain käyttöön ylempi α /2- kvantiili ja älä käytä pienempi α /2- kvantiili. Tämä on mahdollista, koska standardinormaalijakauma symmetrinen x-akselin suhteen ( sen jakautumisen tiheys symmetrinen noin keskimääräinen, ts. 0) . Ei siis tarvitse laskea alempi α/2-kvantiili(se on yksinkertaisesti nimeltään α /2-kvantiili), koska se on tasa-arvoinen ylempi α /2- kvantiili miinusmerkillä.

Muista, että x:n jakauman muodosta riippumatta vastaava satunnaismuuttuja X vrt hajautettu suunnilleenHieno N(μ;σ 2 /n) (katso artikkeli aiheesta). Siksi yleensä yllä oleva lauseke for luottamusväli on vain likimääräinen. Jos x on jaettu normaali laki N(μ;σ 2 /n), sitten lauseke for luottamusväli on tarkka.

Luottamusvälin laskenta MS EXCELissä

Ratkaistaan ​​ongelma. Elektronisen komponentin vasteaika tulosignaaliin on tärkeä laitteen ominaisuus. Insinööri haluaa piirtää keskimääräisen vasteajan luottamusvälin 95 %:n luottamustasolla. Aikaisemmasta kokemuksestaan ​​insinööri tietää, että vasteajan keskihajonna on 8 ms. Tiedetään, että insinööri teki 25 mittausta arvioidakseen vasteaikaa, keskiarvo oli 78 ms.

Ratkaisu: Insinööri haluaa tietää elektronisen laitteen vasteajan, mutta hän ymmärtää, että vasteaika ei ole kiinteä, vaan satunnaismuuttuja, jolla on oma jakaumansa. Joten parasta, mitä hän voi toivoa, on määrittää tämän jakauman parametrit ja muoto.

Valitettavasti ongelman tilasta emme tiedä vastausajan jakautumisen muotoa (sen ei tarvitse olla normaali). , tämä jakauma on myös tuntematon. Vain hänet tunnetaan keskihajontaσ = 8. Siksi, vaikka emme voi laskea todennäköisyyksiä ja rakentaa luottamusväli .

Emme kuitenkaan tiedä jakelua aikaerillinen vastaus, tiedämme sen mukaan CPT , näytteiden jakelukeskimääräinen vasteaika on suunnilleen normaali(oletamme, että ehdot CPT suoritetaan, koska koko näytteet tarpeeksi suuri (n=25)) .

Lisäksi, keskiverto tämä jakauma on yhtä suuri kuin keskiarvo yksikkövastejakaumat, ts. μ. A keskihajonta tämän jakauman (σ/√n) voidaan laskea käyttämällä kaavaa =8/ROOT(25) .

Tiedetään myös, että insinööri sai pistearvio parametri μ on 78 ms (X cf). Siksi voimme nyt laskea todennäköisyydet, koska tiedämme jakelumuodon ( normaali) ja sen parametrit (Х ср ja σ/√n).

Insinööri haluaa tietää odotettu arvoμ vasteaikajakaumasta. Kuten edellä todettiin, tämä μ on yhtä suuri kuin keskimääräisen vasteajan otosjakauman odotus. Jos käytämme normaalijakauma N(X cf; σ/√n), silloin haluttu μ on alueella +/-2*σ/√n noin 95 %:n todennäköisyydellä.

Merkitsevyystaso on 1-0,95 = 0,05.

Etsi lopuksi vasen ja oikea reuna luottamusväli. Vasen reuna: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / JUURI (25) = 74,864 Oikea reuna: \u003d 78 + NORM. ST. OBR (1-0,05 / 2) * 8 / JUURI (25) \u003d 81,136

Vasen reuna: =NORM.INV(0,05/2, 78, 8/SQRT(25)) Oikea reuna: =NORM.INV(1-0,05/2, 78, 8/SQRT(25))

Vastaus : luottamusväli klo 95 % luottamustaso ja σ =8 ms on yhtä suuri 78+/-3,136 ms

SISÄÄN esimerkkitiedosto arkilla Sigma tunnettu loi lomakkeen laskemista ja rakentamista varten kahdenvälinenluottamusväli mielivaltaiselle näytteet tietyllä σ ja merkitsevyystaso .

CONFIDENCE.NORM()-funktio

Jos arvot näytteet ovat alueella B20:B79 , A merkitsevyystaso yhtä suuri kuin 0,05; sitten MS EXCEL -kaava: =KESKIARVO(B20:B79)-LUOTTAMINEN(0,05,σ, LASKE(B20:B79)) palauttaa vasemman reunan luottamusväli .

Sama raja voidaan laskea kaavalla: =KESKIARVO(B20:B79)-NORM..ST.INV(1-0.05/2)*σ/SQRT(LASKE(B20:B79))

Huomautus: TRUST.NORM()-funktio ilmestyi MS EXCEL 2010:ssa. MS EXCELIN aiemmissa versioissa käytettiin TRUST()-funktiota.

Todennäköisyydet kutsutaan riittäväksi arvioimaan luotettavasti yleiset parametrit näytteen ominaisuuksien perusteella luottamusmies .

Yleensä luottamustodennäköisyyksiksi valitaan arvot 0,95; 0,99; 0,999 (ne ilmaistaan ​​yleensä prosentteina - 95%, 99%, 99,9%). Mitä korkeampi vastuullisuuden mitta, sitä korkeampi luottamustaso: 99 % tai 99,9 %.

Liikunnan ja urheilun tieteellisessä tutkimuksessa 0,95 (95 %) luottamustasoa pidetään riittävänä.

Väliä, jolta yleisen perusjoukon otoksen aritmeettinen keskiarvo löydetään tietyllä luottamustodennäköisyydellä, on ns. luottamusväli .

Arvioinnin merkitystaso on pieni luku α, jonka arvo viittaa todennäköisyyteen, että se on luottamusvälin rajojen ulkopuolella. Luottamustodennäköisyyksien mukaisesti: α 1 = (1-0,95) = 0,05; α 2 \u003d (1 - 0,99) \u003d 0,01 jne.

Keskiarvon (odotuksen) luottamusväli a normaalijakauma:

,

missä on arvioinnin luotettavuus (luottamustodennäköisyys); - näytekeskiarvo; s - korjattu keskihajonta; n on näytteen koko; t γ on Studentin jakaumataulukosta (katso liite, taulukko 1) määritetty arvo annetuille n:lle ja γ:lle.

Yleisen populaation keskiarvon luottamusvälin rajojen löytämiseksi on välttämätöntä:

1. Laske ja s.

2. On tarpeen asettaa estimaatin luottamustodennäköisyydeksi (luotettavuudeksi) γ 0,95 (95 %) tai merkitsevyystasoksi α 0,05 (5 %).

3. Laske taulukon t - Studentin jakaumat (Liite, Taulukko 1) mukaan t γ:n raja-arvot.

Koska t-jakauma on symmetrinen nollapisteen suhteen, riittää, että tiedetään vain t:n positiivinen arvo. Esimerkiksi jos otoskoko on n=16, niin vapausasteiden lukumäärä (vapausasteet, df) t– jakelut df=16 - 1=15 . Taulukon mukaan 1 käyttökerta t 0,05 = 2,13 .

4. Löydämme luottamusvälin rajat arvolle α = 0,05 ja n=16:

Luottamuksen rajat:

Suurille näytekokoille (n ≥ 30) t – Opiskelijajakaumasta tulee normaali. Siksi luottamusväli for n ≥ 30 voidaan kirjoittaa seuraavasti:

Missä u ovat normalisoidun normaalijakauman prosenttipisteitä.

Normaalille luottamustodennäköisyydelle (95%, 99%; 99,9%) ja merkitsevyystasoille α-arvot ( u) on esitetty taulukossa 8.

Taulukko 8

Arvot vakioluottamustasoille α

α u
0,05 1,96
0,01 2,58
0,001 3,28

Esimerkin 1 tietojen perusteella määritämme 95 %:n rajat. luottamusväli (α = 0,05) pisteestä ylös hyppäämisen keskimääräiselle tulokselle. Esimerkissämme otoskoko on n = 65, jolloin suuren otoskoon suositusten avulla voidaan määrittää luottamusvälin rajat.

Konstantin Krawchik selittää selkeästi, mitä luottamusväli on lääketieteellisessä tutkimuksessa ja miten sitä käytetään

"Katren-Style" jatkaa Konstantin Kravchikin syklin julkaisemista lääketieteellisistä tilastoista. Kahdessa aiemmassa artikkelissa kirjoittaja käsitteli selostuksia sellaisista käsitteistä kuin ja.

Konstantin Kravchik

Matemaatikko-analyytikko. Lääketieteen ja humanististen tieteiden tilastollisen tutkimuksen asiantuntija

Moskovan kaupunki

Hyvin usein kliinisiä tutkimuksia koskevista artikkeleista löydät mystisen lauseen: "luottamusväli" (95% CI tai 95% CI - luottamusväli). Artikkelissa saatetaan esimerkiksi sanoa: "Opiskelijan t-testiä käytettiin arvioimaan erojen merkitystä 95 %:n luottamusvälillä."

Mikä on "95 %:n luottamusvälin" arvo ja miksi se lasketaan?

Mikä on luottamusväli? - Tämä on alue, jolle väestön todelliset keskiarvot putoavat. Ja mitä, onko olemassa "epätosia" keskiarvoja? Tietyssä mielessä kyllä. Selitimme, että kiinnostavaa parametria on mahdotonta mitata koko populaatiossa, joten tutkijat ovat tyytyväisiä rajoitettuun otokseen. Tässä otoksessa (esimerkiksi ruumiinpainon mukaan) on yksi keskiarvo (tiety paino), jonka perusteella arvioimme keskiarvon koko väestössä. On kuitenkin epätodennäköistä, että otoksen keskimääräinen paino (etenkin pieni) osuisi yhteen yleisen väestön keskimääräisen painon kanssa. Siksi on oikeampaa laskea ja käyttää yleisen väestön keskiarvojen vaihteluväliä.

Oletetaan esimerkiksi, että hemoglobiinin 95 %:n luottamusväli (95 % CI) on 110-122 g/l. Tämä tarkoittaa, että 95 % todennäköisyydellä hemoglobiinin todellinen keskiarvo yleisväestössä on välillä 110-122 g/l. Toisin sanoen emme tiedä keskimääräistä hemoglobiinia väestössä, mutta voimme osoittaa tämän ominaisuuden arvoalueen 95 %:n todennäköisyydellä.

Luottamusvälit ovat erityisen tärkeitä ryhmien välisten keskiarvojen erojen tai niin sanotun vaikutuskoon kannalta.

Oletetaan, että vertailimme kahden rautavalmisteen tehokkuutta: toisen, joka on ollut markkinoilla pitkään, ja toisen, joka on juuri rekisteröity. Hoitojakson jälkeen tutkittujen potilasryhmien hemoglobiinipitoisuus arvioitiin ja tilasto-ohjelma laski meille, että kahden ryhmän keskiarvojen ero 95 %:n todennäköisyydellä on välillä 1,72-14,36 g/l (taulukko 1).

Tab. 1. Riippumattomien näytteiden kriteeri
(ryhmiä verrataan hemoglobiinitason mukaan)

Tämä tulee tulkita seuraavasti: osassa uutta lääkettä käyttävistä potilaista hemoglobiini on keskimäärin 1,72–14,36 g/l korkeampi kuin niillä, jotka ottivat jo tunnettua lääkettä.

Toisin sanoen yleisessä väestössä ero hemoglobiinin keskiarvoissa ryhmissä 95 %:n todennäköisyydellä on näissä rajoissa. Tutkijan tehtävänä on arvioida, onko se paljon vai vähän. Kaiken tämän pointti on, että emme työskentele yhdellä keskiarvolla, vaan arvoalueella, joten arvioimme luotettavammin parametrin eron ryhmien välillä.

Tilastopaketeissa voidaan tutkijan harkinnan mukaan itsenäisesti kaventaa tai laajentaa luottamusvälin rajoja. Pienentämällä luottamusvälin todennäköisyyksiä kavennetaan keskiarvoja. Esimerkiksi 90 % CI:llä keskiarvoalue (tai keskiarvoerot) on kapeampi kuin 95 % CI:llä.

Päinvastoin, todennäköisyyden lisääminen 99 prosenttiin laajentaa arvoaluetta. Ryhmiä verrattaessa CI:n alaraja voi ylittää nollamerkin. Jos esimerkiksi laajensimme luottamusvälin rajoja arvoon 99 %, niin intervallin rajat vaihtelivat välillä –1 - 16 g/L. Tämä tarkoittaa, että yleispopulaatiossa on ryhmiä, joiden keskiarvojen ero tutkittavan ominaisuuden osalta on 0 (M=0).

Luottamusvälejä voidaan käyttää tilastollisten hypoteesien testaamiseen. Jos luottamusväli ylittää nolla-arvon, niin nollahypoteesi, joka olettaa, että ryhmät eivät eroa tutkitussa parametrissa, on totta. Esimerkki on kuvattu yllä, kun laajensimme rajoja 99 prosenttiin. Jossain yleisestä väestöstä löysimme ryhmiä, jotka eivät eronneet millään tavalla.

95 %:n luottamusväli hemoglobiinin erosta, (g/l)


Kuvassa näkyy kahden ryhmän keskimääräisen hemoglobiinieron 95 %:n luottamusväli viivana. Viiva ohittaa nollamerkin, joten keskiarvojen välillä on ero nollan kanssa, mikä vahvistaa nollahypoteesin, että ryhmät eivät eroa toisistaan. Ryhmien välinen ero on -2 - 5 g/l, mikä tarkoittaa, että hemoglobiini voi joko laskea 2 g/l tai nousta 5 g/l.

Luottamusväli on erittäin tärkeä indikaattori. Sen ansiosta näet, johtuivatko erot ryhmissä todella keskiarvoeroista vai suuresta otoksesta, koska suurella otoksella erojen löytäminen on suurempi kuin pienellä.

Käytännössä se voi näyttää tältä. Otimme 1000 ihmisen näytteen, mittasimme hemoglobiinitason ja totesimme, että keskiarvojen eron luottamusväli on 1,2-1,5 g/l. Tilastollisen merkitsevyyden taso tässä tapauksessa s

Näemme, että hemoglobiinipitoisuus nousi, mutta lähes huomaamattomasti, joten tilastollinen merkitsevyys ilmestyi juuri näytteen koosta johtuen.

Luottamusvälit voidaan laskea paitsi keskiarvoille, myös suhteille (ja riskisuhteille). Meitä kiinnostaa esimerkiksi niiden potilaiden osien luottamusväli, jotka saavuttivat remissio kehitetyn lääkkeen käytön aikana. Oletetaan, että 95 % CI suhteille, eli tällaisten potilaiden osuudelle, on välillä 0,60–0,80. Näin ollen voimme sanoa, että lääkkeellämme on terapeuttinen vaikutus 60-80 prosentissa tapauksista.

Luottamusvälin laskenta perustuu vastaavan parametrin keskimääräiseen virheeseen. Luottamusväli näyttää missä rajoissa todennäköisyydellä (1-a) on estimoidun parametrin todellinen arvo. Tässä a on merkitsevyystaso, (1-a) kutsutaan myös luottamustasoksi.

Ensimmäisessä luvussa osoitimme, että esimerkiksi aritmeettisen keskiarvon todellinen perusjoukon keskiarvo on 2 keskivirheen sisällä noin 95 % ajasta. Siten keskiarvon 95 %:n luottamusvälin rajat ovat otoskeskiarvosta kaksinkertaisella keskiarvon keskivirheellä, ts. kerromme keskiarvon keskivirheen jollakin luottamustasosta riippuvaisella tekijällä. Keskiarvolle ja keskiarvojen erolle otetaan Studentin kerroin (Studentin kriteerin kriittinen arvo), osuuksien osuudelle ja erolle z-kriteerin kriittinen arvo. Kertoimen ja keskivirheen tuloa voidaan kutsua tämän parametrin rajavirheeksi, ts. maksimi, jonka voimme saada arvioitaessamme sitä.

Luottamusväli for aritmeettinen keskiarvo : .

Tässä on näytekeskiarvo;

Aritmeettisen keskiarvon keskivirhe;

s- näytteen standardipoikkeama;

n

f = n-1 (opiskelijakerroin).

Luottamusväli for aritmeettisten keskiarvojen ero :

Tässä on ero näytekeinojen välillä;

- aritmeettisten keskiarvojen eron keskimääräinen virhe;

s 1, s 2 - näytteen standardipoikkeama;

n1, n2

Opiskelijan kriteerin kriittinen arvo tietylle merkitsevyystasolle a ja vapausasteiden lukumäärälle f = n1 + n2-2 (opiskelijakerroin).

Luottamusväli for osakkeita :

.

Tässä d on otososuus;

– keskimääräinen osakevirhe;

n– otoskoko (ryhmän koko);

Luottamusväli for jakaa eroja :

Tässä on ero näyteosuuksien välillä;

on aritmeettisten keskiarvojen välisen eron keskivirhe;

n1, n2– otoskoot (ryhmien lukumäärä);

Kriteerin z kriittinen arvo annetulla merkitsevyystasolla a ( , , ).

Laskemalla luottamusvälit indikaattoreiden erolle, näemme ensinnäkin suoraan vaikutuksen mahdolliset arvot, emme vain sen pisteestimaattia. Toiseksi voimme tehdä johtopäätöksen nollahypoteesin hyväksymisestä tai kumoamisesta ja kolmanneksi voimme tehdä johtopäätöksen kriteerin voimasta.

Kun hypoteeseja testataan luottamusvälillä, tulee noudattaa seuraavaa sääntöä:

Jos keskimääräisen eron 100(1-a) prosentin luottamusväli ei sisällä nollaa, erot ovat tilastollisesti merkitseviä a merkitsevyystasolla; päinvastoin, jos tämä väli sisältää nollan, erot eivät ole tilastollisesti merkittäviä.

Todellakin, jos tämä väli sisältää nollan, niin se tarkoittaa, että vertailuindikaattori voi olla joko enemmän tai vähemmän yhdessä ryhmässä toiseen verrattuna, ts. havaitut erot ovat satunnaisia.

Paikan perusteella, jossa nolla sijaitsee luottamusvälin sisällä, voidaan arvioida kriteerin teho. Jos nolla on lähellä intervallin ala- tai ylärajaa, niin ehkä suuremmalla määrällä vertailuryhmiä erot saavuttaisivat tilastollisen merkitsevyyden. Jos nolla on lähellä intervallin puoliväliä, niin se tarkoittaa, että sekä indikaattorin nousu että lasku koeryhmässä ovat yhtä todennäköisiä, eikä eroja todennäköisesti ole.

Esimerkkejä:

Verrattaessa leikkauskuolleisuutta kahdella eri anestesiatyypillä: 61 henkilöä leikattiin ensimmäisellä anestesiatyypillä, 8 kuoli, toisella - 67 henkilöä, 10 kuoli.

d 1 \u003d 8/61 \u003d 0,131; d 2 = 10/67 \u003d 0,149; d1-d2 = -0,018.

Vertailumenetelmien kuolleisuusero on välillä (-0,018 - 0,122; -0,018 + 0,122) tai (-0,14; 0,104) todennäköisyydellä 100(1-a) = 95 %. Väli sisältää nollan, ts. hypoteesia samasta kuolleisuudesta kahdella eri anestesiatyypillä ei voida hylätä.

Siten kuolleisuus voi ja tulee laskemaan 14 %:iin ja nousemaan 10,4 %:iin 95 %:n todennäköisyydellä, ts. nolla on suunnilleen välin puolivälissä, joten voidaan väittää, että todennäköisimmin nämä kaksi menetelmää eivät todellakaan eroa kuolleisuudesta.

Aiemmin käsitellyssä esimerkissä keskimääräistä napautusaikaa verrattiin neljässä koepisteissään poikkeavassa opiskelijaryhmässä. Lasketaan kokeen 2 ja 5 läpäisseiden opiskelijoiden keskimääräisen puristusajan luottamusvälit ja näiden keskiarvojen välisen eron luottamusväli.

Studentin kertoimet löytyvät Studentin jakauman taulukoista (katso liite): ensimmäiselle ryhmälle: = t(0,05;48) = 2,011; toiselle ryhmälle: = t(0,05;61) = 2,000. Näin ollen ensimmäisen ryhmän luottamusvälit ovat: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6) 60,3). Joten niille, jotka läpäisivät kokeen 2, keskimääräinen painallusaika vaihtelee välillä 157,8 ms - 166,6 ms todennäköisyydellä 95%, niillä, jotka läpäisivät kokeen 5 - 152,8 ms - 160,3 ms todennäköisyydellä 95%.

Voit myös testata nollahypoteesia käyttämällä keskiarvojen luottamusväliä, ei vain keskiarvojen eroa. Esimerkiksi, kuten meidän tapauksessamme, jos keskiarvojen luottamusvälit menevät päällekkäin, nollahypoteesia ei voida hylätä. Hypoteesin hylkäämiseksi valitulla merkitsevyystasolla vastaavat luottamusvälit eivät saa mennä päällekkäin.

Etsitään keskimääräisen puristusajan eron luottamusväli 2 ja 5 kokeen läpäisseissä ryhmissä. Keskiarvojen ero: 162,19 - 156,55 = 5,64. Opiskelijan kerroin: \u003d t (0,05; 49 + 62-2) \u003d t (0,05; 109) \u003d 1,982. Ryhmän keskihajonnat ovat yhtä suuria kuin: ; . Laskemme keskiarvojen välisen eron keskivirheen: . Luottamusväli: \u003d (5,64-1,982 * 2,87; 5,64 + 1,982 * 2,87) \u003d (-0,044; 11,33).

Joten ero keskimääräisessä painallusajassa ryhmissä, jotka läpäisivät kokeen klo 2 ja 5, on välillä -0,044 ms - 11,33 ms. Tämä väli sisältää nollan, ts. kokeen erinomaisin tuloksin läpäisseiden keskimääräinen puristusaika voi sekä kasvaa että laskea verrattuna kokeen epätyydyttävästi läpäisseisiin, ts. nollahypoteesia ei voi hylätä. Mutta nolla on hyvin lähellä alarajaa, puristusaika lyhenee paljon todennäköisemmin erinomaisilla syöttäjillä. Siten voimme päätellä, että keskimääräisessä klikkausajassa on edelleen eroja 2:lla ja 5:llä läpäisseiden välillä, emme vain pystyneet havaitsemaan niitä tietylle muutokselle keskimääräisessä ajassa, keskimääräisen ajan hajoamisessa ja otoskokoissa.

Testin teho on todennäköisyys hylätä väärä nollahypoteesi, ts. löytää eroja siellä, missä ne todella ovat.

Testin teho määräytyy merkitsevyystason, ryhmien välisten erojen suuruuden, arvojen jakautumisen ryhmissä ja otoskoon perusteella.

Studentin t-testissä ja varianssianalyysissä voit käyttää herkkyyskaavioita.

Kriteerin tehoa voidaan käyttää tarvittavan ryhmien määrän alustavassa määrittämisessä.

Luottamusväli osoittaa, missä rajoissa estimoidun parametrin todellinen arvo on tietyllä todennäköisyydellä.

Luottamusvälien avulla voit testata tilastollisia hypoteeseja ja tehdä johtopäätöksiä kriteerien herkkyydestä.

KIRJALLISUUS.

Glantz S. - Luku 6.7.

Rebrova O.Yu. - s. 112-114, s. 171-173, s. 234-238.

Sidorenko E. V. - s. 32-33.

Kysymyksiä opiskelijoiden itsetutkiskeluun.

1. Mikä on kriteerin teho?

2. Missä tapauksissa on tarpeen arvioida kriteerien voimaa?

3. Tehon laskentamenetelmät.

6. Miten tilastollinen hypoteesi testataan luottamusvälillä?

7. Mitä voidaan sanoa kriteerin tehosta luottamusväliä laskettaessa?

Tehtävät.