Usaldusintervall

Mis on usaldusintervall:

See on statistikas kasutatava vahemiku hinnang, mis sisaldab populatsiooni parameetrit. Seda tundmatut populatsiooni parameetrit leitakse kogutud andmete põhjal arvutatud näidismudeli abil .

Näide: kogutud proovi keskmine x̅ ei pruugi vastata tegelikule elanikkonna keskmisele μ. Selleks on võimalik kaaluda erinevaid valimivahendeid, kus seda populatsiooni keskmist saab piirata. Mida pikem on see intervall, seda suurem on selle esinemise tõenäosus.

Usaldusvahemik väljendatakse protsendina, väljendatuna usaldusnivoo järgi, kõige rohkem on näidatud 90%, 95% ja 99%. Alloleval pildil on näiteks 90% usaldusintervall selle ülemise ja alumise piiri (a ja -a ) vahel.

Näide 90% usaldusvahemikust selle ülemise (a) ja alumise (-a) piiride vahel.

Usaldusintervall on üks tähtsamaid hüpoteesi testimise kontseptsioone statistikas, sest seda kasutatakse ebakindluse mõõduna. Terminit tutvustasid Poola matemaatik ja statistik Jerzy Neyman 1937. aastal.

Mis on usaldusintervalli tähtsus?

Usaldusvahemik on oluline, et näidata tehtud arvutuse suhtes ebakindlust (või ebatäpsust). See arvutus kasutab uuringu proovi, et hinnata tulemuse tegelikku suurust lähtepopulatsioonis.

Usaldusintervalli arvutamine on strateegia, mis võtab arvesse vigade proovide võtmist. Teie uuringu tulemuste suurus ja usaldusintervall iseloomustavad eeldatava väärtuse algse elanikkonna jaoks.

Mida kitsam on usaldusintervall, seda suurem on tõenäosus, et uuringupopulatsiooni protsent esindab lähtepopulatsiooni tegelikku arvu, andes suurema kindluse uuringuobjekti tulemuste osas.

Kuidas tõlgendada usaldusintervalli?

Usaldusvahemiku õige tõlgendamine on tõenäoliselt selle statistilise kontseptsiooni kõige keerulisem aspekt. Kontseptsiooni kõige tavalisema tõlgendamise näide on järgmine:

On 95% tõenäosus, et tulevikus langeb populatsiooni parameetri tegelik väärtus (nt keskmine) vahemikku X (alampiir) ja Y (ülemine piir).

Seega tõlgendatakse usaldusvahemikku järgmiselt: on 95% kindel, et intervall X (alumine piir) ja Y (ülemine piir) vahel sisaldab populatsiooni parameetri tegelikku väärtust.

Oleks täiesti vale väita, et: on olemas 95% tõenäosus, et X (alumine piir) ja Y (ülemine piir) vaheline intervall sisaldab populatsiooni parameetri tegelikku väärtust.

Ülaltoodud avaldus on kõige levinum väärarusaam usaldusvahemiku kohta. Pärast statistilise vahemiku arvutamist võib see sisaldada ainult populatsiooni parameetrit või mitte.

Siiski võivad intervallid näidiste vahel varieeruda, samas kui tegelik populatsiooni parameeter on proovist sõltumata sama.

Seetõttu võib usaldusvahemiku usaldusvahemiku teha ainult juhul, kui usaldusvahemikud arvutatakse uuesti proovide arvu jaoks.

Usaldusintervalli arvutamise etapid

Vahemik arvutatakse järgmiste sammude abil:

  • Koguge proovi andmed: n ;
  • Arvutage proovi keskmine x̅;
  • Määrake, kas populatsiooni standardhälve ( σ ) on teada või teadmata;
  • Kui populatsiooni standardhälve on teada, võib vastava usaldustaseme jaoks kasutada z- punkti;
  • Kui populatsiooni standardhälve ei ole teada, saame kasutada statistikat t vastava usaldustaseme jaoks;
  • Seega leitakse usaldusvahemiku alumine ja ülemine piir, kasutades järgmisi valemeid:

a) teadaoleva populatsiooni standardhälve :

Valemi teadaoleva populatsiooni standardhälbe arvutamiseks.

b) Tundmatu populatsiooni standardhälve :

Valem tundmatu populatsiooni standardhälbe arvutamiseks.

Usaldusvahemiku praktiline näide

Kliinilises uuringus hinnati seost astma esinemise ja obstruktiivse uneapnoe tekkimise vahel täiskasvanutel.

Mõned täiskasvanud võeti tööle juhuslikult riigiametnike nimekirjast, mida tuleb järgida neli aastat.

Astmaga osalejatel oli võrreldes ilma nendeta nelja aasta jooksul suurem risk apnoe tekkeks.

Sellise näite sarnaste kliiniliste uuringute läbiviimisel värvatakse tavaliselt huvipakkuvat populatsiooni, et suurendada uuringu tõhusust (vähem kulusid ja vähem aega).

See üksikisikute rühm, uuritud populatsioon, koosneb nendest, kes vastavad kaasamise kriteeriumidele ja nõustuvad osalema uuringus, nagu on näidatud allpool oleval pildil.

Näites uuritud populatsiooni selgitav graafika.

Seejärel on uuring lõpetatud ja uurimisküsimusele vastamiseks arvutatakse mõju suurus (näiteks keskmine erinevus või suhteline risk ).

See protsess, mida nimetatakse järelduseks, hõlmab uuringupopulatsioonilt kogutud andmete kasutamist, et hinnata tegeliku mõju suurust huvipakkuvale elanikkonnale, st päritolu elanikkonnale.

Antud näites värbasid teadlased juhusliku valimi riigi töötajatest (lähtepopulatsioonist), kes olid uuringus osalenud ja nõustunud osalema uuringus (uuringupopulatsioon) ja teatasid, et astma suurendab apnoe tekkimise riski uuringupopulatsioonis.

Et võtta arvesse ainult huvipakkuva alarühma töölevõtmisest tulenevat valimiviga, arvutati ka 95% usaldusintervall (hinnangu ümber) 1, 06-1, 82, mis näitab tõenäosust 95 %, et tegelik suhteline risk lähtepopulatsioonis oleks vahemikus 1, 06 kuni 1, 82 .

Usaldusintervall keskmisele

Kui on olemas andmed populatsiooni standardhälbe kohta, võib arvutada selle populatsiooni keskmise või keskmise usaldusvahemiku.

Kui mõõdetav statistiline tunnus (näiteks sissetulek, IQ, hind, kõrgus, kogus või kaal) on arvuline, on enamikel juhtudel leitud, et leitakse keskmine populatsiooni väärtus.

Seega püüame leida elanikkonna keskmist ( μ ), kasutades proovi keskmist ( ) vea piiriga . Selle arvutuse tulemuseks on elanikkonna keskmine usaldusintervall .

Kui populatsiooni standardhälve on teada, on populatsiooni keskmise usaldusvahemiku (CI) valem:

Kus:

  • on proovi keskmine;
  • σ on populatsiooni standardhälve;
  • n on valimi suurus;
  • Ζ * vastab tavalise normaalse jaotuse sobivale väärtusele teie soovitud usaldusnivoo jaoks.

Järgmised on usaldusnivoo väärtused ( Ζ * ):

Usalduse taseZ * väärtus
80%1.28
90%1.645 (tavaline)
95%1.96
98%2.33
99%2.58

Ülaltoodud tabelis on esitatud esitatud usaldusnivoo z * väärtused. Pange tähele, et need väärtused saadakse tavalisest normaaljaotusest (Z-).

Iga z * väärtuse ja selle väärtuse negatiivse ala vahel on (ligikaudne) usaldusprotsent. Näiteks z * = 1, 28 ja z = -1, 28 vaheline pindala on ligikaudu 0, 80. Seetõttu saab seda tabelit laiendada ka teistele usaldusprotsentidele. Tabel näitab ainult kõige sagedamini kasutatavaid usalduse protsente.

Vaata ka hüpoteesi tähendust.