Konfidensintervall
Ett konfidensintervall , kort KI (även konfidensintervall , konfidensnivå eller förväntat intervall kallas) är i statistiken ett intervall som precisionen för positionsuppskattning av en parameter (till exempel ett medelvärde ska specificeras). Konfidensintervallet indikerar intervallet med en viss sannolikhet ( täckningssannolikheten) inkluderar parametern för en fördelning av en slumpmässig variabel. En ofta använda konfidensnivå är 95%, så att i det här fallet - om slumpmässigt experiment upprepas på ett identiskt sätt - täcker ett 95% konfidensintervall den okända "sanna" parametern i ungefär 95% av alla fall.
Den ofta använda formuleringen att det sanna värdet ligger med 95% sannolikhet i konfidensintervallet, dvs. det vill säga i det nu beräknade intervallet är strängt taget inte korrekt, eftersom det sanna värdet antas vara givet (fast) och inte som stokastiskt .
Vid närmare granskning är övre och nedre gränserna för konfidensintervallet slumpmässiga variabler . H. stokastisk. Följaktligen är den korrekta formuleringen: Vid beräkning av ett konfidensintervall omsluter dess intervallgränser den sanna parametern i 95% av fallen och inte i 5% av fallen. Konfidensintervallet är konstruerat på ett sådant sätt att den sanna parametern täcks med sannolikheten om uppskattningsförfarandet upprepas för många prover .
Uppskattningen av parametrar med hjälp av konfidensintervaller kallas intervallestimering , motsvarande uppskattare ett intervall eller intervallestimator . En fördel jämfört med punktestimatörer är att man kan läsa signifikansen direkt från ett konfidensintervall : ett brett intervall för en given konfidensnivå indikerar en liten urvalsstorlek eller en stor variation i populationen .
Konfidensintervallen ska avgränsas av prognosintervall samt förtroende- och prognosband .
definition
För en fast given , ett konfidensintervall för den konfidensnivå (även: en konfidensintervall ) definieras av de två statistik - baserad på ett slumpmässigt urval - och vilken som
uppfylla. Statistiken och är gränserna för konfidensintervallet , vilket alltid antas. Konfidensnivån kallas också täckningssannolikheten . De insikter och i och bildar uppskattningen intervallet . Gränserna för konfidensintervallet är funktioner för slumpmässiga urvalet och är därför också slumpmässiga. Däremot är den okända parametern fixad. Om det slumpmässiga experimentet upprepas på ett identiskt sätt, kommer ett konfidensintervall att täcka den okända parametern i alla fall. Eftersom den okända parametern inte är en slumpmässig variabel kan det dock inte sägas att det finns ett konfidensintervall med sannolikhet . En sådan tolkning är reserverad för den bayesiska motsvarigheten till konfidensintervallet, de så kallade trovärdighetsintervallen . Konfidensnivån kallas också täckningssannolikheten . Ofta satsar du . Sannolikheten kan tolkas som en relativ frekvens : Om man använder intervall för ett stort antal konfidensuppskattningar som var och en har samma nivå , närmar sig den relativa frekvens som de specifika intervallerna täcker parametern till värdet .
Formell definition
Ramverk
En statistisk modell och en funktion ges
- ,
som i det parametriska fallet också kallas parameterfunktionen . Uppsättningen innehåller de värden som kan vara resultatet av en uppskattning. Mestadels är det
Förtroendeintervall
En illustration
kallas ett konfidensintervall, konfidensintervall, intervallestimator eller intervallestimator om det uppfyller följande villkor:
- För alla beloppet är i ingår. (M)
Ett konfidensintervall är därför en kartläggning som till en början tilldelar en godtycklig delmängd till varje observation ( här är uppsättningen maktuppsättning , dvs uppsättningen för alla delmängder av )
Villkoret (M) säkerställer att en sannolikhet kan tilldelas alla uppsättningar . Detta behövs för att definiera konfidensnivån.
Konfidensintervall
Om och alltid är ett intervall för varje , kallas också ett konfidensintervall.
Är konfidensintervaller i formuläret
- ,
definierat är detta också namnet på de övre och nedre förtroendegränserna.
Konfidensnivå och felnivå
Ett förtroendeintervall ges . Då kallas ett konfidensintervall konfidensnivå eller säkerhetsnivå, om
- .
Värdet kallas då också för felnivån. En mer allmän formulering är möjlig med formhypoteser (se formulärhypoteser # Konfidensintervall för formulärhypoteser ).
Detta resulterar i ovan nämnda specialfall med konfidensintervall med övre och nedre konfidensgränser
respektive.
och
Konstruktion av konfidensintervaller
Konstruktion av Wald konfidensintervall
Wald konfidensintervall kan beräknas med hjälp av så kallad Wald-statistik. Till exempel kan det asymptotiska Wald-konfidensintervallet konstrueras med hjälp av Fisher-information , det negativa andra derivatet av log-sannolikhetsfunktionen . Intervallgränserna för följande konfidensintervall omsluter den sanna parametern i 95% av fallen (asymptotiskt för stora urvalsstorlekar)
- ,
där representerar den log-sannolikhetsfunktion och den observerade Fisher informationen (Fisher information i stället för ML estimator ).
Uttrycket är också känd som standardavvikelsen för den maximala sannolikheten estimator . Den förväntade Fisher -informationen används ofta istället för den observerade Fisher -informationen .
exempel
Till exempel, om sannolikheten beräknas med hjälp av en antagen normalfördelning och ett urval (vars variabler är oberoende och identiskt fördelade slumpmässiga variabler ) med storlek , får man och
- alltså det kända standardfelet för medelvärdet.
Konstruktion av andra konfidensintervaller
Konfidensintervaller kan också hittas med hjälp av alternativa parametrariseringar av log-sannolikhetsfunktionen: till exempel kan logit- transformationen eller logaritmen användas. Detta är användbart när log-sannolikhetsfunktionen är mycket krokig. Konfidensintervaller kan också konstrueras med hjälp av sannolikhetskvoten .
Ett icke -parametriskt sätt att uppskatta konfidensintervall är bootstrap -konfidensintervaller , för vilka man inte behöver anta en distribution, utan snarare använder bootstrapping .
Beskrivning av proceduren
Man är intresserad av den okända parametern för en befolkning . Detta uppskattas av en uppskattare från ett urval av storleken . Det antas att urvalet är ett enkelt slumpmässigt urval , ungefär återspeglar populationen, och att uppskattningen därför bör ligga nära den sanna parametern. Estimatorn är en slumpmässig variabel med en distribution som innehåller parametern .
Först och främst, med hjälp av distributionen, kan man ange ett intervall som täcker den okända sanna parametern med en sannolikhet . Vi bestämmer z. Till exempel 95% konfidensintervall för det verkliga förväntade värdet för en population, då betyder det att vi bestämmer ett konfidensintervall som innehåller det förväntade värdet för i genomsnitt 95 av 100 lika slumpmässiga prover.
exempel
Metoden kan demonstreras med hjälp av en normalt distribuerad funktion med det okända förväntade värdet och den kända variansen : Det förväntade värdet för denna normalfördelning ska uppskattas. Den opartiska estimatorn används: provmedlet .
Det förväntade värdet av befolkningen uppskattas med hjälp av vårt urval
- Uppskattare:
- Poänguppskattning:
där den slumpmässiga variabeln står för i: e observationen (innan provet togs). Samplingsmedelvärdet följer en normalfördelning med förväntat värde och varians (se provmedelvärde # egenskaper )
- .
Gränserna för det centrala fluktuationsintervallet
- ,
det som omfattas av sannolikheten bestäms av förhållandet
- .
En standardiserad till standard normalfördelning och erhållen för den standardiserade slumpmässiga variabeln
sannolikheten
- ,
där det - är kvantil av den standardnormalfördelningen . Om man löser för den okända parametern blir resultatet
den konfidensintervallet för
Uppskattningsintervallet, förverkligandet av ett konfidensintervall på basis av ett konkret prov, resulterar sedan som
Uppskattningsintervallets gränser beror emellertid på och ändras därmed från prov till prov. Men om urvalet är extremt täcker inte intervallet parametern. Detta är fallet i α × 100% av alla prover, dvs. det vill säga att med viss intervall täcker den sanna parametern med en sannolikhet för .
Bredden på konfidensintervallet är av särskilt intresse. Detta bestäms av uppskattarens standardavvikelse och den valda konfidensnivån. Att öka provstorleken kan minska bredden. Som regel är ett konfidensintervall som är så smalt som möjligt önskvärt, eftersom detta indikerar en exakt uppskattning med en konstant konfidensnivå.
Som ett absolut misstag betecknar halva bredden av konfidensintervallet. I ovanstående fall gäller följande
Det absoluta felet är ett mått på uppskattningens noggrannhet (konfidensintervallets bredd :) .
Det absoluta felet är viktigt om du vill bestämma den nödvändiga urvalsstorleken för ett givet konfidensintervall och konfidensintervalllängd . Frågan är: Vilken provstorlek behöver du för att uppskatta en parameter (t.ex. aritmetiskt medelvärde) med en viss noggrannhet och en viss grad av säkerhet?
Valda uppskattningsintervaller
Översikt för kontinuerliga distributioner
En översikt över alla fall med normalt fördelade egenskaper finns i artikeln Normal distributionsmodell .
Förväntat värde för en normalt fördelad egenskap med känd varians : är kvanten för standard normalfördelning. |
|
Förväntat värde för en normalt fördelad egenskap med okänd varians: Variansen för populationen bestäms av den korrigerade urvalsvariansen beräknad. är kvanten för t-fördelningen med frihetsgrader . För t-fördelningens kvantil kan ungefär ersättas med motsvarande kvantil för standardnormalfördelningen. |
|
Förväntat värde för en okänd distribuerad egenskap med okänd varians: Om den är tillräckligt stor kan konfidensintervallet bestämmas utifrån den centrala gränssatsen . |
|
Standardavvikelse för en normalt fördelad egenskap:
är p-kvantilen för chi-kvadratfördelningen med frihetsgrader. |
Diskreta fördelningar
Konfidensintervaller för parametern p för binomialfördelningen beskrivs i
Det så kallade Clopper-Pearson konfidensintervallet kan bestämmas med hjälp av beta- eller F- distributionen . Detta konfidensintervall kallas också exakt , eftersom den erforderliga konfidensnivån faktiskt bibehålls. När det gäller approximationsmetoder, som (mestadels) är baserade på approximationen av binomfördelningen med normalfördelningen, bibehålls ofta konfidensnivån inte.
Om antalet element i befolkningen är känt kan ett konfidensintervall för en urnmodell utan ersättning också anges för parametern (med hjälp av en korrigeringsfaktor) .
Konfidensintervaller och hypotesprov
Termerna konfidensintervall och statistiskt test är dubbla mot varandra; under allmänna förhållanden kan statistiska tester för motsvarande punkthypoteser erhållas från ett konfidensintervall för en parameter och vice versa:
Om den nollhypotesen : är testat för en parameter, den nollhypotesen är inte avvisas på en signifikansnivå om motsvarande konfidensintervall, beräknad med samma data, innehåller värdet . Därför ersätter konfidensintervaller ibland hypotesprov.
Till exempel, i regressionsanalys testar du om den multipla linjära regressionsmodellen med det uppskattade regressionshyperplanet
de sanna regressionskoefficienterna är noll (se Global F -test ). Om hypotesen inte avvisas är det sannolikt att motsvarande regressorer saknar betydelse för att förklara den beroende variabeln . Motsvarande information tillhandahålls av konfidensintervallet för en regressionskoefficient: Om konfidensintervallet täcker noll , är regressionskoefficienten inte statistiskt annorlunda än på en signifikansnivå .
Villkoren för äkthet och det genomgående bästa testet kan överföras till konfidensintervall.
Exempel på konfidensintervall
exempel 1
Ett företag vill introducera ett nytt tvättmedel. För att låta köparens acceptans placeras tvättmedlet i en testbutik. Denna åtgärd är avsedd att uppskatta den genomsnittliga dagliga försäljningen i en stormarknad av denna storlek. Den dagliga försäljningen definieras nu som en slumpmässig variabel [bit] med de okända parametrarna förväntat värde och varians . På grundval av långsiktiga observationer antas att fördelningen är ungefär normal. Marknadsundersökningsavdelningen har funnit att en konfidensnivå på 0,95 (95%) är tillräcklig. Daglig försäljning registreras sedan i 16 dagar. Det kapitulerar
Dag | 1 | 2 | 3 | 4: e | 5 | 6: e | 7: e | 8: e | 9 | 10 | 11 | 12: e | 13: e | 14: e | 15: e | 16 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
enhetsvolym | 110 | 112 | 106 | 90 | 96 | 118 | 108 | 114 | 107 | 90 | 85 | 84 | 113 | 105 | 90 | 104 |
För en normalt fördelad population med okänd varians anges konfidensintervallet för det förväntade värdet som
Det är medelvärdet av provet
och variansen för urvalet
Det är kvanten för t-fördelningen med 15 frihetsgrader
Värdet för t kan inte beräknas trivialt och måste därför läsas från en tabell.
95% konfidensintervall beräknas sedan som
I genomsnitt innehåller 95% av de beräknade intervallen det sanna genomsnittet , det vill säga den genomsnittliga dagliga försäljningen av tvättmedelsflaskor i jämförbara stormarknader. För denna specifika intervall, dock påståendet att den innehåller det sanna medelvärdet med 95% sannolikhet inte inte tillämpas . Allt vi vet är att detta intervall kommer från en uppsättning (av intervall) varav 95% innehåller det sanna medelvärdet.
Exempel 2
Ett företag levererade en massa (sats) av 6000 stycken (t.ex. skruvar) till kunden. Detta utför en inkommande inspektion med hjälp av stickprov i enlighet med den internationella standarden ISO 2859-1. Denna z. B. 200 skruvar (beroende på vald AQL) som slumpmässigt dras över hela partiet och kontrolleras att de överenskomna kraven (kvalitetsegenskaper) överensstämmer. Av de 200 testade skruvarna uppfyllde 10 inte kraven. Genom att beräkna konfidensintervallet (Excel-funktionen BETAINV) kan kunden uppskatta hur stor den förväntade andelen defekta skruvar i hela partiet är: vid en konfidensnivå på 95%beräknas Clopper-Pearson konfidensintervall [2,4%, 9: e %] för andelen defekta skruvar i satsen (parametrar: n = 200, k = 10 ).
litteratur
- Ulrich Krengel : Introduktion till sannolikhetsteori och statistik. 8: e upplagan. Vieweg, 2005.
- Joachim Hartung : Statistik. 14: e upplagan. Oldenbourg, 2005.
webb-länkar
- Konfidensintervaller och hypotesprov
- Konfidensintervaller förklaras så enkelt som möjligt (PDF; 109 kB)
- Java -applet för utvärdering av din egen serie mätningar
- Interaktiv illustration
Individuella bevis
- ↑ Betydelse testkontrovers (engelska)
- ↑ Vad är det verkliga resultatet i målpopulationen? I: Statistik i korthet: konfidensintervaller . PMC 2947664 (gratis fulltext) (engelska)
- ^ Leonhard Held och Daniel Sabanés Bové: Tillämpad statistisk slutsats: Sannolikhet och Bayes. Springer Heidelberg New York Dordrecht London (2014). ISBN 978-3-642-37886-7 , s.56.
- ^ Leonhard Held och Daniel Sabanés Bové: Tillämpad statistisk slutsats: Sannolikhet och Bayes. Springer Heidelberg New York Dordrecht London (2014). ISBN 978-3-642-37886-7 , s.57.
- ^ Karl Mosler och Friedrich Schmid: Sannolikhetsberäkning och avgörande statistik. Springer-Verlag, 2011, s. 214.
- ↑ a b c d e Hans-Otto Georgii: Stochastics . Introduktion till sannolikhetsteori och statistik. 4: e upplagan. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7 , sid. 229 , doi : 10.1515 / 9783110215274 .
- ^ A b Ludger Rüschendorf: Matematisk statistik . Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6 , sid. 230-231 , doi : 10.1007 / 978-3-642-41997-3 .
- ^ Ludger Rüschendorf: Matematisk statistik . Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6 , sid. 245 , doi : 10.1007 / 978-3-642-41997-3 .
- ↑ a b c d Tillägg: Logikelihood and Confidence Intervals. Hämtad 14 juli 2021 .
- ↑ Se till exempel kap. IV, avsnitt 3.1.1 och 3.2 för Hartung. Wilson- och Clopper-Pearson-intervallen och korrigeringsfaktorn för den hypergeometriska fördelningen diskuteras här.
- ↑ Inspektion för godkännande av provtagning baserat på antalet defekta enheter eller defekter [attributinspektion] - Del 1: Provtagningsplaner för inspektion av en serie partier beställda enligt det acceptabla kvalitetsgränsskiktet AQL .