Missvisande statistik
I det långa loppet, jämföra i många olika fall, i fallet med tjugo, när du inte fick det rätt. Detta är en skillnad som skyddas om skillnaden är större än felmarginalen, för skillnaden är skillnaden statistiskt säkrad med en risknivå på 5 procent. Från startpunkten till urvalsdragningen är det högst 5 procents sannolikhet att få ett urval missvisande statistik ger den observerade skillnaden, med tanke på att skillnaden inte råder i befolkningen.
Storleken på skillnaden mellan de två värdena ska kallas statistiskt skyddad, beroende på felfältets storlek. Detta beror i sin tur på den givna frekvensen av förtroende, på storleken på urvalsmetoderna och på valet och beräkningen. Ju större val, desto mindre skillnader kan statistiskt säkerställas. Ett exempel kan tas från den statistiska undersökningen av sympati för det svenska partiet.
På grund av fyra missvisande statistik hinder för att komma in i riksdagen är alltså Centerpartiet högre och Kristdemokraterna lägre. Men här blir felfälten viktiga. Konfidensintervallen är 4,2 0,4 för Centerpartiet och 3,6 0,3 för Kristdemokraterna. Det kan ses att 4 procentlåset ligger inom intervallet för Centerpartiet. Detta innebär att det inte är statistiskt garanterat att mittsidan ovanför eller under baren är 4 procent.
Men för Kristdemokraterna är det statistiskt säkerställt att partiet ligger under barriären. Det kan ge en falsk känsla av säkerhet förtroende, och uttalanden om statistiskt säkra skillnader kan ge en falsk känsla av säkerhet och bör tolkas med försiktighet. I exemplet ovan är det omöjligt att vara helt säker på att Kristdemokraterna ligger under fyra procent i verkligheten.
Det finns en osäkerhet som inte täcks av fält och konfidensintervall. Dessa kan vara systematiska fel som uppstår eftersom missvisande statistik alla ingår i urvalet, svarar på osäkerheten i fallet eller osäkerheten i svaren själva. När allt kommer omkring är svaret i omröstningen inte detsamma som att rösta. Det hör också till det faktum att förändringar kan ackumuleras och bli säkrare.
I partiets sympatiundersökning sjönk den centrala sidan från 4,7 till 4,4 procent mellan maj och November, skillnaden var inte statistiskt säker. Under perioden November till maj minskade också den centrala sidan från 4,4 till 4,2 procent. Och detta var inte statistiskt säkerställt. Det faktum att det finns en minskning mellan maj och maj är dock statistiskt garanterad. Det är inte ovanligt att skillnader som inte är statistiskt analyseras och kommenteras i media.
Till exempel kan opinionsundersökningar om partisympatier kommentera tillvägagångssättet för ett visst politiskt parti, vilket parti som är störst eller om partiet ligger under fyra procentsbarriären. Justering för förlust är det viktigt att minska förlustbeloppet. Men förluster förekommer fortfarande, och då kan olika åtgärder genomföras för att minska effekterna av bortfall på statistiken.
Den allmänna metoden kallas viktkompensation eller transformation. Detta är en metod som fungerar bra om svarstrenderna är ungefär desamma för objekten i de strategiska urvalsgrupperna som används. Låt oss till exempel säga att endast hälften svarade inom skiktet bestående av ungdomar. För att statistiken inte ska förvrängas bör de ungdomar som svarade representera dubbelt så många ungdomar jämfört med alla respondenter.
I beräkningen innebär detta kompensation för frånkoppling, vilket ger ungdomarnas svar dubbla vikten. Det kan emellertid inte antas att svarstrenderna är desamma i motsvarande lager. Följaktligen används ofta en mer avancerad metod, så kalibrering används, som ofta kan anpassa sig till förlust mer effektivt. Till exempel, om det finns relativt färre låginkomstarbetare som svarade på undersökningen, tar kalibreringen hänsyn till det, vilket ger svar från låginkomstarbetare något mer vikt än andras svar.
Att hitta lämpliga registervariabler är avgörande för framgångsrik kalibrering. Företrädesvis bör registervariablerna kunna" förklara " både tendensen att reagera och hur människor reagerar. Det är omöjligt att ange en gräns, Det är omöjligt att ange en gräns för hur stor avvikelsen kan vara. En relativt liten men mycket "sned" förlust, koncentrerad till specialgrupper, kan ha en större negativ inverkan på statistiken än en större reträtt som inte är så benägen.
I allmänhet är dock bortfallet en viktig, men inte idealisk, indikator på risken för vilseledande statistik.