Spridningsindex i statistik

Läsningstid ~5 Min.
Spridningsindex är viktiga eftersom de beskriver den variation som finns i en given population eller ett givet urval. Så här använder du dem.

I en datadistribution spelar spridningsindex en mycket viktig roll. Dessa mätningar kompletterar de för den så kallade centrala positionen genom att karakterisera variabiliteten hos datan.

De spridningsindex komplettera de med central tendens. De är också väsentliga i en datadistribution. Detta beror på att de kännetecknar dess variation. Deras relevans i statistisk träning framhölls av Wild och Pfannkuch (1999).

Uppfattningen av datavariabilitet är en av grundkomponenterna i statistiskt tänkande eftersom det ger oss information om spridningen av data i förhållande till ett genomsnitt.

Tolkningen av genomsnittet

De aritmetiskt medelvärde det används ofta i praktiken men kan ofta misstolkas. Detta händer när variabelvärdena är mycket sparsamma. Vid dessa tillfällen är det nödvändigt att åtfölja de genomsnittliga spridningsindexen (2).

Dispersionsindex har tre viktiga komponenter relaterade till slumpmässig variabilitet (2):

  • Uppfattningen av dess allestädes närvarande i världen omkring oss.
  • Tävlingen om dess förklaring.
  • Förmågan att kvantifiera det (vilket innebär att förstå och veta hur man tillämpar begreppet dispersion).

Vad används spridningsindex till?

När det är nödvändigt att generalisera data från ett urval av en population spridningsindex är mycket viktiga eftersom de direkt påverkar felet vi arbetar med . Ju mer spridning vi samlar in i ett prov desto större storlek behöver vi för att arbeta med samma fel.

Å andra sidan hjälper dessa index oss att avgöra om vår data är långt ifrån det centrala värdet. De berättar för oss om detta centrala värde är tillräckligt för att representera studiepopulationen. Detta är mycket användbart för att jämföra distributioner och förstå risker i beslutsprocessen (1).

Dessa förhållanden är mycket användbara för att jämföra fördelningar och förstå risker i beslutsfattande. Ju större spridning, desto mindre representativt är det centrala värdet .

De mest använda är:

  • Räckvidd.
  • Statistisk avvikelse .
  • Variation.
  • Standard eller typisk avvikelse.
  • Variationskoefficient.

Funktioner för spridningsindex

Räckvidd

Användningen av rang är för primär jämförelse. På så sätt tar den bara hänsyn till de två extrema observationerna . Det är därför det endast rekommenderas för små prover (1). Det definieras som skillnaden mellan det sista värdet på variabeln och det första (3).

Statistisk avvikelse

Medelavvikelsen anger var data skulle koncentreras om alla var på samma avstånd från det aritmetiska medelvärdet (1). Vi anser att avvikelsen för ett variabelvärde är skillnaden i absolut värde mellan det variabelvärdet och det aritmetiska medelvärdet av serien. Det betraktas därför som det aritmetiska medelvärdet av avvikelserna (3).

Variation

Variansen är en algebraisk funktion av alla värden lämpliga för inferentiella statistiska uppgifter (1). Det kan definieras som kvadratisk avvikelse (3).

Standard eller typisk avvikelse

För prov tagna från samma population är standardavvikelsen en av de mest använda (1). Det är kvadratroten av variansen (3).

Variationskoefficient

Det är ett mått som främst används för att jämföra förändringen mellan två uppsättningar data mätt i olika enheter Och. Till exempel höjd och vikt grupp av elever i ett prov. Den används för att bestämma i vilken distribution data är mest klustrade och medelvärdet är mest representativt (1).

Variationskoefficienten är ett mer representativt spridningsindex än de tidigare eftersom det är ett abstrakt tal. Med andra ord den är oberoende av enheterna där variabelvärdena förekommer. I allmänhet uttrycks denna variationskoefficient i procent (3).

Slutsatser om spridningsindex

Indexen av spridning indikerar å ena sidan graden av variation i provet. Å andra sidan det centrala värdets representativitet eftersom om du får ett lågt värde betyder det att värdena är koncentrerade runt det centret. Detta skulle innebära att det finns liten variation i data och centret representerar det hela väl.

Tvärtom, om du får ett högt värde betyder det att värdena inte är koncentrerade utan spridda. Detta innebär att det finns mycket variation och att centret inte kommer att vara särskilt representativt. Å andra sidan när vi drar slutsatser kommer vi att behöva ett större urval om vi vill minska felet ökade just på grund av den ökade variabiliteten.

Populära Inlägg