Spredningsindekser i statistikk

Lesetid ~5 Min.
Spredningsindekser er viktige fordi de beskriver variasjonen som finnes i en gitt populasjon eller utvalg. Slik bruker du dem.

I en datadistribusjon spiller spredningsindekser en svært viktig rolle. Disse målingene utfyller målingene til den såkalte sentrale posisjonen ved å karakterisere variasjonen til dataene.

De spredningsindekser utfylle de med sentral tendens. De er også essensielle i en datadistribusjon. Dette er fordi de karakteriserer dens variasjon. Deres relevans i statistisk trening ble fremhevet av Wild og Pfannkuch (1999).

Oppfatningen av datavariabilitet er en av de grunnleggende komponentene i statistisk tenkning, da den gir oss informasjon om spredningen av data i forhold til et gjennomsnitt.

Tolkningen av gjennomsnittet

De aritmetisk gjennomsnitt det er mye brukt i praksis, men kan ofte feiltolkes. Dette skjer når variabelverdiene er svært sparsomme. Ved disse anledninger er det nødvendig å følge de gjennomsnittlige spredningsindeksene (2).

Spredningsindekser har tre viktige komponenter knyttet til tilfeldig variasjon (2):

  • Oppfatningen av dens allestedsnærværende i verden rundt oss.
  • Konkurransen om sin forklaring.
  • Evnen til å kvantifisere det (som innebærer å forstå og vite hvordan man skal anvende begrepet spredning).

Hva brukes spredningsindekser til?

Når det er nødvendig å generalisere dataene til et utvalg av en populasjon spredningsindekser er svært viktige da de direkte påvirker feilen vi jobber med . Jo mer spredning vi samler i en prøve, jo større størrelse trenger vi for å jobbe med samme feil.

På den annen side hjelper disse indeksene oss å avgjøre om dataene våre er langt fra den sentrale verdien. De forteller oss om denne sentrale verdien er tilstrekkelig til å representere studiepopulasjonen. Dette er veldig nyttig for å sammenligne distribusjoner og fatte risiko i beslutningsprosessen (1).

Disse forholdstallene er svært nyttige for å sammenligne fordelinger og forstå risikoer i beslutningstaking. Jo større spredning, jo mindre representativ er den sentrale verdien .

De mest brukte er:

  • Spekter.
  • Statistisk avvik .
  • Varians.
  • Standard eller typisk avvik.
  • variasjonskoeffisient.

Funksjoner av spredningsindekser

Spekter

Bruken av rang er for primær sammenligning. På denne måten tar den kun hensyn til de to ekstreme observasjonene . Dette er grunnen til at det kun anbefales for små prøver (1). Det er definert som forskjellen mellom den siste verdien av variabelen og den første (3).

Statistisk avvik

Gjennomsnittsavviket indikerer hvor dataene ville vært konsentrert dersom alle var like langt fra det aritmetiske gjennomsnittet (1). Vi anser avviket til en variabelverdi som forskjellen i absolutt verdi mellom den variabelverdien og det aritmetiske gjennomsnittet av serien. Det regnes derfor som det aritmetiske gjennomsnittet av avvikene (3).

Varians

Variansen er en algebraisk funksjon av alle verdier passende for slutningsstatistikkoppgaver (1). Det kan defineres som kvadratisk avvik (3).

Standard eller typisk avvik

For prøver tatt fra samme populasjon er standardavviket et av de mest brukte (1). Det er kvadratroten av variansen (3).

Variasjonskoeffisient

Det er et mål som primært brukes til å sammenligne endringen mellom to sett med data målt i forskjellige enheter Og. For eksempel høyde og vekt elevgruppen i et utvalg. Den brukes til å bestemme i hvilken fordeling dataene er mest gruppert og gjennomsnittet er mest representativt (1).

Variasjonskoeffisienten er en mer representativ spredningsindeks enn de foregående siden den er et abstrakt tall. Med andre ord den er uavhengig av enhetene som variabelverdiene vises i. Generelt er denne variasjonskoeffisienten uttrykt i prosent (3).

Konklusjoner om spredningsindekser

Indeksene av spredning indikerer på den ene siden graden av variasjon i utvalget. På den annen side representativiteten til den sentrale verdien siden hvis du får en lav verdi betyr det at verdiene er konsentrert rundt det senteret. Dette vil bety at det er liten variasjon i dataene og senteret representerer det hele godt.

Tvert imot, hvis du oppnår en høy verdi betyr det at verdiene ikke er konsentrert, men spredt. Dette betyr at det er mye variasjon og senteret vil ikke være særlig representativt. På den annen side når vi trekker konklusjoner, trenger vi et større utvalg hvis vi vil redusere feilen økte nettopp på grunn av økningen i variabiliteten.

Populære Innlegg