Normaali jakauma tilastoissa - määritelmä, esimerkki, tulkinta

Mikä on normaali jakauma tilastoissa?

Normaali jakauma on kellon muotoinen taajuusjakautumiskäyrä, joka auttaa kuvaamaan kaikkia mahdollisia arvoja, jotka satunnaismuuttuja voi ottaa tietyllä alueella, kun suurin osa jakautumisalueesta on keskellä ja harvat ovat hännissä, äärimmäisissä kohdissa. Tällä jakaumalla on kaksi avainparametriä: keskiarvo (µ) ja keskihajonta (σ), joilla on keskeinen rooli varojen tuoton laskemisessa ja riskienhallintastrategiassa.

Kuinka tulkita normaalijakaumaa

Yllä oleva kuva osoittaa, että tilastollinen normaalijakauma on kellon muotoinen käyrä. Tämän jakauman mahdollisten tulosten alue on koko reaaliluku, joka on välillä -∞ - + ∞. Kellokäyrän pyrstöt ulottuvat kaavion molemmille puolille (+/-) ilman rajoituksia.

  • Noin 68% kaikista havainnoista on +/- yhden keskihajonnan (σ) sisällä
  • Noin 95% kaikista havainnoista kuuluu +/- kahteen keskihajontaan (σ)
  • Noin 99% kaikista havainnoista kuuluu +/- kolmeen keskihajontaan (σ)

Sen vinous on nolla (jakauman symmetria). Jos datan jakauma on epäsymmetrinen, jakauma on epätasainen, jos tietojoukon vinous on suurempi kuin nolla tai positiivinen vinous. Sitten jakauman oikea häntä on pidempi kuin vasen, ja negatiivisen vinouden (alle nolla) vasen häntä on pidempi kuin oikea häntä.

Sen kurtoosi on 3 (mittaa jakauman huippua), mikä osoittaa, että jakauma ei ole liian huipussaan eikä liian ohut hännänsä. Jos kurtoosi on yli kolme, jakauma on huipussaan rasvaisemmilla hännillä ja jos kurtoosi on alle kolme, siinä on ohuet hännät ja huippupiste on normaalia jakaumaa pienempi.

Ominaisuudet

  • Ne edustavat jakautumisperhettä, jossa keskiarvo ja poikkeama määrittävät jakauman muodon.
  • Tämän jakauman keskiarvo, mediaani ja tila ovat kaikki yhtä suuret.
  • Puolet arvoista on keskiosan vasemmalla puolella ja toinen puoli oikealla.
  • Vakiokäyrän kokonaisarvo on aina yksi.
  • Todennäköisesti jakauma on keskellä, ja vähemmän arvoja on takapäässä.

Muunnos (Z)

Satunnaismuuttujan (X) todennäköisyystiheysfunktio (PDF) seuraavan jakauman perusteella saadaan:

missä -∞ <x <∞; -∞ <µ 0

Missä,

  • F (x) = Normaali todennäköisyysfunktio
  • x = Satunnaismuuttuja
  • µ = keskimääräinen jakautuma
  • σ = Jakauman keskihajonta
  • π = 3,14159
  • e = 2,71828

Muunnoskaava

Missä,

  • X = satunnainen muuttuja

Esimerkkejä normaalijakaumasta tilastoissa

Keskustellaan seuraavista esimerkeistä.

Esimerkki 1

Oletetaan, että yrityksellä on 10000 työntekijää ja useita palkkarakenteita sen roolin mukaan, jossa työntekijä työskentelee. Palkat jaetaan yleensä väestökeskiarvon ollessa µ = 60000 dollaria ja väestön keskihajonta σ = 15000 dollaria. Mikä on todennäköisyys, että satunnaisesti valitun työntekijän palkka on alle 45000 dollaria vuodessa.

Ratkaisu

Kuten yllä olevassa kuvassa on esitetty, tähän kysymykseen vastaamiseksi meidän on selvitettävä normaalikäyrän alla oleva alue 45: stä vasempaan sivuhaaraan. Lisäksi meidän on käytettävä Z-taulukon arvoa saadaksemme oikean vastauksen.

Ensinnäkin meidän on muunnettava annettu keskiarvo ja standardipoikkeama normaaliksi normaalijakaumaksi keskiarvolla (µ) = 0 ja standardipoikkeama (σ) = 1 käyttäen muunnoskaavaa.

Muunnoksen jälkeen meidän on etsittävä Z-taulukko vastaavan arvon selvittämiseksi, mikä antaa meille oikean vastauksen.

Koska

  • Keskiarvo (µ) = 60000 dollaria
  • Keskihajonta (σ) = 15000 dollaria
  • Satunnainen muuttuja (x) = 45000 dollaria

Muunnos (z) = (45000-60000/15000)

Transformaatio (z) = -1

Nyt arvo, joka vastaa -1-arvoa Z-taulukossa, on 0,1587, joka edustaa käyrän alla olevaa aluetta 45: stä vasemmalle. Se osoitti, että kun valitsemme satunnaisesti työntekijän, todennäköisyys ansaita alle 45000 dollaria vuodessa on 15,87%.

Esimerkki 2

Ota nyt huomioon sama skenaario kuin yllä, selvitä todennäköisyys, että satunnaisesti valittu työntekijä ansaitsee yli 80 000 dollaria vuodessa normaalijakaumaa käyttämällä.

Ratkaisu

Joten tässä kysymyksessä meidän on selvitettävä varjostettu alue 80: sta oikealle hännälle käyttäen samaa kaavaa.

Koska

  • Keskiarvo (µ) = 60000 dollaria
  • Keskihajonta (σ) = 15000 dollaria
  • Satunnainen muuttuja (X) = 80 000 dollaria

Muunnos (z) = (80000-60000 / 15000)

Muunnos (z) = 1,33

Z-taulukon mukaan vastaava arvo 1,33 on 0,9082 tai 90,82%, mikä osoittaa, että todennäköisyys valita satunnaisesti alle 80 000 dollaria ansaitsevat työntekijät on 90,82%.

Mutta kuten kysymyksessä, meidän on määritettävä todennäköisyys, että satunnaiset työntekijät ansaitsevat yli 80 000 dollaria vuodessa, joten meidän on vähennettävä arvo 100: sta.

  • Satunnainen muuttuja (X) = 100% - 90,82%
  • Satunnainen muuttuja (X) = 9,18%

Joten todennäköisyys, että työntekijät ansaitsevat yli 80 000 dollaria vuodessa, on 9,18%.

Käyttää

  • Osakemarkkinoiden tekninen kaavio on usein kellokäyrä, jonka avulla analyytikot ja sijoittajat voivat tehdä tilastollisia päätelmiä osakkeiden odotetusta tuotosta ja riskistä.
  • Sitä käytetään todellisessa maailmassa, kuten määritetään todennäköisin paras aika, jonka pizzayritykset kuluttavat pizzan ja monien muiden todellisten sovellusten toimittamiseen.
  • Käytetään tietyn väestöryhmän korkeuksien vertailussa, jossa useimmilla ihmisillä on keskikoko ja vain harvoilla ihmisillä on keskimääräistä korkeampi tai alle keskimääräinen korkeus.
  • Niitä käytetään opiskelijoiden keskimääräisen akateemisen suorituksen määrittämisessä, mikä auttaa vertailemaan opiskelijoiden sijoitusta.

Johtopäätös

Normaali jakelu löytää sovelluksia datatieteessä ja data-analytiikassa. Tämän jakelun kanssa käytettävät kehittyneet tekniikat, kuten tekoäly ja koneoppiminen, voivat parantaa tietojen laatua, mikä auttaa yksilöitä ja yrityksiä tehokkaassa päätöksenteossa.

Mielenkiintoisia artikkeleita...