Outlier-kaava tarjoaa graafisen työkalun tietolaskennan laskemiseksi, joka sijaitsee annetun jakelusarjan ulkopuolella, joka voi olla sisä- tai ulkopuoli muuttujista riippuen.
Mikä on outlier-kaava?
Poikkeama on tietyn näytteen tai havainnon datapiste tai jakaumassa, jonka on oltava kokonaiskuvion ulkopuolella. Yleisesti käytetty sääntö, jonka mukaan datapistettä pidetään poikkeavana, jos sillä on yli 1,5 IQR ensimmäisen kvartiilin alapuolella tai kolmannen kvartiilin yläpuolella.
Toisin sanoen matalien poikkeavien on oltava alle Q1-1,5 IQR: n ja korkeiden poikkeavien on oltava Q3 + 1,5IQR
Lasketaan mediaani, kvartilit, mukaan lukien IQR, Q1 ja Q3.
Ulompi kaava on esitetty seuraavasti,
Kaavan Q1 = ¼ (n + 1) kolmas termi Kaava Q3 = ¾ (n + 1) kolmas termi Kaava Q2 = Q3 - Q1

Poikkeamien laskeminen askel askeleelta
Seuraavat vaiheet on noudatettava laskemaan poikkeama.
- Vaihe 1: Laske ensin kvartilit eli Q1, Q2 ja interkvartiili
- Vaihe 2: Laske nyt arvo Q2 * 1,5
- Vaihe 3: Vähennä nyt Q1-arvo vaiheessa 2 lasketusta arvosta
- Vaihe 4: Lisää tähän Q3 vaiheessa 2 lasketulla arvolla
- Vaihe 5: Luo vaiheissa 3 ja 4 laskettujen arvojen alue
- Vaihe 6: Järjestä tiedot nousevassa järjestyksessä
- Vaihe 7: Tarkista, onko arvoja, jotka ovat vaiheessa 5 luodun alueen alapuolella tai sitä korkeammat.
Esimerkki
Harkitse seuraavien numeroiden tietojoukkoa: 10, 2, 4, 7, 8, 5, 11, 3, 12. Sinun on laskettava kaikki poikkeamat.
Ratkaisu:
Ensinnäkin meidän on järjestettävä tiedot nousevassa järjestyksessä, jotta löydetään mediaani, joka on meille Q2.
2, 3, 4, 5, 7, 8, 10, 11, 12

Koska havaintojen lukumäärä on pariton, mikä on 9, mediaani olisi viidennessä asemassa, joka on 7, ja sama on Q2 tässä esimerkissä.
Siksi Q1 lasketaan seuraavasti:
Q1 = ¼ (9 + 1)
= ¼ (10)
Q1 tulee olemaan -

Q1 = 2,5 termi
Tämä tarkoittaa, että Q1 on keskiarvo 2 toisen ja 3 kolmannen asennon huomautukset, joka on 3 ja 4 tässä, ja keskimäärin sama (3 + 4) / 2 = 3,5
Siksi Q3 lasketaan seuraavasti:

Q3 = ¾ (9 + 1)
= ¾ (10)
Q3 tulee olemaan -

Q3 = 7,5 termi
Tämä tarkoittaa, että Q3 on keskiarvo 7 : nnen ja 8 : nnen aseman huomautukset, joka on 10 ja 11 tässä, ja keskimäärin sama (10 + 11) / 2 = 10,5
Nyt matalien poikkeavien on oltava alle Q1-1,5IQR ja korkeiden poikkeavien Q3 + 1,5IQR
Joten arvot ovat 3,5 - (1,5 * 7) = -7 ja korkeampi alue on 10,5 + (1,5 * 7) = 110,25.
Koska ei ole havaintoja, jotka olisivat joko 110,25 ja -7 ylä- tai alapuolella, meillä ei ole tässä otoksessa poikkeamia.
Esimerkki Outlier-kaavasta Excelissä (Excel-mallilla)
Luovat valmennustunnit harkitsevat 25 prosentin parhaiden opiskelijoiden palkitsemista. He haluavat kuitenkin välttää syrjäytymisiä. Tiedot koskevat 25 opiskelijaa. Käytä Outlier-yhtälöä selvittääksesi onko outlier?
Ratkaisu:
Alla on annettu tiedot ulkopuolisen arvon laskemiseksi.

Tässä on havaintojen lukumäärä 25, ja ensimmäinen vaihe olisi muuntaa yllä olevat raakatiedot nousevaan järjestykseen.
Mediaani tulee olemaan -

Mediaani-arvo = ½ (n + 1)
= ½ = ½ (26)
= 13 th aikavälillä
Q2 eli mediaani on 68,00
Mikä on 50% väestöstä.
Q1 tulee olemaan -

Q1 = ¼ (n + 1) kolmas termi
= ¼ (25 + 1)
= ¼ (26)
= 6,5 th termi, joka vastaa 7 th aikavälillä
Q1 on 56,00, mikä on alin 25%
Q3 tulee olemaan -

Lopuksi Q3 = ¾ (n + 1) kolmas termi
= ¾ (26)
= 19,50 termi
Tässä keskimääräinen tarpeet otetaan, joka on 19 : nnen ja 20 : nnen ehtoja, jotka ovat 77 ja 77 ja keskimäärin sama (77 + 77) / 2 = 77,00
Q3 on 77, mikä on 25% alkuun
Matala kantama
Nyt matalien poikkeavien on oltava alle Q1-1,5IQR ja korkeiden poikkeavien Q3 + 1,5IQR

Korkea kantama -

Joten arvot ovat 56 - (1,5 * 68) = -46 ja korkeampi alue on 77 + (1,5 * 68) = 179.
Poikkeuksia ei ole.
Osuvuus ja käyttötarkoitukset
Outliers-kaava on erittäin tärkeä tietää, koska voi olla tietoa, joka vääristyy tällaisen arvon perusteella. Ota esimerkki havainnoista 2, 4, 6, 101, ja nyt, jos joku ottaa näiden arvojen keskiarvon, se on 28,25, mutta 75% havainnoista on alle 7, ja siten yksi olisi virheellinen päätös tämä näyte.
Voidaan huomata, että 101 näyttää selvästi hahmottuvan, ja jos tämä poistetaan, keskiarvo olisi 4, mikä kertoo arvoista tai havainnoista, että ne ovat alueella 4. Siksi on erittäin tärkeää suorittaa tämä laskenta, jotta vältetään tietojen väärinkäyttö. Tilastotieteilijät ympäri maailmaa käyttävät näitä laajasti, kun he tekevät tutkimusta.