T-testi (määritelmä, tyypit) - Vaiheittaiset laskentamallit

Sisällysluettelo

Mikä on T-testi?

T-testi on menetelmä, josta johdetaan johtopäätös tilastoista, jonka tarkoituksena on selvittää, onko kahden välineen välillä merkittävää eroa, jolloin nämä kaksi ryhmää voivat olla yhteydessä toisiinsa.

Selitys

  • Se on tarkoitettu hypoteesitestaukseen, jota käytetään periaatteessa tiettyyn väestöön liittyvän hypoteesin testaamiseen. T-testi ottaa huomioon T-tilastot, T-jakauma-arvot ja vapausasteet, joita käytetään kahden tietojoukon välisen eron todennäköisyyden määrittämiseen.
  • T-testin taustalla on se, että se ottaa otoksen molemmista sarjoista ja rakentaa ongelmalauseen tarkastelemalla nollahypoteesia, jossa molempien keskiarvojen sanotaan olevan samat.
  • Yhtälöityjen kaavojen perusteella arvot piirretään ja verrataan standardiarvoihin, mikä johtaa edelleen nollahypoteesin hyväksymiseen tai hylkäämiseen. Nollahypoteesin hylkääminen osoittaa, että tietojoukko on melko tarkka eikä sattumalta.

T-testin tyypit

T-testiä on pääasiassa neljää tyyppiä, jotka ovat seuraavat:

# 1 - 1 näyte T-testi

Se on tarkoitettu testaamaan, onko tavoitellun arvon keskiarvo yhtä suuri kuin yhden väestön keskiarvo, esimerkiksi testaamalla, onko luokan 5 opiskelijoiden keskimääräinen paino yli 45 kg

# 2 - 2-näyte T-testi

Se on tarkoitettu testaamaan, onko yhden kohteena olevan arvon keskiarvo yhtä suuri kuin kahden itsenäisen populaation keskiarvo, esimerkiksi testaamalla, eroako luokan 5 poikaopiskelijoiden keskimääräinen paino luokan 5 tyttöopiskelijoista.

# 3 - Yhdistetty T-testi

Se on tarkoitettu testaamaan, onko tavoitellun arvon keskiarvo yhtä suuri kuin riippuvien havaintojen erojen keskiarvo. Esimerkiksi opiskelijoiden pisteiden vertaaminen ennen ja jälkeen opintojen suorittamisen kullekin aineelle auttaa meitä tunnistamaan, onko opintojen suorittaminen riittävän merkittävä parantamaan opiskelijoiden pisteitä.

# 4 - T-testi regressiolähdössä

Se ottaa huomioon regressioyhtälön kertoimen ja testaa, missä määrin se eroaa nolla-arvosta. esim. jos valintakokeen pisteet ovat merkittävä tekijä määritettäessä, saako opiskelija hyvän lopputuloksen.

T-testin oletukset

  • Ensimmäinen oletus t-testistä liittyy mitta-asteikkoon. Tämä liittyy siihen, seuraako asteikko jatkuvaa vai järjestysasteikkoa
  • Toinen oletus voi koskea otoksen satunnaista luonnetta. Tämä tarkoittaa, että kerättyjen tietojen tulisi olla puhtaasti satunnaisia.
  • Kolmas oletus voi olla, että kun piirrämme t-testijakaumaan liittyvät tiedot, sen tulee noudattaa normaalijakaumaa ja saada aikaan kellokäyrä.
  • Neljäs oletus voi olla, että t-jakauman ja erityisesti kellokäyrän muodon saamiseksi meidän on oltava suurempi otoskoko.
  • Lopullinen oletus voi olla t-testin. Varianssin tulisi olla luonteeltaan homogeenista. e. keskihajonta on melkein sama.

Kuinka laskea?

Se toimii kahdessa eri skenaariossa, toisin sanoen riippumaton otos ja toinen riippuva otos.

# 1 - Riippumaton malliskenaario

  • Meidän on laskettava summa, otoksen koko, joka määritetään N: llä, ja pistemäärä keskiarvolle kullekin riippumattomalle näytteelle. Tämän jälkeen vapausaste on laskettava jokaiselle itsenäiselle näytteelle.
  • Tätä edustaa vähentämällä näyte yhdellä, jota merkitsemme "n-1". Tämän jälkeen varianssi ja keskihajonta on laskettava.
  • Näytteiden vapausasteet lisätään, ja tätä kutsutaan nimellä "df-total". Seuraavaksi meidän on kerrottava kunkin näytteen vapausaste kunkin varianssilla. Meidän on lisättävä tulos ja jaettava sitten summa df-totalilla. Saadtua tulosta kutsutaan yhdistetyksi varianssiksi.
  • Yhdistetty varianssi jaetaan sitten näytteiden n: llä. Kaikille näytteille saatu tulos lisätään sitten. Tämän neliöjuuri otetaan, ja tätä kutsutaan eron keskivirheeksi.
  • Lopuksi meidän on vähennettävä näytteen alempi keskiarvo näytteen suuremmasta keskiarvosta. Saatu ero jaetaan sitten eron keskivirheellä, ja saatuja tuloksia kutsutaan T-arvoksi.

# 2 - Riippuva näyte-skenaario

  • Kummankin tietojoukon parista saadut pisteet merkitään muistiin, ja meidän on vähennettävä se. Saadut erot lisätään ja niitä kutsutaan nimellä "D." Kunkin näytteen erot neliöitetään ja lisätään, jotta saadaan tulos nimeltä D-neliö. Tämän jälkeen meidän on kerrottava "N" tai "D-neliön" kanssa pariksi yhdistetty pisteiden määrä.
  • Saatu tulos vähennetään kokonaisluvun ”D.” neliöstä. Tämä tulos jaetaan edelleen arvoon ”N-1”. Saadun neliöjuuri saadaan ja sitä kutsutaan jakajaksi. Lopuksi meidän on jaettava kokonais “D” jakajalla, mikä antaa meille lopullisen t-arvon.

T-testiesimerkkejä

Katsotaanpa, että meillä on pisteet kullekin aineelle kahdella termillä pidetyssä kokeessa.

Vaihe 1: Vähennä vaihe 1 vaiheesta 2

Vaihe 2: Lisää kaikki erot eli -55

Vaihe 3: Nosta eroja

Vaihe 4: Lisää kaikki eron neliöt eli 983

Vaihe 5: Kaavan käyttö T-arvon laskemiseen

T = ((ΣD) / N) / √ (ΣD 2 - (ΣD) 2 / N)) / (N-1) - N
  • = -9,16 / √ (983 - (- 55) 2 /6)) / (6-1) * 6
  • = -9,16 / √15,96
  • = -9,16 / 3,99
  • T-arvo = -2,29

Saadtua T-arvoa verrataan sitten taulukosta saatuun T-arvoon käyttämällä p-arvoa ja vapausastetta. Jos laskettu t-arvo on suurempi kuin taulukon arvo tietyllä ennalta määritetyllä alfatasolla, voimme hylätä nollahypoteesin sanomalla, että keskiarvojen välillä on ero.

Kun sitä käytetään?

Tätä käytetään vertaamaan kahta keskiarvoa tai osuutta. Käytämme myös t-testiä, kun populaatioparametrit eivät ole käyttäjän tiedossa. T-testiskenaarioiden käyttöä on yleisesti kolme tapausta, jotka ovat seuraavat:

  • Itsenäistä näytteen t-testiä käytetään, kun haluamme verrata kahden ryhmän keskiarvoa.
  • Parillista t-testiä käytetään, kun haluamme verrata saman ryhmän keskiarvoa, mutta eri ajankohtina.
  • Yhden näytteen t-testiä käytetään, kun tarvitsemme yksittäisen ryhmän keskiarvon tarkistamista tuntemattomaan keskiarvoon nähden.

T-Testin käyttö Excelissä

  • Excelissä ensimmäinen ja tärkein asia, jota tarvitsemme, on Data Analysis -lisäosan asennus. Tämän jälkeen meidän on mentävä valikkovälilehden kohtaan "Tiedot" ja napsautettava sitä. Tietoanalyysi-vaihtoehto näkyy siellä.
  • T-testin suorittamiseksi meillä on oltava tietomme sarakemuodossa. Napsauttamalla "Data-analyysi", saat useita tilastollisia testejä, jotka voimme suorittaa, ja meidän on luettelosta valittava t-testi ja napsautettava "Ok".
  • Esiin tulee valintaikkuna, jossa meidän on syötettävä polun 1 tiedot muuttujan alue 1 ruutuun ja myös kokeilun 2 tiedot muuttujan alue 2 laatikoihin. Oletuksena alfa-arvo on 0,05, mutta tätä voidaan muuttaa mieltymystemme perusteella. Kun kaikki on kunnossa, napsauta "OK".
  • Voimme nyt nähdä T-testimme tuloksen Excel-taulukossa. Tärkein tässä huomioitava arvo on P-arvo. Siitä, mihin olemme valinneet alfa-arvon, jos P-arvo excelissämme on pienempi kuin alfa-arvo, voimme päätellä, että kahden arvojoukkomme keskiarvojen välillä on tilastollinen aineellinen ero.

Johtopäätös

T-testi on tarkoitettu hypoteesitestaukseen, jota käytetään pohjimmiltaan tiettyyn populaatioon liittyvän hypoteesin testaamiseen. Se kertoo ryhmien välisen eron merkitsevyystason, joka mitataan yleensä keskiarvon perusteella. Täältä löydämme pohjimmiltaan eron väestökeskiarvojen ja oletetun arvon välillä.

Mielenkiintoisia artikkeleita...