Kaava korrelaation laskemiseksi
Korrelaatio on tilastollinen mitta kahden muuttujan välillä, ja se määritellään yhden muuttujan määrän muutokseksi, joka vastaa toisen muutosta, ja se lasketaan summaamalla ensimmäisen muuttujan summan tulo miinus ensimmäisen muuttujan keskiarvo toisen muuttujan miinus summaksi toisen muuttujan keskiarvo jaettuna kokonaismäärästä ensimmäisen muuttujan neliön tulon juuren alapuolella miinus ensimmäisen muuttujan keskiarvo toisen muuttujan neliön summaksi miinus toisen muuttujan keskiarvo.
Korrelaation arvo on rajoitettu välillä -1 ja +1, ja se voidaan tulkita seuraavasti:
- -1: Jos se on -1, muuttujien tiedetään olevan täysin negatiivisesti korreloivia. Tämä tarkoittaa, että jos yksi muuttuja liikkuu yhteen suuntaan, niin toinen liikkuu vastakkaiseen suuntaan.
- 0: Tämä tarkoittaa, että muuttujalla ei ole korrelaatiota.
- +1: Jos se on +1, muuttujien tiedetään olevan täysin positiivisesti korreloivia. Molemmat muuttujat liikkuvat positiivisiin suuntiin.
Jos meillä on 2 muuttujaa x ja y, korrelaatiokerroin kahden muuttujan välillä löytyy seuraavasti:
Korrelaatiokerroin = ∑ (x (i) - keskiarvo (x)) * (y (i) - keskiarvo (y)) / √ (∑ (x (i) - keskiarvo (x)) 2 * ∑ (y (i) tarkoittaa (y)) 2 )
Missä,
- x (i) = x: n arvo näytteessä
- Keskiarvo (x) = x: n kaikkien arvojen keskiarvo
- y (i) = y: n arvo näytteessä
- Keskiarvo (y) = kaikkien y-arvojen keskiarvo
Esimerkkejä
Korrelaation laskeminen Excelissä on vaivatonta. Käytetyn funktion syntakse on seuraava:
Korrelaatiokerroin = CORREL (taulukko1, taulukko2)
Esimerkki 1
Otetaan sama esimerkki, jonka olemme ottaneet edellä laskettaessa korrelaatiota excelin avulla.
Ratkaisu:
Alla ovat x: n ja y: n arvot:

Laskelma on seuraava.

Excelin kaava = CORREL (taulukko (x), taulukko (y))

Kerroin = +0,95
Koska tämä kerroin on lähellä arvoa +1, x ja y korreloivat erittäin positiivisesti.
Esimerkki 2
Korrelaatiosta on hyötyä pääasiassa yritysten osakekurssien analysoinnissa ja sen perusteella osakekannan luomisessa.
Selvitetäänkö Applen osakkeen korrelaatio Nasdaq-indeksin kanssa viimeisen yhden vuoden osakekehityksen perusteella. Apple on yhdysvaltalainen monikansallinen yritys, joka on erikoistunut tietotekniikkatuotteisiin, kuten iPod, iPad, Mac jne.
Ratkaisu:
Alla on Applen ja Nasdaqin osakkeiden kuukausituotto viimeisen vuoden ajalta:

Syötetään nyt arvot -
Korrelaatiokerroin = ∑ (x (i) - keskiarvo (x)). (Y (i) - keskiarvo (y)) / √ ∑ (x (i) - keskiarvo (x)) 2 ∑ (y (i) - keskiarvo (y)) 2

Applen ja Nasdaqin välinen korrelaatio = 0,039 / (√0,0039)

Kerroin = 0,62
Koska korrelaatio Applen ja Nasdaqin välillä on positiivinen, Apple korreloi positiivisesti Nasdaqin kanssa.
Esimerkki 3
Tarkastellaan nyt Walmartin ja Nasdaq-indeksin välistä korrelaatiota viimeisen yhden vuoden osakekehityksen perusteella. Walmart on yhdysvaltalainen yritys, jolla on vähittäiskauppaketju.
Ratkaisu:
Alla on Walmartin ja Nasdaqin kuukausittainen kehitys viimeisen vuoden aikana -

Syötetään nyt arvot kaavaan -
Korrelaatiokerroin = ∑ (x (i) - keskiarvo (x)). (Y (i) - keskiarvo (y)) / √ ∑ (x (i) - keskiarvo (x)) 2 ∑ (y (i) - keskiarvo (y)) 2
Siksi laskelma on seuraava,

Walmartin ja Nasdaqin välinen korrelaatio = 0,0032 / (√0,0346 * 0,0219)

Kerroin = 0,12
Voimme nähdä, että Walmart ja Nasdaq korreloivat myös positiivisesti, mutta eivät niin paljon verrattuna Applen korrelaatioon Nasdaqin kanssa.
Osuvuus ja käyttö
Korrelaatiokerroin on hyödyllinen kahden muuttujan välisen lineaarisen suhteen muodostamisessa. Se mittaa kuinka muuttuja liikkuu verrattuna toisen muuttujan liikkeeseen. Tämän kertoimen käytännön tarkoituksena on selvittää osakekurssimuutosten suhde markkinoiden kokonaisliikkeeseen. Tämän analyysin perustana osakeanalyytikko sisältää osakkeiden osuuden optimaalisen salkun luomiseksi mahdollisimman pienellä riskillä. Datatieteessä on myös hyödyllistä selvittää kahden muuttujan suhde.
Korrelaatiokerrointa käytetään myös erittäin hyvin tutkittaessa tietojen konstruktin validiteettia tekijäanalyysissä. Sitä käytetään erittäin paljon regressioanalyysissä ennustamaan riippuvien muuttujien arvot riippuvien ja riippumattomien muuttujien välisen suhteen perusteella. Tämä yhtälö on varsin hyödyllinen kvantitatiivisessa analyysissä saadakseen erilaisten muuttujien välisen suhteen luonteen. Tämän suhteen perusta, jos muuttuja ei liity muihin muuttujiin, se voidaan poistaa luettelosta.