Lineaarinen regressio (määritelmä, esimerkkejä) Kuinka tulkita?

Mikä on lineaarinen regressio?

Lineaarinen regressio on pohjimmiltaan tilastollinen mallintamistekniikka, jota käytettiin osoittamaan yhden riippuvan muuttujan ja yhden tai useamman itsenäisen muuttujan välinen suhde. Se on yksi yleisimmistä ennusteanalyyseistä. Tämän tyyppinen jakauma muodostaa linjan, joten tätä kutsutaan lineaariseksi regressioksi. Tässä artikkelissa otamme esimerkkejä lineaarisesta regressioanalyysistä Excelissä.

Suorita ensin lineaarinen regressioanalyysi, meidän on lisättävä Excel-apuohjelmia seuraamalla vaiheita.

Napsauta Tiedosto - Asetukset (Tämä avaa sinulle Excel-asetukset-ponnahdusikkunan).

Napsauta Apuohjelmat - Valitse Excel-apuohjelmat avattavasta Hallitse-valikosta Excelissä ja napsauta sitten Siirry.

Tämä avaa Apuohjelmat-ponnahdusikkunan. Valitse Analysis ToolPak ja napsauta sitten OK.

Data Analysis -apuohjelma ilmestyy Lisää-välilehteen.

Ymmärretään alla olevien esimerkkien avulla lineaarisen regressioanalyysin Excelissä.

Esimerkkejä lineaarisesta regressioanalyysistä

Esimerkki 1

Oletetaan, että meillä on kuukausittainen myynti ja käytetty markkinointiin viime vuodesta, ja nyt meidän on ennustettava tulevat myynnit viime vuoden myynnin ja käytettyjen markkinointien perusteella.

Kuukausi Mainonta Myynti
Jan 40937 502729
Helmikuu 42376 507553
Maaliskuu 43355 516885
Huhti 44126 528347
saattaa 45060 537298
Kesäkuu 49546 544066
Heinäkuu 56105 553664
Elokuuta 59322 563201
Syyskuu 59877 568657
Lokakuu 60481 569384
marraskuu 62356 573764
Joulu 63246 582746

Napsauta Data-välilehdessä Tietoanalyysi, ja tämä avaa sinulle Tietoanalyysi-ponnahdusikkunan.

Valitse nyt luettelosta Regressio ja napsauta OK.

Regressio-ponnahdusikkuna avautuu.

Valitse Y-akselin ruudusta Myyntialue $ C $ 1: $ C $ 13, koska tämä on riippuvainen muuttuja ja $ B $ 1: $ B $ 14 X-akselilla, kun mainos on käytetty, on riippumaton muuttuja.

Valintamerkki Tarrat-ruudussa, jos olet valinnut otsikot tiedoissa, muuten se antaa sinulle virheen.

Valitse Tulostusalue, jos haluat saada arvon taulukkolaskennan tietylle alueelle.Muuten valitse Uusi laskentataulukko: ja tämä lisää uuden laskentataulukon ja antaa tuloksen.

Valitse sitten Jäännökset-ruutu ja napsauta OK.

Tämä lisää laskentataulukot ja antaa sinulle seuraavan tuloksen.

Ymmärretään tuotos.

Yhteenveto

Moninkertainen R: Tämä edustaa korrelaatiokerrointa. Arvo 1 osoittaa positiivisen suhteen ja arvo 0 ei suhdetta.

R-neliö: R-neliö edustaa määrityskerrointa. Tämä kertoo, kuinka prosenttiosuus pisteistä putoaa regressiolinjalle. 0,49 tarkoittaa, että 49% arvoista sopii malliin

Säädetty R-neliö : Tämä on säädetty R-neliö, joka vaaditaan, kun sinulla on enemmän kuin yksi X-muuttuja.

Standardivirhe: Tämä on arvio virheen keskihajonnasta. Regressiokerroin mitataan tällä tarkkuudella.

Havainnot: Tämä on havaintojen määrä, jonka olet ottanut näytteestä.

ANOVA - Df: Vapauden asteet

SS: Neliöiden summa.

MS: Meillä on kaksi MS: tä

  • Regressio MS on regressio SS / regressio Df.
  • Jäännös MS on keskimääräinen neliövirhe (jäännös SS / jäännös Df).

F: F -testi nullhypoteesille.

Merkitys F: Merkitykseen liittyvät P-arvot

Kerroin: Kerroin antaa arvion pienimmistä neliöistä.

T-tilastot: T-arvo nollahypoteesille vs. vaihtoehtoinen hypoteesi.

P-arvo: Tämä on hypoteesitestin p-arvo.

Alempi 95% ja ylempi 95%: Nämä ovat luottamusvälin ala- ja yläraja

Jäännöslähtö: Meillä on 12 havaintoa tietojen perusteella. 2 toinen sarake edustaa ennustettu myynnin ja 3 rd sarake jäännökset. Jäännökset ovat periaatteessa ero ennustetussa myynnissä todellisesta.

Esimerkki 2

Valitse ennustettu myynti ja markkinointi -sarake

Siirry lisäysvälilehden kaavion ryhmään. Valitse sirontakaaviokuvake

Tämä lisää sirontakaavion Exceliin. Katso alla oleva kuva

Napsauta hiiren kakkospainikkeella mitä tahansa kohtaa ja valitse sitten Lisää trendiviiva Excelissä. Tämä lisää trendiviivan kaavioon.

  • Voit muotoilla trendiviivan napsauttamalla hiiren kakkospainikkeella mitä tahansa trendiviivaa ja valitsemalla sitten muodon trendiviivan.
  • Voit tehdä lisää parannuksia kaavioon. eli trendiviivan muotoilu, väri ja otsikon muuttaminen jne
  • Voit myös näyttää kaavan kaaviossa tarkistamalla kaavion Näytä kaava ja näyttämällä kaaviossa R-neliön arvo.

Joitakin muita esimerkkejä lineaarisesta regressioanalyysistä:

  1. Ennustus sateen perusteella myydystä sateenvarjosta tapahtui alueella.
  2. Ennuste myydystä AC: stä kesän lämpötilan perusteella.
  3. Tenttikauden aikana Stationaryn myynti lähinnä kasvoi.
  4. Myynnin ennustaminen, kun mainonta on tapahtunut, perustuu korkeaan TRP-sarjaan, jossa mainos tehdään, tuotemerkin suurlähettilään suosioon ja jalanjälkeihin paikassa, jossa mainos julkaistaan.
  5. Talon myynti sijainnin, alueen ja hinnan perusteella.

Esimerkki 3

Oletetaan, että meillä on yhdeksän opiskelijaa, joilla on älykkyysosamääränsä ja testillä pisteytetty määrä.

Opiskelija Testin tulos Älykkyysosamäärä
RAM 100 145
Shyam 97 140
Kul 93 130
Kappu 91 125
Raju 89 115
Vishal 86 110
Vivek 82 100
Vinay 78 95
Kumar 75 90

Vaihe 1: Selvitä ensin riippuvat ja riippumattomat muuttujat. Tässä Testipisteet on riippuva muuttuja, ja IQ on riippumaton muuttuja, koska Testipisteet vaihtelevat, kun IQ muuttuu.

Vaihe 2: Siirry Data-välilehteen - Napsauta Data Analysis - Select regression - napsauta OK.

Tämä avaa Regressio-ikkunan sinulle.

Vaihe 3. Syöttötestipistealue Input Y Range Box -ruudussa ja IQ Input X Range Box -ruudussa. (Valitse Tarrat, jos sinulla on otsikoita tietovälilläsi. Valitse tulostusvaihtoehdot ja tarkista sitten haluamasi jäännökset. Napsauta OK.

Saat yhteenvedon, joka näkyy alla olevassa kuvassa.

Vaihe 4: Regressioon analysointi yhteenvetotuloksen avulla

Yhteenveto

Useita R: Tässä korrelaatiokerroin on 0,99, mikä on hyvin lähellä arvoa 1, mikä tarkoittaa, että lineaarinen suhde on erittäin positiivinen.

R-neliö: R-neliöarvo on 0,983, mikä tarkoittaa, että 98,3% arvoista sopii malliin.

P-arvo: Tässä P-arvo on 1.86881E-07, mikä on hyvin alle .1, mikä tarkoittaa, että IQ: lla on merkittävät ennustavat arvot.

Katso alla oleva kaavio.

Voit nähdä, että melkein kaikki pisteet putoavat linjassa tai lähellä olevaa trendiviivaa.

Esimerkki 4

Meidän on ennustettava vaihtovirran myynti toisen kuukauden myynnin ja lämpötilan perusteella.

Kuukausi Lämpötila Myynti
Jan 25 38893
Helmikuu 28 42254
Maaliskuu 31 42845
Huhti 33 47917
saattaa 37 51243
Kesäkuu 40 69588
Heinäkuu 38 56570
Elokuuta 37 50000

Noudata seuraavia vaiheita saadaksesi regressiotuloksen.

Vaihe 1: Selvitä ensin riippuvat ja riippumattomat muuttujat. Tässä myynti on riippuva muuttuja ja lämpötila on itsenäinen muuttuja, koska myynti vaihtelee lämpötilan muuttuessa.

Vaihe 2: Siirry Data-välilehteen - Napsauta Data Analysis - Select regression - napsauta OK.

Tämä avaa Regressio-ikkunan sinulle.

Vaihe 3. Syöttömyynti Input Y Range Box -ruudussa ja Temp Input X Range Box -ruudussa. (Valitse Tarrat, jos sinulla on otsikoita tietovälilläsi. Valitse tulostusvaihtoehdot ja tarkista sitten haluamasi jäännökset. Napsauta OK.

Tämä antaa sinulle yhteenvedon kuten alla.

Vaihe 4: Analysoi tulos.

Useita R: Tässä korrelaatiokerroin on 0,877, mikä on lähellä arvoa 1, mikä tarkoittaa, että lineaarinen suhde on positiivinen.

R-neliö: R-neliöarvo on 0,770, mikä tarkoittaa, että 77% arvoista sopii malliin

P-arvo: Tässä P-arvo on 1.86881E-07, mikä on hyvin alle .1, mikä tarkoittaa, että älykkyysosamäärällä on merkittävät ennustavat arvot.

Esimerkki 5

Tehkäämme nyt regressioanalyysi useille itsenäisille muuttujille:

Sinun on ennustettava ensi vuonna käynnistyvän matkapuhelimen myynti. Sinulla on hinta ja niiden maiden väestö, jotka vaikuttavat matkapuhelinten myyntiin.

Mobiiliversio Myynti Määrä Väestö
MEILLE 63860 858 823
Iso-Britannia 61841 877 660
KZ 60876 873 631
CH 58188 726 842
H N 52728 864 573
AU 52388 680 809
NZ 51075 728 661
RU 49019 689 778

Noudata seuraavia vaiheita saadaksesi regressiotuloksen.

Vaihe 1. Selvitä ensin riippuvat ja riippumattomat muuttujat. Tässä myynti riippuu muuttujasta, määrästä ja populaatiosta. Molemmat ovat itsenäisiä muuttujia, koska myynti vaihtelee maan määrän ja väestön mukaan.

Vaihe 2. Siirry Data-välilehteen - Napsauta Data Analysis - Select regression - napsauta OK.

Tämä avaa Regressio-ikkunan sinulle.

Vaihe 3. Syöttömyynti Input Y Range Box -ruudussa ja valitse määrä ja populaatio Input X Range Box -ruudussa. (Valitse Tarrat, jos sinulla on otsikoita tietovälilläsi. Valitse tulostusvaihtoehdot ja tarkista sitten haluamasi jäännökset. Napsauta OK.

Suorita nyt regressio käyttämällä Data-välilehden data-analyysiä. Tämä antaa sinulle alla olevan tuloksen.

Yhteenveto

Moninkertainen R: Tässä korrelaatiokerroin on 0,93, mikä on hyvin lähellä arvoa 1, mikä tarkoittaa, että lineaarinen suhde on erittäin positiivinen.

R-neliö: R-neliöarvo on 0,866, mikä tarkoittaa, että 86,7% arvoista sopii malliin.

Merkitys F: Merkitys F on pienempi kuin .1, mikä tarkoittaa, että regressioyhtälöllä on merkittävä ennustearvo.

P-arvo : Jos tarkastelet määrän ja väestön P-arvoa, näet, että arvot ovat pienempiä kuin .1, mikä tarkoittaa, että määrällä ja populaatiolla on merkittävä ennustearvo. Pienemmät P-arvot tarkoittavat, että muuttujalla on merkittävämpi ennustearvo.

Sekä määrällä että populaatiolla on kuitenkin merkittävä ennustearvo, mutta jos tarkastellaan määrän ja populaation P-arvoa, kuin näet, että määrällä on pienempi P-arvo excelissa kuin populaatiossa. Tämä tarkoittaa, että määrällä on merkittävämpi ennustearvo kuin väestöllä.

Muistettavaa

  • Tarkista aina riippuvat ja riippumattomat muuttujat aina, kun valitset tietoja.
  • Lineaarinen regressioanalyysi ottaa huomioon muuttujien keskiarvon välisen suhteen.
  • Tämä mallintaa vain lineaaristen muuttujien välistä suhdetta
  • Joskus se ei sovi parhaiten reaalimaailman ongelmaan. Esimerkki: (Ikä ja palkat). Suurimman osan ajasta palkat nousevat iän kasvaessa. Eläkkeelle siirtymisen jälkeen ikä kuitenkin nousee, mutta palkat laskevat.

Mielenkiintoisia artikkeleita...