1. kamere
  2. Car Audio & Electronics
  3. Domači glasbeni sistem
  4. Osebni avdio
  5. televizorji
  6. Pametni dom
  >> Elektronske tehnologije Online >  >> Pametni dom >> Pametno življenje

Kako uporabljati večkratno regresijo v Excelu

Excel je zmogljivo orodje za analizo podatkov, ne glede na to, ali delate s preprostim razmerjem med eno neodvisno spremenljivko in odvisno spremenljivko ali pa je treba upoštevati več neodvisnih spremenljivk. Naučiti se, kako izvesti multivariatno analizo v Excelu – v obliki večkratne regresije – in razložiti rezultate je bistvenega pomena, če morate obdelati zapletene podatke. Dobra novica je, da je Excel dobro nastavljen za opravljanje teh nalog in se morate naučiti le, kako deluje ena funkcija, da začnete razumevati svoje podatke.

Kaj je multipla regresija?

Multipla regresija je način povezovanja več neodvisnih spremenljivk z eno samo odvisno spremenljivko z iskanjem enačbe, ki opisuje, kako se zadevna spremenljivka spreminja z vsako. Bolj osnovno, a podobno orodje je linearna regresija, katere cilj je raziskati povezavo med eno neodvisno spremenljivko, kot je debelost, in odvisno spremenljivko, kot je tveganje za raka, vendar so stvari le redko tako enostavne. Če nadaljujemo s primerom, število pokajenih cigaret na dan je prav tako povezano s tveganjem za nastanek raka, prav tako količina popitega alkohola. Da bi dobili zanesljivo napoved tveganja za raka za posameznika, bi morali upoštevati vse te dejavnike (in še več).

Splošna oblika enačbe, ki se uporablja za večkratne regresije, je:

Y ^ =a + b x + b x + b x

Torej Y ^ je pričakovana vrednost za opazovanje, b in tako naprej predstavljajo naklon razmerja ravne črte med x in Y ^ in x in tako naprej so spremenljivke, vključene v analizo. a vam pove bistvo y -prestreči. Večkratna regresija vključuje izbiro vrednosti koeficientov (b in tako naprej), ki zmanjšujejo razliko med pričakovano vrednostjo Y ^ in opazovano vrednost Y , kar vam omogoča najboljše ujemanje med modelom in podatki.

Kaj vam pove večkratna regresija?

Večkratne regresije dodajo številčne vrednosti povezavi med množico spremenljivk in izidom, tako da jih lahko uporabite za napovedi, za ocenjevanje relativnih prispevkov različnih spremenljivk k rezultatu ali za nekaj drugih namenov, kot je izbira najbolj ustreznih spremenljivk. za uporabo v matematičnem modelu.

Recimo, da imate podatke o cenah hiš v določenem mestu (vaša odvisna spremenljivka), skupaj z informacijami, kot so, ali ima bazen, koliko kvadratnih metrov zaseda, koliko spalnic ima, koliko kopalnic ima , in koliko garaž ima. Večkratna regresija bi vam omogočila, da pogledate, kako je vsak od teh dejavnikov povezan s ceno hiše, torej – potem ko ste pogledali, kako so povezani s ceno – lahko uporabite svojo enačbo za napovedovanje cene hiše na podlagi teh točke.

To vrsto regresijske analize lahko uporabite tudi v Excelu, da pogledate, kako določen dejavnik mnogih – na primer, ali ima hiša bazen – vpliva na odvisno spremenljivko (cene hiš), če vse druge spremenljivke ostanejo nespremenjene. Če pretvorite koeficiente (imenovane "delni regresijski koeficienti") v standardne delne regresijske koeficiente, ki predstavljajo, koliko standardnih odstopanj Y bi se spremenila za, če bi ustrezno spremenljivko spremenili za eno standardno deviacijo, potem vam enačba tudi pove, kateri dejavniki so pomembnejši pri določanju rezultata.

Kako narediti večkratno regresijo v Excelu

V Excelu lahko izvedete večvariatno regresijo z uporabo vgrajene funkcije, ki je dostopna prek Analize podatkov pod Podatki in Analiza skupina. Kliknite Analiza podatkov in poiščite možnost za regresijo v oknu, ki se odpre, ga označite in kliknite V redu . Kliknite izberi celice ikono poleg Vnosnega obsega Y in nato izberite stolpec z rezultati za vašo odvisno spremenljivko. Nato storite enako za Vhodni obseg X vendar izberite več stolpcev za svoje neodvisne spremenljivke. Ti stolpci morajo biti eden poleg drugega, tako da, če niso, jih morate premakniti, preden ustvarite regresijo.

Okno Regresija ima vrsto dodatnih možnosti, ki jih lahko izberete, da prilagodite postopek svojim potrebam. Če želite, lahko na primer nastavite stopnjo zaupanja, ki ni 95-odstotna, izberete prikaz ostankov in določite, kje v vašem delovnem zvezku je izhod. Ta zadnja možnost je samodejno nastavljena na Nov sloj delovnega lista zato so rezultati prikazani na novem listu, vendar lahko spremenite to ali katero koli drugo možnost, da ustreza vašim potrebam. Poleg tega preverite Oznake polje, če imajo stolpci za vaše neodvisne spremenljivke oznake na vrhu, tako da so te prikazane v izhodu.

Kliknite V redu da ustvarite svojo regresijsko analizo v Excelu in se preusmerite na nov list.

Izhod regresije iz Excela

Po izvedbi večkratne regresije v Excelu so trije glavni razdelki rezultatov, ki jih dobite:regresijska statistika, ANOVA in podrobnosti o ocenjeni regresijski črti. Regresijska statistika vključuje večkratni korelacijski koeficient ("Multiple R"), ki prikazuje smer in moč korelacije, od −1 do +1. Koeficient determinacije, "kvadrat R", vam pove, kolikšen odstotek (kot decimalno število) variacije odvisne spremenljivke pojasnjujejo neodvisne spremenljivke. »Prilagojeni R-kvadrat« vam pokaže razlagalno moč, vendar je ni enostavno interpretirati, »standardna napaka« pa vam poda merilo variacije med opazovanimi rezultati in vašo regresijsko črto.

Razdelek ANOVA vsebuje statistične informacije o količini variacije, ki jo pojasnjuje regresijska črta, pri čemer vam "SS Regression" pove znesek, ki ga pojasnjuje črta, "SS Residual" pa predstavlja znesek, ki ni pojasnjen. Razdelki »MS« pomenijo »Mean Square«, »F Statistic« pa je testna statistika, ki se uporablja za testiranje pomembnega rezultata, pri čemer vam razdelek »Significance F« poda P-vrednost.

Nazadnje, zadnji razdelek vam pove o značilnostih ocenjene regresijske črte, zlasti o vrednostih koeficientov, o tem, ali so pomembno povezani z odvisno spremenljivko, in o količini variacije, ki bi lahko bila v njih. Pozitivni koeficienti kažejo pozitivno razmerje med zadevno spremenljivko in odvisno spremenljivko, tako da ko se ena poveča, se poveča tudi druga. Negativne vrednosti pomenijo, da se odvisna spremenljivka zmanjšuje, ko neodvisna spremenljivka narašča. Torej, če je koeficient "kvadratnih metrov" pri večkratni regresiji cen hiš 300, to pomeni, da dodaten kvadratni čevelj prostora poveča ceno hiše v povprečju za 300 USD.

Predpostavke in omejitve večkratne regresije

Pomembno si je zapomniti, da je večkratna regresija le orodje in kot večino orodij jo lahko uporabite le v določenih okoliščinah, nekaterih stvari pa preprosto ne zmore.

Ena najpomembnejših omejitev je, da je na podlagi rezultatov težko sklepati o vzročnosti. Na primer, če imate večkratno regresijo s škodo, ki jo je povzročil požar, in številnimi potencialno pomembnimi dejavniki, boste verjetno našli pomembno povezavo med številom prisotnih gasilcev in povzročeno škodo. To ne pomeni, da so povzročili gasilci škodo, ker bi drug dejavnik, kot je velikost požara, ki ni vključen v model, lahko pojasnil obe ugotovitvi.

Dve pomembni predpostavki multivariatne analize v Excelu te vrste sta predpostavki linearnosti in normalnosti. Predpostavljate linearno razmerje med odvisnimi in neodvisnimi spremenljivkami, zato morate pred izvedbo analize preveriti, ali je to verjetno veljavno. Za preverjanje lahko pogledate razmerje med vsako spremenljivko posebej, vendar to ni popolna strategija. Podobno test predpostavlja, da so spremenljivke normalno porazdeljene, zato morate pred izvedbo testa preveriti, ali so rezultati za vsako normalni.


  1. Kako uporabljati več RFID čitalcev ?
  2. Kako uporabljati Excel datotek na Blackberry
  3. Kako uporabljati Wingdings v Excelu
  4. Kako uporabljati navidezne spremenljivke v Excelovi regresiji
  5. Kako uporabljati funkcijo minus v Excelu