Kā aprēķināt lineārās korelācijas koeficientu

Autors: Eric Farmer
Radīšanas Datums: 7 Martā 2021
Atjaunināšanas Datums: 1 Jūlijs 2024
Anonim
Correlation Coefficient
Video: Correlation Coefficient

Saturs

Korelācijas koeficients (vai lineārās korelācijas koeficients) tiek apzīmēts kā "r" (retos gadījumos kā "ρ") un raksturo divu vai vairāku mainīgo lineāro korelāciju (tas ir, saistību, ko nosaka kāda vērtība un virziens). Koeficienta vērtība ir no -1 līdz +1, tas ir, korelācija var būt gan pozitīva, gan negatīva. Ja korelācijas koeficients ir -1, pastāv perfekta negatīva korelācija; ja korelācijas koeficients ir +1, ir perfekta pozitīva korelācija. Pretējā gadījumā starp abiem mainīgajiem ir pozitīva korelācija, negatīva korelācija vai nav korelācijas. Korelācijas koeficientu var aprēķināt manuāli, izmantojot bezmaksas tiešsaistes kalkulatorus vai ar labu grafisko kalkulatoru.

Soļi

1. metode no 4: korelācijas koeficienta aprēķināšana manuāli

  1. 1 Savākt datus. Pirms sākat aprēķināt korelācijas koeficientu, izpētiet šos skaitļu pārus. Labāk tos pierakstīt tabulā, kuru var sakārtot vertikāli vai horizontāli. Iezīmējiet katru rindu vai kolonnu ar "x" un "y".
    • Piemēram, ņemot vērā četrus mainīgo "x" un "y" vērtību (skaitļu) pārus. Jūs varat izveidot šādu tabulu:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 Aprēķiniet vidējo aritmētisko "x". Lai to izdarītu, saskaitiet visas x vērtības un pēc tam sadaliet rezultātu ar vērtību skaitu.
    • Mūsu piemērā mainīgajam "x" ir četras vērtības. Lai aprēķinātu vidējo aritmētisko "x", pievienojiet šīs vērtības un pēc tam daliet summu ar 4. Aprēķini tiek uzrakstīti šādi:
    • μx=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}
    • μx=12/4{ displaystyle mu _ {x} = 12/4}
    • μx=3{ displaystyle mu _ {x} = 3}
  3. 3 Atrodiet vidējo aritmētisko "y". Lai to izdarītu, veiciet tās pašas darbības, tas ir, saskaitiet visas y vērtības un pēc tam sadaliet summu ar vērtību skaitu.
    • Mūsu piemērā ir norādītas četras mainīgā "y" vērtības. Pievienojiet šīs vērtības un pēc tam sadaliet summu ar 4. Aprēķini tiks uzrakstīti šādi:
    • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}
    • μy=16/4{ displaystyle mu _ {y} = 16/4}
    • μy=4{ displaystyle mu _ {y} = 4}
  4. 4 Aprēķiniet standarta novirzi "x". Pēc "x" un "y" vidējo aprēķināšanas atrodiet šo mainīgo standarta novirzes. Standarta novirzi aprēķina, izmantojot šādu formulu:
    • σx=1n1Σ(xμx)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}
    • Mūsu piemērā aprēķini tiks uzrakstīti šādi:
    • σx=141((13)2+(23)2+(43)2+(53)2){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}
    • σx=13(4+1+1+4){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}
    • σx=13(10){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}
    • σx=103{ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}
    • σx=1,83{ displaystyle sigma _ {x} = 1,83}
  5. 5 Aprēķiniet standarta novirzi "y". Izpildiet iepriekšējā solī aprakstītās darbības. Izmantojiet to pašu formulu, bet pievienojiet y vērtības.
    • Mūsu piemērā aprēķini tiks uzrakstīti šādi:
    • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}
    • σy=13(9+1+1+9){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}
    • σy=13(20){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}
    • σy=203{ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}
    • σy=2,58{ displaystyle sigma _ {y} = 2.58}
  6. 6 Pierakstiet korelācijas koeficienta aprēķināšanas pamatformulu. Šī formula ietver abu mainīgo lielumus, standarta novirzes un skaitļu pāru skaitu (n). Korelācijas koeficients ir apzīmēts kā "r" (retos gadījumos kā "ρ"). Šajā rakstā tiek izmantota formula, lai aprēķinātu Pīrsona korelācijas koeficientu.
    • ρ=(1n1)Σ(xμxσx)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } pa labi) * pa kreisi ({ frac {y- mu _ {y}} { sigma _ {y}}} pa labi)}
    • Šeit un citos avotos daudzumus var apzīmēt dažādi. Piemēram, dažas formulas satur “ρ” un “σ”, bet citas satur “r” un “s”. Dažās mācību grāmatās ir dažādas formulas, taču tās ir matemātiskas līdzības iepriekšminētajai formulai.
  7. 7 Aprēķiniet korelācijas koeficientu. Jūs esat aprēķinājis abu mainīgo vidējos un standarta novirzes, tāpēc varat izmantot formulu, lai aprēķinātu korelācijas koeficientu. Atgādiniet, ka "n" ir abu mainīgo vērtību pāru skaits. Citas vērtības ir aprēķinātas agrāk.
    • Mūsu piemērā aprēķini tiks uzrakstīti šādi:
    • ρ=(1n1)Σ(xμxσx)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } pa labi) * pa kreisi ({ frac {y- mu _ {y}} { sigma _ {y}}} pa labi)}
    • ρ=(13){ displaystyle rho = pa kreisi ({ frac {1} {3}} pa labi) *}[(131,83)(142,58)+(231,83)(342,58){ displaystyle left ({ frac {1-3} {1.83}} right) * left ({ frac {1-4} {2.58}} right) + left ({ frac {2 -3} {1.83}} pa labi) * pa kreisi ({ frac {3-4} {2.58}} pa labi)}
         +(431,83)(542,58)+(531,83)(742,58){ displaystyle + left ({ frac {4-3} {1.83}} right) * left ({ frac {5-4} {2.58}} right) + left ({ frac { 5-3} {1.83}} pa labi) * pa kreisi ({ frac {7-4} {2.58}} pa labi)}]
    • ρ=(13)(6+1+1+64,721){ displaystyle rho = left ({ frac {1} {3}} right) * left ({ frac {6 + 1 + 1 + 6} {4.721}} right)}
    • ρ=(13)2,965{ displaystyle rho = left ({ frac {1} {3}} right) * 2.965}
    • ρ=(2,9653){ displaystyle rho = left ({ frac {2,965} {3}} right)}
    • ρ=0,988{ displaystyle rho = 0,988}
  8. 8 Analizējiet rezultātu. Mūsu piemērā korelācijas koeficients ir 0,988. Šī vērtība kaut kādā veidā raksturo noteiktu skaitļu pāru kopu. Pievērsiet uzmanību vērtības zīmei un lielumam.
    • Tā kā korelācijas koeficienta vērtība ir pozitīva, pastāv pozitīva korelācija starp mainīgajiem lielumiem "x" un "y". Tas ir, palielinoties "x" vērtībai, palielinās arī "y" vērtība.
    • Tā kā korelācijas koeficienta vērtība ir ļoti tuvu +1, mainīgo "x" un "y" vērtības ir ļoti korelētas. Ja jūs ievietojat punktus koordinātu plaknē, tie atradīsies tuvu kādai taisnei.

2. metode no 4: tiešsaistes kalkulatoru izmantošana korelācijas koeficienta aprēķināšanai

  1. 1 Atrodiet internetā kalkulatoru, lai aprēķinātu korelācijas koeficientu. Šo koeficientu bieži aprēķina statistikā. Ja ir daudz skaitļu pāru, korelācijas koeficientu manuāli aprēķināt ir gandrīz neiespējami. Tāpēc ir tiešsaistes kalkulatori, lai aprēķinātu korelācijas koeficientu. Meklētājprogrammā ievadiet "korelācijas koeficienta kalkulators" (bez pēdiņām).
  2. 2 Ievadiet datus. Pārbaudiet norādījumus vietnē, lai ievadītu pareizos datus (ciparu pārus). Obligāti jāievada atbilstošie skaitļu pāri; pretējā gadījumā jūs iegūsit nepareizu rezultātu. Atcerieties, ka dažādām vietnēm ir dažādi ievades formāti.
    • Piemēram, vietnē http://ncalculators.com/statistics/correlation-coefficient-calculator.htm mainīgo x un y vērtības tiek ievadītas divās horizontālās līnijās. Vērtības ir atdalītas ar komatiem. Tas ir, mūsu piemērā vērtības "x" tiek ievadītas šādi: 1,2,4,5 un vērtības "y" šādi: 1,3,5,7.
    • Citā vietnē http://www.alcula.com/calculators/statistics/correlation-coefficient/ dati tiek ievadīti vertikāli; šajā gadījumā nejauciet atbilstošos skaitļu pārus.
  3. 3 Aprēķiniet korelācijas koeficientu. Pēc datu ievadīšanas vienkārši noklikšķiniet uz pogas "Aprēķināt", "Aprēķināt" vai tamlīdzīgi, lai iegūtu rezultātu.

3. metode no 4: grafiskā kalkulatora izmantošana

  1. 1 Ievadiet datus. Paņemiet grafisko kalkulatoru, pārejiet statistikas aprēķinu režīmā un atlasiet komandu "Rediģēt".
    • Dažādiem kalkulatoriem ir jānospiež dažādi taustiņi. Šajā rakstā apskatīts Texas Instruments TI-86 kalkulators.
    • Nospiediet [2.] - Stat (virs + taustiņa), lai ieietu statistikas aprēķinu režīmā. Pēc tam nospiediet F2 - Rediģēt.
  2. 2 Izdzēsiet iepriekš saglabātos datus. Lielākā daļa kalkulatoru saglabā jūsu ievadīto statistiku, līdz to izdzēšat. Lai nesajauktu vecos datus ar jaunajiem, vispirms izdzēsiet visu saglabāto informāciju.
    • Izmantojiet bulttaustiņus, lai pārvietotu kursoru un iezīmētu virsrakstu 'xStat'. Pēc tam nospiediet Clear un Enter, lai notīrītu visas kolonnā xStat ievadītās vērtības.
    • Izmantojiet bulttaustiņus, lai iezīmētu virsrakstu 'yStat'. Pēc tam nospiediet Clear un Enter, lai notīrītu visas slejā yStat ievadītās vērtības.
  3. 3 Ievadiet sākotnējos datus. Izmantojiet bulttaustiņus, lai pārvietotu kursoru uz pirmo šūnu zem virsraksta "xStat". Ievadiet pirmo vērtību un nospiediet taustiņu Enter. Ekrāna apakšdaļā tiek parādīts “xStat (1) = __”, un ievadītā vērtība aizstāj atstarpi. Pēc Enter nospiešanas ievadītā vērtība parādīsies tabulā, un kursors pārcelsies uz nākamo rindu; ekrāna apakšdaļā tiks parādīts "xStat (2) = __".
    • Ievadiet visas mainīgā "x" vērtības.
    • Pēc visu x vērtību ievadīšanas izmantojiet bulttaustiņus, lai pārietu uz kolonnu yStat un ievadiet y vērtības.
    • Pēc visu ciparu pāru ievadīšanas nospiediet Iziet, lai notīrītu ekrānu un izietu no apkopošanas režīma.
  4. 4 Aprēķiniet korelācijas koeficientu. Tas raksturo datu tuvumu noteiktai taisnei. Grafiskais kalkulators var ātri noteikt piemērotu taisni un aprēķināt korelācijas koeficientu.
    • Noklikšķiniet uz Stat - Calc. TI -86 nospiediet [2nd] - [Stat] - [F1].
    • Atlasiet funkciju Lineārā regresija. TI-86 nospiediet [F3], kas apzīmēts ar “LinR”. Ekrānā parādīsies līnija "LinR _" ar mirgojošu kursoru.
    • Tagad ievadiet divu mainīgo nosaukumus: xStat un yStat.
      • TI-86 atveriet vārdu sarakstu; lai to izdarītu, nospiediet [2.] - [Saraksts] - [F3].
      • Pieejamie mainīgie tiek parādīti ekrāna apakšējā rindā. Atlasiet [xStat] (lai to izdarītu, iespējams, ir jānospiež F1 vai F2), ievadiet komatu un pēc tam atlasiet [yStat].
      • Nospiediet Enter, lai apstrādātu ievadītos datus.
  5. 5 Analizējiet savus rezultātus. Nospiežot taustiņu Enter, ekrānā tiks parādīta šāda informācija:
    • y=a+bx{ displaystyle y = a + bx}: šī ir līniju raksturojošā funkcija. Lūdzu, ņemiet vērā, ka funkcija nav uzrakstīta standarta formā (y = kx + b).
    • a={ displaystyle a =}... Šī ir taisnes un y ass krustošanās y koordināta.
    • b={ displaystyle b =}... Tas ir līnijas slīpums.
    • corr={ displaystyle { text {corr}} =}... Tas ir korelācijas koeficients.
    • n={ displaystyle n =}... Tas ir skaitļu pāru skaits, kas tika izmantots aprēķinos.

4. metode no 4: Pamatjēdzienu skaidrošana

  1. 1 Izprotiet korelācijas jēdzienu. Korelācija ir statistiska saistība starp diviem daudzumiem. Korelācijas koeficients ir skaitliska vērtība, ko var aprēķināt jebkurai divām datu kopām. Korelācijas koeficienta vērtība vienmēr ir robežās no -1 līdz +1 un raksturo divu mainīgo attiecību pakāpi.
    • Piemēram, ņemot vērā bērnu (apmēram 12 gadus vecu) augumu un vecumu. Visticamāk, būs spēcīga pozitīva korelācija, jo bērni ar vecumu kļūst garāki.
    • Negatīvas korelācijas piemērs: soda sekundes un biatlona treniņos pavadītais laiks, tas ir, jo vairāk sportists trenējas, jo mazāk tiek piešķirtas soda sekundes.
    • Visbeidzot, dažreiz ir ļoti maza korelācija (pozitīva vai negatīva), piemēram, starp apavu izmēru un matemātikas rādītājiem.
  2. 2 Atcerieties, kā aprēķināt vidējo aritmētisko. Lai aprēķinātu vidējo aritmētisko (vai vidējo), jums jāatrod visu šo vērtību summa un pēc tam jāsadala ar vērtību skaitu. Atcerieties, ka vidējais aritmētiskais ir nepieciešams, lai aprēķinātu korelācijas koeficientu.
    • Mainīgā vidējo vērtību norāda burts ar horizontālu joslu virs tā. Piemēram, mainīgo "x" un "y" gadījumā to vidējās vērtības apzīmē šādi: x̅ un y̅. Vidējo reizēm apzīmē ar grieķu burtu "μ" (mu). Lai uzrakstītu mainīgā "x" vērtību vidējo aritmētisko, izmantojiet apzīmējumu μx vai μ (x).
    • Piemēram, ņemot vērā šādas mainīgā "x" vērtības: 1,2,5,6,9,10. Šo vērtību vidējo aritmētisko aprēķina šādi:
      • μx=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}
      • μx=33/6{ displaystyle mu _ {x} = 33/6}
      • μx=5,5{ displaystyle mu _ {x} = 5,5}
  3. 3 Ņemiet vērā standarta novirzes nozīmi. Statistikā standarta novirze raksturo to, cik lielā mērā skaitļi ir izkliedēti attiecībā pret to vidējo. Ja standarta novirze ir maza, skaitļi ir tuvu vidējam; ja standarta novirze ir liela, skaitļi ir tālu no vidējā.
    • Standarta novirzi norāda burts "s" vai grieķu burts "σ" (sigma). Tādējādi mainīgā "x" vērtību standartnovirze tiek apzīmēta šādi: sx vai σx.
  4. 4 Atcerieties summēšanas operācijas simbolu. Summēšanas simbols ir viens no visbiežāk sastopamajiem matemātikas simboliem un norāda vērtību summu. Šis simbols ir grieķu burts "Σ" (lielie simboli).
    • Piemēram, ja dotas šādas mainīgā "x" vērtības: 1,2,5,6,9,10, tad Σx nozīmē:
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

Padomi

  • Korelācijas koeficientu dažkārt sauc par "Pīrsona korelācijas koeficientu" pēc tā izstrādātāja Karla Pīrsona.
  • Vairumā gadījumu, ja korelācijas koeficients ir lielāks par 0,8 (pozitīvs vai negatīvs), pastāv spēcīga korelācija; ja korelācijas koeficients ir mazāks par 0,5 (pozitīvs vai negatīvs), tiek novērota vāja korelācija.

Brīdinājumi

  • Korelācija raksturo attiecību starp divu mainīgo vērtībām. Bet atcerieties, ka korelācijai nav nekāda sakara ar cēloņsakarību. Piemēram, salīdzinot cilvēku augumu un apavu izmēru, iespējams, atradīsit spēcīgu pozitīvu korelāciju. Parasti, jo garāks cilvēks, jo lielāks apavu izmērs. Bet tas nenozīmē, ka augstuma palielināšanās rezultātā automātiski palielinās apavu izmērs vai ka lielākas pēdas izraisīs straujāku augšanu. Šie daudzumi ir vienkārši savstarpēji saistīti.