Aprēķiniet kovariāti

Autors: Judy Howell
Radīšanas Datums: 2 Jūlijs 2021
Atjaunināšanas Datums: 1 Jūlijs 2024
Anonim
Covariance and the regression line | Regression | Probability and Statistics | Khan Academy
Video: Covariance and the regression line | Regression | Probability and Statistics | Khan Academy

Saturs

Kovariācija ir statistisks aprēķins, lai padarītu saistību starp divām datu kopām pārredzamākas. Piemēram, pieņemsim, ka antropologi pēta populācijas augstumu un svaru noteiktā kultūrā. Katrai pētījumā iesaistītajai personai augumu un svaru var parādīt ar datu pāri (x, y). Šīs vērtības var izmantot standarta formulā, lai aprēķinātu kovariācijas attiecību. Šajā rakstā vispirms ir izskaidroti aprēķini, lai noteiktu datu kopas kovariāciju. Tālāk tiks apspriesti vēl divi automatizēti rezultāta noteikšanas veidi.

Lai soli

1. metode no 4: aprēķiniet kovarianci ar rokām, izmantojot standarta formulu

  1. Uzziniet kovariācijas standarta formulu un tās daļas. Kovariances aprēķināšanas standarta formula ir Σ(XiXvid)(yiyvid)/(n1){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}}) / (n-1)}Kontrolējiet savu datu tabulu. Pirms darba sākšanas ir noderīgi apkopot datus. Izveidojiet tabulu, kas sastāv no piecām kolonnām. Katra kolonna jādeklarē šādi:
    • X{ displaystyle x}Aprēķiniet vidējo x datu punktu. Šajā datu kopas paraugā ir 9 numuri. Lai atrastu vidējo, saskaitiet tos kopā un daliet summu ar 9. Tas dod rezultātu 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Kad jūs dalāt to ar 9, iegūstat vidējo 4.89. Šī ir vērtība, kuru nākamajos aprēķinos izmantosiet kā x (vid.).
    • Aprēķiniet vidējo y datu punktu. Šajā y kolonnā jābūt arī 9 datu punktiem, kas sakrīt ar x datu punktiem. Nosakiet to vidējo rādītāju. Šai datu kopas paraugam tas kļūst par 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Sadaliet šo kopsummu ar 9, lai iegūtu vidējo vērtību 5,44. Nākamajos aprēķinos jūs izmantosiet 5,44 kā y (vidējo) vērtību.
    • Aprēķiniet vērtības (XiXvid){ displaystyle (x_ {i} -x _ { teksts {avg}})}Aprēķiniet vērtības (yiyvid){ displaystyle (y_ {i} -y _ { teksts {avg}})}Aprēķiniet katras datu rindas produktus. Jūs aizpildāt pēdējās kolonnas rindas, reizinot skaitļus, kurus aprēķinājāt divās iepriekšējās slejās (XiXvid){ displaystyle (x_ {i} -x _ { teksts {avg}})}Pēdējā kolonnā atrodiet vērtību summu. Šeit ienāk simbols Σ. Pēc visu līdzšinējo aprēķinu veikšanas saskaitiet rezultātus kopā. Šai datu kopas paraugam tagad pēdējā slejā jābūt deviņām vērtībām. Pievienojiet šos deviņus skaitļus kopā. Pievērsiet īpašu uzmanību tam, vai skaitlis ir pozitīvs vai negatīvs.
      • Šīs izlases datu kopas summai jāsasniedz -64,57. Rakstiet šo kopsummu kolonnas apakšdaļā. Šī ir kovariācijas standarta formulas skaitītāja vērtība.
    • Aprēķiniet kovariācijas formulas saucēju. Kovariācijas standarta formulas skaitītājs ir tikko aprēķinātā vērtība. Saucēju attēlo (n-1), un tas ir par vienu mazāk nekā datu pāru skaits jūsu datu kopā.
      • Šajā problēmas piemērā ir deviņi datu pāri, tātad n ir 9. Tāpēc (n-1) vērtība ir vienāda ar 8.
    • Sadaliet skaitītāju ar saucēju. Kovariances aprēķināšanas pēdējais solis ir sadalīt skaitītāju, Σ(XiXvid)(yiyvid){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}})}Ievērojiet, kādi ir atkārtoti aprēķini. Kovariācija ir aprēķins, kas jums pāris reizes jāveic ar roku, lai saprastu rezultāta nozīmi. Tomēr, ja jūs parasti izmantojat kovariāciju datu interpretēšanai, jums ir nepieciešams ātrāks un automatizētāks veids, kā iegūt rezultātus. Tagad jūs, iespējams, pamanījāt, ka ar mūsu salīdzinoši mazo datu kopu, kurā ir tikai deviņi datu pāri, aprēķini sastāvēja no diviem vidējiem rādītājiem, astoņpadsmit atsevišķiem atņemumiem, deviņiem reizinājumiem, viena saskaitīšanas un visbeidzot vēl viena dalījuma. Tas ir 31 salīdzinoši neliels aprēķins, lai atrastu risinājumu. Pa ceļam jūs riskējat pazaudēt negatīvas zīmes vai nepareizi kopēt rezultātus, tāpēc atbilde vairs nav pareiza.
    • Kovariances aprēķināšanai izveidojiet darblapu. Ja esat iepazinies ar programmu Excel (vai citu aprēķinu programmu), varat viegli izveidot tabulu kovariācijas noteikšanai. Piešķiriet piecu kolonnu virsrakstus tāpat, kā to darījāt aprēķiniem ar roku: x, y, (x (i) -x (avg)), (y (i) -y (avg)) un Produkts.
      • Lai vienkāršotu nosaukumu piešķiršanu, nosauciet trešo kolonnu kā "x starpība" un ceturto sleju "y starpība", ja vien atceraties datu nozīmi.
      • Ja tabula sākas darblapas augšējā kreisajā stūrī, šūna A1 tiks marķēta ar x, bet pārējās etiķetes turpinās līdz šūnai E1.
    • Ievadiet datu punktus. Ievadiet datu vērtības divās kolonnās x un y. Atcerieties, ka datu punktu secībai ir nozīme, tāpēc jums katram y jāsakrīt ar atbilstošo x vērtību.
      • X vērtības sākas šūnā A2 un turpinās līdz vajadzīgajam datu punktam.
      • Y vērtības sākas šūnā B2 un turpinās līdz vajadzīgajam datu punktam.
    • Nosakiet vidējo vērtību x un y. Excel ļoti ātri aprēķina vidējos rādītājus. Pirmajā tukšajā šūnā zem katras datu kolonnas ierakstiet formulu = AVERAGE (A2: A ___). Aizpildiet tukšo vietu ar šūnas numuru, kas atbilst jūsu pēdējam datu punktam.
      • Piemēram, ja jums ir 100 datu punkti, šūnas A2 līdz A101 tiek aizpildītas, tāpēc šūnā ierakstāt = AVERAGE (A2: A101).
      • Y datiem ierakstiet formulu = AVERAGE (B2: B101).
      • Atcerieties, ka formula programmā Excel sākas ar zīmi "=".
    • Ierakstiet kolonnas formulu (x (i) -x (avg)). Šūnā C2 ievadiet formulu pirmās atņemšanas aprēķināšanai. Šī formula kļūst: = A2 -___. Aizpildiet tukšo vietu ar šūnas adresi, kurā ir x datu vidējais lielums.
      • Piemēram, no 100 datu punktiem vidējais rādītājs būs šūnā A103, tāpēc jūsu formula kļūs: = A2-A103.
    • Atkārtojiet formulu datu punktiem (y (i) -y (avg)). Sekojot tam pašam piemēram, tas nonāk šūnā D2. Formula kļūst: = B2-B103.
    • Ierakstiet kolonnas “Produkts” formulu. Piektajā kolonnā E2 šūnā ierakstiet formulu, lai aprēķinātu divu iepriekšējo šūnu reizinājumu. Tad tas kļūst par: = C2 * D2.
    • Nokopējiet formulas, lai aizpildītu tabulu. Līdz šim jūs esat ieprogrammējuši tikai dažus pirmos datu punktus 2. rindā. Izmantojot peli, atzīmējiet šūnas C2, D2 un E2. Novietojiet kursoru uz mazā lodziņa apakšējā labajā stūrī, līdz parādās plus zīme. Noklikšķiniet un turiet peles pogu un velciet peli uz leju, lai paplašinātu atlasi un aizpildītu visu datu tabulu. Šis solis automātiski kopēs trīs formulas no šūnām C2, D2 un E2 uz visu tabulu. Tabula automātiski jāaizpilda ar visiem aprēķiniem.
    • Programējiet pēdējās kolonnas summu. Jums ir nepieciešama slejā “Produkts” esošo vienumu summa. Tukšajā šūnā tieši zem šīs slejas pēdējā datu punkta ierakstiet formulu: = SUM (E2: E ___). Aizpildiet tukšo vietu ar pēdējā datu punkta šūnas adresi.
      • Piemērā ar 100 datu punktiem šī formula nonāk šūnā E103. Tips: = SUM (E2: E102).
    • Nosakiet kovariāciju. Jūs varat arī likt Excel veikt jums galīgo aprēķinu. Mūsu piemērā pēdējais aprēķins šūnā E103 ir kovariācijas formulas skaitītājs. Tieši zem šīs šūnas ierakstiet formulu: = E103 / ___. Aizpildiet tukšo vietu ar jūsu iegūto datu punktu skaitu. Mūsu piemērā tas ir 100. Rezultāts ir jūsu datu kovariācija.

3. metode no 4: tiešsaistes kovariācijas kalkulatoru izmantošana

  1. Kovariācijas kalkulatorus meklējiet tiešsaistē. Dažādās skolās, uzņēmumos vai citos avotos ir tīmekļa vietnes, kas kovariācijas vērtības ļoti viegli aprēķina jums. Meklētājprogrammā izmantojiet meklēšanas vienumu "kovariācijas kalkulators".
  2. Ievadiet savu informāciju. Uzmanīgi izlasiet vietnē sniegtos norādījumus, lai pārliecinātos, ka informācija ir ievadīta pareizi. Ir svarīgi, lai jūsu datu pāri tiktu uzturēti kārtībā, pretējā gadījumā radītais rezultāts būs nepareiza kovariācija. Vietnēs ir dažādi datu ievades stili.
    • Piemēram, vietnē http://ncalculators.com/statistics/covariance-calculator.htm ir horizontāla rūtiņa x vērtību ievadīšanai un otra horizontāla rūtiņa y vērtību ievadīšanai. Dati jāievada atdalīti ar komatiem. Tādējādi šajā rakstā iepriekš aprēķinātā x datu kopa pēc tam jāievada kā 1,3,2,5,8,7,12,2,4. Y dati kā 8,6,9,4,3,3,2,7,7.
    • Citā vietnē https://www.thecalculator.co/math/Covariance-Calculator-705.html jums tiks lūgts ievadīt x datus pirmajā lodziņā. Dati tiek ievadīti vertikāli ar vienu vienumu katrā rindā. Tāpēc ieraksts šajā vietnē izskatās šādi:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. Aprēķiniet savus rezultātus. Šajos tiešsaistes aprēķinos pievilcīgais ir tas, ka pēc datu ievadīšanas jums parasti ir jānoklikšķina tikai uz pogas "Aprēķināt", un rezultāti parādīsies automātiski. Lielākā daļa vietņu sniegs starpposma aprēķinus x (avg), y (avg) un n.

4. metode no 4: Kovariācijas rezultātu interpretēšana

  1. Meklējiet pozitīvas vai negatīvas attiecības. Kovariācija ir viens statistikas skaitlis, kas norāda saikni starp vienu un otru datu kopu. Ievadā minētajā piemērā tiek mērīts augstums un svars. Jūs varētu sagaidīt, ka pieaugot cilvēkiem, pieaugs arī viņu svars, kas novedīs pie pozitīva kovariācijas viedokļa. Cits piemērs: Pieņemsim, ka tiek savākti dati, kas norāda stundu skaitu, kad kāds nodarbojas ar golfu, un rezultātu, ko viņš vai viņa sasniedz. Šajā gadījumā jūs sagaidāt negatīvu kovariju, kas nozīmē, ka, palielinoties treniņu stundu skaitam, golfa rezultāts samazināsies. (Golfā labāk ir zemāks rezultāts).
    • Apsveriet iepriekš aprēķināto datu kopas paraugu. Rezultātā kovariācija ir -8,07. Mīnus zīme nozīmē, ka, palielinoties x vērtībām, y vērtībām ir tendence samazināties. To var redzēt, aplūkojot dažas no vērtībām. Piemēram, x vērtības 1 un 2 atbilst y vērtībām 7, 8 un 9. X vērtības 8 un 12 ir saistītas ar y vērtībām attiecīgi 3 un 2 .
  2. Interpretējiet kovariācijas lielumu. Ja kovariācijas rādītāja skaits ir liels - vai nu liels pozitīvs skaitlis, vai liels negatīvs skaitlis, tad to varat interpretēt kā divus datu elementus, kas ir savstarpēji cieši saistīti, vai nu pozitīvā, vai negatīvā veidā.
    • Datu izlases kovariācija -8,07 ir diezgan liela. Ņemiet vērā, ka dati svārstās no 1 līdz 12. Tātad 8 ir diezgan liels skaitlis. Tas norāda uz diezgan spēcīgu sakarību starp datu kopām x un y.
  3. Saprast attiecību trūkumu. Ja jūsu rezultāts ir kovariāts, kas vienāds ar vai ir ļoti tuvu 0, varat secināt, ka datu punkti nav saistīti. Tas ir, vienas vērtības pieaugums var, bet tam nav jāpalielina citas vērtības pieaugums. Abi termini ir saistīti gandrīz nejauši.
    • Pieņemsim, ka jūs saistāt apavu izmērus ar eksāmenu vērtējumiem. Tā kā ir tik daudz faktoru, kas ietekmē studenta eksāmenu vērtējumus, var sagaidīt kovariācijas rādītāju, kas ir tuvu 0. Tas norāda, ka starp abām vērtībām gandrīz nav sakarību.
  4. Skatiet attiecības grafiski. Lai vizuāli izprastu kovariāciju, datu punktus varat uzzīmēt uz diagrammas x, y. To darot, jums vajadzētu viegli redzēt, ka punkti, kaut arī tie nav tieši taisni, mēdz tuvoties kopai pa diagonāli no augšas pa kreisi uz leju pa labi. Šis ir negatīvās kovariances raksturojums. Var redzēt arī to, ka kovariances vērtība ir vienāda ar -8,07. Tas ir diezgan liels skaits, salīdzinot ar datu punktiem. Lielais skaitlis liecina, ka kovariācija ir diezgan spēcīga, ko jūs varat secināt no datu punktu lineārās formas.
    • Lai to vēlreiz pārdzīvotu, lasiet rakstus par punktu zīmēšanu wikiHow koordinātu sistēmā.

Brīdinājumi

  • Kovariācija statistikā ir ierobežota. Bieži vien tas ir solis ceļā uz korelācijas koeficientu vai citu jēdzienu aprēķināšanu. Esiet uzmanīgs no pārāk drosmīgām interpretācijām, kuru pamatā ir kovariācijas rādītājs.