Aprēķiniet galējos rādītājus

Autors: Charles Brown
Radīšanas Datums: 8 Februāris 2021
Atjaunināšanas Datums: 1 Jūlijs 2024
Anonim
Aprēķina rādītāji un KPI ar DAX
Video: Aprēķina rādītāji un KPI ar DAX

Saturs

A ārējs vai ārējs statistikā ir datu punkts, kas būtiski atšķiras no citiem izlases datu punktiem. Bieži vien ārējie rādītāji norāda uz neatbilstībām vai kļūdām mērījumos statistikā, pēc tam viņi var noņemt no datu kopas izteiktās vērtības. Ja viņi patiešām izvēlas izņemt no datu kopas neievērojamos rādītājus, tas varētu radīt būtiskas izmaiņas pētījuma secinājumos. Tāpēc, ja vēlaties pareizi interpretēt statistikas datus, ir svarīgi aprēķināt un noteikt novirzes.

Lai soli

  1. Uzziniet, kā pamanīt iespējamos novirzes. Pirms mēs varam izlemt, vai noņemt anomālas vērtības no konkrētas datu kopas, mums, protams, vispirms jāidentificē iespējamie datu kopas izņēmumi. Vispārējie rādītāji ir datu punkti, kas ievērojami atšķiras no tendences, kas veido citas kopas vērtības, citiem vārdiem sakot, tie nošaut no pārējām vērtībām. Parasti to ir viegli atpazīt tabulās un (īpaši) diagrammās. Ja datu kopa tiek attēlota vizuāli, izņēmumi būs "tālu" no pārējām vērtībām. Piemēram, ja lielākā daļa datu kopas punktu veido taisnu līniju, izņēmumi neatbilst šai līnijai.
    • Apskatīsim datu kopu, kas parāda 12 dažādu objektu temperatūru telpā. Ja 11 objektu temperatūra svārstās par dažiem grādiem, maksimums, ap 21 ° C, savukārt viena priekšmeta, krāsns, temperatūra ir 150 ° C, jūs varat uzreiz redzēt, ka krāsns, visticamāk, ir atšķirīga.
  2. Kārtojiet visus datu punktus no zemākā līdz augstākajam. Pirmais solis, aprēķinot izņēmumus, ir datu kopas vidējās vērtības (vai vidējās vērtības) atrašana. Šis uzdevums kļūst daudz vieglāks, ja kopas vērtības ir secībā no zemākās līdz augstākajām. Tāpēc, pirms turpināt, kārtojiet vērtības savā datu kopā šādi.
    • Turpināsim ar iepriekš minēto piemēru. Šeit ir mūsu datu kopa, kas parāda dažādu objektu temperatūru telpā pēc Fārenheita grādiem: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Ja mēs sakārtojam kopas vērtības no zemākās līdz augstākajai, tā kļūst par mūsu jauno kopu: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. Aprēķiniet datu kopas mediānu. Datu kopas mediāna ir datu punkts, kur puse datu atrodas virs tā, bet puse datu atrodas zem tā - faktiski tas ir datu kopas "centrs". Ja datu kopā ir nepāra punktu skaits, mediānu ir viegli atrast - mediāna ir punkts, kurā ir tik daudz punktu, cik zemāk. Ja punktu skaits ir pāra skaitlis, jo nav viena centra, jums jāņem vidējais rādītājs no diviem centra punktiem, lai atrastu mediānu. Aprēķinot izņēmumus, uz mediānu parasti atsaucas mainīgais Q2 - jo tas atrodas starp Q1 un Q3, pirmo un trešo kvartili. Mēs šos mainīgos noteiksim vēlāk.
    • Nejauciet ar datu kopām ar pāra punktu skaitu - divu vidējo punktu vidējais rādītājs bieži ir skaitlis, kura nav pašā datu kopā - tas ir labi. Tomēr, ja abi vidējie punkti ir vienādi, vidējais, protams, būs arī šis skaitlis - arī tas ir Labi.
    • Mūsu piemērā mums ir 12 punkti. Divi vidējie termini ir attiecīgi 6. un 7. punkts - attiecīgi 70 un 70. Tātad mūsu datu kopas mediāna ir šo divu punktu vidējā vērtība: ((70 + 71) / 2) =70,5.
  4. Aprēķiniet pirmo kvartili. Šis punkts, ko mēs apzīmējam ar mainīgo Q1, ir datu punkts, zem kura atrodas 25 procenti (vai ceturtā daļa) novērojumu. Citiem vārdiem sakot, tas ir visu jūsu datu kopas punktu centrs zemāk mediāna. Ja zem vidējās vērtības ir pāra skaitlis, jums atkal jāņem divu vidējo vērtību vidējais lielums, lai atrastu Q1, kā jūs, iespējams, pats esat izdarījis, lai noteiktu mediānu.
    • Mūsu piemērā seši punkti atrodas virs vidējā un seši punkti zem tā. Tātad, lai atrastu pirmo kvartili, mums jāņem vidējais rādītājs no diviem vidējiem punktiem apakšējos sešos punktos. Apakšējā sešinieka 3. un 4. punkts ir abi 70, tāpēc to vidējais lielums ir ((70 + 70) / 2) =70. Tātad mūsu vērtība Q1 ir 70.
  5. Aprēķiniet trešo kvartili. Šis punkts, ko mēs apzīmējam ar mainīgo Q3, ir datu punkts, virs kura atrodas 25 procenti datu. Q3 atrašana praktiski ir tāda pati kā Q1 atrašana, izņemot to, ka mēs šajā gadījumā aplūkojam punktus virs mediāna.
    • Turpinot iepriekš minēto piemēru, mēs redzam, ka sešu punktu divi vidējie punkti virs mediānas ir 71 un 72. Šo divu punktu vidējais lielums ir ((71 + 72) / 2) =71,5. Tātad mūsu Q3 vērtība ir 71,5.
  6. Atrodiet starpkvartilu diapazonu. Tagad, kad esam noteikuši Q1 un Q3, mums jāaprēķina attālums starp šiem diviem mainīgajiem. Attālumu starp Q1 un Q3 varat atrast, atņemot Q1 no Q3. Vērtība, ko iegūstat starpkvartilu diapazonam, ir izšķiroša, lai noteiktu datu kopas neatšķirīgo punktu robežas.
    • Mūsu piemērā Q1 un Q3 vērtības ir attiecīgi 70 un 71,5. Lai atrastu starpkvartilu diapazonu, mēs aprēķinām Q3 - Q1: 71,5 - 70 =1,5.
    • Tas darbojas pat tad, ja Q1, Q3 vai abi skaitļi ir negatīvi. Piemēram, ja mūsu Q1 vērtība būtu -70, starpkvartiles diapazons būtu 71,5 - (-70) = 141,5, kas ir pareizi.
  7. Atrodiet datu kopas "Iekšējās robežas". Varat atpazīt nepieņemamos rādītājus, nosakot, vai tie ietilpst vairākās skaitliskās robežās; tā sauktās "iekšējās robežas" un "ārējās robežas". Punkts, kas atrodas ārpus datu kopas iekšējām robežām, tiek klasificēts kā viens maigs izņēmums, un punkts ārpus ārējām robežām tiek klasificēts kā viens ārkārtējs izņēmums. Lai atrastu datu kopas iekšējās robežas, vispirms reiziniet starpkvartilu diapazonu ar 1,5. Pievienojiet rezultātu Q3 un atņemiet to no Q1. Abi rezultāti ir jūsu datu kopas iekšējās robežas.
    • Mūsu piemērā starpkvartiles diapazons ir (71,5 - 70) vai 1,5. Reiziniet to ar 1,5, lai iegūtu 2,25. Šo skaitli mēs pievienojam Q3 un atņemam no Q1, lai atrastu iekšējās robežas šādi:
      • 71,5 + 2,25=73,75
      • 70 - 2,25=67,75
      • Tātad iekšējās robežas ir 67.75 un 73.75.
    • Mūsu datu kopā ārpus krāsnis ir tikai krāsns temperatūra - 300 grādi pēc Fārenheita. Tātad tas var būt neliels izņēmums. Tomēr mums vēl nav jānosaka, vai šī temperatūra ir ārkārtīgi izteikta, tāpēc pagaidām nepieļausim secinājumus.
  8. Atrodiet datu kopas "ārējās robežas". Jūs to darāt tāpat kā ar iekšējām robežām, ar vienīgo atšķirību, ka starpkvartila attālumu reizināt ar 3, nevis 1,5. Pēc tam jūs pievienojat rezultātu Q3 un atņemat no Q1, lai atrastu ārējās robežvērtības.
    • Šajā piemērā mēs reizinām starpkvartila attālumu ar 3, lai iegūtu (1,5 * 3) vai 4,5. Tagad mēs varam atrast ārējās robežas tāpat kā iekšējās robežas:
      • 71,5 + 4,5=76
      • 70 - 4,5=65,5
      • Tātad ārējās robežas ir 65.5 un 76.
    • Datu punkti, kas atrodas ārpus ārējām robežām, tiek uzskatīti par galējiem izņēmumiem. Mūsu piemērā krāsns temperatūra, 300 grādi pēc Fārenheita, krietni pārsniedz ārējās robežas. Tātad krāsns temperatūra ir noteikti ārkārtējs izņēmums.
  9. Izmantojiet kvalitatīvu novērtējumu, lai noteiktu, vai jums vajadzētu "izmest" ārējos rādītājus. Izmantojot iepriekš minēto metodi, jūs varat noteikt, vai noteikti punkti ir maigi, galēji vai vispār nav. Bet nekļūdieties - atzīstot punktu kā nepārsniegtu, tas kļūst tikai par vienu kandidāts jānoņem no datu kopas, nevis uzreiz punkts, kas tiek noņemts jābūt pārvērsties par. The iemesls kāpēc iznākums atšķiras no pārējiem komplekta punktiem, ir izšķiroša nozīme, nosakot, vai izņēmums ir jānoņem. Parasti tiek noņemti nepieļaujamie faktori, ko izraisījusi kāda kļūda - kļūda, piemēram, mērījumos, ierakstos vai eksperimentālajā projektā. Turpretī parasti kļūst tādi izņēmumi, kurus neizraisa kļūdas un kuri atklāj jaunu, neparedzētu informāciju vai tendences dzēsts.
    • Vēl viens apsverams kritērijs ir tas, vai izņēmumi ietekmē datu kopas vidējo līmeni šķībā vai maldinošā veidā. Tas ir īpaši svarīgi, ja plānojat izdarīt secinājumus no vidējā datu kopas.
    • Spriedīsim par mūsu piemēru. Kopš augstākais Maz ticams, ka krāsns kāda neparedzēta dabas spēka dēļ sasniedza 300 ° F temperatūru, mūsu piemērā ar gandrīz 100% pārliecību varam secināt, ka krāsns tika nejauši ieslēgta, izraisot nenormāli augstu temperatūras rādījumu. Turklāt, ja mēs nenoņemam izņēmumu, mūsu datu kopas vidējais lielums ir (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 ° F, bet vidējais bez iznākums iznāk (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 ° F.
      • Tā kā novirzi izraisīja cilvēciska kļūda un tā kā nav pareizi apgalvot, ka vidējā istabas temperatūra bija tuvu 32 ° C, mums jāizvēlas izmantot mūsu atstarotāju. noņemt.
  10. Saprast, cik svarīgi (dažkārt) saglabāt nepiederošu cilvēku skaitu. Kaut arī daži nepieļaujamie rādītāji no datu kopas būtu jānoņem tāpēc, ka tie ir kļūdu rezultāts vai tāpēc, ka tie maldinoši izkropļo rezultātus, citi izņēmumi būtu jāsaglabā. Piemēram, ja novirze ir iegūta pareizi (un tāpēc nav kļūdas rezultāts) un / vai ja iznākums piedāvā jaunu ieskatu mērāmajā parādībā, to nevajadzētu nekavējoties noņemt. Zinātniskie eksperimenti ir īpaši jutīgas situācijas, kad runa ir par nepieļaujamajiem gadījumiem - kļūdaini noņemot novirzi, var nozīmēt svarīgas informācijas izmetšanu par jaunu tendenci vai atklājumu.
    • Piemēram, iedomājieties, ka mēs izstrādājam jaunu medikamentu, lai zivis zivaudzētavā izaugtu lielākas. Izmantosim savu veco datu kopu ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}) ar atšķirību, ka katrs punkts tagad apzīmē zivju masu (gramos) ) pēc ārstēšanas ar citām eksperimentālām zālēm kopš dzimšanas. Citiem vārdiem sakot, pirmās zāles vienai zivij deva 71 gramu masu, otrā - 70 gramu masu utt. Šajā situācijā 300 joprojām milzīgs izņēmums, taču mums to nevajadzētu noņemt tagad. Tā kā, ja pieņemam, ka novirze nav kļūdas rezultāts, tas mūsu eksperimentā ir ļoti veiksmīgs. Zāles, kas ražoja 300 gramu lielu zivju, darbojās labāk nekā citas zāles, tāpēc tā arī ir lielākā daļa svarīgs datu punkts mūsu komplektā, nevis vismazāk svarīgs datu punkts.

Padomi

  • Ja atrodat īpatnības, mēģiniet tos izskaidrot, pirms izņemat tos no datu kopas; tie var norādīt mērījumu kļūdas vai novirzes sadalījumā.

Nepieciešamība

  • Kalkulators