Kā aprēķināt emisijas

Autors: Janice Evans
Radīšanas Datums: 23 Jūlijs 2021
Atjaunināšanas Datums: 1 Jūlijs 2024
Anonim
2.seminārs par Eiropas zaļo kursu un ilgtspējīgu uzņēmumu_17.septembris
Video: 2.seminārs par Eiropas zaļo kursu un ilgtspējīgu uzņēmumu_17.septembris

Saturs

Statistikā novirzes ir vērtības, kas krasi atšķiras no citām savāktās datu kopas vērtībām. Ārkārtas rādītājs var norādīt uz datu izplatīšanas vai mērījumu kļūdu anomālijām, tāpēc novirzes bieži tiek izslēgtas no datu kopas. Izslēdzot no datu kopas novirzes, jūs varat nonākt pie negaidītiem vai precīzākiem secinājumiem. Tāpēc, lai nodrošinātu pareizu statistikas izpratni, ir jāspēj aprēķināt un novērtēt novirzes.

Soļi

  1. 1 Iemācieties atpazīt iespējamos novirzes. Pirms izslēgšanas no datu kopas jāidentificē iespējamās novirzes. Ārkārtas ir vērtības, kas ļoti atšķiras no lielākās daļas datu kopas vērtību; citiem vārdiem sakot, novirzes ir ārpus lielākās vērtības tendences. To ir viegli atrast vērtību tabulās vai (īpaši) grafikos. Ja datu kopas vērtības ir uzzīmētas, novirzes būs tālu no vairuma citu vērtību. Ja, piemēram, lielākā daļa vērtību nokrīt taisnā līnijā, tad novirzes atrodas abās šādas taisnes pusēs.
    • Piemēram, apsveriet datu kopu, kas attēlo 12 dažādu objektu temperatūru telpā. Ja 11 objekti ir aptuveni 70 grādu leņķī, bet divpadsmitais objekts (iespējams, krāsns) ir 300 grādu leņķī, tad, ātri apskatot vērtības, var norādīt, ka krāsns ir iespējama izpūšana.
  2. 2 Kārtojiet datus augošā secībā. Pirmais solis, lai noteiktu novirzes, ir aprēķināt datu kopas mediānu. Šis uzdevums ir ievērojami vienkāršots, ja datu kopas vērtības ir sakārtotas augošā secībā (no mazākās līdz lielākajai).
    • Turpinot iepriekš minēto piemēru, apsveriet šādu datu kopu, kas attēlo vairāku objektu temperatūru: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Šis komplekts jāpasūta šādi: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 Aprēķiniet datu kopas mediānu. Datu kopas mediāna ir vērtība datu kopas vidū. Ja datu kopā ir nepāra vērtību skaits, mediāna ir vērtība pirms un pēc kuras datu kopā ir vienāds vērtību skaits. Bet, ja datu kopā ir pāra skaits vērtību, jums jāatrod abu vidējo aritmētiskais. Ņemiet vērā, ka, aprēķinot novirzes, mediānu parasti sauc par Q2, jo tā atrodas starp Q1 un Q3, apakšējo un augšējo kvartili, ko mēs definēsim vēlāk.
    • Nebaidieties strādāt ar datu kopām, kurām ir pāra vērtību skaits- abu vidējo aritmētiskais būs skaitlis, kas nav datu kopā; tas ir normāli. Bet, ja abas vidējās vērtības ir vienāds skaitlis, tad vidējais aritmētiskais ir vienāds ar šo skaitli; tas ir arī lietu kārtībā.
    • Iepriekš minētajā piemērā vidējās 2 vērtības ir 70 un 71, tāpēc mediāna ir ((70 + 71) / 2) = 70,5.
  4. 4 Aprēķiniet apakšējo kvartili. Šī vērtība, ko dēvē par Q1, ir zemāka par 25% datu kopas vērtību. Citiem vārdiem sakot, tā ir puse no vērtībām līdz mediānai. Ja no datu kopas pirms mediānas ir pāra skaits vērtību, jums ir jāatrod abu vidējo vidējais aritmētiskais, lai aprēķinātu Q1 (tas ir līdzīgi kā vidējās vērtības aprēķināšanai).
    • Mūsu piemērā 6 vērtības atrodas aiz mediānas un 6 vērtības- pirms tās. Tas nozīmē, ka, lai aprēķinātu apakšējo kvartili, mums jāatrod sešu vērtību vidējo aritmētiskais vidējais. Šeit vidējās vērtības ir 70 un 70. Tādējādi Q1 = ((70 + 70) / 2) = 70.
  5. 5 Aprēķiniet augšējo kvartili. Šī vērtība, ko dēvē par Q3, pārsniedz 25% datu kopas vērtību. Q3 aprēķināšanas process ir līdzīgs Q1 aprēķināšanas procesam, taču šeit tiek ņemtas vērā vērtības pēc mediānas.
    • Iepriekš minētajā piemērā divi vidējie seši pēc mediānas ir 71 un 72. Tātad Q3 = ((71 + 72) / 2) = 71,5.
  6. 6 Aprēķiniet starpkvartilu diapazonu. Aprēķinot Q1 un Q3, ir jāatrod attālums starp šīm vērtībām. Lai to izdarītu, atņemiet Q1 no Q3. Starpkvartilu diapazona vērtība ir ārkārtīgi svarīga, lai noteiktu to vērtību robežas, kuras nav ārējās.
    • Mūsu piemērā Q1 = 70 un Q3 = 71,5. Starpkvartilu diapazons ir 71,5 - 70 = 1,5.
    • Ņemiet vērā, ka tas attiecas arī uz negatīvajām Q1 un Q3 vērtībām. Piemēram, ja Q1 = -70, tad starpkvartilu diapazons ir 71,5 -(-70) = 141,5.
  7. 7 Atrodiet datu kopas vērtību "iekšējās robežas". Ārējās vērtības nosaka, analizējot vērtības- neatkarīgi no tā, vai tās ietilpst tā sauktajās "iekšējās robežās" un "ārējās robežās". Vērtība, kas atrodas ārpus “iekšējām robežām”, tiek klasificēta kā “neliela novirze”, bet vērtība, kas atrodas ārpus “ārējām robežām”, tiek klasificēta kā “nozīmīga novirze”. Lai atrastu iekšējās robežas, jums jāreizina starpkvartilu diapazons ar 1,5; rezultāts jāpievieno Q3 un jāatņem no Q1. Atrastie divi skaitļi ir datu kopas iekšējās robežas.
    • Mūsu piemērā starpkvartilu diapazons ir (71,5 - 70) = 1,5. Tālāk: 1,5 * 1,5 = 2,25. Šis numurs jāpievieno Q3 un jāatņem no Q1, lai atrastu iekšējās robežas:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • Tādējādi iekšējās robežas ir 67,75 un 73,75.
    • Mūsu piemērā tikai krāsns temperatūra - 300 grādi - atrodas ārpus šīm robežām, un to var uzskatīt par nenozīmīgu emisiju. Bet nesteidzieties ar secinājumiem - mums ir jānosaka, vai šī temperatūra ir ievērojama novirze.
  8. 8 Atrodiet datu kopas "ārējās robežas". Tas tiek darīts tāpat kā iekšējām robežām, izņemot to, ka starpkvartālu diapazons tiek reizināts ar 3, nevis 1,5. Rezultāts jāpievieno Q3 un jāatņem no Q1. Atrastie divi skaitļi ir datu kopas ārējās robežas.
    • Mūsu piemērā reiziniet starpkvartilu diapazonu ar 3: 1,5 * 3 = 4,5. Aprēķiniet ārējās robežas:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • Tātad ārējās robežas ir 65,5 un 76.
    • Visas vērtības, kas atrodas ārpus ārējām robežām, tiek uzskatītas par nozīmīgām emisijām. Mūsu piemērā krāsns temperatūra 300 grādi tiek uzskatīta par ievērojamu izpūšanu.
  9. 9 Izmantojiet kvalitatīvu novērtējumu, lai noteiktu, vai novirzes ir jāizslēdz no datu kopas. Iepriekš aprakstītā metode ļauj noteikt, vai dažas vērtības ir novirzes (nelielas vai nozīmīgas). Tomēr nekļūdieties - vērtība, kas tiek klasificēta kā ārpuskārtas, ir tikai “izņēmuma kandidāts”, kas nozīmē, ka jums tas nav jāizslēdz. Izņēmuma cēlonis ir galvenais faktors, kas ietekmē lēmumu izslēgt izņēmumu. Parasti tiek izslēgti novirzes, kas rodas kļūdu dēļ (mērījumos, ierakstos utt.). No otras puses, novirzes, kas saistītas nevis ar kļūdām, bet ar jaunu informāciju vai tendenci, parasti tiek atstātas datu kopā.
    • Tikpat svarīgi ir novērtēt noviržu ietekmi uz datu kopas mediānu (neatkarīgi no tā, vai tās to izkropļo vai ne). Tas ir īpaši svarīgi, veicot secinājumus no datu kopas mediānas.
    • Mūsu piemērā ir ārkārtīgi maz ticams, ka krāsns sakarsēs līdz 300 grādu temperatūrai (ja vien neņemam vērā dabiskās anomālijas). Tāpēc (ar lielu noteiktību) var secināt, ka šāda temperatūra ir mērījumu kļūda, kas jāizslēdz no datu kopas. Turklāt, ja neizslēdzat izņēmumus, datu kopas mediāna būs (69 + 69 + 70 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 grādi, bet, ja jūs izslēdzat novirzi, mediāna būs (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 grādi.
      • Ārkārtas parasti ir cilvēku kļūdu rezultāts, tāpēc novirzes ir jāizslēdz no datu kopām.
  10. 10 Izprotiet datu kopā atstāto (dažreiz) noviržu nozīmi. Dažas novirzes būtu jāizslēdz no datu kopas, jo tās rodas kļūdu un tehnisku problēmu dēļ; citi novirzes jāatstāj datu kopā. Ja, piemēram, izņēmums nav kļūdas rezultāts un / vai sniedz jaunu izpratni par pārbaudāmo parādību, tad tas jāatstāj datu kopā. Zinātniskie eksperimenti ir īpaši jutīgi pret novirzēm - kļūdaini novēršot novirzi, jūs, iespējams, palaižat garām kādu jaunu tendenci vai atklājumu.
    • Piemēram, mēs izstrādājam jaunu narkotiku, lai palielinātu zivju lielumu zvejā. Mēs izmantosim veco datu kopu ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), taču šoreiz katra vērtība atspoguļos zivju svaru (gramos) pēc norīšanas eksperimentālās zāles. Citiem vārdiem sakot, pirmā narkotika noved pie zivju svara palielināšanās līdz 71 g, otrā narkotika - līdz 70 g utt. Šajā situācijā 300 ir ievērojama novirze, taču mēs to nedrīkstam izslēgt; ja pieņemam, ka nebija mērījumu kļūdu, tad šāds izņēmums ir ievērojams eksperimenta panākums. Zāles, kas palielināja zivju svaru līdz 300 gramiem, darbojas daudz labāk nekā citas zāles; tādējādi 300 ir vissvarīgākā vērtība datu kopā.

Padomi

  • Kad tiek konstatētas novirzes, mēģiniet izskaidrot to klātbūtni, pirms izslēdzat tās no datu kopas. Tie var norādīt uz mērījumu kļūdām vai izplatīšanas anomālijām.

Ko tev vajag

  • Kalkulators