Kā novērtēt statistisko nozīmīgumu: 15 soļi (ar Fotoattēlu) - Padomi

Video: Шесть сигма. Бережливое производство. Управление изменениями

Saturs

Soļi
Padoms
Brīdinājums

Hipotēžu pārbaudi vada statistiskā analīze. Statistiski ticama ticamība tiek aprēķināta, izmantojot p vērtību - kas norāda novērotā rezultāta varbūtību, ja noteikta (nulles hipotēze) ir patiesa. Ja p vērtība ir mazāka par nozīmības līmeni (parasti 0,05), eksperimentētājs var secināt, ka ir pietiekami daudz pierādījumu, lai atspēkotu nulles hipotēzi un atzītu apgriezto hipotēzi. Izmantojot vienkāršu t testu, jūs varat aprēķināt p vērtību un noteikt nozīmīgumu starp divām dažādām datu grupām.

Soļi

1. daļa no 3: iestatiet eksperimentus

Nosakiet savu hipotēzi. Pirmais solis statistiskās nozīmības novērtēšanā ir atbildes uz jautājumiem identificēšana un hipotēzes paziņošana. Hipotēze ir empīrisko datu un iespējamo neatbilstību populācijā izklāsts. Katram eksperimentam ir nulles hipotēze un apgriezta hipotēze. Kopumā jūs salīdzināsiet divas grupas, lai redzētu, vai tās ir vienādas vai atšķirīgas.
- Parasti hipotēze nav (H₀) apstiprina, ka starp abām datu grupām nav atšķirību. Piemērs: Studenti, kuri izlasīja materiālu pirms stundas, nesaņem labākas pēdējās atzīmes.
- Apgrieztā hipotēze (H_a) ir pretrunā nulles hipotēzei un ir apgalvojums, kuru jūs mēģināt atbalstīt ar saviem empīriskajiem datiem. Piemēram: Studenti, kuri izlasīja materiālu pirms stundas, faktiski iegūst labākas pēdējās atzīmes.
Atlasiet nozīmīguma līmeni, lai noteiktu atšķirības pakāpi, ko datos var uzskatīt par nozīmīgu. Nozīmības līmenis (pazīstams arī kā alfa) ir slieksnis, kuru izvēlaties, lai noteiktu nozīmi. Ja p vērtība ir mazāka vai vienāda ar noteikto nozīmības līmeni, dati tiek uzskatīti par statistiski nozīmīgiem.
- Parasti nozīmības pakāpe (vai alfa) parasti tiek izvēlēta 0,05 līmenī - tas nozīmē, ka varbūtība, ka novēro datos redzamo atšķirību, ir nejauša tikai 5%.
- Jo augstāks ticamības līmenis (un tāpēc zemāka p vērtība), jo jēgpilnāki ir rezultāti.
- Ja nepieciešama lielāka pārliecība, pazeminiet p vērtību līdz 0,01. Lai noteiktu produkta defektus, ražošanā bieži izmanto zemu p vērtību. Augsta uzticamības pakāpe ir kritiska, lai pieņemtu, ka katra detaļa darbosies tā, kā vajadzētu.
- Lielākajai daļai uz hipotēzēm balstītu eksperimentu nozīmīguma līmenis ir 0,05.
Izlemiet, vai izmantot vienas vai divu asti pārbaudi. Viens no t-testa pieņēmumiem ir tas, ka jūsu dati atrodas normālā sadalījumā. Normālais sadalījums veidos zvana līkni ar lielāko daļu novērojumu centrā. T-tests ir matemātisks tests, kas pārbauda, vai jūsu dati atrodas ārpus normālā sadalījuma, virs vai zem, līknes “augšējā” daļā.
- Ja neesat pārliecināts, vai dati ir virs vai zem kontroles grupas, izmantojiet divējādu testu. Tas ļauj pārbaudīt nozīmīgumu abos virzienos.
- Ja zināt, kāds ir paredzamais jūsu datu virziens, izmantojiet vienvirziena testu. Iepriekš minētajā piemērā jūs sagaidāt, ka studenta rādītāji uzlabosies. Tādēļ jūs izmantojat vienvirziena testu.
Nosakiet parauga lielumu ar spēka analīzi. Testa spēks ir spēja novērot gaidīto rezultātu ar noteiktu parauga lielumu. Kopējais spēka (vai β) slieksnis ir 80%. Spēka analīze var būt diezgan sarežģīta bez dažiem sākotnējiem datiem, jo jums ir nepieciešama informācija par paredzamo vidējo vērtību starp grupām un to standartnovirzes. Izmantojiet tiešsaistes spēka analīzi, lai noteiktu optimālo datu izlases lielumu.
- Pētnieki bieži veic nelielu priekšnoteikumu pētījumu, lai informētu spēka analīzi un izlemtu izlases lielumu, kas nepieciešams lielam un visaptverošam pētījumam.
- Ja nav iespēju veikt sarežģītus priekšnoteikumu pētījumus, novērtējiet iespējamo vidējo vērtību, pamatojoties uz rakstu lasīšanu un pētījumiem, kurus, iespējams, ir veikuši citi cilvēki. Tas var dot jums labu sākumu paraugu lieluma noteikšanā.
reklāma

2. daļa no 3: Aprēķiniet standartnovirzi

Nosakiet standarta novirzes formulu. Standarta novirze mēra datu izkliedi. Tas sniedz jums informāciju par katra izlases datu punkta identitāti. Sākot darbu, vienādojumi var izskatīties diezgan sarežģīti. Tomēr tālāk norādītās darbības palīdzēs jums viegli saprast aprēķinu procesu. Formula ir s = √∑ ((x_i - µ) / (N - 1)).
- s ir standarta novirze.
- ∑ norāda, ka jums būs jāapkopo visi savāktie novērojumi.
- x_i katrs apzīmē jūsu datu vērtību.
- µ ir katras grupas datu vidējais lielums.
- N ir kopējais novērojumu skaits.
Vidējais novērojumu skaits katrā grupā. Lai aprēķinātu standartnovirzi, vispirms jāaprēķina novērojumu vidējais rādītājs katrai atsevišķai grupai. Šo vērtību simbolizē grieķu burts mu vai µ. Lai to izdarītu, vienkārši pievienojiet novērojumus un daliet tos ar kopējo novērojumu skaitu.
- Piemēram, lai atrastu vidējo punktu skaitu grupai, kas pirms stundas lasīja dokumentu, apskatīsim dažus datus. Vienkāršības labad mēs izmantosim 5 punktu datu kopu: 90, 91, 85, 83. un 94. (100 punktu skalā).
- Saskaitiet visus novērojumus: 90 + 91 + 85 + 83 + 94 = 443.
- Sadaliet iepriekš minēto summu ar novērojumu skaitu N (N = 5): 443/5 = 88,6.
- Šīs grupas vidējais rādītājs ir 88,6.
No katras novērotās vērtības atņemiet vidējo. Nākamais solis ietver daļu (x_i - µ) vienādojuma. No katras novērotās vērtības atņemiet vidējo vērtību. Izmantojot iepriekš minēto piemēru, mums ir pieci atņemšanas gadījumi.
- (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) un (94 - 88,6).
- Aprēķinātā vērtība ir 1,4; 2,4; -3,6; -5,6 un 5,4.
Izkārtojiet iepriekš minētās atšķirības un saskaitiet tās. Katra tikko aprēķinātā jaunā vērtība tagad tiks kvadrātā. Šeit tiks noņemta arī negatīvā zīme. Ja pēc šīs darbības vai aprēķina beigās parādās negatīva zīme, iespējams, esat aizmirsis veikt iepriekš minēto darbību.
- Mūsu piemērā tagad strādāsim ar 1,96; 5,76; 12,96; 31.36 un 29.16.
- Saskaitiet šos laukumus kopā: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
Daliet ar kopējo novērojumu skaitu mīnus 1. Dalīšana ar N - 1 palīdz kompensēt aprēķinu, kas netiek veikts kopumā iedzīvotājiem, bet ir balstīts uz visu studentu izlasi.
- Atņemt: N - 1 = 5 - 1 = 4
- Sadalīt: 81,2 / 4 = 20,3
Iegūstiet kvadrātsakni. Kad tas ir dalīts ar novērojumu skaitu mīnus 1, ņem iegūtās vērtības kvadrātsakni. Šis ir pēdējais solis, lai aprēķinātu standartnovirzi. Dažas statistikas programmas palīdzēs jums veikt šo aprēķinu pēc sākotnējo datu importēšanas.
- Izmantojot iepriekš minēto piemēru, studentu semestra beigu pakāpes klases novirze pirms stundas ir: s = √20,3 = 4,51.
reklāma

3. daļa no 3: Statistiskās nozīmības noteikšana

Aprēķiniet dispersiju starp abām novērojumu grupām. Līdz šim brīdim piemērā ir aplūkota tikai viena novērojumu grupa. Lai salīdzinātu divas grupas, jums acīmredzami ir nepieciešami dati no abām. Aprēķiniet otrās novērojumu grupas standartnovirzi un izmantojiet to, lai aprēķinātu dispersiju starp abām eksperimentālajām grupām. Dispersijas aprēķināšanas formula ir: s_d = √ ((s₁/ N₁) + (s₂/ N₂)).
- S_d ir dispersija starp grupām.
- S₁ ir 1. un N grupas standartnovirze₁ ir 1. grupas lielums.
- S₂ ir 2. un N grupas standartnovirze₂ ir 2. grupas lielums.
- Pieņemsim, ka mūsu piemērā 2. grupas datiem (skolēniem, kuri pirms stundas nav lasījuši tekstu) lielums ir 5 un standarta novirze ir 5,81. Dispersija ir:
  - S_d = √ ((s₁) / N₁) + ((s₂) / N₂))
  - S_d = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
Aprēķiniet datu t punktu. T-statistika ļauj konvertēt datus formā, kas ir salīdzināma ar citiem datiem. T-vērtība ļauj arī veikt t-testu, testu, kas ļauj aprēķināt statistiski nozīmīgas atšķirības iespējamību starp abām grupām. T-statistikas aprēķināšanas formula ir: t = (µ₁ – µ₂) / S_d.
- µ₁ ir pirmās grupas vidējais rādītājs.
- µ₂ ir otrās grupas vidējais rādītājs.
- S_d ir novirze starp novērojumiem.
- Izmantojiet lielāko vidējo vērtību kā µ₁ lai nesaņemtu negatīvu t-statistiku.
- Pieņemsim, ka 2. grupas (kas nav lasījis iepriekšējo rakstu) novērotais vidējais lielums ir 80. t-rādītājs ir: t = (µ₁ – µ₂) / S_d = (88,6 – 80)/3,29 = 2,61.
Nosakiet parauga brīvības pakāpi. Izmantojot t-statistiku, brīvības pakāpes tiek noteiktas, pamatojoties uz izlases lielumu. Saskaitiet novērojumu skaitu katrai grupai un pēc tam atņemiet divus. Iepriekš minētajā piemērā brīvības pakāpe (d.f.) ir 8, jo pirmajā grupā ir 5 paraugi un otrajā grupā 5 paraugi ((5 + 5) - 2 = 8).
Izmantojiet tabulu t, lai novērtētu nozīmīgumu. T vērtību un brīvības pakāpju tabulas var atrast standarta statistikas grāmatā vai tiešsaistē. Atrodiet rindu, kurā ir datu brīvības pakāpes un p-vērtība, kas atbilst jūsu rīcībā esošajai t-statistikai.
- Ar brīvības pakāpēm 8 un t = 2,61 p-vērtība viena astes testam ir no 0,01 līdz 0,025. Tā kā izvēlētais nozīmības līmenis ir mazāks vai vienāds ar 0,05, mūsu dati ir statistiski nozīmīgi. Izmantojot šos datus, mēs noraidām nulles hipotēzi un pieņemam apgriezto hipotēzi: studentiem, kuri izlasīja materiālu pirms klases, ir augstāki galīgie rezultāti.
Apsveriet iespēju veikt papildu pētījumus. Daudzi pētnieki veic priekšnoteikumu pētījumus ar vairākiem rādītājiem, lai saprastu, kā noformēt lielāku pētījumu. Veicot citus pētījumus ar lielāku metriku, jūs palielināsiet pārliecību par saviem secinājumiem. reklāma

Padoms

Statistika ir liela un sarežģīta joma. Izpildiet vidusskolas vai universitātes līmeņa statistikas hipotēzes testu (vai augstāku), lai saprastu statistisko nozīmīgumu.

Brīdinājums

Šī analīze koncentrējas uz t-testu, lai pārbaudītu atšķirību starp divām standarta sadalījuma populācijām. Atkarībā no datu sarežģītības jums var būt nepieciešams cits statistikas tests.