Vědecká opatření: spolehlivost a platnost

Měření je důležitou součástí vědeckého procesu. Klíčovými aspekty kvality vědeckých opatření jsou spolehlivost a platnost.

Spolehlivost je měřítkem vnitřní konzistence a stability měřicího zařízení.

Platnost nám dává indikaci, zda měřicí zařízení měří to, na co nárokuje.

Vnitřní konzistence je míra, v níž položky nebo otázky týkající se opatření důsledně hodnotí stejný konstrukt. Každá otázka by měla být zaměřena na měření stejné věci. Interní konzistence se často měří pomocí Cronbach's Alpha - super korelace všech položek na stupnici. Pokud je skóre 0,70 nebo vyšší, je měření přijatelné. Výhodnější je však 0,80 nebo vyšší. Při zvažování skóre, které odráží vnitřní konzistenci, je také důležité vzít v úvahu kontext.

Stabilita se často měří spolehlivostí testu / opakovaného testu. Stejná osoba absolvuje stejný test dvakrát a výsledky každého testu se porovnávají. Vysoká korelace mezi dvěma skóre testu znamená, že test je spolehlivý. Ve většině případů je korelace alespoň 0,70 považována za přijatelnou. Jedná se však o obecné vodítko a nikoli o statistický test.

Spolehlivost Interrater je další koeficient spolehlivosti, který se někdy používá při hodnocení spolehlivosti. Se spolehlivostí mezi hodnotiteli provádějí pozorování různí soudci nebo hodnotitelé (dva nebo více), zaznamenávají svá zjištění a poté porovnávají svá pozorování. Pokud jsou hodnotitelé spolehliví, pak by procento shody mělo být vysoké.

Když se ptáme, zda je opatření platné, ptáme se, zda měří, co má. Platnost je úsudek založený na shromážděných datech, nikoli statistický test. Existují dva hlavní způsoby, jak určit platnost: existující míry a známé skupinové rozdíly.

Test existujících měr určuje, zda nová míra koreluje se stávajícími příslušnými platnými měrami. Nové opatření by mělo být podobné opatřením, která byla zaznamenána s již zavedenými platnými měřicími zařízeními.

Známé skupinové rozdíly určují, zda nová míra rozlišuje mezi známými skupinovými rozdíly. Ilustrace známých skupinových rozdílů je vidět, když je různým skupinám dána stejná míra a očekává se, že budou bodovat odlišně. Například pokud byste měli dát demokratům a republikánům test hodnotící sílu určitých politických názorů, očekávali byste, že budou bodovat jinak. Jejich názory se v mnoha otázkách podstatně liší. Pokud tyto dvě skupiny skórovaly odlišně, jak se očekávalo, mohli bychom říci, že míra označuje platnost - měření toho, co tvrdí k měření.

Při konstrukci nových měřicích přístrojů je bezpodmínečně nutné vzít v úvahu jejich spolehlivost a platnost. Opatření může být spolehlivé a neplatné. Platné opatření je však vždy spolehlivým měřítkem.

!-- GDPR -->