Hva er typene validering? Hva det er? Du finner svar på disse og andre spørsmål i artikkelen. Validitet er iboende en enkelt karakteristikk som inkluderer på den ene siden data om hvorvidt teknologien er egnet til å måle hva den er utviklet for, og på den andre siden hva som er dens effektivitet, praktiske nytteverdi, effektivitet. Å sjekke gyldigheten til en teknologi kalles validering. Vi vil vurdere det mer detaljert nedenfor.
Visninger
Mange spør: "Hva er validering?" Det sies at det raffinerte sinnet ikke har noen grenser. Metodologer ser ut til å konkurrere med hverandre om hvem som skal oppdage eller finne opp flere typer og typer validitet. Det bare navn som ikke har dukket opp i det siste! Det viser seg at det er:
- ekstern og intern gyldighet;
- convergent;
- discriminant;
- obvious;
- faktoriell;
- prediktiv;
- konstruktiv;
- kriterium;
- meningsfull og så videre.
Det er ingen måte å forstå, og enda mer å fornuftig skille en variant fra en annen. Forvirring i definisjoner og klassifiseringer fører til at forskjellige forfattere tillegger helt forskjellige måter å forbedre den på samme form for gyldighet.
Eksterne kriterier
For å utføre den pragmatiske valideringen av metodikken, det vil si å vurdere dens praktiske betydning, effektivitet, effektivitet, brukes vanligvis et eksternt uavhengig kriterium - en indikator for å vise kvaliteten som studeres i hverdagen. Et slikt kriterium kan være både produksjonsprestasjoner (for teknologier med profesjonell orientering), og akademisk ytelse (for tester av intelligens, prestasjoner eller læringsevner), og effektiviteten av faktiske aktiviteter - modellering, tegning og så videre (for tester av spesielle ferdigheter), personlige vurderinger (for identitetsbekreftelse).
Typer av eksterne valideringskriterier er som følger:
- ytelsesmål (disse kan omfatte mengden arbeid som er implementert, tiden brukt på trening, akademiske prestasjoner, kvalifikasjonsveksten og lignende);
- fysiologiske tegn (brukes når man studerer påvirkningen av miljøet og andre situasjonsvariabler på menneskets psyke og kropp);
- blodtrykk, puls, tretthetssymptomer, elektrisk motstand i huden og så videre målesneste;
- subjektive mål (inkluderer ulike typer svar som gjenspeiler en persons holdning til noen eller noe, hans synspunkter, meninger, preferanser; som regel innhentes slike mål ved hjelp av spørreskjemaer, spørreskjemaer, intervjuer);
- tegn på ulykker (brukes når formålet med studien for eksempel gjelder problemet med å velge ut personer som er mindre utsatt for ulykker til arbeid).
Empirisk gyldighet. Hva handler det om?
Få mennesker vet hva empirisk validering er. Ved innholdsvaliditet blir testen evaluert av eksperter (som fastslår at testoppgavene samsvarer med innholdet i måleobjektet). Og den empiriske måles alltid ved hjelp av statistisk korrelasjon: korrelasjonen mellom to typer verdier beregnes - testresultater og indekser for en ekstern parameter valgt som pålitelighetskriterium.
Konstruktiv
Ikke alle kjenner til typene valideringsmetoder. Hva er konstruksjonsvaliditet? Det har med selve den teoretiske konstruksjonen å gjøre, og består i å lete etter faktorer som forklarer testytelsesatferd.
Som en spesifikk type er konstruksjonsvaliditet legitimert i en artikkel av Mil og Cronbach (1955). Ved å bruke denne formen for validitet evaluerte forfatterne alle testundersøkelser som ikke var direkte rettet mot å forutsi noen signifikante kriterier. Forskningen inneholdt informasjon om psykologiske konstruksjoner.
Innholdsgyldighet
Du fortsattdu spør: "Validering - hva er det." Vurder innholdets gyldighet. Det krever at hvert problem, spørsmål eller oppgave som tilhører et gitt område har en identisk sjanse til å bli et testelement.
Content Validity evaluerer testenhetens egnethet til det målte atferdsområdet. Verifikasjoner opprettet av to grupper utviklere utføres på et utvalg av de som kontrolleres. Påliteligheten til tester beregnes ved å dele spørsmål i to soner, noe som resulterer i en indeks for innholdsgyldighet.
Predictive
Vi fortsetter å vurdere valideringsmetoder. Prediktiv validitet etableres også av et eksternt, ganske pålitelig kriterium. Men informasjon om ham samles inn en tid etter bekreftelsen.
Den eksterne målestokken er vanligvis en persons yrke, vist i enhver vurdering, for den type yrke han ble valgt for på grunnlag av resultatene fra diagnostiske tester.
Selv om denne metoden er mest egnet for oppgaven med diagnostiske verktøy - spådommen om fremtidig suksess, er den svært vanskelig å bruke. Nøyaktigheten til prognosen er omvendt avhengig av tiden som er tildelt for en slik prediksjon. Jo mer tid som går etter målingen, jo flere faktorer må tas i betraktning når man vurderer teknologiens prediktive verdi. Det er imidlertid nesten umulig å ta hensyn til alle faktorene som påvirker prediksjonen.
Retrospective
Enig, validering er en veldig komplisert prosess. Det er kjent at retrospektiv gyldighet avsløres på grunnlag av kriteriet,som gjenspeiler tilstanden til en kvalitet eller hendelse i fortiden. Kan brukes til å umiddelbart skaffe prediktive teknologikilder. Så for å revidere i hvilken grad gode resultater av en ferdighetstest samsvarer med rask læring, kan man sammenligne tidligere ekspertuttalelser, ytelsesvurderinger og så videre hos personer med lave og høye diagnostiske indekser for øyeblikket.
Diskriminerende og konvergent
Typer validering er av interesse for mange. La oss finne ut hva diskriminerende og konvergent gyldighet er. Strategien for å introdusere etablerte elementer i testen avhenger av hvordan psykologen avslører den diagnostiske konstruksjonen. Hvis Eysenck definerer kvaliteten "nevrotisme" som uavhengig av introversjon-ekstroversjon, betyr dette at spørreskjemaet hans i like stor grad bør representere posisjoner som vil bli godkjent av nevrotiske ekstroverte og introverte.
Hvis det i praksis viser seg at elementene fra «introversjon-nevrotisisme»-kvadranten vil råde i oppgaven, så betyr dette ut fra Eysencks teori at indikatoren «nevrotisme» er lastet med en irrelevant indikator - "introversjon". En identisk effekt vises når det er en skjevhet i prøven - hvis det er flere nevrotiske introverte i den enn de samme ekstraverte.
For å unngå slike kompleksiteter er psykologer villige til å forholde seg til empiriske elementer som kun informerer om en enkelt faktor. Men i virkeligheten er dette kravet aldri oppfylt: hver empirisk indeks viser seg å være bestemt ikkebare av faktoren vi trenger, men også av andre - irrelevant for måleproblemet.
For faktorer som er konseptuelt definert som ortogonale til det målte (som forekommer med det i alle kombinasjoner), er testskaperen forpliktet til å bruke strategien med uautentisk balansering ved valg av elementer.
Korrespondansen av poeng til den målte indikatoren garanterer testens konvergerende gyldighet. Konsistens av elementer med hensyn til irrelevante kilder gir diskriminerende gyldighet. Empirisk manifesterer den seg i fravær av signifikant korrelasjon med testen, som måler den konseptuelt unike kvaliteten.
Verktøysett
I det generelle settet med valideringsmetoder inkluderer forfattere vanligvis:
- ikke-formalisert (fra enkle triks for å nøye gjennomgå listen over alternativer i spørreskjemaet til mer sofistikerte prosedyrer for teoretisk trinn-for-trinn-analyse);
- formalisert, som inkluderer prosedyrer og teknologier for matematisk statistikk: testing av statistiske hypoteser, beregning av estimater, korrelasjonsanalyse, konstruksjon av konfidensintervaller, vurdering av sammenhenger mellom variabler, spredning, faktoriell, regresjon og strukturelle analyser, og så på.
Opprette verktøy
Og likevel, hva er validering? Sofistikerte valideringsverktøy ble først laget av psykologer. Tilbake i 1959 ble en spesiell teknikk utviklet av D. Fiske og D. Campbell (USA). Hun fikk en helt naturlig for engelsk, men uoversettelig tilspråket vårt, navn: multi-method-multi-damn matrise (MTMM). Denne matrisen var en tabell over korrelasjoner. Den besto av to svært attraktive oppfinnelser, hvorav den ene var ment å avsløre konvergerende sannhet, og den andre for diskriminerende sannhet.
Forfatterne hevdet at hvem som helst kan bevise intern aksept hvis:
- verdier som det antas et høyt nivå av teoretisk sammenheng mellom vil finne et identisk nivå i empirien (konvergens);
- verdier som er teoretisk urelaterte vil vise seg å være urelaterte empirisk etter utførelse av testen (diskriminering).
Grovt sett bør konvergent validitet si at det er mye mer likhet mellom to team med ansatte, for eksempel bygningsarbeidere og samlebåndarbeidere, når det gjelder sjanser på arbeidsmarkedet enn mellom eiere og ansatte. Hvis den teoretisk tiltenkte sammenhengen er funnet empirisk, er utvalget ditt gyldig.
Diskriminerende validitet viser graden av identifikasjon av ulike fenomener. For å ta det samme eksempelet på arbeidsmarkedet, skulle man forvente at en velformet teori med sine virkemidler kunne skille mellom eiernes og arbeidstakernes muligheter på arbeidsmarkedet. Du kan ikke forvirre dem, og teorien din kan skille dem fra hverandre.
Hvis du opprettet en skala som måler matematiske evner, bør i tilfelle av gyldigheten av de konvergerende indeksene for matematiske talenter korrelere godt med de generelle ferdighetene til en person, hvis et slikt forhold på teoretisk nivådet er, og dårlig - med estetiske evner som krever helt andre talenter av en person enn telleferdigheter, hvis teorien din forkynner en lav korrelasjon.
Typer
Validering er prosessen med å tune, forbedre de opprettede psykodiagnostiske metodene. Dens grunnleggende oppgave er å sikre at teknologien diagnostiserer nøyaktig hva utvikleren trenger. Det skilles mellom teoretisk og pragmatisk validering.
For den første typen er kardinalproblemet forholdet mellom mentale fenomener og deres indekser, ved hjelp av hvilke disse fenomenene prøver å bli kjent. Det viser at resultatene av metodikken og forfatterens abstrakte intensjon er de samme.
For å etablere abstrakt validitet er det svært vanskelig å finne noe uavhengig kriterium som ligger utenfor metodikken. I historien om psykodiagnostikk i de tidlige stadiene var derfor avhengigheten av det instinktive konseptet som testen måler:
- En metode ble ansett som gyldig hvis den bare var "åpenbar".
- Gyldighetsbeviset var basert på prospektørens tro på at teknologien hans kunne "forstå testeren".
- Opplegget ble kun ansett som gyldig fordi teorien bak teknologien var "ganske bra".
Deretter begynte søket etter bevis rettferdiggjort av vitenskap. Det skal bemerkes her at den umerkelige akkumuleringen av et arsenal av teknologier med en allerede underbygget og kjentgyldighet. Hvis en psykodiagnostiker lager et opplegg for å vurdere en kvalitet og det er kjent at andre, gyldige teknologier er rettet mot samme vurdering, så kan du studere sammenhengen, sammenligne resultatene etter andres og din egen metode.
Hvis korrelasjonskoeffisienten er for høy, har det genererte skjemaet imponerende abstrakt gyldighet. Hvis du er i tvil om nøyaktig hva en teknologi evaluerer, sammenlign resultatene for den med resultatene for andres gyldige ordninger som gjenkjenner tilstøtende (mistenkelige) eiendommer. Hvis korrelasjonsverdiene viser seg å være uventet store, kan det konkluderes med at metoden ikke anslår det som var forventet.
Dermed, hvis det allerede finnes andre ordninger som tar sikte på å måle nøyaktig de samme normene eller relaterte, kan vi bestemme diskriminerende og konvergent gyldighet.
Nyances
Så, hva er validering? Med enkle ord er dette en revisjon av produktet for å se hvordan det samsvarer med de deklarerte egenskapene. Det vil si at noen smarttelefonvalidering ikke vil bestå før da. Inntil kundene sørger for at den har kameraet og lagringen de er villige til å betale for.
Valideringskriteriet er et mål på mental kvalitet som er uavhengig og direkte fra testen som valideres, og som psykodiagnoseordningen er rettet mot.
Current validity - et trekk ved testen som gjenspeiler dens evne til å skille mellom forsøkspersoner på grunnlag av et diagnostisk trekk som er gjenstand for studiet i dennemetode.
Konkurransevaliditet estimeres ved korrelasjonen av den opprettede testen med andre, hvis gyldighet i forhold til den målte parameteren er etablert. Differensiell validitet kan forklares med eksemplet med interessetester.