Klinisk forskning – Test av ett diagnostiskt test

2016-10-06 / Svensk Kirurgi / Volym 74 / Nr 5 / 2016

En del medicinsk forskning går ut på att utveckla test som kan identifiera huruvida patienten lider av en viss sjukdom eller inte. Det är få test som är helt perfekta i den meningen att de bombsäkert kan separera friska från sjuka. När man undersöker ett test är det bra att börja med två huvudbegrepp: sensitivitet och specificitet. För att förstå dessa begrepp kan det vara bra att göra följande tabell:

Johan Sundström
johan.sundstrom@ucr.uu.se
Uppsala

Ett antal känt sjuka patienter (a + c) och ett antal friska (b + d) testas. För de sjuka patienterna med ett positivt test för sjukdomen (a) och de friska patienterna med ett negativt test för sjukdomen (d) var testet helt uppenbart ett bra test, medan det för de andra grupperna (b och c) uppstod en diskordans mellan sjukdomen och testresultatet.

Sensitivitet är ett mått på hur väl testet fångar upp de sjuka personerna, det vill säga sannolikheten för ett positivt test hos sjuka personer, eller a/(a + c). Om sensitiviteten är hög, nära 1,0 eller 100 procent, betyder det att antalet falskt negativa test är lågt, det är alltså ovanligt att man med testet friskförklarar en sjuk patient. Med andra ord är testet bra på att fånga upp de sjuka.

Specificitet är sannolikheten för ett negativt test hos friska personer, det vill säga d/(b + d). Om specificiteten är hög betyder det att antalet falskt positiva test är lågt, det är alltså ovanligt att man med testet sjukförklarar friska personer.

När man använder diagnostiska test i praktiken vet man inte om patienten är sjuk eller frisk (då skulle man ju inte behöva utföra testet!). Man utgår då ifrån testresultatet, i stället för tvärtom, och kan istället använda två andra begrepp, positivt respektive negativt prediktivt värde. Positivt prediktivt värde (PPV) är sannolikheten för att en person som uppvisar ett positivt test har sjukdomen, a/(a + b). Negativt prediktivt värde (NPV) beskriver i sin tur sannolikheten för att en person som uppvisar ett negativt test är frisk, d/(c + d).

I dessa formler ser man att sjukdomens prevalens har ett betydande inflytande på både PPV och NPV. Ett test på en sjukdom som är ovanlig, ger automatiskt ett lågt PPV och högt NPV. Det innebär att för ovanliga sjukdomar kommer bara en liten del av de testpositiva personerna verkligen att vara sjuka. Däremot kommer de flesta testnegativa personerna att verkligen vara friska. Om det däremot är fråga om en mycket vanlig sjukdom kommer PPV att vara högt och NPV lågt, det vill säga en mycket större andel med ett positivt test är sjuka. Kunskap om sjukdomens prevalens är alltså viktig för att veta hur man ska tolka ett testutfall.

Ett sätt att bedöma den kliniska nyttan med ett test är att kvantifiera sannolikheten för att ha sjukdomen med (post-test) respektive utan (pre-test) den information som testet givit. Ett test är ju väldigt kliniskt nyttigt om man genom att använda det kan gå från en låg sannolikhet för sjukdomen till en hög.

I det enklaste möjliga scenariot, helt utan kännedom om patienten, är pre-test probability (sannolikheten för att ha sjukdomen innan testet utförts) lika med sjukdomens prevalens i den kliniska verksamhet där man befinner sig; positive post-test probability (sannolikheten för att ha sjukdomen om testet faller ut positivt) = PPV; och negative post-test probability (sannolikheten för att ha sjukdomen om testet faller ut negativt) = 1-NPV. Oftast har man ju redan en grov uppfattning om risken för att patienten har sjukdomen; det räcker ofta med att man känner till dennes ålder och kön för att man ska kunna skatta en annan pre-test probability hos patienten än sjukdomens prevalens. Då gäller inte dessa enkla samband, och man får räkna ut post-test probability på andra sätt, till exempel via testets likelihood ratio. Ett tests likelihood ratio är antagligen det bästa måttet på testets kliniska användbarhet. Läs mer om detta i vår lärobok.

William Sealy Gosset (1876-1937) studerade kemi och matematik vid Oxford, och fick sen anställning vid Guinness-bryggeriet i Dublin, som just hade börjat anställa vetenskapspersoner för att säkerställa kvaliteten i produktionen. Gosset blev mycket intresserad av statistiska problem och fick publicera sina artiklar under pseudonymen ”Student” eftersom bryggeriet inte ville avslöja sin vetenskapliga aktivitet för omvärlden. Han utvecklade de små samplens statistik, bland annat genom att ta fram t-distributionen för att kunna avgöra säkerheten i kvalitetsbedömningen från små stickprov av humle; t-testet för att jämföra medelvärden med sannolikhetsprövning; och tog de första resonemangen kring statistisk signifikans (även om Gosset själv tyckte att praktisk – jämfört klinisk – signifikans var mycket viktigare).

Denna kolumn är ett utdrag ur boken Handbok i biomedicinsk forskning, av Johan Sundström och Lars Lind, som under 2015 utkommit på Liber förlag med ISBN 47-11399-6. Under temaåret Forskningens år kommer denna kolumn, Klinisk forskning, att regelbundet återkomma i Svensk Kirurgi med handfasta metodologiska tips för den kliniska forskaren inom olika fält såsom evidensbaserad medicin, studiedesign, epidemiologiska begrepp, praktiskt genomförande av studier, statistisk analys, och skrivande av vetenskapliga artiklar.