Validering av APACHE II-, APACHE III- och SAPS II-poäng för att förutsäga dödligheten på sjukhus och under ett år på en blandad intensivvårdsavdelning i Polen: en kohortstudie

december 10, 2021

admin 0 Comments Articles

Denna single-center-studie syftade till att validera APACHE II, APACHE III och SAPS II i mortalitetsförutsägelser på en intensivvårdsavdelning med 10 bäddar i Polen. Vi upptäckte att även om alla poäng var acceptabla när det gällde att förutsäga dödlighet ur statistisk synvinkel, visade sig deras förmåga när det gällde 12-månaders prognostisering vara begränsad ur klinisk synvinkel.

Vi fann att dödligheten på intensivvårdsavdelningen under sjukhus var 35,6 %, vilket var relativt högt jämfört med internationella data, men lägre än det värde som observerades i Schlesien-regionen (43,7 %) . Den högre dödligheten på polska intensivvårdsavdelningar jämfört med andra europeiska länder , som har diskuterats under de senaste åren, beror snarare på skillnader i patientpopulationer, indikationer för intagning på intensivvårdsavdelning, tillgången på intensivvårdsplatser och organisationen av vård i livets slutskede i Polen. Detta beror också på vissa yrkesutövares skeptiska inställning till riktlinjer för futil behandling och officiella kriterier för intagning på intensivvårdsavdelningen . Även om patienter som läggs in på polska intensivvårdsavdelningar oftare löper högre risk att dö jämfört med andra länder, var den dödlighet på intensivvårdsavdelningar som observerades i Silesian Registry of Intensive Care Units lägre än den som förutspåddes av APACHE II-poängen .

I vår studie var APACHE II-, APACHE III- och SAPS II-poängen och den förutspådda dödligheten på intensivvårdsavdelningar som följer: 19 (IQR 12-24) poäng (dvs. mortalitet på 25,8 %; IQR 12,1-46), 67 poäng (IQR 36,5-88) (mortalitet på 18,5 %; IQR 3,8-41,8) respektive 44 poäng (IQR 27-56) (mortalitet på 34,8 %; IQR 7,9-59,8). APACHE II och SAPS II hade jämförbara observerade till förväntade mortalitetskvoter, nära 1,0. För APACHE III var förhållandet överraskande högt och nådde 1,38. Vanligtvis överskattar poängen mortaliteten . Orsaken till detta fenomen verkar vara komplex och kan bero på betydande skillnader mellan patientpopulationen på vår enhet (blandade intagningar, inklusive postoperativa fall som första prioritet) och de målpopulationer som dessa prognostiska modeller utvecklades för. Medicinska patienter bekräftades ha högre dödlighet än kirurgiska patienter, vilket är i linje med tidigare forskning i denna fråga .

Den insamlade uppgifternas tillförlitlighet är viktig eftersom dålig kvalitet på källdata, liksom antalet och typen av saknade fysiologiska variabler, kan påverka dödlighetsprognoserna. I den ursprungliga APACHE II-studien saknades variabler i 13 % av fallen . I vår dataserie saknades totalt 14 % av variablerna i alla tre studiens resultat, vilket bör beaktas vid tolkningen av data. Datainsamlingsprocessen är behäftad med en hög risk för bias. När det gäller APACHE II-poäng observerades att de främsta orsakerna till datafel är inkonsekventa val mellan de högsta och lägsta värdena och problem med bestämning av GCSpoäng hos sederade patienter . Vi använde GCS före sedering hos sederade patienter om det fanns tillgängligt, data verifierades alltid av två medlemmar av studiegruppen oberoende av varandra.

Två huvudsakliga objektiva kriterier används för utvärdering av prognostiska skalors prestanda: nämligen kalibrering och diskriminering. Diskriminering avser en prognostisk poängs förmåga att klassificera patienter som överlevande eller icke överlevande och mäts med ROC-kurvor (dvs. AUC och 95 %CI). Kalibrering avser hur nära de uppskattade sannolikheterna för dödlighet korrelerar med den observerade dödligheten, är av stor betydelse för kliniska prövningar eller jämförelser av vård mellan intensivvårdsavdelningar, och visas grafiskt eller bedöms med hjälp av goodness-to-fit-modeller. Diskrimineringen i vår studie var godtagbar: alla tre undersökta poäng förutspådde dödlighet på sjukhus med en AUC på nästan 0,8, utan statistiskt signifikanta skillnader mellan dem. När det gäller förutsägelse av dödlighet efter utskrivning var poängens diagnostiska noggrannhet också godtagbar när det gäller AUC (dvs. > 0,7), men var snarare av klinisk relevans på gränsen till gränsen (AUC låg närmare 0,5 än 1,0, vilket indikerar ett helt korrekt test). Det är dock viktigt att notera att AUC i sig saknar klinisk tolkningsbarhet eftersom den inte återspeglar detta. Eftersom en AUC mäter prestanda över alla tröskelvärden (cut-offs) för poängen omfattar den både de kliniskt relevanta och de kliniskt ologiska. Därför förblir den kliniska tolkningen av AUC svår .

Våra observationer stämmer överens med tidigare studier som bevisar poängens höga noggrannhet vid prognostisering på kort sikt . Även om alla poäng hade jämförbara AUC:er verkade APACHE II och SAPS II prestera bättre ur klinisk synvinkel eftersom deras observerade till förväntade dödlighetstal var 1,12 och 0,96 jämfört med 1,38 för APACHE III. I en studie av Beck m.fl. som validerade samma prognostiska modeller på 16 646 vuxna intensivvårdspatienter i södra Storbritannien rapporterades en liknande god diskriminering för alla tre skalorna, men kalibreringen var bristfällig . APACHE II-poängen var mer tillförlitlig än SAPS II och APACHE III hos intensivvårdspatienter i en studie av Gilani et al. Liknande resultat kommer från en studie av Khwannimit et al. som jämförde SAPS II och APACHE II. Även om den sistnämnda modellen fungerade bättre hos thailändska intensivvårdspatienter var kalibreringen av båda poängen dålig även i detta fall. Däremot rapporterade Sungurtekin et al. bättre prognostisk noggrannhet för SAPS II än APACHE II hos organofosfatförgiftade intensivvårdspatienter . En annan studie av Godinjak et al. visade att APACHE II och SAPS II har en jämförbar hög diagnostisk noggrannhet.

Kalibreringen av våra poäng var god när det gäller chi-kvadrat- och p-värden. Men eftersom tillämpningen av Hosmer-Lemeshow-testet nyligen har kritiserats , ritade vi kalibreringskurvorna för att visualisera effekten av god anpassning. Även om den lilla urvalsstorleken men den höga händelsegraden (dvs. dödsfall) är en styrka i vår studie för hela kohorten, var de beräkningar som utfördes i undergrupper av patienter för förutspådd dödlighet ganska undermåliga. Å ena sidan uppmuntrar denna nackdel oss att utvidga denna prospektiva analys till en större patientgrupp. Å andra sidan måste man komma ihåg att populationen av kritiskt sjuka personer förändras med tiden och att parametrarna för diagnostisk noggrannhet därför kan förändras dynamiskt . Skillnader i resultat av poäng kan bero på variation i fallmixen, standarder, strukturen och organisationen av den medicinska vården samt livsstil och genetiska skillnader mellan olika populationer . Trots de många studier som hittills utförts i detta ämne finns det därför fortfarande ett behov av att validera dessa prognostiska modeller med hjälp av data från oberoende urval från olika intensivvårdsavdelningar i olika länder, eller till och med regioner, vid upprepade tidsintervaller.

Och även om vi fann vissa skillnader i AUC-värdena mellan kirurgiska och medicinska patienter har det bekräftats av tidigare undersökningar att kirurgiska patienter generellt sett har bättre överlevnadsprognos än medicinska intensivvårdspatienter . Förklaringen till detta faktum är ganska enkel: hos dessa patienter är orsaken till att de läggs in på intensivvårdsavdelningen oftast deras instabila tillstånd till följd av det utförda långvariga och omfattande kirurgiska ingreppet, och inte så mycket på grund av deras dåliga allmäntillstånd före operationen eller deras komorbiditeter.

Men även om alla de tre undersökta värdena på ett statistiskt signifikant sätt förutspådde dödligheten efter 12 månader efter utskrivningen var deras diagnostiska noggrannhet mycket lägre (AUC på ~ 0,7). I en studie av Angus et al. var APACHE II-poängen också prediktiv för 1-årsmortalitet (AUC på 0,671) hos patienter som genomgick levertransplantation. I en studie av Lee et al. rapporterades däremot inget samband mellan de poäng som beräknades vid intagningen och dödligheten efter utskrivningen. Lägre diagnostisk noggrannhet när det gäller att förutsäga långsiktig dödlighet kan bero på olika orsaker. Poängen beräknas under de första 24 timmarna efter intagningen med hjälp av de sämsta resultaten. Den behandling som genomförs under intensivvårdsvistelsen, eventuella komplikationer och kvaliteten på uppföljningsvården och rehabiliteringen påverkar patientens resultat och kan förändra de resultat som poängsystemen ger. Lee et al. fann att APACHE II-poängen vid utskrivning var en bra prediktor för dödlighet och återinläggning efter intensivvård. Därför vore det rimligare att fokusera på de poäng som beräknas för att uppskatta patienternas långsiktiga prognos när de skrivs ut från intensivvårdsavdelningen. Eftersom de verktyg som för närvarande finns tillgängliga inte ursprungligen har utformats för en sådan tillämpning bör ytterligare studier genomföras för att skapa poäng som uppskattar den långsiktiga förutsägelsen. I detta sammanhang bör man komma ihåg att en korrekt screening och noggrann identifiering av patienter som kommer att förbli i riskzonen efter en lyckad utskrivning från intensivvårdsavdelningen kan vara av stor betydelse för att undvika återinläggningar på intensivvårdsavdelningen, ytterligare försämring av livskvaliteten och högre dödlighet efter utskrivningen.

Den aktuella studien har vissa begränsningar. De som rör validering har beskrivits ovan. Man bör dock också komma ihåg att som en studie på ett enda center kan det finnas bias med hänsyn till den heterogena populationen och den relativt lilla urvalsstorleken. De slutliga resultaten i poängen kan påverkas av den förväxlande effekten av dataurvalsprocessen och beräkningen av Glasgow Coma Scale-resultaten. Uppföljningsperioden i vår studie var begränsad till 12 månader efter dagen för intagningen på intensivvårdsavdelningen. Slutligen inkluderade vi inte SOFA-poängen i vår analys. Eftersom just detta poängsystem i första hand skapades för prognostisering bland septiska patienter verkar det dock mindre omfattande i den blandade intensivvårdsinställningen än APACHE eller SAPS .

Validering av APACHE II-, APACHE III- och SAPS II-poäng för att förutsäga dödligheten på sjukhus och under ett år på en blandad intensivvårdsavdelning i Polen: En kohortstudie

Validering av APACHE II-, APACHE III- och SAPS II-poäng för att förutsäga dödligheten på sjukhus och under ett år på en blandad intensivvårdsavdelning i Polen: En kohortstudie

Lämna ett svar Avbryt svar