De betrouwbaarheid van keuringen bij ziekte en arbeidsongeschiktheid

Zodra iemand in Nederland ziek wordt en hiervan niet herstelt, kun je in aanmerking komen voor een uitkering ingevolge de Ziektewet, de WIA, de WAJONG en andere sociale verzekeringen. Ook bestaan er particuliere verzekeringen tegen arbeidsongeschiktheid, bijvoorbeeld bij Nationale Nederlanden.

Geen enkele instantie zal direct overgaan tot uitbetaling. Verzekeringsgeneeskundige controles zijn dan aan de orde. Of je nu te maken hebt met het UWV bij de sociale wetgeving of met een particuliere verzekeraar.

Dan staat de vraag centraal in conflicten hoe betrouwbaar de rapportages van de verzekeringsartsen zijn.

Dikwijls wordt het een welles-nietes-kwestie, waarbij je als burger, particulier, bijna gedwongen wordt om een externe deskundige in te schakelen. Ook daar speelt dezelfde vraag een rol: Hoe betrouwbaar zijn de rapportages?

In wezen gaat het om de methode, die verzekeringsartsen gebruiken bij de beoordeling van iemands arbeidsongeschiktheid.

Wat vrijwel niemand weet is, dat er ook wetenschappelijk onderzoek is gedaan naar de beoordelaarsbetrouwbaarheid van verzekeringsartsen. Men spreekt wel van intra-beoordelaarsbetrouwbaarheid, wanneer het gaat om één en dezelfde arts. Hoe betrouwbaar rapporteert een arts, die een verzekerde op verschillende momenten onderzoekt?

Gaat het om verschillende verzekeringsartsen onderling, dan spreekt men over inter-beoordelaarsbetrouwbaarheid. Het gaat dan dikwijls om de toepassing ook van de Functionele Mogelijkheden Lijst (FML), vroeger ook het belastbaarheidspatroon ingevolge het Functie-Informatiesysteem (FIS).

Ziet men dergelijke formulieren (FIS- of FML-, het maakt niet uit), dan vraag je je toch dikwijls af ook als advocaat: Hoe betrouwbaar zijn die lijsten ingevuld door de verzekeringsarts?

Jarenlang is al bekend, dat verzekeringsartsen elkaar overschrijven, waardoor die inter-beoordelaarsbetrouwbaarheid al niet kan worden getoetst. Hetzelfde geldt natuurlijk voor een arts, die in de loop der tijd één en dezelfde persoon onderzoekt. Zo’n arts schrijft zichzelf over. Maar dat neemt niet weg, dat er wetenschappelijk onderzoek is gedaan naar de onderlinge beoordelaarsbetrouwbaarheid en de interne beoordelaarsbetrouwbaarheid.

Gewezen wordt in dit verband op Prof. Dr Michiel F. Reneman, verbonden aan het UMCG, Centrum voor Revalidatie in Haren. Hij en zijn Vakgroep publiceren artikelen onder meer in het Tijdschrift voor Bedrijfs- en Verzekeringsgeneeskunde, TBV, zoals in TBV 11 nummer 12 (december 2003), welk artikel veel te weinig bekend is. 30 patiënten met a-specifieke chronische lage-rugpijn (24 mannen en 6 vrouwen) werden bij dit onderzoek betrokken. Zij waren door de revalidatie-arts aangemeld voor een behandeling in het Centrum voor Revalidatie in Haren in de periode van mei 2000 tot april 2001. De gemiddelde leeftijd van deze patiënten was 40 jaar. Het onderzoek bestond uit twee sessies. De eerste sessie vond plaats op twee opeenvolgende dagen (testdag 1 en 2). Na een tussenperiode van twee weken vond sessie 2 plaats, ook weer op twee opeenvolgende dagen (testdag 3 en 4). Bij elke patiënt voerden twee verzekeringsartsen een beoordeling uit. Een beoordeling bestond uit een gestandaardiseerd beoordelingsgesprek en een lichamelijk onderzoek.

Op de eerste dag voerde de eerste arts het gesprek en het lichamelijk onderzoek uit en een dag later deed de tweede arts hetzelfde. Vervolgens vulde elke arts afzonderlijk het FIS-belastbaarheidspatroon en de FML in voor de arbeidsgerelateerde fysieke activiteiten. Na twee weken voerden dezelfde artsen in dezelfde volgorde de belastbaarheidsbeoordeling opnieuw uit. Elke patiënt werd dus uiteindelijk vier beoordeeld. Op basis van beschikbaarheid van de artsen werden combinaties gemaakt. Gedurende de testdagen bleef het tijdstip van onderzoek gelijk en vond de beoordeling in dezelfde onderzoeksruimte plaats. Het gehele onderzoek werd uitgevoerd voordat het revalidatieprogramma begon. Het onderzoek was goedgekeurd door de Medische Ethische Toetsingscommissie en alle patiënten hadden schriftelijke toestemming gegeven voor deelname.

Na analyse met behulp van twee betrouwbaarheidsmaten werden zowel de intra- als inter-beoordelaarsbetrouwbaarheid bepaald. Onder verwijzing naar het artikel en hoe dat precies werkte ter zake van de berekening van zogenoemde Kappa-waarden en een uiteenzetting over het percentage absolute overeenstemming werd bepaald dat voor de zogenoemde Kappa-waarden een waarde als acceptabel werd beschouwd van meer dan 0,60. En een acceptabele waarde van het percentage overeenstemming werd arbitrair gesteld op 80%.

De resultaten waren schokkend. De intra- en inter-beoordelaarsbetrouwbaarheid bij gebruikmaking van het FIS-BLP bleek zeer matig op basis van Kappa-berekeningen (0,60 of hoger) en op basis van percentage overeenstemming (80% of hoger).

De intra- en inter-beoordelaarsbetrouwbaarheid bij gebruikmaking van de FML was hoger, hogere Kappa-waarden en grotere percentages overeenstemming, maar ook voor dit instrument gold dat voor een groot deel van de activiteiten de grenswaarden van de Kappa en het percentage overeenstemming niet werd gehaald.

In de discussie over de resultaten werd meegedeeld dat één van de bronnen voor deze (onacceptabele, P.B.) variatie de arts is die het onderzoek uitvoert. Meegedeeld wordt dan: “Iedere arts heeft zijn eigen wijze van gespreksvoering. Tevens kunnen bij de variatie door de artsen factoren als motivatie, vermoeidheid en geheugen een rol spelen”.

De onderzoekers (S. Brouwer et al) komen dan tot de conclusie:

Op basis van dit onderzoek dient te worden geconcludeerd dat het FIS-BLP en de FML onvoldoende betrouwbare gegeven opleveren voor het beoordelen van de arbeidsgerelateerde functionele status bij patiënten met chronische a-specifieke lage-rugpijn. Op basis van deze resultaten kan men zich afvragen of deze methodieken in de praktijk bruikbaar zijn (…). Op basis van de gevonden betrouwbaarheid moet worden geconcludeerd dat zowel de FIS-BLP als het FML niet bruikbaar zijn binnen de revalidatie-geneeskunde”.

Opgemerkt wordt dan door de onderzoekers:

De gehanteerde werkwijze van de artsen (anamnese, lichamelijk onderzoek en invullen FIS-BLP en FML) wijkt niet af van de werkwijze zoals die wordt toegepast in de dagelijkse praktijk (van de verzekeringsartsen, P.B.) en dat gebruikmaking van het FIS-BLP en de FML door verzekeringsartsen binnen deze onderzoeksopzet heeft geleid tot onvoldoende betrouwbare resultaten. In welke mate dit consequenties heeft voor de arbeidsongeschiktheidsbeoordeling, zou nader onderzocht moeten worden”.

Ervaring op ons kantoor met dit soort zaken leert, dat ook advocaten goed op de hoogte moeten zijn van gebruikte methoden of juist het ontbreken van methoden door verzekeringsartsen bij de beoordeling van arbeidsongeschiktheid. Het gaat daarbij altijd om de claimbeoordeling, de beoordeling van de stellingen van verzekerden, dat een door hen ervaren beperking in het lichamelijk en/of geestelijk functioneren, neergelegd in een claim of klacht, leidt tot een verminderd of ontbrekend vermogen arbeid te verrichten. Dergelijke claimklachten worden door verzekeringsartsen in strijd met de methode van het methodisch beoordelingsgesprek, of ook wel genoemd de argumentatieve claimbeoordeling, zoals verplicht onderwezen aan verzekeringsgeneeskundigen, niet geïnventariseerd en niet herschreven in medische termen en niet geverifieerd danwel gefalsifieerd. Daardoor is de verzekeringsgeneeskunde dikwijls een vorm van waarzeggerij en snijdt men er als verzekeringsarts vaak langsheen. Het gaat hier evenwel om grote belangen. Het is zaak als cliënt én als advocaat beiden gespitst te zijn op de door de verzekeringsarts gehanteerde “methode”. Het raakt immers aan de verplichte te eerbiedigen wettelijke bepalingen ter zake van de in acht te nemen zorgvuldigheid door de verzekeringsarts/UWV/particuliere verzekeraar.

Let op Uw zaak.

Pieter Bogaers, advocaat en bioloog