IMAGR assisteert radioloog met AI
Zelflerende software helpt radiologen hun werk sneller, preciezer en effectiever te doen. Maar deze software is meestal lastig inpasbaar in de ict-systemen van ziekenhuizen. Daarom ontwikkelde het UMC Utrecht IMAGR: een digitale infrastructuur waarop dit soort software kan draaien binnen de klinische workflow. “Samen met het medische IT-bedrijf Sectra kunnen we de wereldwijde inzet van artificial intelligence voor patiënten versnellen.”
Op zijn veertiende hackte hij zijn eigen middelbare school, op zijn zestiende verkocht hij zijn eerste software-programma en ook als postdoc op Stanford University ontwikkelde hij apps. Nu houdt hij zich gedurende een werkweek drie dagen bezig met radiologie en twee dagen met IT. Wouter Veldhuis noemt zichzelf een beetje ‘een nerd’. Maar dan wel een nerd met een missie, want hij is uitgesproken enthousiast over de mogelijkheden van AI (artificial intelligence ofwel zelflerende software) voor de radiologie.
Supergespecialiseerd
“AI-applicaties voor beeldverwerking zijn supergespecialiseerd”, vertelt Wouter. “Ze kunnen één ding heel goed, bijvoorbeeld het detecteren van borstkanker op een mammografie of de mate van slijtage in een reumahand bepalen op een röntgenfoto. Radiologen werken al bijna een kwart eeuw digitaal, zodat er inmiddels een enorme hoeveelheid beeldmateriaal voorhanden is. Naarmate een AI-applicatie meer gevoed wordt met relevante beelden, leert de software daarvan. Hoe meer gegevens, hoe nauwkeuriger het algoritme – de instructies waarmee de AI-applicatie de taak uitvoert – zijn werk kan doen.” Er zijn inmiddels al meer AI-toepassingen die een diagnostische taak sneller, preciezer of met minder fouten uitvoeren dan specialisten van vlees en bloed. Twee jaar geleden kwamen onderzoekers van Google bijvoorbeeld met een algoritme dat op scans beter longkanker vindt dan artsen en onlangs ontwikkelden wetenschappers van TU Eindhoven, het Amsterdam UMC en het Catharina Ziekenhuis een algoritme dat op foto’s beter slokdarmkanker herkent.
Razendsnel
“Zonder context kun je al gauw denken dat kunstmatige intelligentie de radioloog overbodig maakt”, zegt Wouter. “Maar besef wel, dat zo’n vergelijking tussen slimme software en radiologen op één ziektebeeld de werkelijkheid enorm versimpelt. Radiologen moeten ook bedacht zijn op zeldzame ziekten of onverwachte presentaties van bekende aandoeningen. In radiologische tekstboeken staan al gauw twintigduizend diagnoses.” AI-applicaties zijn dus niet zozeer een vervanger van de radioloog, als wel een hulpmiddel waarmee zij preciezer hun werk kunnen doen. En sneller. Want behalve dat AI-applicaties één ding heel goed kunnen, hebben ze er meestal ook veel minder tijd voor nodig dan mensen.
Wouter: “Als je een CT-scan van het hele lichaam maakt, is die scan opgebouwd uit 1500 horizontale plakjes. Stel nou, dat je daarin het vet en de verschillende soorten spierweefsel wil onderscheiden en het volume ervan wil inschatten. Bij kankerpatiënten bijvoorbeeld slinken vet en spieren, en dat beeld zegt iets over hun gevoeligheid voor de ziekte en de behandeling. Een CT-scan van de buik bestaat uit zo’n 150 plakjes. Om de verschillende bestanddelen als vet en spieren te onderscheiden, kleuren we die in. Dat kost een radioloog ongeveer een half uur per plakje. Een AI-applicatie doet de 1500 plakjes van het hele lichaam in twaalf seconden.”
Bevolkingsonderzoek borstkanker
Slimme software die snel en gericht scans of röntgenfoto’s uitpluist, kan radiologen dus ontlasten. Zij krijgen meer tijd voor complexe diagnoses. En er is nog een voordeel: AI-applicaties kunnen helpen om wachttijden te verminderen. Als voorbeeld noemt Wouter de DENSE-studie die draait binnen het bevolkingsonderzoek naar borstkanker. Vanaf hun vijftigste jaar krijgen vrouwen tweejaarlijks een oproep om zich te laten controleren. Dit onderzoek gebeurt met mammografie, een röntgenfoto van de borst. Zo’n acht procent van de vrouwen heeft echter zulk dicht borstweefsel dat mammografie onvoldoende duidelijkheid geeft over de eventuele aanwezigheid van een tumor. De DENSE-studie laat zien dat een MRI-scan bij deze vrouwen een duidelijker beeld geeft: van elke 1000 vrouwen met heel dicht borstweefsel waren er 17 waarbij borstkanker wel met een MRI-scan werd opgespoord, terwijl op het mammogram geen afwijkingen te zien waren.
De minister van Volksgezondheid denkt nu na of de MRI-scan voor vrouwen met heel dicht borstweefsel aan het bevolkingsonderzoek moet worden toegevoegd. Wouter: “Het gaat om zo’n 80.000 vrouwen. Omdat zij een verhoogde kans op borstkanker hebben, is het extra belangrijk hen goed te screenen. Maar een MRI-scan is duurder dan mammografie en het beoordelen ervan duurt langer. Een bestaand AI-algoritme kan in de helft van de gevallen al uitsluiten dat het om kanker gaat. Die scans hoef je als radioloog dan niet meer te zien. Dat scheelt aanzienlijk in tijd en kosten. Bovendien worden er bij die 40.000 scans geen menselijke fouten gemaakt.”
Digitale infrastructuur
Met alle voordelen van dit soort AI-toepassingen zou je verwachten dat ze al op grote schaal in ziekenhuizen draaien of ingevoerd worden. Dat valt echter tegen. De reden hiervoor is simpel: de digitale infrastructuur om alles aan elkaar te koppelen, ontbreekt. Aan de ene kant heb je de ziekenhuizen, waar artsen werken met een PACS: een Picture Archiving and Communication System. PACS bestaat uit een netwerk van computers en servers (met specifieke software), dat het mogelijk maakt om de beelden (met verslag) van de afdeling radiologie, te verwerken, archiveren en te verspreiden naar de aanvragende medisch specialisten. Aan de andere kant zijn er wetenschappers en bedrijven met allerlei losse AI-applicaties.
Neem bijvoorbeeld een AI-applicatie om de slijtage in een reumahand te bepalen. Wouter: “Voor een radioloog zit er weinig uitdaging in het analyseren van boterosie en -versmalling, van gewrichtspleetjes en nieuwe botvorming. Dat is eentonig werk, maar het moet wel heel precies gebeuren. Stel nou, dat een promovendus daar een algoritme voor ontwikkelt. Dit algoritme werkt uiteindelijk preciezer dan ik en de software raakt niet afgeleid of vermoeid. Als de promovendus op een gegeven moment klaar is met zijn promotie, staat er een functionerende applicatie op zijn laptop, maar is het nog géén medisch product dat in het ziekenhuis gebruikt kan worden.” En zo zijn er allerlei losse AI-applicaties die bedrijven en wetenschappers hebben ontwikkeld: voor aorta’s, vet, spieren, borsten, prostaten enzovoort. Om die oplossingen technisch in te passen in de netwerken van ziekenhuizen, hebben we IMAGR ontwikkeld, een digitale infrastructuur die alles aan elkaar koppelt, zodat de AI-applicaties beschikbaar komen in het PACS en gekoppeld zijn aan HiX.
Eén standaard
IMAGR biedt één standaard, die ook aantrekkelijk is voor vendors: commerciële leveranciers van slimme software met een specifiek algoritme dat bijvoorbeeld via een koop- of pay-per-use-contract wordt aangeboden. Omdat deze software van externe bedrijven – in tegenstelling tot de meeste wetenschappelijk ontwikkelde algoritmen – al Europees gecertificeerd zijn, kunnen ziekenhuizen er direct mee aan de slag. Al die applicaties draaien met IMAGR, waardoor ze dus ook direct aan PACS en HiX gekoppeld zijn. Daarnaast is het goed voor de borging van privacy. Wouter: “Je wil liever geen patiëntgegevens in de cloud opslaan. Eén cloud provider is te overzien, maar met 200 AI-applicaties heb je dan op 200 verschillende plekken in de cloud patiëntgegevens staan. Met IMAGR blijft alles in dezelfde omgeving en binnen het ziekenhuis. Dat is wel zo praktisch.”
Op congressen en symposia merkt hij dat ziekenhuizen enthousiast reageren op IMAGR. Er is zoveel animo voor de inzet van AI, dat het echt tijd is voor een volgende stap. “Die zetten we nu samen met het medische IT-bedrijf Sectra. Zij kunnen IMAGR wereldwijd uitrollen naar andere ziekenhuizen.” Wat de samenwerking bijzonder maakt, is dat Sectra IMAGR niet koopt als in een gewone deal, maar dat beide partijen een gezamenlijk ontwikkeltraject aangaan. Wouter: “IMAGR draait al 24/7 in het UMC Utrecht. Met Sectra gaan we daar een aantal ziekenhuizen met slimme mensen bijhalen om zo samen de basis voor AI-implementatie verder uit te bouwen. Hoe je in de klinische praktijk met AI moet omgaan, welke veiligheidsmaatregelen je inbouwt, dat soort inzichten moet artsen zelf nog ontdekken. Wat er technisch kan en hoe je de interactie van radioloog met AI-algoritme opslaat, dat is iets wat Sectra moet gaan ontdekken. In die uitdagingen zit de kracht van de samenwerking: echte vooruitgang veréist een gezamenlijke aanpak.”
AI-uitdagingen
Kunstmatige intelligentie is wezenlijk anders dan ‘gewone’ analysesoftware. Een AI-algoritme is geen berekening maar het antwoord van een neuraal netwerk op een bepaalde input. Hoe en op welke data het algoritme is getraind, is daarbij essentieel, stelt Wouter. “Kent het algoritme ons soort patiënten wel? Anders gezegd: kan het algoritme omgaan met ziekteverschijnselen in Nederlandse patiënten als het is getraind op Amerikanen? Andere belangrijke vraag: hoe maak je inzichtelijk waarop het algoritme zijn antwoord baseert? Welke bevinding gaf de doorslag? Dat is nodig om zo mogelijk van te leren, maar ook om het risico op bias – vooringenomenheid – te minimaliseren. Een derde uitdaging is het zogeheten versioning. Tussen opeenvolgende versies kan de vendor het algoritme verder hebben getraind. Stel, dat een patiënt een jaar geleden voor het laatst gecheckt is op een bepaalde aandoening en dat het algoritme nu ineens een veel hoger risico daarop aangeeft: ligt dat dan aan de verslechterende gezondheid van de patiënt of aan het algoritme dat zich in dat jaar verder ontwikkeld heeft? Het is cruciaal om dat precies te weten. Daarom moeten we oudere versies van het algoritme kunnen oproepen om de vergelijking te kunnen maken: wat is er in versie twee veranderd ten opzichte van versie één?”
Zo zijn er meer uitdagingen waarvoor kunstmatige intelligentie ontwikkelaars stelt, zoals logging (het bijhouden van alle gebeurtenissen in een programma zodat je eventuele fouten kunt opsporen), het opslaan van feedback (wat maakt dat het programma leert?) en het opslaan van de afwezigheid van bevindingen. Wouter: “We moeten inzichtelijk maken hoe AI werkt. En we willen voorzichtig beginnen, met zaken die voor patiënten wel nuttig maar niet risicovol zijn. En we moeten letten op veilig gebruik: hoe verwerk je dat in de richtlijnen voor medisch personeel? Daarom willen we als medici betrokken blijven bij de uitrol en verdere uitbouw van IMAGR. Zo kunnen we blijven meesturen.”
Ten slotte kan ook de wetenschap profiteren van de AI-inzet in ziekenhuizen. Wouter noemt IMAGR daarom een snelweg in twee richtingen. Hij ziet het programma als een digitale infrastructuur die het mogelijk maakt om AI-applicaties voor beeldverwerking in ziekenhuizen te faciliteren en omgekeerd om wetenschappelijk onderzoek te voeden met een schat aan klinische gegevens. “Hoe meer gegevens er beschikbaar komen, hoe beter het is: daar kunnen we massaal van leren.”
De IMAGR-software is het resultaat van een samenwerkingsverband binnen de divisie Beeld van het UMC Utrecht. De kerngroep bestaat uit Wouter Veldhuis van Radiologie en Edwin Bennink, Christian Mol, Hugo Kuijf en Koen Vincken van het Image Sciences Institute (ISI). Eerder ontwikkelde Veldhuis onder meer de myBody-myData-app.