Kennisportal
Kennisportal is een kennisplatform met een focus op de brede doelgroep Business en IT.

Honderdduizenden variabelen naar een unieke DNA Fingerprint: een stap naar ‘personalized medicine’

SAS & Finaps dragen bij aan kankeronderzoek tijdens de Beyond Banking Hackathon
Team: Joost Huiskens, Rik de Ruiter, Turan Bulmus, Michael van Elk en Joran Roor
Artikel door: Joran Roor & Michael van Elk

Beyond Banking Hackathon

Begin juni organiseerde ABN-AMRO de 48-uurs hackathon Beyond Banking in de Sugar City in Halfweg. Er waren acht cases waaraan deelgenomen kon worden, waaronder de healthcare case, welke tot stand is gekomen in samenwerking met het Erasmus MC en het UMC Groningen. Zij waren benieuwd of data scientists in staat zouden zijn om nieuwe inzichten te halen uit genetische data van de patiënt, met als doel om kanker beter te begrijpen en behandelingen beter aan te laten sluiten bij het genetisch profiel van de patiënt.

Zowel SAS als Finaps zijn al actief betrokken bij het invoeren van advanced analytics in de gezondheidszorg, met projecten zoals het CAESAR-Project en Big Data for Small Babies. SAS en Finaps hebben deze mogelijkheid om bij te dragen aan onderzoek naar kanker met enthousiasme aangegrepen, en hebben samen een team gevormd dat heeft deelgenomen aan deze case.

Accelerating Cancer Research

Onderzoek naar behandelingen voor kanker gebeurt momenteel door naar een groep patiënten te kijken, om zo te bepalen welke behandeling effectief is en welke niet. Het is bekend dat zowel de genetische opmaak van de patiënt als de specifieke mutaties in de tumor van grote invloed kunnen zijn op de effectiviteit van een therapie. Idealiter zou deze informatie meegenomen worden in de afweging tussen verschillende behandelingen.

Door vooruitgang in de technologie om genetische informatie van een patiënt te verwerven is deze informatie steeds goedkoper en gemakkelijker te verkrijgen. De hoop is dat deze gegevens niet alleen meer inzicht kunnen geven in de moleculaire basis van de ziekte, maar ook kan helpen bij het bepalen van de beste behandeling voor de individuele patiënt. Het ideaalbeeld is een nieuw tijdperk van gepersonaliseerde zorg, waarbij iedereen een behandeling op maat krijgt.

Er zijn veel verschillende soorten genetische informatie die we kunnen verkrijgen. De bekendste hiervan gaat over de volgorde van het DNA, ook wel genomics genoemd. Verder is er epigenomics (een vorm van regulatie van uitdrukking van DNA), transcriptomics (de uitdrukking van het DNA, op meerdere manieren gemeten), en proteomics (de uiteindelijke uitdrukking van eiwitten).

Vanwege de grote hoeveelheid informatie die op deze wijze per patiënt verkregen kan worden, blijkt het voor artsen en medisch onderzoekers een grote uitdaging om deze data in kaart te brengen of om er conclusies uit te trekken. De medische wereld heeft dus een grote behoefte aan data scientists die deze gegevens op een geïntegreerde manier kunnen analyseren om hier nieuwe inzichten uit te halen.

Onderzoeksvragen

Voor de Healthcare Challenge werden meerdere onderzoeksvragen geformuleerd. Deze dienden als richtlijnen, het was aan de teams om een aanpak te verzinnen die een of meerdere van deze vragen zo goed mogelijk zou beantwoorden. Deze vragen waren:

  • Is het mogelijk de correlaties tussen de verschillende datasets visualiseren?
  • Is het mogelijk om patiënten te verdelen in subtypes op basis van genetische informatie?
  • Is het mogelijk om overleving in te schatten op basis van genetische informatie?
  • Is het mogelijk om de respons op therapie te voorspellen op basis van de genetische informatie?

Aanpak

Voor het oplossen van deze problemen en het beantwoorden van de onderzoeksvragen is de volgende aanpak geformuleerd:

  • Inladen, schoonmaken en samenvoegen van de datasets.
  • Het reduceren van het aantal variabelen om tot een zogenaamde Personal Multi-omics Fingerprint te komen voor elke patiënt.
  • Het zoeken naar subtypes op basis van deze vingerafdruk.
  • Onderzoeken of deze subtypes verschillen in overleving of respons op chemotherapie.

De aanpak en de technische details van het onderzoek zullen worden behandeld in de volgende blog.

Voorlopige resultaten wijzen op onderscheidende methode

Op basis van enkel de Personal Multi-omics Fingerprint is onderstaande Kaplan-Meier overlevingsgrafiek gemaakt.

Er is duidelijk te zien dat er twee groepen zijn te onderscheiden die een sterk uiteenlopende overlevingsverwachting laten zien. Deze groepering is dus te maken door alleen informatie te gebruiken dat afkomstig is van de genetische informatie van de patiënt, zonder te kijken naar klinische variabelen zoals leeftijd, geslacht, stadium van de tumor etc. Sterker nog, tussen de klinische gegevens van de groepen blijkt geen significant verschil te bestaan. Dit betekent dus dat deze nieuwe methode van patiëntclassificatie op basis van de Personal Multi-omics Fingerprint niet mogelijk was op basis van enkel de klinische gegevens, waar artsen momenteel hun prognose op baseren. Dit is een sterke aanwijzing dat deze methode van toegevoegde waarde kan zijn in de klinische praktijk.

Dankwoord

Het team is dankbaar voor deze kans om een kleine bijdrage te hebben kunnen leveren aan kankeronderzoek. Specifieke dank gaat uit naar de organisatoren van de hackathon, Tjebbe Tauber van ABN-AMRO, en alle artsen en onderzoekers van het Erasmus MC en het UMC Groningen:

  • Prof. Dr. Ing. Peter van der Spek (Erasmus MC Rotterdam)
  • Prof. Dr. Harry Groen (UMCG, Groningen)
  • Prof. Dr. Joachim Aerts (Erasmus MC Rotterdam)
  • Daan Hurkmans (Erasmus MC Rotterdam)
  • Menno Tamminga (UMC Groningen)
  • Rogier van Wijck (Erasmus MC Rotterdam)

Wil je meer weten over toekomstige onderwerpen die een rol gaan spelen in de gezondheidszorg? Lees dan deze white paper: Machine learning toepassingen in de zorg.