Algoritmes ontrafelen de dynamiek in cellen, en wat dit betekent voor doelgerichte therapieën
Moderne technologie kan de expressie van duizenden genen in cellen monitoren. Maar om echt te begrijpen hoe een cel belangrijke functies uitvoert en zich aanpast aan veranderingen in de omgeving, moeten we de wisselwerking tussen deze genen doorgronden. Innovatieve, aan de TU Delft ontwikkelde, algoritmes leggen de fundamentele bouwstenen van cellulaire processen bloot, in zowel gezonde als zieke cellen – met nieuwe behandelmogelijkheden in het vooruitzicht.
Organen, zoals het hart en de longen, zijn de bouwstenen van het menselijk lichaam. De organen zelf bestaan weer uit grote aantallen cellen. Door de nauwe samenwerking tussen deze cellen kunnen de organen de benodigde taken uitvoeren zodat het lichaam kan functioneren in een variërende omgeving. Op een nog veel kleinere schaal, in de cellen zelf, vindt ook samenwerking plaats. Zodra een cel zich moet aanpassen aan een verandering in de omgeving zal de expressie (activiteit) van bepaalde genen toenemen of juist afnemen. Dit leidt tot het aanmaken van proteïnen. Dit zijn eiwitten die een specifieke taak hebben binnen een cel. Deze verschillende proteïnen werken vervolgens samen om een taak uit te voeren binnen de cel. Een complexe biologische reactie is vaak het gevolg van meerdere groepen van genen die tijdelijk met elkaar samenwerken, waarbij elke groep een kleine, goed gedefinieerde, taak uitvoert. ‘Deze actieve groep groepen van genen kan je zien als functionele modules,’ zegt Joana Gonçalves, universitair docent aan de faculteit Elektrotechniek, Wiskunde en Informatica van de TU Delft. ‘Ze kunnen variëren tussen verschillende celtypes, en ook tussen gezonde en zieke cellen. Wij ontwikkelen algoritmes om deze functionele modules, en de verschillen daarin, bloot te leggen.’
Als computerwetenschappers voegen wij een frisse, onbevooroordeelde, blik toe aan het vakgebied van de biologie.
Tijdsbewust
‘Ik ben al een tijdje geïntrigeerd door het paradigma om biologische systemen vanuit modulariteit te analyseren,’ zegt Gonçalves. ‘Cellen die zichzelf in levende wezens organiseren tot organen zijn een voorbeeld van modulariteit als een structureel concept, met modules als fysieke bouwstenen. Andere voorbeelden hiervan zijn woorden die zinnen vormen in een tekst, en pixels die objecten vormen in een afbeelding. Maar er is ook zoiets als functionele modulariteit, zoals genen en proteïnen die gecoördineerd samenwerken om een biologische taak uit te voeren.’ Een belangrijk kenmerk van functionele modulariteit is dat het plaatsvindt over een bepaalde tijdsspanne. Om de dynamiek van cellulaire processen te ontrafelen, analyseren de onderzoekers de expressie van genen zoals die op meerdere tijdstippen is gemeten. Moderne technologie kan dit gelijktijdig doen voor alle genen in een cel. Het doel van het onderzoek is om groepen genen te identificeren die een vergelijkbare expressie vertonen, als aanwijzing voor functionele verwantschap. Een van de uitdagingen hierbij is dat zowel het aantal functionele modules als de duur van de biologische taken die zij uitvoeren, van tevoren onbekend zijn. ‘De meeste methodes die beschikbaar zijn voor het analyseren van deze data, zoals de traditionele algoritmes voor het zoeken naar clusters kijken naar de expressie van genen gemeten over alle tijdstippen,’ legt Gonçalves uit. ‘Dit is prima voor het ontdekken van genen die betrokken zijn bij de meer algemene biologische processen, maar niet om inzicht te krijgen in de meer “lokale” afstemming zoals die vaak plaatsvindt bij een adaptieve respons. Zogenoemde “eerste respons” genen zullen bijvoorbeeld alleen aan het begin van een proces getriggerd worden, maar zullen in latere stadia mogelijk geen coördinerende rol meer spelen. Als we over de gehele tijdsspanne van de data een hoge mate van gelijkenis vereisen, zullen we deze lokale effecten mogelijk over het hoofd zien.’ Er bestaan ook methodes voor het zoeken naar lokale patronen, maar deze zijn niet specifiek ontworpen voor de analyse van tijdreeksen. Ze kunnen functionele modules vinden met willekeurige sprongen in de tijd. Deze zijn moeilijk te interpreteren, en misschien zelfs onrealistisch. ‘De informatie zit in de data,’ zegt Gonçalves, ‘maar het is belangrijk deze op de juiste manier te behandelen en te interpreteren. Hiervoor hebben we nieuwe algoritmes moeten ontwikkelen, algoritmes die tijdsbewust zijn en die lokale patronen kunnen detecteren.’
We gebruiken de eigenschappen van tijd om efficiënte algoritmische methodes te ontwerpen voor de analyse van tijdreeksen.
UDDNNNUUUD
Domweg alle mogelijke combinaties van genen doorzoeken op functionele modules van willekeurige tijdsduur zou wel eens oneindig lang kunnen duren. ‘We maken daarom graag gebruik van de eigenschappen van tijd om nuttige algoritmische technieken toe te passen,’ legt Gonçalves uit. ‘Het feit dat tijd een strikte chronologische volgorde heeft, geeft ons een richting waarlangs we moeten zoeken. En omdat we mogen verwachten dat biologische processen zich binnen een bepaalde tijdsduur afspelen, kunnen we een redelijke beperking opleggen aan het aantal opeenvolgende meetpunten waarbinnen een functionele module gevonden moet worden.’ Misschien wel het belangrijkste aspect van hun aanpak is dat de onderzoekers kijken naar het patroon in de expressie van de genen, en niet naar de exacte waardes. Als bijvoorbeeld de expressie van twee genen op een bepaald moment met een factor drie toeneemt, dan kan dit een match zijn, ook al is er een groot verschil tussen de beginwaarden van beide genen. Voor hun data-analyse bepalen de onderzoekers dan ook of de genexpressie tussen twee opeenvolgende meetpunten omhoog gaat (‘U’, up), omlaag (‘D’, down) of onveranderd blijft (‘N’, no change). Het gaat hierbij om de snelheid van de verandering in expressie. ‘Dit is slechts een van de mogelijke manieren waarop we de data kunnen discretiseren,’ zegt Gonçalves. ‘Door genexpressie om te zetten in een lettercode kunnen we efficiënte string-matching algoritmes gebruiken voor het zoeken naar modules. We zoeken naar modules met een maximale lengte die niet volledig binnen een andere module vallen.’ De waargenomen patronen moeten exact overeenkomen, zoals “UDDNNNUUUD”, en dankzij de discretisatiestap is de techniek ongevoelig voor kleine variaties in de gemeten data als gevolg van ruis. Het meest recente algoritme van de onderzoekers staat ook nog eens toe dat deze patronen in de tijd verschoven zijn ten opzichte van elkaar. Hierdoor kunnen ze ook modules vinden waarbinnen genen met enige vertraging (op elkaar) reageren. Dankzij het slimme ontwerp van hun LateBiclustering algoritme volstaat een eenvoudige desktopcomputer voor vrijwel elke beschikbare genexpressie dataset.
Modules verfijnen
Een van de valkuilen van combinatorische algoritmes is dat ze een te grote hoeveelheid resultaten kunnen opleveren. ‘We hebben daarom strategieën ontwikkeld om alleen de beste modules te selecteren, aan de hand van verschillende statistische criteria,’ licht Gonçalves toe. ‘Zo bepalen we van iedere module de waarschijnlijkheid dat we deze toevallig zouden ontdekken, gebaseerd op het patroon van de module en het aantal genen en meetpunten daarin. We kijken bijvoorbeeld ook hoe vaak “up”, “down” en “no change” in een bepaalde functionele module voorkomen, in verhouding tot hun aanwezigheid in de gehele dataset.’ Deze criteria zijn puur op de meetdata gebaseerd. Daarnaast gebruiken de onderzoekers ook biologische databases. Hiermee toetsen ze de consistentie in de biologische rol van de verschillende genen in een functionele module. ‘Met deze en andere statistieken filteren en rangschikken we de modules, waarna we de meest veelbelovende kandidaten kunnen gebruiken voor verdere experimentele validatie.’
Terug naar de biologie
De onderzoekers hebben eerst publiekelijk beschikbare meetdata gebruikt als proof of concept. Voor de daaropvolgende experimentele validatie werkten ze nauw samen met biomedisch onderzoekers van het Nederlands Kanker Instituut (NKI). ‘Omdat de genen in een functionele module vergelijkbaar gedrag vertonen, was ons idee dat ze wel eens door eenzelfde zogenoemde regulator kunnen worden aangestuurd,’ legt Gonçalves uit. Regulators zijn biologisch interessant omdat ze bepalen van welke genen de activiteit toeneemt en in welke mate. Zo bezien zitten ze een stap hoger in de organisatie van de cel, als een soort manager die een collectie van genen aanstuurt. ‘We hebben deze regulators geïdentificeerd aan de hand van een aanpak waarover ik al tijdens mijn promotie publiceerde. Dit hebben we nu gecombineerd met ons tijdsbewuste zoek-algoritme.’ De onderzoekers hebben hiermee de respons van menselijke prostaatkankercellen op androgenen (mannelijke hormonen) geanalyseerd. De werking van enkele van deze geïdentificeerde regulators is bij daaropvolgende validatie-experimenten onderdrukt. En inderdaad zagen de onderzoekers consistente veranderingen in genexpressie in de functionele modules die deze regulators zouden moeten aansturen. ‘Dankzij de samenwerking met het NKI hebben we laten zien dat onze algoritmes kunnen bijdragen aan het vergroten van biologisch inzicht en kennis,’ aldus Gonçalves.
Doelgerichte therapie
Het analyseren van genexpressie over tijd is noodzakelijk voor het vergroten van onze kennis van complexe biologische processen zoals normale groei en ontwikkeling van het menselijk lichaam, vatbaarheid voor ziekte en de progressie daarvan, en of en hoe een behandeling zal aanslaan. Alhoewel het nog wel even duurt voordat we hiermee kanker kunnen genezen, zullen deze nieuwe technieken wel degelijk nieuwe targets opleveren voor nog te ontwikkelen medicijnen. Prostaatkanker wordt bijvoorbeeld sterk beïnvloed door androgenen. De standaardbehandeling blokkeert het binden van androgenen aan het zogenoemde androgeen-receptor gen, een bekende regulator van de androgeenreactie. Bij veel patiënten ontwikkelen de kankercellen echter immuniteit tegen deze behandeling. Daarom is het belangrijk om nieuwe alternatieve targets te vinden voor de behandeling van deze kanker. ‘We hebben laten zien dat onze algoritmes hier een veelbelovende bijdrage aan kunnen leveren,’ zegt Gonçalves. ‘Door te ontrafelen hoe prostaatkankercellen reageren op androgenen kunnen we achterhalen hoe functionele modules en biologische mechanismes bijdragen aan de progressie van deze ziekte. Bij het ontwikkelen van nieuwe medicijnen is het beïnvloeden van een enkele regulator van zo’n mechanisme een veel eenvoudiger target dan het afzonderlijk manipuleren van alle genen in een functionele module.’ Een van de eerstvolgende stappen van de onderzoekers is het ontwikkelen van algoritmes die functionele modules kunnen identificeren aan de hand van meerdere samples tegelijk. Denk aan verschillende soorten weefsel, weefsel van meerdere patiënten of van meerdere gebieden binnen dezelfde tumor. ‘Met deze volgende algoritmes kunnen we meer robuuste patronen ontdekken en, bijvoorbeeld, functionele modules identificeren die enkel en alleen in kankercellen ontregeld zijn en niet in gezonde cellen. Dit kunnen we dan therapeutisch uitbuiten,’ zegt Gonçalves. ‘We kunnen ook modules vinden die alleen in bepaalde groepen patiënten van belang zijn. Op basis van zulke informatie kunnen deze groepen dan een andere behandeling voorgeschreven krijgen.’ Tot nu toe hebben de onderzoekers alleen zogenoemde modelsystemen onderzocht, zoals gekweekte kankercellijnen. Deze zijn veel homogener van samenstelling dan de tumoren in patiënten. ‘Een grote uitdaging bij het ontwikkelen van nieuwe medicijnen is dan ook het vertalen van nieuwe kennis en inzichten vanuit zulke modelsystemen naar daadwerkelijke tumoren in patiënten,’ aldus Gonçalves.
Onze algoritmes openen nieuwe mogelijkheden voor doelgerichte therapieën door groepen samenwerkende genen te ontdekken, en de regulators die deze aansturen.
Een frisse blik
Omdat Gonçalves overwoog om geneeskunde te gaan studeren, was biologie een van de vakken op haar eindlijst. Ze koos uiteindelijk voor de studie computerwetenschappen. De professor Algoritmiek bij wie ze wilde afstuderen, bleek echter met name aan biologische vraagstukken te werken. Sindsdien is ze gegrepen door de bioinformatica. Omdat hun achtergrond nogal verschillend is, kost het zowel biologen als computerwetenschappers enige inspanning om elkaar goed te begrijpen. Daar staat tegenover dat de samenwerking ook tot anders onbereikbare resultaten leidt. ‘Biologen hebben diepgaande kennis van experimentele technieken en biologische systemen,’ zegt Gonçalves. ‘Op basis daarvan doen ze aannames en interpreteren ze de resultaten. Als computerwetenschappers, met veel minder voorkennis, voegen wij hier een aanvullend perspectief aan toe. Wij gaan volkomen objectief met de data om, zien interessante patronen daarin, en stellen dan vragen daarover. We bekijken biologische systemen met een frisse blik, wat soms leidt tot verrassende bevindingen.’ Gonçalves onderhoudt nauwe banden met het NKI, en werkt daarnaast met groepen binnen het LUMC en het Erasmus MC aan verschillende gezamenlijke projectaanvragen.
Tekst: Merel Engelsman | Foto: Mark Prins