Welke moleculaire aanwijzingen zijn er dat het leven op Aarde een gemeenschappelijke oorsprong heeft?

Douglas Theobald
Michael Aelbrecht

“We hebben schattingen verkregen van genetische differentiatie tussen mensen en mensapen niet groter dan die tussen fysiek niet te onderscheiden soorten fruitvliegjes.”

Elizabeth J. Bruce and Francisco J. Ayala. Humans And Apes Are Genetically Very Similar, Nature 276: 264, Nov. 16, 1978

Moleculaire sequenties geven het meest indrukwekkende en sterkste bewijs voor de genealogische verwantschap van alle leven op aarde. De aard van moleculaire sequenties laat toe om erg precieze waarschijnlijkheidsberekeningen te maken die laten zien hoe goed de voorspellingen gemaakt vanuit het perspectief van gemeenschappelijke afkomst met modificaties, overeenstemmen met empirische observatie. Gemeenschappelijke afkomst kunnen we dus zien als een deductie die direct volgt uit enkele premissen gebaseerd op empirisch waargenomen moleculair bewijs.

Functionele redundantie van proteïnen

Dit deductieve argument is bijzonder omdat het het enige is waarbinnen we kunnen besluiten dat similariteit verwantschap impliceert. Het besluit hangt af van de similariteit van biologische structuren binnen een specifieke context: de gelijkenis van omnipresente genen van verschillende soorten. De volgende discussie is een tikje technisch, dus stellen we ze eerst overzichtelijk voor in de vorm van een deductief argument: enkele premissen gevolgd door een logische, afgeleide conclusie.

De kern van het argument

  • Premisse 1: Omnipresente genen: er zijn bepaalde genen die alle levende organismen hebben omdat ze zeer basische functies vervullen en dus noodzakelijk zijn voor het leven zoals wij het kennen: dit zijn de ‘ubiquitous genes’ (omnipresente genen)
  • Premisse 2: ‘Ubiquitous genes’ hebben geen verband met soortspecifieke fenotypes: een bepaald soortspecifiek kenmerk wordt nooit bepaald door ‘ubiquitous genes’. Het maakt niet uit of je een mens, bacterie, kikker, walvis, slak of schimmel bent – je hebt deze genen en ze voeren allemaal dezelfde basische biologische functie uit, noodzakelijk voor elk organisme.
  • Premisse 3: Moleculaire sequenties van ‘ubiquitous genes’ zijn functioneel redundant: elk ‘ubiquitous’ proteïne komt voor in een zeer groot aantal verschillende, functioneel equivalente vormen. D.w.z. dat elke vorm (≈sequentie) dezelfde functie kan uitvoeren, er zijn dus meer versies van het eiwit dan strikt noodzakelijk, dit is functionele redundantie.
  • Premisse 4: Specifieke ‘ubiquitous genes’ zijn niet vereist in enige soort: het maakt niet uit welke van de vele mogelijke sequenties voor een bepaald ‘ubiquitous’ gen een organisme nu net bezit. Er is slechts 1 van de functioneel equivalente vormen nodig, onafhankelijk van de rest van het genetisch materiaal.
  • Premisse 5: Erfelijkheid correleert sequenties, zelfs in de afwezigheid van functionele noodzakelijkheid: er is slechts 1 waargenomen mechanisme dat ervoor zorgt dat 2 verschillende organismen ‘ubiquitous genes’ hebben met gelijkaardige sequenties. Dat mechanisme is erfelijkheid, het doorgeven van genen aan het nageslacht.

Conclusie: Dus, gelijkaardige ‘ubiquitous genes’ tonen genealogische verwantschap aan: het volgt dus dat organismen die gelijkaardige sequenties hebben voor ‘ubiquitous genes’, verwant zijn aan elkaar. De enige reden waarom ze gelijkaardige sequenties hebben i.p.v. totaal verschillende, wat a-priori aannemelijk is gezien het enorme aantal mogelijkheden, is door erfelijkheid. Ruw gezegd, hoe gelijkaardiger de sequenties, hoe dichter de genealogische relatie.

Uitgebreide discussie

De aminozuursequenties van proteïnen worden vaak gebruikt om fylogenetische verwantschappen tussen soorten vast te stellen. Sequentiestudies met functionele genen hebben steeds betrekking op ‘ubiquitous genes’ (alle organismen hebben ze). Dit wordt gedaan om er zeker van te zijn dat de sequentie vergelijkingen onafhankelijk zijn van het algemene species fenotype, zodat we geen vertekend beeld krijgen.

Stel bv. dat we de proteïne-sequentie van een chimpansee en een mens vergelijken. Beide dieren hebben vele gelijkaardige anatomische en functionele kenmerken, dus we kunnen verwachten dat hun proteïnen ook gelijkaardig zullen zijn, ongeacht of beide dieren nu genealogisch verwant zijn of niet. Het onderzoek zou zo tot verkeerde resultaten kunnen leiden, namelijk het veronderstellen van verwantschap die er niet is. We kunnen echter ook de sequentie vergelijken van enkele fundamenteel noodzakelijke genen die voorkomen bij alle organismen (plant, dier of zelfs bacterie), zoals het cytochroom c gen.

Cytochroom c is een essentieel en omnipresent proteïne dat we terug vinden in alle organismen, van eukaryoten tot bacteriën (Voet and Voet 1995, p. 24). De mitochondria in cellen bevatten cytochroom c, waar het elektronen transporteert in een fundamenteel metabolisch proces, nl oxidatieve fosforylatie. De zuurstof die we inademen dient in dit energieleverend ‘verbrandingsproces’ als eindbestemming voor de elektronen (Voet and Voet 1995, pp. 577-582).

Als we een ‘ubiquitous gene’ zoals cytochroom c gebruiken, is er geen a-priori reden om aan te nemen dat twee organismen een zelfde of een zelfs maar gelijkaardige proteïne sequentie zouden hebben, tenzij ze genealogisch gerelateerd zouden zijn. Dit is deels vanwege de functionele redundantie van proteïne sequenties en structuren. Functionele redundantie wil hier zeggen dat vele verschillende proteïne-sequenties (dus een andere volgorde van aminozuurbouwstenen) in grote lijnen dezelfde structuur kunnen vormen en dezelfde biologische rol vervullen. Cytochroom c is een extreem redundant proteïne vermits vele ongelijkaardige sequenties toch allemaal cytochroom c elektrontransport proteïnes vormen. Functionele redundantie is niet per se exact in termen van performantie: sommige cytochroom c sequenties zijn lichtjes beter in elektronen transport dan andere.

Decennia aan biochemisch bewijs hebben laten zien dat vele aminozuur mutaties (puntmutaties), vooral van aminozuren die zich aan de oppervlakte van een proteïne bevinden, slechts een klein effect hebben op de functie en structuur van het eiwit (Branden and Tooze 1999, Ch. 3; Harris et al. 1956; Lesk 2001, Chs. 5 and 6, pp. 165-228; Li 1997, p. 2; Matthews 1996). Een zeer sterk voorbeeld wordt gegeven door c-type cytochromen van allerlei bacteriën, dewelke vrijwel volledig verschillen in hun sequentie, maar toch allemaal dezelfde 3D structuur vormen en dezelfde biologische rol vervullen (Moore and Pettigrew 1990, pp. 161-223; Ptitsyn 1998).

Zelfs op het soortniveau zijn de meeste aminozuur mutaties functioneel non relevant. Er zijn bv. minstens 250 bekende aminozuur mutaties in menselijk hemoglobine, die geen klinische manifestatie hebben in zowel heterozygotische als homozygotische individuen (Bunn and Forget 1986; Voet and Voet 1995, p. 235). Het fenomeen van functionele redundantie in proteïnen is zeer algemeen en goed gedocumenteerd in alle bekende proteïnen en genen.

Met dit in het achterhoofd herinneren we ons dat cytochroom c absoluut essentieel is voor het leven, organismen kunnen niet zonder. Het is reeds aangetoond dat het menselijk cytochroom c werkt in gist waaruit het eigen cytochroom c gen werd verwijderd, desondanks het feit dat gist cytochroom c voor meer dan 40% verschilt met het menselijk cytochroom c (Tanaka et. al 1988a; Tanaka et al. 1988b; Wallace and Tanaka 1994). Verder nog, de cytochroom c genen van tonijn (vis), duif (vogel), paard (zoogdier), fruitvlieg (insect) en rat werken allemaal in gist zonder een eigen cytochroom c gen (Clements et al. 1989; Hickey et al. 1991; Koshy et al. 1992; Scarpulla and Nye 1986). Daarbij werd er aangetoond dat het grootste deel van de cytochroom c sequentie eigenlijk niet nodig is voor het correct functioneren van het eiwit (Hampsey et al. 1986; Hampsey et al. 1988). Slechts ongeveer een derde van de 100 aminozuren in cytochroom c zijn vereist voor de in vivo functie. De meeste aminozuren zijn dus hypervariabel, d.w.z. ze kunnen vervangen worden door een groot aantal functioneel gelijkaardige aminozuren (Dickerson and Timkovich 1975). Gebaseerd op deze genetische analyses heeft Hubert Yockey berekend dat er minimum 2.3 x 1093 mogelijke functionele cytochroom c sequenties bestaan (Hampsey et al. 1986; Hampsey et al. 1988; Yockey 1992, Ch. 6, p. 254). In perspectief geplaatst, dit nummer is een miljard maal groter dan het aantal atomen in het zichtbare heelal, onbevattelijk groot dus. Er is daarom geen a-priori reden om aan te nemen dat 2 verschillende soorten eenzelfde of zelfs een redelijk gelijkaardige cytochroom c sequentie zouden hebben. Dit omdat de kans hierop zo waanzinnig klein is vanwege het gigantische aantal mogelijke sequenties.

Bij een wetenschappelijke statische analyse stelt de ‘null hypothese’ dat de identiteit van niet-essentiële aminozuren in het cytochroom c proteïne van mensen en chimpansees willekeurig zou moeten zijn tegenover elkaar. We weten echter dat mensen en chimpansees vrij nauw verwant zijn. We voorspellen daarom dat menselijk en chimpansee cytochroom c veel gelijkaardiger zal zijn dan bv. menselijk en gist cytochroom c, gewoon door erfelijkheid.

Confirmatie

Mensen en chimpansees hebben exact dezelfde cytochroom c proteïne-sequentie. De eerder gegeven ‘null hypothese’ is dus foutief. Zonder het mechanisme van gemeenschappelijke afkomst zou de kans hierop kleiner zijn dan 1 op 1093 (nog veel straffer dan vele malen de lotto achter elkaar winnen). D.w.z., de hoge gelijkaardigheid van deze proteïnen is een spectaculaire bevestiging van de theorie van de gemeenschappelijke afkomst. Verder nog, menselijk (en chimpansee) cytochroom c verschilt in slechts 10 aminozuren van alle andere zoogdieren. De kans hierop zonder dat erfelijkheid zou meespelen is minder dan 1 op 1029. De gist Candida krusei is een van de minst met de mens verwante eukaryotische organismen. Candida heeft 51 aminozuur verschillen met de menselijke sequentie. De kans hierop (zonder het mechanisme van erfelijkheid) is minder dan 1 op 1025.

Kritiek

Een mogelijke, maar onwaarschijnlijke, tegenwerping is dat de kleine verschillen in functionele performantie tussen de verschillende cytochromen c verantwoordelijk zou zijn voor deze sequentie gelijkaardigheid. Dit is onwaarschijnlijk vanwege het enorm grote aantal zogoed als equivalente sequenties die fenotypisch niet te onderscheiden vallen voor elk vereist niveau aan performantie. Sterk verschillende sequenties kunnen eenzelfde performantie hebben. Omgekeerd hebben bijna gelijke sequenties niet altijd een gelijke performantie.

Laten we voor de volledigheid toch even de veronderstelling maken dat cytochroom c dat sneller elektronen transporteert (performanter is), nodig is in organismen met een actiever metabolisme of hoge graad aan spiercontractie. In zulk geval zouden we kunnen verwachten een patroon waar te nemen waar gelijkaardige sequenties correleren met gelijkaardige leefomgevingen of fysiologische kenmerken. Dit patroon bestaat echter niet in de natuur. Bv. vleermuis cytochroom c lijkt veel meer op menselijk cytochroom c dan op kolibrie cytochroom c; bruinvis (een dolfijnachtig wezen) cytochroom c lijkt veel meer op menselijk cytochroom c dan op dat van een haai.

Samengevat

We weten dat voor vele ‘ubiquitous proteines’ (zoals cytochroom c) er een enorm aantal equivalente sequenties bestaan die allemaal een naar behoren werkend proteïne opleveren, in eender welk organisme. Als we dus in 2 organismen een (zeer) gelijkaardige sequentie aantreffen voor een bepaald ‘ubiquitous proteine’, weten we dat er iets aan de hand is. Waarom zouden ze immers gelijkaardige sequenties hebben als de kans hierop astronomisch klein is? Momenteel kennen we slechts één reden waarom organismen gelijkaardige sequenties (in de afwezigheid van functionele noodzakelijkheid) zouden hebben: erfelijkheid. Zodus, in deze gevallen kunnen we met vertrouwen zeggen dat de 2 organismen in kwestie genealogisch verwant zijn. Sequentie gelijkaardigheid is dus niet enkel een test van de theorie van gemeenschappelijke afkomst, gemeenschappelijk afkomst is ook een deductie van het principe van erfelijkheid en de observatie van sequentie gelijkaardigheid. Als laatste, de voorgaande bespreking gaat niet enkel op voor cytochroom c; alle ‘ubiquitous proteines’ die vergeleken zijn tussen mensen en chimpansees zijn zeer gelijkaardig en er zijn veel vergelijkende onderzoeken gedaan.

Potentiële falsificatie

De basis van dit argument kan gemakkelijk ondergraven worden als men kan aantonen dat ofwel

  • Soort specifiek cytochroom c is exclusief functioneel in de respectieve organismen.
  • Geen andere cytochroom c sequentie kan functioneren in een organisme buiten het eigen cytochroom c.
  • Er is een mechanisme ander dan erfelijkheid dat causaal de sequentie van een ‘ubiquitous proteine’ kan correleren met een specifieke morfologie.

 

DNA coding redundantie

Zoals bij proteïne-sequentie gelijkaardigheid, impliceert ook DNA-sequentie gelijkaardigheid van 2 ‘ubiquitous genes’ gemeenschappelijke afkomst. Dit hoeft natuurlijk niet te verwonderen gezien het DNA codeert voor de proteïnen. Er is op DNA niveau echter nog een extra redundantie. De genetische code is namelijk informationeel redundant (gedegenereerde code). Gemiddeld zijn er 3 verschillende codons (= 3 achtereenvolgende basen) die elk voor hetzelfde aminozuur coderen. Er is dus geen strikt 1 op 1 verband waarbij elk aminozuur door slechts 1 codon gecodeerd wordt (Voet and Voet 1995, p. 966). Dus, voor cytochroom c zijn er ongeveer 3104 of meer dan 1046 verschillende mogelijke DNA sequenties (dus 1046 genen) die allemaal voor exact hetzelfde proteïne coderen.

We kunnen nu vrij specifiek zijn in onze predictie. Elk (DNA)-sequentie verschil tussen 2 functionele cytochroom c genen is noodzakelijk functioneel neutraal of zogoed als (als de functie van het eiwit in het gedrang komt door de mutaties, zal het organisme niet overleven). De achtergrond mutatie snelheid in mensen bedraagt ongeveer 1 à 5 x 10-8 base substituties per site per generatie (Mohrenweiser 1994, pp. 128-129), en een gemiddelde primaten generatie is ± 20 jaar. Via fossielen weten we dat mensen en chimpansees minder dan 10 miljoen jaar geleden (Stewart and Disotell 1998) afgesplitst zijn van een gemeenschappelijke voorouder. Dus, als mensen en chimpansees werkelijk genealogisch gerelateerd zijn, voorspellen we dat het verschil tussen hun respectieve cytochroom c genen minder dan 3% moet zijn.

Confirmatie:

Zoals reeds vermeld, is het cytochroom c proteïne in mensen en chimpansees exact hetzelfde. Dit wil echter niet per se zeggen dat daarom ook de DNA sequenties gelijk moeten zijn, wegens de gedegenereerde code. Desondanks zien we dat de 2 DNA sequenties die voor cytochroom c in mensen en chimpansees coderen in slechts 4 nucleotiden verschillen (= een verschil van 1,2%).

De gecombineerde effecten van DNA code redundantie en proteïne-sequentie redundantie maken DNA-sequentie vergelijkingen dubbel redundant; DNA-sequenties van ‘ubiquitous’ proteïnen zijn volledig ongecorreleerd met fenotypische verschillen tussen species, maar zijn sterk causaal gecorreleerd met erfelijkheid.

Potentiële falsificatie:

Een sterke falsificatie zou de ontdekking zijn dat DNA-sequenties die voor proteïnen zoals cytochroom c coderen radicaal verschillen.

Moleculair bewijs – Transposons

Transposons lijken in vele opzichten op virussen. De belangrijkste verschillen zijn het gebrek aan genen voor virale mantelproteïnen en het feit dat ze geen cellulaire barrières kunnen oversteken, ze repliceren dus enkel in het genoom van hun gastheer. Men kan ze daarom wel als intragenomische parasieten beschouwen. Behalve in zeer zeldzame omstandigheden is de enige manier van transmissie van het ene organisme naar het ander direct via DNA duplicatie en erfelijkheid (je transposons worden dus doorgegeven aan je kinderen) (Li 1997, pp. 338-345).

Replicatie houdt in dat het transposon zichzelf kopieert en zich dan willekeurig ergens anders in het genoom van de gastheer insereert. Dit proces (ook transpositie genoemd) is al bij vele organismen direct geobserveerd, zoals bv. gist, maïs, mensen, bacteriën en vliegen. Bepaalde geobserveerde gevallen van retrotranspositie hebben ziekten als neurofibromatosis en hemofilie in mensen veroorzaakt (Kazazian et al. 1988; Wallace et al. 1991).

Dit stukje over transposons en de volgende 2 secties over pseudogenen en endogene retrovirussen zijn conceptueel gerelateerd aan elkaar. De DNA sequenties in intergenische regio’s (d.w.z. stukken DNA dat niet codeert voor een proteïne of op een andere wijze kan doorgaan als gen, vaak aangeduid als ‘junk-DNA’) bevatten vele transposons (zoals LINEs en SINEs), endogene retrovirussen (zoals HERVs), pseudogenen en andere gerelateerde sequenties zoals microsatellieten. Vele microsatellieten zijn trouwens nauw verwant en ontstaan uit retrotransposons zoals LINEs en SINEs (Arcot et al. 1995; Nadir et al. 1996; Wilder and Hollocher 2001; Yandava et al. 1997). Deze intergenische sequenties zijn hoofdzakelijk verantwoordelijk voor de zeer specifieke patronen die we zien in ‘DNA fingerprinting’ analyses, zoals gebruikt bij vaderschapstesten. Net als bij gewone vingerafdrukken, verschillen deze intergenische regio’s aanzienlijk tussen individuen en zijn de patronen grotendeels arbitrair. Alu elementen bv., een type SINE retrotransposon, transposeren in een nieuwe genomische locatie elke 200 (menselijke) geboorten (Deininger and Batzer 1999), zodat ze significant bijdragen aan de menselijke genetische diversiteit (Batzer and Deininger 2002). In het geval van het menselijke L1 transposon, slechts 1 van de vele LINE elementen, vinden we een nieuwe retrotranspositie terug in ongeveer 1 op de 20 individuen (Scaringe et al. 2001; Ostertag and Kazazian 2001). Zoals alle DNA zijn deze intergenische regio’s evengoed erfelijk wat leidt tot zeer sterke correlatie tussen verwanten. Als er dus 2 individuen zijn die bepaalde intergenische patronen delen, wijst dat er sterk op dat ze gemeenschappelijke afkomst hebben. De kans op gelijke patronen is immers zeer klein, vanwege het enorm grote aantal mogelijke patronen (een zelfde redenering zoals we eerder ook tegenkwamen).

Eenmaal we een gemeenschappelijke voorouder postuleren die ook een bepaald transposon bevat, zouden alle afstammelingen van deze voorouder eveneens hetzelfde transposon moeten bevatten. Een mogelijke uitzondering zou zijn dat het transposon verwijderd werd door een zeldzame deletie. Deleties zijn echter meestal niet ‘clean’ en gewoonlijk blijft een deel van de transposon sequentie over. Gebruik makend van dezelfde principes achter DNA fingerprinting, hebben biologen transposonen, pseudogenen en endogene retrovirussen gebruikt om aan te tonen dat vele species genetisch verwant zijn, zoals mensen en andere primaten. Enkele voorbeelden volgen hieronder.

Confirmatie:

Een veel voorkomende klasse transposon is het SINE retroelement (Li 1997, pp. 349-352). Een belangrijk SINE transposon is het 300 bp Alu element. Alle zoogdieren bevatten vele Alu elementen, waaronder ook mensen waar ze 10% van het genoom uitmaken (60 miljoen bp repetitief DNA!) (Smit 1996; Li 1997, pp. 354, 357). In de menselijke α-globine cluster zijn er 7 Alu elementen, en elk element delen we met chimpansees in exact dezelfde 7 locaties (Sawada et al. 1985). Specifieker, 3 verschillende SINE transposities werden gevonden in dezelfde chromosomale locaties van walvissen, nijlpaarden en runderen, allemaal diersoorten die nauw verwant zijn volgens de standaard fylogenetische stamboom. Alle andere zoogdieren, waaronder kamelen en varkens, hebben deze 3 specifieke transposities niet (Shimamura 1997).

Meer detail en uitleg over dit onderwerp kan terug gevonden worden in Edward Max’s Plagiarized Errors and Molecular Genetics FAQ

 

Potentiële falsificatie:

Zie verder, dezelfde principes zijn hier ook van toepassing.

Moleculair bewijs – redundante pseudogenen

Andere moleculaire voorbeelden die bewijs leveren voor gemeenschappelijke afkomst zijn curieuze DNA sequenties bekend als pseudogenen. Pseudogenen zijn heel nauw gerelateerd aan functionele genen (die coderen voor proteïnen of RNA). De gelijkenissen omvatten zowel de DNA sequentie en (vaak) de specifieke chromosomale locatie van de genen. Het verschil is dat pseudogenen gebrekkige regulatorische sequenties hebben die verhinderen dat het gen transcriptie kan ondergaan tot mRNA of ze hebben interne stop codons waardoor het proteïne niet helemaal kan gevormd worden. In dit opzicht zijn pseudogenen moleculaire voorbeelden van rudimentaire structuren, zoals de kleine botten voor ‘achterpootjes’ bij walvissen.

Pseudogenen zijn echter in nog een opzicht bijzonder. Morfologische rudimenten hebben hun oorspronkelijke functie verloren (zoals de walvis ‘achterpoten’ of de menselijke blinde darm) en het organisme dat de rudimenten nog meedraagt heeft dus ook die functie niet meer (een walvis kan niet wandelen). Pseudogenen hebben ook hun functie verloren, maar het organisme zelf kan de functie echter nog steeds bezitten indien het de functionele tegenhanger van het pseudogen heeft. Dit soort pseudogenen noemen we ‘redundante pseudogenen’. Pseudogenen kunnen evengoed ‘vestigial’ zijn in de zin van morfologische structuren, zoals het vitamine C synthese pseudogen (mensen hebben geen functioneel vitamine C synthese gen, we moeten vitamine C uit de voeding halen).

De meeste pseudogenen zijn non-functioneel. Die conclusie wordt ondersteund door enkele waarnemingen.

  • De aanwezigheid of afwezigheid van de meeste specifieke pseudogenen heeft geen meetbaar effect op het fenotype.
  • Normale genen ondergaan transcriptie en translatie met de vorming van proteïnen als gevolg. Dit is niet het geval voor pseudogenen, zij vormen geen functionele genproducten.
  • Indien pseudogenen inderdaad non-functioneel zijn, zullen de meeste mutaties geen tot weinig gevolgen hebben en vele mutaties zullen niet weg geselecteerd worden. We zien inderdaad dat de meeste pseudogenen mutaties accumuleren aan de hoogste snelheid bekend voor dierlijke genomen.
  • Als laatste weten we hoe redundante pseudogenen ontstaan en hebben we hun vorming kunnen waarnemen in het lab en in het wild. Redundante pseudogenen ontstaan door genduplicatie en daaropvolgende mutatie. Vele geobserveerde processen kunnen genen dupliceren, waaronder transposities, chromosomale duplicatie en ‘unequal crossing-over’ van chromosomen.

Deze feiten tonen dus aan dat pseudogenen weinig of geen functie hebben. Zoals transposities is de creatie van nieuwe redundante pseudogenen zeldzaam en willekeurig en natuurlijk is het gedupliceerde DNA ook erfelijk. Hetzelfde pseudogen in dezelfde chromosomale locatie aantreffen bij 2 soorten is sterk bewijs van gemeenschappelijke afkomst.

Confirmatie

Er zijn heel veel voorbeelden van redundante pseudogenen die gedeeld worden door primaten en mensen. 1 ervan is het ψη-globine gen, een hemoglobine pseudogen. Het komt enkel bij primaten voor, op telkens exact dezelfde chromosomale locatie, met dezelfde mutaties die de functionaliteit tenietdoen (Goodman et al. 1989). Een ander voorbeeld is het steroïde 21-hydroxylase gen. Mensen hebben 2 kopijen van dit gen, een functioneel en een pseudogen dat geen translatie ondergaat. Inactivatie van het functionele gen leidt tot andrenogenitaal syndroom (een zeldzame en ernstige genetische ziekte), bewijs dat het 21-hydroxylase pseudogen inderdaad zijn functie verloren is. Zowel mensen als chimpansees delen dezelfde acht basepaar deletie in dit pseudogen (Kawaguchi et al. 1992).

potentiële falsificatie

Zoals reeds uitgelegd, zijn waargenomen genduplicaties zeldzaam en willekeurig. Het is dus zeer onwaarschijnlijk dat andere zoogdieren dezelfde redundante pseudogenen zouden hebben in dezelfde locatie en met dezelfde mutaties die de functie vernietigen.

Eens een gen is gedupliceerd en verworden tot een redundant pseudogen vanwege mutaties, wordt het zo overgeërfd door alle afstammelingen. Zodus, wanneer bepaalde organismen worden gevonden die eenzelfde pseudogen bevatten, volgt uit gemeenschappelijke afstamming dat alle organismen die fylogenetisch intermediair (tussen beide organismen staan in de stamboom) zijn ook dit pseudogen bevatten. Stel bv. dat we vinden dat mensen en oude wereld apen (Cercopithecidae) een bepaald redundant pseudogen delen. Dit zou betekenen dat alle mensapen (waaronder chimpansees, gorilla’s, orang-oetans en siamangs) noodzakelijkerwijs ook ditzelfde pseudogen moeten bevatten op dezelfde locatie. Deze conclusie berust op de veronderstelling dat er geen mechanismen bestaan die pseudogenen verwijderen (of dat zulk mechanisme erg inefficiënt is). Dit is blijkbaar waar voor vertebraten, maar sommige organismen met korte generatie cycli, zoals bacteriën, protisten en Drosophila hebben manieren om exces DNA te verwijderen.

De confirmatie en potentiële falsificatie zijn onafhankelijk van het feit of een specifiek pseudogen een functie heeft of compleet non-functioneel is. Zoals bij elk ander genetisch element of organismale structuur kan evolutionair opportunisme het pseudogen naar een nieuwe functie doen bewegen.

Moleculair bewijs – Endogene retrovirussen

Endogene retrovirussen verschaffen eveneens een voorbeeld van moleculair sequentie bewijs voor de theorie van gemeenschappelijke afkomst. Ze zijn moleculaire overblijfselen van een parasitaire virale infectie. Occasioneel worden kopijen van een retrovirus genoom gevonden in het genoom van een gastheer, deze worden dan aangeduid als endogene retrovirale sequenties. Retrovirussen (zoals AIDS of HTLV1) maken een kopij van hun eigen virale genoom en insereren dit in het genoom van hun gastheer. Als dit gebeurt in een geslachtscel (spermatozoïden of eicellen) zullen afstammelingen van de gastheer het retrovirale DNA overerven. Net als genduplicatie is dit proces zeldzaam en behoorlijk willekeurig zodat het aantreffen van retrogenen in identieke chromosomale posities bij twee verschillende soorten op gemeenschappelijke afkomst wijst.

Confirmatie:

Endogene retrovirussen maken ongeveer 1% uit van het menselijke genoom, in totaal gaat het over ~30.000 verschillende retrovirussen die zich in het DNA van elke persoon bevinden (Sverdlov 2000). Er zijn minstens zeven verschillende gedeelde retrogene inserties tussen chimpansees en mensen, en dit aantal zal zeker nog toenemen wanneer de sequenering van het genoom van beide organismen compleet is (Bonner et al. 1982; Dangel et al. 1995; Svensson et al. 1995; Kjellman et al. 1999; Lebedev et al. 2000; Sverdlov 2000). Figuur 4.4.1 toont een fylogenetische boom van meerdere primaten, waaronder mensen, afkomstig uit een recente studie die talloze gedeelde endogene retrovirussen ontdekte in de genomen van de primaten in kwestie (Lebedev et al. 2000). De pijltjes duiden de relatieve tijdstippen aan waarop het virale DNA zich insereerde in het gastheer genoom. Alle takken na dit punt (naar rechts toe dus) dragen dat retrovirale DNA, een gevolg van het feit dat eens een retrovirus zich insereert in een geslachtscel, alle afstammelingen het retroviraal DNA zullen dragen. Ltr32 komt dus voor in mensen, chimpansees en gorilla’s, maar niet in andere apensoorten.

Katachtigen vormen een ander voorbeeld. Volgens de standaard fylogenetische stamboom divergeren de kleine katachtigen later dan de grote katachtigen. Kleine katten (e.g. de moeraskat, de Europese wilde kat, de huiskat) delen een specifiek retroviral DNA stukje. Alle andere geteste carnivoren daarentegen missen dit retrogen (Futuyma 1998, pp. 293-294; Todaro et al. 1975).

Potentiële falsificatie

Een sterke falsificatie zou de ontdekking zijn van de eerder besproken retrogenen op dezelfde locaties in andere zoogdieren dan primaten of katachtigen.