Artikkel

Stadig nye overraskelser i torskens genom

Ole Kristian Tørresen og Lex Nederbragt ved Institutt for biovitenskapå
Ole Kristian Tørresen (t.v.) og Lex Nederbragt har levert en kraftig forbedret analyse av torskens genom, og der fant de noe helt nytt. Foto: Bjarne Røsjø

Stadig nye overraskelser i torskens genom

Forskerne ved UiO finner stadig nye overraskelser, desto mer i detalj de studerer torskens genom. Nå viser det seg at genomet til "Tore Torsk" inneholder uvanlig mange korte og helt like DNA-sekvenser, og det kan kanskje gi arten en evolusjonsmessig fordel.

Det er uvisst nøyaktig hvor «Tore Torsk» ble fanget, men det var i alle fall folk fra Norsk institutt for vannforskning (NIVA) som halte ham sprellende opp fra havet under et tokt i Lofoten og Barentshavet for snart ti år siden. Derfra gikk ferden til NIVAs anlegg på Solbergstrand utenfor Drøbak, hvor forskere fra Institutt for biovitenskap ved UiO fant Tore, kakket ham i hodet og tok prøver som havnet i en fryseboks.

De fleste torsker som havner i en fryseboks kan regne med å bli spist, men Tore Torsk innledet isteden en ny karriere. 

Atlanterhavstorsken (Gadus morhua) kan veie opp mot 60 kilo og bli opptil 150-200 cm lang. Du kjenner den igjen på det karakteristiske hakeskjegget.
Tore Torsk må ha vært genetisk i slekt med denne ruggen, som ble fanget i Lofoten i 2011. Foto: Sissel Jentoft, UiO.  Bruk bildet.

Tore var nemlig en flott og karakteristisk representant for bestanden av skrei, som er betegnelsen på torsk som vandrer mellom beiteområder i Barentshavet og gyteområder langs norskekysten. Dermed fikk han den ærefulle oppgaven med å levere sitt arvestoff til forskere som ville kartlegge torskens genom. 

I 2008 startet forskere ved UiO et unikt prosjekt i Norge: Å kartlegge genomet hos en fisk med stor økonomisk betydning, nemlig torsken. Deretter har torskegenom-forskerne levert en jevn strøm av overraskelser, basert på undersøkelser av Tore Torsks genom. I 2011 påviste de for eksempel at torsken har et unikt immunforsvar, og i 2016 fant de kjønnsgenet som kan gjøre oppdrettsnæringen mer lønnsom.

Nytt funn i torskens genom

Stipendiaten Ole Kristian Tørresen og senioringeniøren Lex Nederbragt ved Institutt for biovitenskap og Senter for økologisk og evolusjonær syntese (CEES) har nå gjennomført en enda mer detaljert analyse enn det som har vært mulig tidligere, og nok en gang er det påvist noe overraskende i torskens genom.

– Det som er nytt med denne undersøkelsen, er at vi har kombinert data fra tre ulike teknikker for DNA-sekvensering.  Dermed har vi klart å kartlegge torskens genom mye mer detaljert enn det som var mulig tidligere, og da fant vi samtidig årsaken til at det har vært så vanskelig å kartlegge genomet i detalj. Årsaken til vanskene er at torskens genom inneholder ekstraordinært mange såkalte tandem-gjentakelser, det vil si at korte sekvenser av basemolekyler blir gjentatt mange ganger etter hverandre, forteller Ole Kristian Tørresen.

Tore Torsk startet en ny karriere da han ble dissekert
Slik så Tore Torsk ut i det han ble dissekert og innledet en ny karriere, som leverandør av vev til DNA-undersøkelser. Foto: UiO. Bruk bildet.

Utgangspunktet for denne observasjonen er at genomet hos alle organismer er skrevet med et «alfabet» som består av kun fire basemolekyler: Adenin (A), tymin (T), guanin (G) og cytosin (C).

– Vi kaller det en tandem-gjentakelse hvis vi for eksempel finner «AC» flere ganger etter hverandre i DNA-sekvensene. Det er også en tandem-gjentakelse hvis det står for eksempel «A» flere ganger etter hverandre, eller «CGA». Poenget er uansett at det har vært veldig vanskelig å forstå hvordan de sammenhengende DNA-sekvensene egentlig ser ut, når vi i praksis står overfor et enormt «puslespill» hvor et stort antall små «brikker» er helt like, tilføyer Nederbragt. Det er som om å ha mange brikker i et puslespill med bare blå himmel.

Flere forskningsnyheter om realfag og teknologi? Abonner på vårt ukentlige nyhetsbrev(link is external) eller følg oss på Facebook.

Har kartlagt 93 prosent av genomet

DNA-sekvensering og genom-kartlegging kan nemlig sammenliknes med å hakke opp en veldig lang tekst i mange millioner biter, og deretter skal du sette sammen teksten igjen og lage en digitalisert kopi – uten å vite hvor hver enkelt bit kom fra.

Torskens genom

  • Genomet er hele den arvemessige informasjonen som er kodet inn i en organismes DNA (eller, hos noen virus, i deres RNA).
  • Torskens genom består av ca. 700 millioner basepar (menneskets genom har 3200 millioner basepar).
  • Torskens genom er fordelt på 23 kromosomer par (like mange som hos mennesket).

Det forskerne gjør når de kartlegger et genom, er å kartlegge den komplette rekkefølgen av baseparene A, T, G og C i arvestoffet. Torskens genom består av ca. 700 millioner slike baser eller rettere basepar (DNA-molekylet består jo av to tråder med matchende basepar på hver tråd), og med den siste undersøkelsen har forskerne til sammen kartlagt hele 93 prosent av dette genomet og fordelt resultatet på torskens 23 kromosomer. Dermed har de klart å fylle igjen mange av «hullene» som sto igjen etter de tidligere kartleggingene.

LES OGSÅ: Truer du torsken, truer du mennesket

DNA-kartlegging som et enormt puslespill

Med dagens teknologi er det mulig å kartlegge sammenhengende DNA-sekvenser med en lengde på opptil 10 000 basepar, men det er jo langt derfra til et helt torskekromosom med ca. 25 millioner basepar. Forskerne må derfor dele opp DNA-strengene i biter, som så blir lest hver for seg. Resultatet blir at forskerne blir sittende med en stor mengde fragmenter som de må forsøke å sette sammen i den digitaliserte kopien – omtrent som et puslespill med ekstremt mange biter.

Men når mange av bitene er helt like, fordi genomet inneholder mange tandem-gjentakelser, blir det vanskelig å avdekke hvor hver enkelt bit hører hjemme. Tørresen og Nederbragt og forskerteamet har løst dette problemet ved å bruke tre ulike sekvenseringsteknologier parallelt, for deretter å kombinere dem. Dessuten har de gjenbrukt store mengder data som var blitt generert i forbindelse med de tidligere genom-studiene og analysert dem om igjen med nye og bedre metoder.

– Den eldste metoden, som kalles 454-sekvensering, kan kartlegge fragmenter med opptil 700 basepar. Men metoden kommer til kort hvis fragmentene inneholder flere like baser etter hverandre. Hvis fragmentet for eksempel inneholder sekvensen AAAAA, klarer ikke denne metoden alltid å avgjøre hvor mange A’er som står etter hverandre, forteller Tørresen.

– Vi har også brukt en nyere metode som kalles Illumina-sekvensering. Denne metoden kan bare generere fragmenter med en lengde på opptil 100 basepar, men til gjengjeld er kartleggingen mer nøyaktig enn med 454-metoden. Og så har vi supplert med en tredje metode, PacBio-sekvensering, som på det tidspunktet kunne kartlegge DNA-sekvenser med opptil 2000-3000 basepar. Det hjalp mye for sammensetningen, selv om nøyaktigheten med denne teknologien er en god del lavere, forklarer Nederbragt.

– Dermed har vi brukt tre ulike metoder i den samme undersøkelsen og kombinert dem, og det er samtidig grunnen til at vi har fått mer nøyaktige resultater. Nå har teknologien utviklet seg enda lenger enn da vi begynte på våre analyser, slik at vi kunne fått enda bedre resultater hvis vi hadde begynt i dag. Men vi kan jo ikke hele tiden vente på at teknologien skal bli bedre, for da stopper alt opp, kommenterer Nederbragt.

Hva betyr de mange kopiene?

Forskerne er usikre på hva de mange tandem-gjentakelsene betyr for torsken som art.

– Vi antyder i den vitenskapelige artikkelen vår at dette har en evolusjonsmessig betydning, fordi mange av kopiene sitter inne i sekvenser med arvestoff som koder for oppbyggingen av proteiner. Det kan bety at de repeterte sekvensene kan føre til at en populasjon av torsk kan inneholde mange ulike varianter av de samme proteinene. Vi ser for oss at det kan gi torsken en fordel hvis den for eksempel må tilpasse seg  et nytt miljø, men vi kan ikke si noe sikkert om dette ennå, kommenterer Tørresen.

Det går imidlertid an å finne ut slikt. Nå har forskerne kartlagt torskens genom i stor detalj, og det neste blir å kartlegge hvilke gener som inneholder koden for spesifikke proteiner. Forskerne ved Institutt for biovitenskap har nå begynt å undersøke slike sammenhenger.

– Vi har forøvrig allerede funnet en fiskeart som har enda flere tandem-gjentakelser, og det er den nærstående hysa. Både torsk (latinsk navn: Gadus morhua) og hyse/kolje (Melanogrammus aeglefinus) er medlemmer av torskefamilien (Gadidae). Dette kan tyde på at hele gruppen har en økt andel slike gjentakelser, tilføyer Nederbragt.

Kjetill S. Jakobsen er professor ved Institutt for biovitenskap og CEES
Professor Kjetill S. Jakobsen mener at det nye torskegenomet vil få stor betydning. Foto: Millimeterpress Bruk bildet.

Ole Kristian Tørresen og Lex Nederbragt presiserer at alle studiene av torskens genom så langt er gjort på DNA fra det samme individet, nemlig den omtalte Tore Torsk. De regner med at han var en god og karakteristisk representant for skreibestanden, men i det påbegynte Aqua Genome-prosjektet skal forskere ved UiO og Norges miljø- og biovitenskapelige universitet (NMBU) studere genomet hos et stort antall av både torsk og laks. Da kan de for eksempel undersøke hvordan ulike populasjoner – som skrei, kysttorsk og Østersjø-torsk – skiller seg fra hverandre. NMBU-forskerne konsentrerer seg mest om laksen, mens UiO-forskerne fortsetter dypdykket i torskens genom.

«A never ending story»

– Den nye versjonen av torskegenomet er en kraftig forbedring og vil få betydning for framtidig forvaltning ved at det er en referanse for sekvensering av andre stammer og individer. Samtidig har det forbedrede genomet et potensial i forbindelse med å utvikle torsk som er egnet for akvakultur med hensyn på vekst, kjønnsmodning og sykdomsresistens, sier professor Kjetill S. Jakobsen ved Institutt for biovitenskap og CEES. Han har ledet studiene av torskens genom ved UiO siden starten.

– Vi er stolte av dette kraftig forbedrede torskegenomet. Men det å sette sammen slike store genomer er en “never ending story”, og det er fortsatt rom for forbedring. En versjon nr. tre vil garantert komme, og den vil være ennå bedre, men fortsatt ikke perfekt, tilføyer seniorrådgiver Sissel Jentoft ved CEES.

Den nye studien er gjennomført som et samarbeid mellom forskere ved UiO, NMBU, Havforskningsinstituttet, Yale School of Medicine og J. Craig Venter Institute.

Kontakt:

Stipendiat Ole Kristian Tørresen, Institutt for biovitenskap og CEES. Twitter: @tierhon

Senioringeniør Lex Nederbragt, Institutt for biovitenskap og CEES. Twitter: @lexnederbragt

Vitenskapelige artikler og mer informasjon:

Ole K. Tørresen, Alexander J. Nederbragt et al.: An improved genome assembly uncovers prolific tandem repeats in Atlantic cod. BMC Genomics 2017, 18:95

Bastian Staar et al.: The genome sequence of Atlantic cod reveals a unique immune system. Nature 477, 207–210 (08 September 2011).

Ole K. Tørresen et al.: The new era of genome sequencing using high-throughput sequencing technology: generation of the first version of the Atlantic cod genome. Chapter in book Genomics in Aquaculture, December 2016

Torskens genom finnes her: CEES Genome Browsers

Forskning.no, 2011: Torsken har unikt immunforsvar

Norges forskningsråd, 2009: En Lofot-torsk er avslørt

Interessert i fisk? Les mer på Titan.uio.no:

Skriv ny kommentar

Verifiser deg (din epost-adresse vil ikke bli vist offentlig)

Les også

Ann-Cecilie Larsen

I stjerneklassen

– Vi lager nye og eksotiske isotoper ved å skyte atomkjerner på hverandre. Slik oppsummerer Ann-Cecilie Larsen jobben som forsker ved Fysisk institutt. Men den handler også om Star Wars og Dr. Who.

Inger Sandlie

Den utrettelige idégeneratoren

I BIRKELANDS SPOR: Professor Inger Sandlie jakter alltid på innovasjoner – både i eget hode og ikke minst hos studenter og forskerkolleger.