Havene representerer jordens største biosfære (~ 97%). Mikroorganismene som finnes i havene er i sin helhet svært viktige og ansvarlige for mange av de fundamentale prosessene globalt, slik som næringssyklusen og tilnærmet halvparten av verdens oksygen produksjonen. I tillegg er mange sykdomsfremkallende og et problem innen akvakultur. Informasjon om disse mikroorganismene er dessverre begrenset og vanskelig tilgjengelig.
Marin mikrobiell genomikk og metagenomikk er studier som omfavner disse mikroorganismene, deres DNA og leveområder. Fellesnevneren er at prøvene er tatt direkte fra det marine miljøet. Som voksende forskningsområde er det fare for at data produseres raskere enn brukerne er i stand til å analysere, tolke og dele. Dette har resultert i et behov for en infrastruktur som er dedikert til marin mikrobiell genetisk forskning og innovasjon i feltet.
Vi introduserer de marine databasene; MarRef, MarDB og MarCat (https://mmp.sfb.uit.no/databases/). Disse representerer fritt tilgjengelige ressurser som har til hensikt å presentere søkbar genetisk data eksklusivt fra det marine miljø. Dataressursene er gjort tilgjengelige i web-portalen Marine Metagenomics Portal (MMP) (https://mmp.sfb.uit.no/), som samlinger av rikt annotert og manuelt kurerte metadatabaser med tilhørende sekvensdatabaser.
MarRef er en referanse database bestående av fullstendig sekvenserte prokaryotiske (Bakterier og Archaea) genomer av høyeste kvalitet. Databasen inneholder 612 komplette og publiserte genomer.
MarDB er en utvidelse som komplementerer MarRef med alle kjente sekvenserte prokaryotiske genomer av marint opphav som er ufullstendige. Denne databasen har 3726 oppføringer av genomer og, som MarRef, består av 114 beskrivende datafelter som er fult søkbare.
MarCat representerer, i motsetning til de tidligere nevnte databasene, marin metagenomikk som en gen-katalog over ukultiverbare (og kultiverbare) marine gener avledet fra marine metagenomiske prøver. Databasen holder 1227 oppføringer beskrevet av 55 datafelter.
Datafeltene for hver prøve er presentert i kategorier for prøvetaking, sekvensering, data håndtering og analyse, organisme og taksonomi. Alle databasene er linket opp tll eksterne databaser for mer informasjon som litteratur, kultursamlinger samt protein og DNA databaser.