Veileder for arkiveiere

Denne veilederen er beregnet på institusjoner som ønsker å opprette et institusjonelt publiseringsarkiv. Publiseringsarkiv spiller i dag en viktig rolle for tilgjengeliggjøring av forskningsarbeider for allmennheten. Institusjoner som oppretter et åpent arkiv vil kunne samle og synliggjøre sin faglige produksjon, og bidrar samtidig til sikker langtidslagring av forskningsarbeider.

Et institusjonelt arkiv bevarer og tilgjengeliggjør godkjente versjoner av publiserte artikler. Anskaffelse og tilgjengeliggjøring av litteratur er tradisjonelt bibliotekenes oppgave, og det er i all hovedsak institusjonens bibliotek som har ansvaret for drift av de institusjonelle arkivene. Det er imidlertid viktig at arbeidet med arkivet forankres i hele institusjonen.

Argumenter for å opprette institusjonelle arkiv er i all hovedsak knyttet til bevaring, tilgang og spredning av forskningsresultater. Et institusjonelt arkiv fremmer ulike sider ved formidling av en institusjons produksjon:

  • Formidling av forskningsresultater fra institusjonens forskere
  • Bidrag til den såkalte kunnskapsallmenningen, dvs. å bidra til gratis kunnskap på nettet.
  • Bred spredning og bevaring for framtiden.

Institusjonelle arkiv er ikke en publiseringskanal, men en kanal for tilgjengeliggjøring av vitenskapelige dokumenter, inkludert artikler. Artikler som publiseres i tidsskrift, kan egenarkiveres i institusjonelle arkiv som en ekstra kanal for spredning av institusjonens forskning. Tilgjengeliggjøring må da gjøres i henhold til tidsskriftenes vilkår for dette. Innholdet i et institusjonelt arkiv vil først og fremst være egenarkivert materiale som vitenskapelige artikler, mastergradsoppgaver og doktoravhandlinger. Alt materiale er åpent og fritt tilgjengelig i fulltekst for alle.

For forskerne og de vitenskapelige samfunn de representerer, er det av stor interesse å sikre at forskningsresultatene blir spredt så raskt, så vidt og så effektivt som mulig. Hovedhensikten med arkivene er å bidra til størst mulig spredning av vitenskapelig produksjon, til beste for videre forskning, utdanning, næringsliv, media og for den alminnelig interesserte borger. Når en rekke forskningsinstitusjoner verden over velger å gjøre dette blir forskningsresultater et felles gode. Forskning utført ved institusjonen blir mer synlig, og materiale formidlet gjennom et institusjonelt arkiv blir langtidslagret og får stabile url-er slik at materialet også er tilgjengelig i fremtiden.

Den enkelte forsker får et sentralt elektronisk arkiv for sine forskningsarbeider. Doktoravhandlinger har tradisjonelt vært vanskelige å få tak i og publisering av doktoravhandlinger på internett vil gjøre dette materialet langt mer tilgjengelig. Statistikk viser at doktoravhandlinger og masteroppgaver tilgjengelige i institusjonelle arkiver er mye nedlastet (og potensielt brukt). Ved egenarkivering på egen nettside, vil man blant annet miste fordelen av gode rutiner for sikkerhetskopiering, langtidsbevaring, gjenfinnbarhet og kvalitetssikring av metadata. Men man kan godt lenke fra egen nettside til fulltekstversjonen som ligger i det institusjonelle arkivet - da får man både egen profilering og god tilgjengelighet på internett.


Hvordan forankre arkivet?

Nøkkelen til suksess er å ha bred støtte i egen institusjon ved etablering av et institusjonelt arkiv.

Den viktigste erfaringen fra de institusjonene som har institusjonelle arkiv er at det må påregnes en del ressursbruk for at et arkiv skal fremstå som pålitelig, og kunne fungere som et effektivt og nyttig verktøy

Det er biblioteket som bruker ressursene og som har den mest sentrale rollen når et arkiv skal etableres, men det er viktig at det sikres en sterk bevissthet blant alle interessenter ved institusjonen.  Det gjelder for eksempel faglig ansatte (innholdsskapere, forfattere), mastermiljøene, de som arbeider med forskningsformidling, IT-miljøet (systemutviklere) og institusjonens ledelse, og de bør være representert i arbeidet rundt beslutninger om arkivets eksistensbegrunnelse, valg av system, hva institusjonens arkiv skal inneholde, samt fastsettelse av ansvar og roller i arbeidet med arkivet.

For å oppnå god forankring i institusjonen må det planlegges kompetanseheving på ulikt nivå for alle i institusjonen. Områder dette gjelder for er for eksempel:

  • Informasjon om åpen tilgang til alle involverte: Hva, hvorfor, hvordan.
  • Involvering og koordinering av faglige miljøer og superbrukere.
  • Informasjon om opphavsrettslig problematikk forbundet med OA til alle involverte
  • Informasjon om publiseringsprosesser til alle involverte.
  • Nødvendig teknisk kompetanse for gruppen som skal sette det opp/drifte institusjonsarkiv.

Infrastrukturen ved institusjonen vil være en avgjørende faktor for valg av arkivsystem og organisering.


Valg av arkivsystem

Når det skal velges arkivsystem, finnes det hovedsakelig tre muligheter. Institusjonen/biblioteket kan:

  1. Inngå samarbeidsavtale eller delta i konsortier. Dette innebærer å kjøpe seg inn i en eksisterende løsning, som sikrer at utvikling og drifting av arkivet sikres av andre. En alternativ strategi for en liten institusjon ville være å sette ut arkivfunksjonen til en av de kommersielle leverandørene. Eksempler på dette er Bibsys Brage og HeRa (Open Repository).
  2. Opprette eget arkiv basert på eksisterende teknologi. Det finnes en rekke forskjellige programmer som kan benyttes (Fedora, Eprints og Greenstone). I Norge er imidlertid DSpace det mest brukte alternativet for institusjoner som ikke har utviklet egne løsninger.
  3. Utvikle egen løsning. Dette alternativet er imidlertid ikke et valg vi anbefaler.

I implementeringsfasen er det viktig å ha med støttespillere både fra forskersiden (altså de som skriver/leverer innhold) og ledelsen. På toppnivå i institusjonen må man få på plass mandatet, policyvedtak knyttet til åpen tilgang og arkivet, og incentivordninger for innlevering av dokumenter. Samtidig er det viktig å få frem ambassadørene som kan bidra med suksesshistorier knyttet til arkivet.  Informasjon om og markedsføring av arkivet må være planlagt og tydelig.

Det er viktig å passe på at fokuset hele tiden er på det faglige miljøet som skal fylle arkivet. Organiseringen av arbeidet bør derfor ta hensyn til dette ved å gi de faglige miljøene – de som sitter nær innholdsskaperne – ansvaret for at arkivet fylles. Samtidig som implementeringsfasen starter kan det være nyttig å ha på plass nettsider med informasjon om arkivet og veiledninger som viser hvordan man leverer materiale til arkivet.

Systemansvar både for forskningsrapporteringssystemet Cristin og det institusjonelle arkivet kan gjerne tilhøre samme gruppe. Dermed blir det enkelt å se mulighetene for gode løsninger. Ettersom det er mulig å egenarkivere dokumenter i Cristin kan dette sikre en god arbeidsflyt – ikke minst for forskeren, som er vant til å registrere selv, føler eierskap til egne data og er opptatt av at de er fullstendige og korrekte.

De viktigste støttespillerne for institusjonelle arkiv er innholdsleverandørene og den faglige ledelsen i institusjonen.


Hva skal arkivet inneholde?

Arkivets innhold er knyttet til hvilken rolle arkivet skal ha i institusjonen. Arkivet bør ha en policybeslutning om hva innholdet skal være. Her er det viktig at arkivets innholdsleverandører deltar i prosessen rundt beslutningen.

Les mer om Open Access-policy i vår veileder for institusjoner.

Institusjonelle arkiv kan inneholde mange ulike typer innhold i ulike formater og versjoner. Digitalt materiale spenner fra enkle (for eksempel tekstbaserte) digitale filer til komplekse multimedia- og databaseressurser. Anskaffelse og datafangst av hver av disse typene av innhold innebærer konsekvenser for de ressursene som kreves for å samle, lagre og tilgjengeliggjøre innholdet fra arkivet. For noen institusjoner kan det være viktig at innholdet er fagfellevurdert, eller at oppgaver fra høyere grads studenter og doktoravhandlinger blir ivaretatt. For andre institusjoner er behovet å samle alle digitale ressurser innen et fagområde det viktigste.

I tillegg til institusjonelle arkiv finnes det emne- og mediespesifikke arkiv som for eksempel:

  • arXiv.org som er et automatisert arkiv for vitenskapelige artikler og gir åpen tilgang til rundt 750 000 (per mars 2012) artikler innen fysikk, matematikk, informatikk, kvantitativ biologi, økonomi og statistikk.
  • Repec  som er et arkiv for økonomifaget der 1400 arkiv leverer innhold.
  • CiteSeerX er et arkiv og søketjeneste innen informatikk.

Opphavsrettigheter

Hvert element i arkivet vil ha opphavsrettigheter avtalt med forfatteren og/eller utgiver. Spørsmål tilknyttet rettigheter og tillatelser er viktige faktorer som bestemmer hvilke versjoner av tidsskriftartikler som kan publiseres i institusjonelle arkiv. Arbeid med rettighetsklarering kan medføre betydelige personalkostnader knyttet til drift av et arkiv.


Hva er «kvalitet» i et arkiv?

De åpne arkivene må støtte den internasjonale standarden OAI-PMH (Open Archives Initiative - Protocol for Metadata Harvesting), som gjør at de kan høstes av store nasjonale og internasjonale forskningsressurser og søketjenester som CRIStin (overtar f.o.m. 2014 for NORA-tjenesten), DRIVER (Digital Repository Infrastructure Vision for European Research) og BASE (Bielefeld Academic Search Engine). Alt innhold kan også indekseres av viktige søkemotorer som Google/Google Scholar og Bing. Doktoravhandlinger som publiseres i arkivet blir automatisk gjort synlig i DART-Europe E-theses Portal som inneholder mer enn 300 000 avhandlinger fra mer enn 400 europeiske universiteter. Arkivet bidrar derfor til at den vitenskapelige aktiviteten fra institusjonen får økt synlighet for hele verden.

De norske publiseringsarkivene samarbeider med Cristin, som blant annet dokumenterer forskningsaktivitet i Norge.  Forskerne laster opp fulltekstversjoner av artiklene sine i Cristin, og de lokale institusjonelle arkivene kan så høste ut fullteksten sammen med tilhørende metadata fra Cristin.

For at arkivet skal kunne være driftssikkert og tåle utvikling og vekst, må noen krav til arkivløsningen og organisasjonen være innfridd:

  • Det bør finnes et system for unik, varig identifikasjon av digitale objekter som støtter langsiktig bevaring.
  • Må støtte protokoller for innhøsting/datautveksling
  • Må ha støtte for standardiserte metadataformater
  • Må kunne integreres med andre relevante systemer (Eksempel: Cristin, Bibsys)
  • Må kunne tilpasses institusjonens (skiftende) behov
  • Må ha systemsikkerhet
  • Må ta ansvar for langsiktig vedlikehold av digitale ressurser på vegne
    av sine innholdsleverandører og til fordel for nåværende og fremtidige brukere
  • Må ha et organisatorisk system som støtter langsiktig levedyktighet og stabil drift
  • Må kunne levere statistikk om samlingene og bruken av dem

Samlingsforvaltning

Institusjoner som oppretter et arkiv, bør ta stilling til følgende punkter

  • Dokumenttyper
    • Preprint versus postprint
    • Kopi av forlagets PDF
    • Forfattere: ansatte, studenter, andre?
  • Dokumentformater
    • HTML, PDF, ePub, Postscript, RTF, ASCII, osv.
  • Digital bevaringspolitikk
  • Innleveringsprosedyrer
    • Mediert / DIY?
    • Konvertering av filformat, etablering av metadata
  • Forfattertillatelse og lisensvilkår
    • Opphavsrett
    • Samsvar med utgivers opphavsrettsvilkår
  • Standarder for metadatakvalitet (se neste avsnitt)

Metadata

Programvare for arkiv gjør det mulig å forøke verdien av dokumentene med metadata som for eksempel sammendrag, emneord, emneklassifikasjon, forfatternavn osv., slik at informasjonen lettere dukker opp som relevant informasjon i et søkeresultat. Det er viktig å ha en enhetlig registreringspraksis dersom man er mange som registrerer dokumenter i arkivet, og man bør jevnlig ha «opprydningsrunder» der man ser over innlagte metadata.

Alle norske forskningsarkiv vil fra 2014 høstes av den felles nasjonale søkeportalen i Cristin (tidligere NORA). Felles retningslinjer for registrering gjør det lettere å etablere Cristin som «single point of harvest» for tjenester som høster data fra de norske arkivene. Registreringspraksis vil gjøre det enklere å høste direkte fra arkivene, dersom noen skulle foretrekke det.

Det er utviklet en håndbok for bruk av metadata i arkiver. Målsettingen med håndboka er at den skal kunne gi veiledning og anbefalinger for alle norske forskningsarkiv som benytter Dublin Core som metadataformat. Dublin Core er i dag “de facto standarden” for registrering av metadata i forskningsarkiv. De fleste institusjonene i Norge bruker eller er i ferd med å ta i bruk DSpace som arkivsystem. Samtlige av disse bruker Dublin Core som metadataformat.


Tjenester

Programvare for arkiv inneholder som regel tjenester som gjør det enkelt for brukere å få informasjon om nytt og interessant innhold. Eksempler på dette er e-postvarsling eller RSS-strømmer som gir beskjed om nye dokumenter. Slike tjenester vil kunne gi bedre brukeropplevelser enn tilsvarende tjenester på institusjonenes hjemmesider.


 

Publisert 18. des. 2013 12:20 - Sist endret 20. aug. 2019 13:26