Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Arkade 5 v2.9.1 setter uuid:Arkivuttrekk #163

Open
solfeggietto opened this issue Mar 30, 2023 · 4 comments
Open

Arkade 5 v2.9.1 setter uuid:Arkivuttrekk #163

solfeggietto opened this issue Mar 30, 2023 · 4 comments

Comments

@solfeggietto
Copy link
Collaborator

solfeggietto commented Mar 30, 2023

Hvorfor lages ikke lenger en uuid for uttrekket?

Nytt Arkade 5 v2.9.1: Filnavn uttrekk "Arkivuttrekk.tar"
OBJID="UUID:Arkivuttrekk"

Før: Filnavn uttrekk ".tar
OBJID="UUID:"

Info.xml er no uten noe uuid og alle uttrekk er derfor bare alltid identifisert som UUID = Arkivuttrekk

Jeg ruller tilbake til en eldre versjon av Arkade 5 der uuid faktis blir brukt, for de som produserer uttrekk som skal leveres til Depot.
Depot som bare skal teste Noark 5-uttrekk, sjekke PUID filformatinfo eller validere PDF-filer kan fortsatt bruke Arkade 5 v2.9.1.

Men skal man bevare i depotforvaltningssystem kan ikke alle pakker ha UUID = Arkivuttrekk !

@solfeggietto
Copy link
Collaborator Author

Jeg kan til en viss grad forstå at "Arkivuttrekk.xml" er bedre navn på overføringsfil for en vanlig person enn .xml f. eks. a4f6bfc2-4ea4-407f-9819-b7a125b60fd0.xml.

Og om jeg er veldig ettergivende at uttrekksfilen deponeringspakken får navn Arkivuttrekk.tar i stedet for .tar f. eks. a4f6bfc2-4ea4-407f-9819-b7a125b60fd0.tar

MEN det MÅ jo være unike uuid på metadata for pakken, OBJID i METS som DIAS-standarden bygger på som Arkade 5 pakker det inn som! Personlig så foretrekker jeg konsekvent bruk av i navn på både tar-fil og info-fil fordi det er unike filnavn, der både arkiskaper og depot behandler mange filer. Så bare å bruke Arkivuttrekk på filnavn er sterk anbefaling å unngå i seg selv, mens uuid som nevnt MÅ være unik og utfyllende hver gang.

<mets:mets xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" OBJID="UUID:a4f6bfc2-4ea4-407f-9819-b7a125b60fd0" LABEL="1599_077 ephorte SIARD (2004-2007)" TYPE="SIP" PROFILE="http://xml.ra.se/METS/RA_METS_eARD.xml" xsi:schemaLocation="http://www.loc.gov/METS/ http://schema.arkivverket.no/METS/mets.xsd" xmlns:mets="http://www.loc.gov/METS/">
Forskrift om utfyllende tekniske og arkivfaglige bestemmelser om behandling av offentlige arkiver (riksarkivarens forskrift)
§ 5-2.Definisjoner
https://lovdata.no/forskrift/2017-12-19-2286/§5-2

f. Avleverings- eller deponeringspakke: betegnelse på en arkivversjon med metadata jf. § 5-27 og § 5-28 som er ferdig pakket som en TAR-fil og klar for overføring til arkivdepot, samt en overføringsfil, jf. bokstav g).
g. Overføringsfil: en enkelt fil som overføres parallelt med en avleverings- eller deponeringspakke og inneholder informasjon om avleverings- eller deponeringspakken (filen tidligere kjent som info.txt og info.xml).

@solfeggietto
Copy link
Collaborator Author

solfeggietto commented Mar 31, 2023

Ny full test i dag

Konklusjon

  • Feilkilde er at Arkade 5 v2.9.1 tar filnavn på .tar fil som lastes inn og bruker det som UUID i metadata, altså SIP-UUID eller omd et er AIP-pakke som AIP-UUID (antar jeg, må teste AIP-generering).

Løsning

  • Arkade 5 må validere om der er en UUID i uttrekket. Hvis det bare er filnavn til .tar fil som skal være uuid, så må Arkade 5 sjekke om det er en gyldig uuid, og hvis ikke må Arkade 5 generer en ny uuid for pakken, slik den gjør vil vi laster inn en filstruktur i Arkade 5 i stedet for en .tar.

Merknad

  • Jeg foretrekker at Arkade 5 lagrer filnavn til .tar alltid som <uuid>.tar den bruker, samt også Overføringsfilen som vi kaller info.xml at den også fortsatt får filnavn <uuid>.xml.
  • Da unngår vi tekstlig rot i filnavn og strukturer i bevaring og bruk av pakkene, for vi lager ikke uttrekk og overføringsfil primært for at filnavn skal være leselige for hvem som helst. men for at filene er unike og blir håndtert således.
  • Alternativt kall Overføringsfil "Arkivuttrekk_<uuid>.xml, så får man fra begge verdener, som et automatisert prosess kan håndtere med filnavn.

@solfeggietto
Copy link
Collaborator Author

Workaround

  • Endre filnavn fra Arkivuttrekk.tar til en UUID du lager selv (manuelt eller autogenerert fra en app)
  • Alternativt gjør det på en kopi av originalen
  • Har testet dette og resultatet er at Arkade 5 v2.9.1 bruker UUID korrekt som metadata
  • Så antakelsen om at Arkade bare bruker .tar filanv som UUID er da korrekt

Det går ikke klart fram av Arkivforskriften at uttrekk SKAL pakkes i en DIAS IP-pakkestruktur, så bare av den grunn bør Arkade validere om en innlastet .tar fil er en DIAS IP-pakke, i tillegg til at en DIAS IP-pakke jo også kan ha feil.

@erikaaberg
Copy link

Her er det svikt i logikken fra gammelt av. Vi utreder for øyeblikket hvordan ny logikk skal/bør være. Vi må også være sikre på at ny/endret/bedre logikk ikke velter noen lass i forhold til gamle uttrekk/versjoner.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants