Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

PRONOM PUID filformat versus Gyldig arkivformat feil og hvor er master listen? #158

Open
solfeggietto opened this issue Feb 15, 2023 · 3 comments

Comments

@solfeggietto
Copy link
Collaborator

To spørsmål etter at jeg ser noen "feil" i vurdering av Godkjent arkivformat versus PRONOM PUID filformat

  1. Hvor er master-listen over kobling PRONOM PUID versus Godkjent arkivformat/Ugyldig=Produksjonsformat?
  2. Det må vel være feil (ref. bildet vedlagt) at MS Excel og MS Powerpoint er Godkjent arkivformat?
  3. OpenDocument Presentation og Text "aksepteres" står det i forskriften, men en PDF/A-versjon bør leveres som tillegg. Så kanskje Godkjent(*), altså med en stjerne hadde vært en måte å indikere det på (ikke noen stor sak, den vurderingen kan tas manuelt også).
  4. Filformatinfo-statistikk.csv er no meget god, sorteres fint i sine kolonner som oftes (her er noe avvik, skal melde det i egen Issue).

fmt/214 Microsoft Excel for Windows 2007 onwards 1460 Gyldig
fmt/445 Microsoft Excel Macro-Enabled 2007 1 Gyldig
fmt/215 Microsoft Powerpoint for Windows 2007 onwards 41 Gyldig

fmt/292 OpenDocument Presentation 1.1 1 Gyldig
fmt/293 OpenDocument Presentation 1.2 1 Gyldig
fmt/136 OpenDocument Text 1.0 1 Gyldig
fmt/290 OpenDocument Text 1.1 4 Gyldig
fmt/291 OpenDocument Text 1.2 19 Gyldig

Arkade5_v2 9 0_pronom-arkivformat-test_2023-02-15b

@erikaaberg
Copy link

1: Master listen finnes i form av en JSON mapping av forskriften. Vi ser litt på hvordan den kan publiseres, på Arkivverkets nettsider og som en del av Arkade dokumentasjon.
2: Nei. MS-Office etter 2007 (OOXML) er godkjent. Men det bes også om en PDF/A versjon i tillegg.
3: Ja - - mulig vi kunne tydeliggjort at en PDF/A versjon ønskes i tillegg. Gjelder da også OOXML.

@solfeggietto
Copy link
Collaborator Author

solfeggietto commented Feb 16, 2023

  1. Kan MS Office 365 filer virkelig merkes som Godkjent arkivformat?
  • Er virkelig .xlsx alltid eller som hovedregel et arkivformat og ikke lenger proprietær?
  • Årsaken til jeg spør er at vi i MS Office 365 har valg mellom 2 formater når du installere:
  • Og vi velger ikke den som er Open fordi den gir mindre funksjonalitet…
  1. Eksempelet under har kun filer i rot DOKUMENTER (som om det var et Noark 5-uttrekk uten undermapper i dokument-mappen).
  • Eneste måte å vite at det er en fil inne i en zip er å se etter # et sted inne i Kol 1Absolutt filsti eller # i Kol 2 Filnavn.
  • Jeg ville foretrekke kun filnavn i Kol 2 Filnavn og kun sti, altså den relative sti vi valgte fra Arkade i Kol 1.
  • Men dere kan ha hensyn jeg ikke vet om.
  1. Dere ser feilen med offset av komma i filnavn, som skyldes Excel.
  • Funker fint visning i The V File Viewer sin csv visning og csv viser at dobbel apostrof er korrekt.
  1. ZIP-filer (og andre pakkede formater) må håndteres bedre
  • Foreslår egen kolonne for nivå som vanlig fil eller inne i zip fil
  • f. eks. 1 = Hovedfil som er vanlige filer inklusiv zip rar 7zip filer dokumenter m/undermapper
  • f. eks. 2 = Fil som er inne i en pakket fil (zip rar 7zip osv over)
  1. Absolutt filsti kol 1 versus Filnavn kol 2
  • Det er litt tullete for meg at man at Absolutt filsti er komplett alt + filnavn
  • Mens filsti er bare fra nivå DOKUMENTER f. eks. i Noark 5-uttrekk (ser ikke hvor den kom fra)?
  • Det vanlige ville vært sti i kolonne 1 og filnavn i kolonne 2
  • For i Excel er det enkelt med Search Replace for hardkodet del hvis man vil ned til relative sti
    altså relativ til f. eks. Noark 5 DOKUMENT(ER)
  1. Slår Arkade 5 opp mot register eller er Arkivversjon mot PUID hardkodet pr. versjon Arkade 5?

  2. Foreslår *) for filformat som er Arkivformat, men bør ha med PDF/A i tilllegg (som vi i Depot ofte da må lage)
    8 . Foreslår **) for pakkede filformater. Det hjelper fint lite for bevaring og depot om ZIP er godkjent filformat, hvis innholdet inne i pakken er bare produksjonsformater?

dokumenter-debug-02-filformatinfo_med-komma-error.xlsx
dokumenter-debug-02-filformatinfo-statistikk.csv
dokumenter-debug-02-filformatinfo-statistikk.xlsx
Arkade5_v2 9 0_a01

dokumenter-debug-02-filformatinfo.csv
dokumenter-debug-02-filformatinfo
Arkade5_v2 9 0_a02

@erikaaberg
Copy link

Oppdatering pr. 6/3-23. Litt diverse ting over. Mye er forbedret i versjon 2.9.1, og mye er avklart. Se også release notes. Vi har fortsatt ikke helt avklart hvordan vi skal publisere JSON "master lista" over foretrukne formater, men det kommer.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants