Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Bruk konsistent nummerering av metadatafelt (MXXX) #10

Conversation

petterreinholdtsen
Copy link
Contributor

Det forenkler maskinell prosessering av Noark 5-relaterte tekster hvis
en kan vite at alle metadatafelt har konsistent identifikator, slik det
har vært i Noark 5 i mange år. Jeg tenker her på MXXX-formatet, der
alle metadata har en identifikator som består av M fulgt av tre siffer.

I metadatakatalog.xsd for v5.0 er det introdusert et avvik fra dette,
M001-a. Jeg foreslår at denne heller gis identifikator M016, som er den
første som er ledig i ID-serien (1-19).

Denne M016 bør kanskje også endre navn til UUID, for a gjøre det klart
for alle lesere hva det er slags type ID?

Det forenkler maskinell prosessering av Noark 5-relaterte tekster hvis
en kan vite at alle metadatafelt har konsistent identifikator, slik det
har vært i Noark 5 i mange år.  Jeg tenker her på MXXX-formatet, der
alle metadata har en identifikator som består av M fulgt av tre siffer.

I metadatakatalog.xsd for v5.0 er det introdusert et avvik fra dette,
M001-a.  Jeg foreslår at denne heller gis identifikator M016, som er den
første som er ledig i ID-serien (1-19).

Denne M016 bør kanskje også endre navn til UUID, for a gjøre det klart
for alle lesere hva det er slags type ID?
@AnnKnu
Copy link

AnnKnu commented Feb 5, 2020

@joergen-vs, kjenner du til bakgrunn hvorfor M001-a er bruk i xsd?

arkivverket/noark5-standard#6 (comment)

@joergen-vs
Copy link
Contributor

"001-a" var noe jeg tok ut av luften, for å ha en spesifisering av "001". Den kan fint bli "016"

@petterreinholdtsen
Copy link
Contributor Author

Hva konkret er poenget med å dele dem? De ser jo ut til å begge representere en UUID. Hentet fra arkivsttruktur.xsd:

  <xs:simpleType name="ID">
    <xs:annotation>
      <xs:documentation>M001-a</xs:documentation>
    </xs:annotation>
    <xs:restriction base="xs:string">
      <xs:pattern value="[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}"/>
    </xs:restriction>
  </xs:simpleType>
  
  <xs:complexType name="systemID">
    <xs:annotation>
      <xs:documentation>M001</xs:documentation>
    </xs:annotation>
    <xs:simpleContent>
      <xs:extension base="ID">
        <xs:attribute name="label" type="xs:string"/>
      </xs:extension>
    </xs:simpleContent>
  </xs:complexType>

Hvis jeg forstår dette riktig så er M001-a navngit ID og har formatkrav som gjør det til en UUID, mens M001 er navngitt "systemID" og er en undertype av ID med de samme formatkrav. De burde dermed være ekvivalente og ethvert sted ID brukes i XSD-ene kan en i stedet bruke systemID. Hva har jeg misforstått?

@joergen-vs
Copy link
Contributor

Fordi ID brukes av andre felter også, f.eks. referanseAvskrivesAvJournalpost. Men de trenger ikke 'label'-attributtet som er lagt til systemID, som er ment som et hjelpefelt for arkivenhet (intern id, hjelpetekst, post-type o.l.). Så kan de heller arve fra en enkel type som har innholds-regler.

@petterreinholdtsen
Copy link
Contributor Author

petterreinholdtsen commented Feb 12, 2020 via email

@petterreinholdtsen
Copy link
Contributor Author

En ekvivalent fiks ble sjekket inn i b5bb14e, ca3d638 og 31ac9f5, så jeg lukker demme som løst.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

3 participants