Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Les thésaurus sont encodés avec une date de publication en double #918

Open
vbombaerts opened this issue Sep 27, 2024 · 18 comments
Open

Comments

@vbombaerts
Copy link

Sur Metawal-temp (pas vérifié sur les autres environnements), quand on ajout des mots-clés depuis un thésaurus, la date de publication du thésaurus est encodée en double

image

Ex: https://metawal-temp.wallonie.be/geonetwork/srv/eng/catalog.search#/metadata/cead67e8-fd93-4741-a38b-fa798f723a39 ou

@vbombaerts
Copy link
Author

vbombaerts commented Sep 27, 2024

Peut-être directement lié au thésaurus. J'ai le problème aussi sur la prod actuelle et j'ai réimporté des thésaurus hier. Même le thésaurus infraSIG pose problème aujourd'hui alors qu'hier j'ai édité plusieurs fiches pour ajouter un mot-clé infrasig sans souci.

@vbombaerts
Copy link
Author

Solution temporaire pour corriger les XML : batch edit de type supprimer avec la condition suivante (sur les données/series)

/mdb:MD_Metadata/mdb:identificationInfo/mri:MD_DataIdentification/mri:descriptiveKeywords/mri:MD_Keywords/mri:thesaurusName/cit:CI_Citation/cit:date[2]

@fxprunayre
Copy link

En lien avec geonetwork#6972

@vbombaerts
Copy link
Author

J'ai l'impression que c'est présent sur tous les thésaurus, pas uniquement sur les thésaurus DCAT. A vérifier.
J'ai aussi l'impression que c'est apparu "tout à coup" alors que le problème n'était pas là avant. (mais je ne l'avais peut-être juste pas remarqué avant...)

@fxprunayre
Copy link

Oui c'est pour tous les thésaurus. L'idée était d'ajouter les informations sur toutes les dates du thésaurus (création, publication, révision) quand elles sont déclarées. Y'a quelques améliorations possibles.

@fxprunayre
Copy link

fxprunayre commented Sep 30, 2024

A déployer en test @GeryNi

Cf. geonetwork#8392

@fxprunayre
Copy link

Disponible en test pour validation.

@vbombaerts
Copy link
Author

C'est pas encore ça. J'ai ouvert en édition puis enregistré et fermé.
https://metawal.test.wallonie.be/geonetwork/napits/api/records/5467f3bd-c898-4531-bb4f-9f7b670d794b/formatters/xml
image

@fxprunayre
Copy link

Oui j'attends un retour de Ian pour savoir ce qu'ils voulaient faire exactement.
Pour nous, le plus simple serait de n'avoir qu'une date dans le thésaurus de type années-mois-jour eg.

    <dcterms:modified>2015-12-17</dcterms:modified>

Peut être que ça vaut le coup de prendre tous les thésaurus de prod et de les mettre dans github en vérifiant ça ?

@fxprunayre
Copy link

Thésaurus mis à jour dans github

https://github.com/SPW-DIG/metawal-core-geonetwork/tree/metawal-4.4.x/web/src/main/webapp/WEB-INF/data/config/codelist/external/thesauri/theme

avec correction dans les thésaurus suivants:

  • inspire-technical-guidelines.rdf
  • Themes_geoportail_wallon_hierarchy.rdf
  • httpinspireeceuropaeucodelistEnvironmentalDomain-EnvironmentalDomain.rdf
  • httpinspireeceuropaeuglossary-glossary.rdf
  • httpregistrymetawalcodelistmediatypes-media-types.rdf
  • httpinspireeceuropaeucodelistZoneTypeCode-ZoneTypeCode.rdf
  • httpinspireeceuropaeumetadatacodelistDegreeOfConformity-DegreeOfConformity.rdf

Corrections:

  • suppression de l'heure
  • ou suppression d'une des 2 dates

Correction faite lors de l'import depuis un registre pour ne fixer que la date dct:issued

@vbombaerts
Copy link
Author

vbombaerts commented Oct 4, 2024

Je voudrais modifier le nom high-value-dataset-applicable-legislation.rdf --> applicable-legislation.rdf et qques infos (title, description + ajout des legilsations ITS) de https://github.com/SPW-DIG/metawal-core-geonetwork/blob/metawal-4.4.x/web/src/main/webapp/WEB-INF/data/config/codelist/external/thesauri/theme/high-value-dataset-applicable-legislation.rdf,

Est-ce qu'en faisant un batch editing pour changer le nom du thésaurus dans les fiches permettra de ne pas casser les fiches ?

@vbombaerts
Copy link
Author

Une fois les thesaurus corrigés rechargés, il faut éditer toutes les fiches ?

@vbombaerts
Copy link
Author

Thésaurus corrigés rechargés en environnement de valid

@vbombaerts
Copy link
Author

Thésaurus corrigés rechargés en prod.
Il faut repérer et corriger les fiches qui ont encore l'erreur de la double date de publication via une requête SQL. A faire pour les 3 environnements.

@fxprunayre
Copy link

Pour avoir la liste des fiches:

WITH ns AS (select ARRAY [ARRAY ['xlink', 'http://www.w3.org/1999/xlink'],
                       ARRAY ['mdb', 'http://standards.iso.org/iso/19115/-3/mdb/2.0'],
                       ARRAY ['cit', 'http://standards.iso.org/iso/19115/-3/cit/2.0'],
                       ARRAY ['mri', 'http://standards.iso.org/iso/19115/-3/mri/1.0'],
                       ARRAY ['mco', 'http://standards.iso.org/iso/19115/-3/mco/1.0'],
                       ARRAY ['mrd', 'http://standards.iso.org/iso/19115/-3/mrd/1.0'],
                       ARRAY ['xsi', 'http://www.w3.org/2001/XMLSchema-instance'],
                       ARRAY ['gco', 'http://standards.iso.org/iso/19115/-3/gco/1.0']] AS n)
SELECT * FROM (
    SELECT distinct(
                             unnest(xpath('//mdb:identificationInfo/*/mri:citation/*/cit:title/*/text()',
                                          XMLPARSE(DOCUMENT data), n)))::text AS currentTitle,
                         uuid                                                 as currentId,
                         unnest(xpath('count(//mri:descriptiveKeywords/*/mri:thesaurusName/*[count(cit:date) > 1]/cit:title/*/text())',
                                      XMLPARSE(DOCUMENT data), n))::text::int      AS nbThesaurusWithMoreThanOneDate
          FROM metadata,
               ns
          WHERE isharvested = 'n'
          ORDER BY uuid) AS records
WHERE nbThesaurusWithMoreThanOneDate > 0;

@GeryNi
Copy link

GeryNi commented Nov 26, 2024

@marceaulouis: Exécuté en TEST: à tester ?

Exzemple en TEST: https://metawal.test.wallonie.be/geonetwork/napits/api/records/5467f3bd-c898-4531-bb4f-9f7b670d794b/formatters/xml

Corrigé en TEST:
Image

@vbombaerts
Copy link
Author

Testé sur Biens patrimoine mondial UNESCO - Service de visualisation WMS et c'est OK.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

3 participants