Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Partage et enrichissement des données entre instances de TaxHub #28

Open
ghost opened this issue Dec 22, 2018 · 6 comments
Open

Partage et enrichissement des données entre instances de TaxHub #28

ghost opened this issue Dec 22, 2018 · 6 comments
Labels
question Further information is requested

Comments

@ghost
Copy link

ghost commented Dec 22, 2018

Les différentes instances de TaxHub des structures utilisatrices de GeoNature contiennent aussi des
informations sur les différents taxons (photos, médias, articles liés, descriptions, milieux…).
Le titulaire étudiera dans quelle mesure ces différentes instances pourraient partager des contenus
(PnX-SI/TaxHub#110) mais aussi comment elles pourraient être alimentées
par d’autres sources (INPN, Wikidata, EOL…). En se basant notamment sur le web-sémantique.

@ghost ghost changed the title TaxHub API Partage et enrichissement des données entre instances de TaxHub Dec 22, 2018
@camillemonchicourt
Copy link
Member

camillemonchicourt commented Dec 22, 2018

Oui cela est à étudier au niveau de TaxHub où une API assez complète est déjà existante.
Et où des scripts d'intégration de médias provenant de wikidata ou INPN ont été développés entre temps : PnX-SI/TaxHub#150

Reste à voir :

  • pour pouvoir importer des médias depuis l'API GBIF sur le même modèle.
  • importer d'autres types de ressources comme des descriptifs ?
  • si l'API existante de TaxHub permet de partager des contenus entre différentes instances de TaxHub et comment la sécuriser ou l'ouvrir à tous
  • mettre en place le script qui permet d'interroger une API TaxHub pour y récupérer automatiquement les médias et attributs souhaités en pouvant définir des règles (par exemple ne prendre les images que pour les cdnoms où je n'ai aucune image dans mon TaxHub)

@camillemonchicourt
Copy link
Member

Oui concernant les médias se pose aussi la question de stocker les médias localement ou juste de stocker leur URL distantes.
Les 2 se discutent.
Dans ses scripts INPN et Wikidata @amandine-sahl a plutôt opté pour un import local.

Quant aux 2 solutions sur le partage je ne comprends pas assez pour me prononcer.

@orovellotti
Copy link

orovellotti commented Dec 24, 2018

Il y a deux options :

1/ Approche base de données distribuée, LOD:
La phylosophie du Web de données est celle d'une base de données distribuée ou on peut ajouter un nouveau noeud à tout moment en le liant à un noeud existant.
Chaque noeuds est ainsi responsable de ses propres données et doit être en ligne pour être interrogé.

Pour respecter cette vision, il serait intéressant de ne pas rapatrier les données localements.
Si nous avions une UI pour TaxHub ou pour l'Atlas nous pourrions alors lancer la requete sur le LOD à chaque chargement de la page.

2/Approche base centralisée:
Nous pourrions aussi rapatrier les informations sur un serveur GeoNature (Cf Amandine)

Deux problémes ce posent:
a) juqu'ou aller, en effet le Web de donnée est ouvert et donc on ne peut pas tout rapatrier
b) que faire de la responsabilité, si la source change comment le savoir et comment mettre à jour le server local.

Je privilégirais l'option 1 avec une page dynamique (dans l'Atlas) qui permettrais de découvir les données associées présente sur le LOD.

@orovellotti orovellotti added the question Further information is requested label Dec 24, 2018
@camillemonchicourt
Copy link
Member

Là tu m'as perdu.
On pensait juste faire un script qui puisse se connecter à l'API d'un autre TaxHub (avec connexion ?) pour y rapatrier les médias et attributs pour lesquels il n'a pas d'info localement.

@ghost
Copy link
Author

ghost commented Jan 9, 2019

Oui, un script est évidement une solution pragmatique à un problème de première nécessité.

Ce que propose Olivier dans son option d'approche "distribuée", dans ma compréhension, serait d'embarquer des données sémantiques dans le code html des pages de taxhub et occtax et de rendre ainsi leur URI déréférençable ("To dereference a URI means to request a representation of the resource designated by the URI.").

Ces données pourrait être aussi composées d'URIs déréférençables nous liant au reste du lod (par l'intermédiaire de taxref-ld et mnhn, gbif, dbpedia, ... par exemple) avec la liberté de mutualiser toutes les ressources.

@camillemonchicourt
Copy link
Member

Oui OK dans ce cas ça serait au niveau de GeoNature-atlas, car c'est là que les données sont vraiment accessibles, exposées et publiques.
Mais je pense qu'on verra ça dans un prochain projet.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
question Further information is requested
Projects
None yet
Development

No branches or pull requests

2 participants