-
Notifications
You must be signed in to change notification settings - Fork 2
NLP : Instanciation LLM Tranformer
L'objectif de cet atelier est de cerner les objectifs du projet, l'impact visé et de de proposer un périmètre et des usages cibles.
- Pour chaque participant: Nom, Prénom, Métier, Service
- Alain Crawford, DS, DIE Direction Immobilier Etat
- Mehdi Boyer, DS, DiTP
- Benoit Courty, DS, Assemblee nationale
Mettre a disposition les nouveaux modeles de langage (LLM type ChatGPT) dans l'administration
- Est-ce un besoin de votre service ? Oui
- Si pertinent, à quelles autres services pourrait-on également apporter cette solution ?
Beaucoup car les usages sont multiples :
- Extraction d'information
- Resume
- Classification
- Generation de texte (suggestion de reponse a une demande usager)
- Question Answering
- Moderation de contenu / Anonymisation
- reformulation
- Suggestion d'amelioration d'aprres une liste d'avis usager
Idéalement, quel impact aura la solution que vous visez ? Quelles difficultés résorbera-t-elle, ou quelles nouvelles possibilités apportera-t-elle ?
- Eviter les taches repetitive
- Gain de qualite : respect d'une charte administrative
- Gain de temps : delai de traitement raccourcis
- Automatisation de taches nouvelle qui ne pouvait pas etre realisee manuellement
-
Ce qui est dans le périmètre
- Recherche des solutions
- Identifier les contraintes et possibilite
- Identifier les cas d'usages
- Hebergement du POC
- Besoin et Solution de deploiement : DiNUM
- Mettre a disposition une API
- Option : Perennisation de la solution
-
Ce qui est exclu du périmètre
- API publique : trop gourmand
- Uniquement du contenu texte
-
Quels objectifs d'ici l'été ? Quels objectifs d'ici la fin de la saison 2023 ?
- Ete:
- Déploiement chez Onyxia
- Ete:
Le but de cet atelier est de faire un état des lieux de l'existant, en partageant ce qui a déjà été fait par les membres de l'équipe et en recensant les ressources disponibles qui pourraient être utiles au projet.
Avez-vous connaissance de répertoires open source sur lesquels on pourrait s'appuyer (ou éventuellement de solutions propriétaires) ?
- Quel est l'apport de cette ressource au projet ?
- Est-elle utilisable telle quelle ou des modifications de code sont-elles nécessaires ?
- Éventuellement, prendre un peu de temps pour faire des recherches sur Internet
- Ce qui a été testé (qui aurait fonctionné ou non, sur tel ou tel cas d'usage)
- Ce qui peut-être testé facilement ? (si possible, le tester dans cet atelier)
- Ce qu'on devrait tester plus tard
Faire une synthèse de l'atelier, en résumant l'état des lieux et en listant les solutions à tester à l'avenir
L'objectif de la suite de l'atelier est de déterminer au sein de chaque groupe les jalons opérationnels de votre projet, ainsi que la production qui constituera le rendu majeur du projet. Par exemple, un jalon peut être la mise en place d'une infrastructure, le développement d'un produit intermédiaire (documentation, API, logiciel, base de données, etc.), une contribution à un produit libre déjà existant, la réalisation d'une batterie de tests, etc. La méthodologie qui sera déterminée pendant cet atelier pourra bien sûr être complétée et évoluer au fil du projet, l'objectif de cette séance est de se donner un premier guide pour structurer les collaborations.
Avec qui d'autre collaborer pour assurer la réussite du projet ? Pour chaque collaboration envisagée, indiquer la nature de la collaboration (partage de retours d'expériences, mise à disposition de données, écriture de code, etc.) :
Nature du livrable (documentation, API, logiciel, base de données, etc.) et description sommaire (technologies) :
- Jalon "notre premier jalon" : nature et description
- Jalon "nos premiers tests" :
- Jalon "notre deuxième jalon" : nature et description
- ...
- ...
- python3
- Structure spécialisée en calcul : Plusieurs GPU et centaines de Go de RAM.
- Pereniser l'infrastructure et les competences