-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Normalisez le titre et l'objet #15
Comments
Tâche absolument nécessaire car datasette-lite ( refers to #9 (comment) ) ne peut pas charger le CSV à cause des "" qui traînent dans le texte. Il en est de même pour tablerow. |
|
Je ne comprends pas trop les deux liens envoyés |
Oui je l'ai mis pour moi-même hahaha. |
Sinon il faudra mettre à jour ta branche avec main ( via un rebase) quand t'auras fini car j'ai poussé une mise à jour sur main avec:
Du coup une fois que t'auras terminé le clean dans ton fichier process_data , tu pourras juste rajouter l'enlèvement des espaces en trop et les guillemets dans la fonction normalize |
https://docs.python.org/3/library/textwrap.html#textwrap.dedent
https://github.com/wolfgarbe/SymSpell
https://github.com/jfilter/clean-text
https://ftfy.readthedocs.io/en/v6.0/
https://github.com/maxbachmann/RapidFuzz
The text was updated successfully, but these errors were encountered: