Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

handwerk #11

Open
rvosa opened this issue Feb 25, 2019 · 3 comments
Open

handwerk #11

rvosa opened this issue Feb 25, 2019 · 3 comments

Comments

@rvosa
Copy link
Member

rvosa commented Feb 25, 2019

Het valt me op dat de naam van de vicuna verkeerd is gespeld en dat er wat inconsistenties zijn in de kolommen van de gedomesticeerde data sets (quotes ja/nee, een eerste kolom met record numbers ja/nee). Ik vermoed dat dit het resultaat is van handwerk, wat dus niet goed reproduceerbaar is. Het lijkt me toch beter dat we dat niet doen: in principe moet elke stap opnieuw te doen zijn door scripts te runnen.

@ElkeHendrix
Copy link
Member

ElkeHendrix commented Feb 26, 2019

Klopt ik zie al wat ik verkeerd heb gedaan, ik heb alle zipfiles afzonderlijk gedownload en toen is er wat mis gegaan met de namen. Ik download nu alles direct van de github.

En bij het opslaan als csv voegt r een id row toe, ik kijk even hoe ik die eruit haal.

En wat bedoel je precies met de quotes, gaat dat om de underscore of om meer?

@rvosa
Copy link
Member Author

rvosa commented Feb 28, 2019

Als je CSV wegschrijft met R dan gaan er by default double quotes om alle tekstvelden, dus de soortnamen. Die kolom met nummers en die quotes zet je zo uit: https://github.com/naturalis/trait-geo-diverse-ungulates/blob/master/script/darwincore2csv.R#L38-L44

@rvosa rvosa closed this as completed Feb 28, 2019
@rvosa
Copy link
Member Author

rvosa commented Apr 1, 2019

Sorry, maar het kan echt niet dat er stiekem toch dingen met de hand gedaan moeten worden. De gedachte is dat dit onderzoek door anderen opnieuw uitgevoerd kan worden. Als we een manuscript indienen en het blijkt niet te werken omdat er stilletjes stappen gezet moesten worden die nergens gedocumenteerd staan = reject = al het werk voor niets gedaan.

@rvosa rvosa reopened this Apr 1, 2019
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants