-
Notifications
You must be signed in to change notification settings - Fork 4
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
handwerk #11
Comments
Klopt ik zie al wat ik verkeerd heb gedaan, ik heb alle zipfiles afzonderlijk gedownload en toen is er wat mis gegaan met de namen. Ik download nu alles direct van de github. En bij het opslaan als csv voegt r een id row toe, ik kijk even hoe ik die eruit haal. En wat bedoel je precies met de quotes, gaat dat om de underscore of om meer? |
Als je CSV wegschrijft met R dan gaan er by default double quotes om alle tekstvelden, dus de soortnamen. Die kolom met nummers en die quotes zet je zo uit: https://github.com/naturalis/trait-geo-diverse-ungulates/blob/master/script/darwincore2csv.R#L38-L44 |
Sorry, maar het kan echt niet dat er stiekem toch dingen met de hand gedaan moeten worden. De gedachte is dat dit onderzoek door anderen opnieuw uitgevoerd kan worden. Als we een manuscript indienen en het blijkt niet te werken omdat er stilletjes stappen gezet moesten worden die nergens gedocumenteerd staan = reject = al het werk voor niets gedaan. |
Het valt me op dat de naam van de vicuna verkeerd is gespeld en dat er wat inconsistenties zijn in de kolommen van de gedomesticeerde data sets (quotes ja/nee, een eerste kolom met record numbers ja/nee). Ik vermoed dat dit het resultaat is van handwerk, wat dus niet goed reproduceerbaar is. Het lijkt me toch beter dat we dat niet doen: in principe moet elke stap opnieuw te doen zijn door scripts te runnen.
The text was updated successfully, but these errors were encountered: