Skip to content

Commit

Permalink
Merge pull request #108 from cienciadedatos/pr-89
Browse files Browse the repository at this point in the history
Translation - Vetores do stringr: frutas, palavras, frases #89
  • Loading branch information
rivaquiroga authored Aug 8, 2024
2 parents cdeec61 + 0e889b3 commit 46d1fed
Show file tree
Hide file tree
Showing 25 changed files with 1,545 additions and 305 deletions.
1 change: 1 addition & 0 deletions .Rbuildignore
Original file line number Diff line number Diff line change
Expand Up @@ -9,3 +9,4 @@
^cran-comments\.md$
^codemeta\.json$
^CRAN-RELEASE$
^data-raw$
2 changes: 1 addition & 1 deletion DESCRIPTION
Original file line number Diff line number Diff line change
Expand Up @@ -70,7 +70,7 @@ License: GPL-3
Encoding: UTF-8
LazyData: true
Roxygen: list(markdown = TRUE)
RoxygenNote: 7.1.2
RoxygenNote: 7.2.3
URL: https://github.com/cienciadedatos/dados
BugReports: https://github.com/cienciadedatos/dados/issues
Depends:
Expand Down
31 changes: 31 additions & 0 deletions R/stringr.R
Original file line number Diff line number Diff line change
@@ -0,0 +1,31 @@
#' Vetores de caracteres do pacote stringr
#'
#' Amostra de vetores de caracteres para praticar a manipulação de strings
#'
#' frases - é uma lista de frases escritas em português
#'
#' frutas - é uma seleção e adaptação ao português dos dados de prática contidos em stringr::fruit.
#'
#' palavras - é uma lista de palavras frequentes usadas em português brasileiro
#' @format Um vetor
#' @name dados-stringr
#' @examples
#'
#' length(frases)
#' frases[1:5]
#'
#' length(frutas)
#' frutas[1:5]
#'
#' #' length(palavras)
#' palavras[1:5]
NULL

#' @rdname dados-stringr
"frases"

#' @rdname dados-stringr
"frutas"

#' @rdname dados-stringr
"palavras"
16 changes: 8 additions & 8 deletions README.Rmd
Original file line number Diff line number Diff line change
Expand Up @@ -20,11 +20,12 @@ library(stringr)
knitr::opts_chunk$set(echo = TRUE)
```

# dados <img src="man/figures/dados-hex.png" align="right" width = "120px"/>
# dados <img src="man/figures/dados-hex.png" align="right" width="120px"/>

<!-- badges: start -->
[![CRAN status](https://www.r-pkg.org/badges/version/dados)](https://cran.r-project.org/package=dados)
[![R-CMD-check](https://github.com/cienciadedatos/dados/workflows/R-CMD-check/badge.svg)](https://github.com/cienciadedatos/dados/actions)

[![CRAN status](https://www.r-pkg.org/badges/version/dados)](https://cran.r-project.org/package=dados) [![R-CMD-check](https://github.com/cienciadedatos/dados/workflows/R-CMD-check/badge.svg)](https://github.com/cienciadedatos/dados/actions)

<!-- badges: end -->

Este pacote disponibiliza a tradução de conjuntos de dados em inglês originalmente disponíveis em outros pacotes de R. Os dados traduzidos são utilizados nos exemplos do livro [R for Data Science](https://r4ds.had.co.nz/) de Hadley Wickham & Garrett Grolemund, cuja [versão em português](https://altabooks.com.br/produto/r-para-data-science/) foi publicada por AltaBooks & O'Reilly.
Expand All @@ -44,7 +45,6 @@ A versão de desenvolvimento pode ser instalada a partir do GitHub:
remotes::install_github("cienciadedatos/dados")
```


## Traduções

As traduções disponíveis dentro de `dados` são as seguintes:
Expand All @@ -67,18 +67,19 @@ pkgs %>%
knitr::kable()
```

Os dados para praticar a manipulação de strings são `frases`, `palavras` e `frutas`.

## Uso

O pacote `dados` pode ser carregado como qualquer outro pacote de R:
O pacote `dados` pode ser carregado como qualquer outro pacote de R:

```{r, message = FALSE}
library(dados)
library(ggplot2)
library(dplyr)
```

Ao carregar o pacote, as variáveis que contêm os dados estarão disponíveis imediatamente para uso. Porém, os dados não serão traduzidos até que a variável seja "chamada" explicitamente por um comando. Neste exemplo, o conjunto de dados `diamante`, que provém de `ggplot2::diamonds`, é carregado no _workspace_ do R no momento em que o chamamos pela primeira vez em português:
Ao carregar o pacote, as variáveis que contêm os dados estarão disponíveis imediatamente para uso. Porém, os dados não serão traduzidos até que a variável seja "chamada" explicitamente por um comando. Neste exemplo, o conjunto de dados `diamante`, que provém de `ggplot2::diamonds`, é carregado no *workspace* do R no momento em que o chamamos pela primeira vez em português:

```{r}
glimpse(diamante)
Expand All @@ -97,8 +98,7 @@ diamante %>%
```

<img src="man/figures/diamantes.png">

<img src="man/figures/diamantes.png"/>

## Funções internas de `dados`

Expand Down
8 changes: 6 additions & 2 deletions README.md
Original file line number Diff line number Diff line change
@@ -1,13 +1,14 @@

<!-- README.md is generated from README.Rmd. Please edit that file -->

# dados <img src="man/figures/dados-hex.png" align="right" width = "120px"/>
# dados <img src="man/figures/dados-hex.png" align="right" width="120px"/>

<!-- badges: start -->

[![CRAN
status](https://www.r-pkg.org/badges/version/dados)](https://cran.r-project.org/package=dados)
[![R-CMD-check](https://github.com/cienciadedatos/dados/workflows/R-CMD-check/badge.svg)](https://github.com/cienciadedatos/dados/actions)

<!-- badges: end -->

Este pacote disponibiliza a tradução de conjuntos de dados em inglês
Expand Down Expand Up @@ -84,6 +85,9 @@ As traduções disponíveis dentro de `dados` são as seguintes:
| dados_oms | Dados de tuberculose da Organização Mundial da Saúde | tidyr | who |
| dados_oms2 | Dados de tuberculose da Organização Mundial da Saúde | tidyr | who2 |

Os dados para praticar a manipulação de strings são `frases`, `palavras`
e `frutas`.

## Uso

O pacote `dados` pode ser carregado como qualquer outro pacote de R:
Expand Down Expand Up @@ -128,7 +132,7 @@ diamante %>%
labs(title = "Diamantes", subtitle = "Preço e transparência", y = "Preço", x = "Transparência")
```

<img src="man/figures/diamantes.png">
<img src="man/figures/diamantes.png"/>

## Funções internas de `dados`

Expand Down
43 changes: 43 additions & 0 deletions data-raw/frases.R
Original file line number Diff line number Diff line change
@@ -0,0 +1,43 @@
# Vetor de frases, criado com o ChatGPT
# Solicitei que adicionasse frases de livros do Machado de Assis
frases <- c(
"Ao verme que primeiro roeu as frias carnes do meu cad\u00E1ver dedico como saudosa lembran\u00E7a estas Mem\u00F3rias P\u00F3stumas.",
"N\u00E3o tive filhos, n\u00E3o transmiti a nenhuma criatura o legado da nossa mis\u00E9ria.",
"Ao vencedor, as batatas.",
"Marcela amou-me durante quinze meses e onze contos de r\u00E9is.",
"Aos quarenta e cinco anos estava ainda mo\u00E7o, e para a minha cura n\u00E3o havia outro rem\u00E9dio sen\u00E3o um enterro.",
"Olhando bem para dentro de mim mesmo, verifiquei que a vida podia ser comparada a uma viagem de barco.",
"Eu sou um homem que carrega dentro de si muitos homens mortos.",
"Certo de que a fortuna n\u00E3o \u00E9 sen\u00E3o uma grande roleta, em que uns poucos ganham e muitos perdem.",
"A verdadeira filosofia \u00E9 a que nos ensina a viver sem morrer de medo.",
"O tempo \u00E9 um rato roedor das coisas, que as diminui ou altera no sentido de torn\u00E1-las rid\u00EDculas.",
"Nunca conheci quem tivesse levado porrada. Todos os meus conhecidos t\u00EAm sido campe\u00F5es em tudo.",
"N\u00E3o \u00E9 o sentimento que nos atrapalha, mas sim a tentativa de entend\u00EA-lo.",
"O destino \u00E9 um ca\u00E7ador furtivo.",
"A loucura, objeto de meus estudos, \u00E9 um enigma que s\u00F3 a morte resolver\u00E1.",
"Cada qual sabe amar a seu modo; o modo pouco importa; o essencial \u00E9 que saiba amar.",
"A dor \u00E9 um rem\u00E9dio indispens\u00E1vel ao ser humano.",
"Cada qual sabe amar a seu modo; o modo pouco importa; o essencial \u00E9 que saiba amar.",
"A diferen\u00E7a entre a paisagem e o homem \u00E9 que a paisagem n\u00E3o muda nunca.",
"A desconfian\u00E7a \u00E9 a m\u00E3e da seguran\u00E7a.",
"A vida sem luta \u00E9 um mar morto no centro do organismo universal.",
"A melhor defini\u00E7\u00E3o do amor n\u00E3o vale um beijo de mo\u00E7a namorada.",
"A d\u00FAvida \u00E9 o privil\u00E9gio dos s\u00E1bios.",
"A eternidade \u00E9 um rel\u00F3gio de areia.",
"A esperan\u00E7a \u00E9 um empr\u00E9stimo que se pede \u00E0 felicidade.",
"A humildade \u00E9 o \u00FAnico escudo contra a vaidade.",
"A ironia \u00E9 a chave do esp\u00EDrito.",
"A maior parte das pessoas que falam das belezas da virtude n\u00E3o a praticam.",
"A mentira \u00E9 muitas vezes t\u00E3o involunt\u00E1ria como a respira\u00E7\u00E3o.",
"A morte \u00E9 um sono sem sonhos.",
"A saudade \u00E9 o remorso de n\u00E3o termos aproveitado cada instante.",
"A virtude \u00E9 o brilho do esp\u00EDrito.",
"As feridas da alma s\u00E3o curadas com carinho, aten\u00E7\u00E3o e paz.",
"Calar \u00E9 o segredo dos fortes.",
"O passado \u00E9 um pr\u00F3logo.",
"Os olhos s\u00E3o o espelho da alma.",
"A vida \u00E9 uma com\u00E9dia para os que pensam e uma trag\u00E9dia para os que sentem.",
"Viver \u00E9 a coisa mais rara do mundo. A maioria das pessoas apenas existe."
)

usethis::use_data(frases, overwrite = TRUE)
171 changes: 171 additions & 0 deletions data-raw/frutas.R
Original file line number Diff line number Diff line change
@@ -0,0 +1,171 @@
# Vetor de frutas
frutas_chatgpt <- c(
"Abacate",
"Abacaxi",
"A\u00E7a\u00ED",
"Acerola",
"Ameixa",
"Amora",
"Banana",
"Caju",
"Cacau",
"Camu-camu",
"Caqui",
"Carambola",
"Cereja",
"Coco",
"Cupua\u00E7u",
"Damasco",
"Framboesa",
"Figo",
"Goiaba",
"Graviola",
"Jabuticaba",
"Jaca",
"Jambo",
"Kiwi",
"Laranja",
"Lichia",
"Lim\u00E3o",
"Ma\u00E7\u00E3",
"Manga",
"Maracuj\u00E1",
"Melancia",
"Mel\u00E3o",
"Mirtilo",
"Morango",
"Nectarina",
"Noni",
"Papaya",
"P\u00EAssego",
"Pera",
"Pitanga",
"Pitaia",
"Rom\u00E3",
"Sapoti",
"Seriguela",
"Tamarindo",
"Tangerina",
"Tomate",
"Uva",
"Acerola",
"Ara\u00E7\u00E1",
"Atemoia",
"Baru",
"Buti\u00E1",
"Cabeludinha",
"Cagaita",
"Camu-Camu",
"Camu\u00E7\u00E1",
"Castanha-do-Par\u00E1",
"Cupua\u00E7u",
"Groselha",
"Ing\u00E1",
"Jamel\u00E3o",
"Jenipapo",
"Juc\u00E1",
"Mangaba",
"Man\u00E1-Cubiu",
"Murici",
"Pequi",
"Pitanga",
"Pitomba",
"Pu\u00E7\u00E1",
"Quina",
"Sapoti",
"Seriguela",
"Umbu",
"Uvaia",
"Uvaporanga",
"Veludo",
"Xix\u00E1",
"Zabel\u00EA"
)

# https://github.com/cienciadedatos/pt-r4ds/issues/21#issuecomment-1839200177
frutas_sugestao <- c(
"ma\u00E7\u00E3",
"damasco",
"abacate",
"banana",
"piment\u00E3o",
"mirtilo",
"amora",
"groselha",
"laranja sangu\u00EDnea",
"blueberry",
"amoras silvestres",
"fruto-p\u00E3o",
"mel\u00E3o can\u00E1rio",
"mel\u00E3o cantalupo",
"cherimoya",
"cereja",
"pimenta chili",
"clementina",
"amora branca",
"coco",
"arando",
"pepino",
"groselha preta",
"ameixa damasco",
"t\u00E2mara",
"fruta do drag\u00E3o",
"durian",
"berinjela",
"sabugueiro",
"feijoa",
"figo",
"goji berry",
"groselha",
"uva",
"grapefruit",
"goiaba",
"mel\u00E3o verde",
"mirt\u00EDlo",
"jaca",
"jamel\u00E3o",
"jujuba",
"kiwi",
"kumquat",
"lim\u00E3o",
"lima",
"n\u00EAspera",
"lichia",
"mandarina",
"manga",
"amora",
"nectarina",
"noz",
"azeitona",
"laranja",
"pomelo",
"mam\u00E3o",
"maracuj\u00E1",
"p\u00EAssego",
"pera",
"caqui",
"fis\u00E1lis",
"abacaxi",
"ameixa",
"rom\u00E3",
"pomelo",
"mangostin roxo",
"marmelo",
"uva passa",
"rambutan",
"framboesa",
"groselha vermelha",
"mel\u00E3o",
"baga de salal",
"tangerina",
"carambola",
"morango",
"tomate de \u00E1rvore",
"tangerina",
"melancia"
)

frutas <- unique(stringr::str_to_lower(c(frutas_chatgpt, frutas_sugestao)))


usethis::use_data(frutas, overwrite = TRUE)
Loading

0 comments on commit 46d1fed

Please sign in to comment.