Distinção de vira-latas caramelos

1. O que é o projeto?

Os vira-latas caramelos são cachorros sem raça definida e que possuem a cor caramelo em sua pelugem. Apesar de serem animais sem raça definida, possuem um padrão em suas caraterísticas físicas que podem ser encontradas: pêlos na cor caramelo, focinho comprido e em alguns casos mesclagem com a cor preta na pelugem.

Em contrapartida, existem os animais com raças definidas, como os poodles, labradores, pastores alemães, etc. De acordo com a raça, é possível observar que existe também dentro de cada uma delas um padrão para os animais.

A intenção deste projeto é distinguir os vira-latas caramelos dos demais cachorros de raça.

2. O dataset

Um grande conjunto de dados pode ser considerado um dataset. O dataset deste projeto conta com imagens de animais de raça, contidos na pasta de treino e posteriormente na pasta chamada normais, e as imagens de vira-latas caramelos podem ser encontradas na pasta de treino e posteriormente na pasta caramelos.

Apesar de que os vira-latas caramelos possuem um padrão entre si conforme mencionado anteriormente, para facilitar o objetivo de encontrar e distinguir os cães do dataset, há uma grande quantidade de fotos do mesmo vira-lata caramelo, nomeado como Zeca. Desse modo, as fotos com o Zeca tendem a possuir maior facilidade de serem distinguidas caso os demais vira-latas caramelos não possuam um padrão tão definido em seus traços.

3. O uso de deep learning no projeto

Deep Learning é conhecido como uma área dentro do aprendizado de máquina (também conhecido como machine learning) que faz o uso de algoritmos de redes neurais para encontrar padrões, previsões e identificação de imagens.

A rede neural é uma sequência de camadas e podemos usar o modelo sequencial oferecido pelo Keras, que possui as funções necessárias para construir cada camada de uma rede neural convolucional.

3.1 Construção da rede neural

A primeira camada de Convolução utiliza 32 features para o array 2D e o array no formato 3x3, As imagens de 64x64px serão armazenadas em um array de 3 dimenções devido ao modo de cor das imagens (R, G e B).

Após a aplicação da primeira camada de Convolução é realizado um agrupamento para reduzir o mapa de features decorrente da primeira camada, reduzindo o tamanho dele.

Logo após o primeiro pooling, é adicionado outra camada de Convolução para tornar a rede mais profunda, após isso é realizado o segundo Pooling (Agrupamento).

Depois da segunda camada de convolução estar preparada é realizado o achatamento (Flatten), que converte a estrutura de dados 2D resultantes da segunda camada em 1D, ou seja, um vetor.

No próximo passo todas as camadas são conectadas utilizando uma função de ativação retificadora (relu). Também é utilizado então uma função de ativação sigmóide para obter as probabilidades de cada imagem conter um cachorro normal ou um vira-lata caramelo. O modelo raramente terá 100% de certeza e o que ele gera como um resultado é uma probabilidade.

Para compilar a rede, é utilizado o otimizador "Adam" e uma função log loss com "entropia binária cruzada". A métrica utilizada será a acurácia, pois essa é a maior preocupação no treinamento deste tipo de modelo.

5.0 Como rodar o projeto

Para rodar o projeto basta execultar o jupyter notebook no diretorio do projeto e executar as etapas do arquivo (ViraLataCarameloNotebook)[ViraLataCarameloNotebook.ipynb].

5.0 Resultados

Como resultado do treino e da predição temos que o treino realizou todas as etapas do fit_generator com uma acuracia acima de 80%, porém a predição falhou na imagem escolhida, indicando que a foto de um cachorro normal era um vira-lata caramelo. O notebook da execução pode ser encontrado aqui.

Desenvolvedores do projeto

É importante destacar para fins de correção que o numero de alterações no código ou de commits não reflete o esforço realizado por cada membro da equipe, visto que o projeto foi realizado de forma presencial e em grupo, tendo participação dos 3 membros listados abaixo, porém por desatenção dos membros os commits foram realizados sem o co-authored.

Gabriel Batista Albino Silva - 16/0028361
Gabriela Barrozo Guedes, 16/0121612
Helena Bretas Goulart, 16/0124034

Referências

[1]deep learning - o que é e qual é a sua importância?

[2]afinal, o que é deep learning?

[3]redes neurais - o que são e qual é a sua importância?

[4] VARGAS, Ana Caroline Gomes; PAES, Aline; VASCONCELOS, Cristina Nader. Um estudo sobre redes neurais convolucionais e sua aplicação em detecção de pedestres. In: Proceedings of the XXIX Conference on Graphics, Patterns and Images. 2016. p. 1-4.

[5] KOVÁCS, Zsolt László. Redes neurais artificiais. Editora Livraria da Fisica, 2002.

[6]capítulo 47 – reconhecimento de imagens com redes neurais convolucionais em python – parte 4

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
dataset		dataset
.gitignore		.gitignore
README.md		README.md
ViraLataCarameloNotebook.ipynb		ViraLataCarameloNotebook.ipynb
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Distinção de vira-latas caramelos

1. O que é o projeto?

2. O dataset

3. O uso de deep learning no projeto

3.1 Construção da rede neural

5.0 Como rodar o projeto

5.0 Resultados

Desenvolvedores do projeto

About

Releases

Packages

Contributors 3

Languages

deeplearningunb/ViraLataCaramelo

Folders and files

Latest commit

History

Repository files navigation

Distinção de vira-latas caramelos

1. O que é o projeto?

2. O dataset

3. O uso de deep learning no projeto

3.1 Construção da rede neural

5.0 Como rodar o projeto

5.0 Resultados

Desenvolvedores do projeto

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages