Skip to content

laurelianox/DecisionTree

Repository files navigation

DecisionTree

Árvores de decisão são modelos estatísticos que utilizam um treinamento supervisionado para a classificação e previsão de dados. Uma árvore de decisão é um mapa dos possíveis resultados de uma série de escolhas relacionadas.

O que é ?

Prática para implementar uma árvore de decisão em um dataset sobre diabetes.

Versões:

DecisionTree - versão com comentários sobre as bibliotecas e métodos usados. Aconselhado para estudantes.
DecisionTree_ClearVersion - versão só com a aplicação.

Nesta prática utilizamos:

Python
Pandas
Matlotlib
4. Imblearn
4.1. Under_sampling
4.1.1. RandomUnderSampler
4.2.1. TomekLinks
Collections (Counter)
Scikit-learn (model_selection.train_test_split)
Sklearn.tree.DecisionTreeClassifier
Graphviz
Sklearn.metrics.accurancy_store

Processo

  1. Importação dataset.
  2. Análise dos Dados.
  3. Tratamento dos dados desbalanceados.
  4. Redução das classes majoritárias.
  5. Separação do conjunto de dados em features e target.
  6. Realizar separação entre conjunto de teste e treinamento.
  7. Criar árvore de decisão.
  8. Verificando a importancia de cada feature no modelo.
  9. Criando lista com os nomes das features e dos rótulos.
  10. Instalando biblioteca para visualização da árvore de decisão.
  11. Visualização da árvore.
  12. Calculando acurácia do modelo.
  13. Poda de árvore.

Documentação

https://imbalanced-learn.org/stable/references/under_sampling.html#module-imblearn.under_sampling
https://imbalanced-learn.org/stable/references/generated/imblearn.under_sampling.RandomUnderSampler.html?highlight=randomundersampler
https://imbalanced-learn.org/stable/references/generated/imblearn.under_sampling.TomekLinks.html
https://docs.python.org/3/library/collections.html
https://docs.python.org/3/library/collections.html#collections.Counter
https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html
https://scikit-learn.org/stable/modules/classes.html?highlight=tree#module-sklearn.tree
https://graphviz.org/

Final

Agradecimento ao Prof Leandro Lessa pelo aprendizado. Repositório original: https://github.com/ProfLeandroLessa/CDD-material-video-aulas

Aulas ofertadas pela IGTI (atual XP Educação) em parceria com o Banco Pan

Alterações e acréscimos: Lidiane Aureliano https://github.com/laurelianox

Saiba Mais sobre Árvore de Decisão: https://sigmoidal.ai/entendendo-as-arvores-de-decisao-em-machine-learning/

Observação

Apesar de ter entendido o conceito e como se interpreta os nós, não entendi o que os últimos nós respondem. Preciso estudar mais.