Esta ferramenta faz parte de um trabalho de graduação e mestrado e busca facilitar a extração de dados de projetos hospedados em repositórios Git/GitHub.
A ferramenta encontra-se escrita em Python para extração em projetos escritos em Java, mais precisamente Python 2.7, a busca pelos dados brutos existente no repositório Git é feita executando scripts Bash executados a partir de chamadas Python. Assim, neste momento a ferramenta necessita estar dentro de um repositório Git. Atualmente os dados extraidos devem ser armazendos em arquivo CSV para análise dos dados extraidos.
Para execução da ferramenta faz-se necessário duas listas de informações:
- Lista de imports que fazem referência a API - arquivo imports.txt
- Lista de métodos que buscam - arquivo log4j.txt
- A ferramenta deve estar na raiz do projeto que contem um repositório Git
- Deve ser execução do arquivo main.py
- A ferramenta irá gerar um arquivo tuplas_extraidas.cvs, onde poderão ser vistas as tuplas gerais relacionando os dados extraídos.
Como resultado poderão ser vistas tuplas relacionando os seguintes dados
- PROJETO
- CODIGO DO COMMITE
- TIMESTAMP DO COMMIT
- DESENVOLVEDOR
- ARQUIVO
- MÉTODO/ATRIBUTO COMMITADO
- QUANTIDADE DE VEZES COMMITADO