Uma plataforma para coleta e análise de dados do GitHub

Natan Fernandes Cláudio Oliveira, Tassio Ferenzini Martins Sirqueira

Resumo


Os repositórios de código-fonte são fontes ricas da história da evolução de projetos de software e podem ser acessados e estudados abertamente. Quando queremos estudar algum fenômeno dentro da engenharia de software, precisamos de muitos dados históricos, e os projetos de código aberto são uma excelente oportunidade para explorar esse universo. Com a análise de dados históricos contidos em repositórios de códigofonte, é possível detectar e identificar padrões que podem explicar a evolução dos sistemas de software. Neste trabalho, desenvolvemos uma ferramenta para coletar, analisar e exportar dados de repositórios de código-fonte. Os objetivos da ferramenta são consultar dados diretamente do GitHub via API e apresentá-los por meio de uma interface clara e objetiva para pesquisadores e gerentes de projeto. Um exemplo passo
a passo de como usar a ferramenta funciona será apresentado para demonstração. Considerando o repositório de código-fonte como base histórica, através da mineração de dados, é possível extrair informações úteis que auxiliam no processo de manutenção e evolução de software, consequentemente seu gerenciamento ao longo do ciclo de vida.


Palavras-chave: Código fonte. GitHub. Mineração de Repositórios.


Texto completo:

PDF

Apontamentos

  • Não há apontamentos.


 ANALECTA é um espaço para repositório de resumos e anais dos Congressos promovidos pelos cursos do Centro Universitário Academia. Juiz de Fora (MG).