Détection de codes sources fonctionnellement similaires
Défense de mémoire de Masia Munsi
Date : 03/09/2019 15:30 - 03/09/2019 16:30
Lieu : Salle académique
Orateur(s) : Masia Munsi
Organisateur(s) : Isabelle Daelman
Dans le domaine du génie logiciel, la recherche de codes similaires est une tache incontournable. Elle s'effectue entre autres lors d'opérations de factorisation de codes, lors d'analyse d'impact, lors de l'identification de portions de codes qui ont été plagiés. Dans des cas d'écolage, on y a recours pour la compréhension ou pour le développement de fonctionnalités.
Les approches traditionnelles pour la détection de clones logiciels permettent d'identifier des clones de type textuel, syntaxique, structurel et métrologique, mais elles sont peu adaptées pour la détection des clones sémantiques.
Récemment, de nouvelles approches basées sur l'apprentissage automatique ont été proposées dans la littérature.
Ce mémoire commence par exposer les approches classiques de recherche de clones logiciels. Puis propose une implémentation basée sur le plongement lexical.
Cette implémentation est réalisée à l'aide d'un réseau de neurones et s'appuie sur un vaste jeu de données. Son objectif est de pouvoir détecter des codes sources Python sémantiquement similaires.
Mots-clés: Clone logiciel, Similarité sémantique, Plongement lexical, Apprentissage automatique, Apprentissage non supervisé, Réseau de neurones
Contact :
Isabelle Daelman
-
4966
-
isabelle.daelman@unamur.be
Télecharger :
vCal