www.enligne.sn

Sécurité des applications Web : analyse, modélisation et détection des attaques par apprentissage automatique (Thèse)

Doctorat ParisTech

Thèse pour obtenir le grade de docteur délivré par TELECOM ParisTech

Spécialité « Informatique et Réseaux »

Thèse présentée et soutenue publiquement par Abdelhamid MAKIOU le 16 Décembre 2016

Sécurité des applications Web : analyse, modélisation et détection des attaques par apprentissage automatique

Directeur de thèse : Ahmed SERHROUCHNI

MOTS-CLEFS : Applications Web, attaques, détection, signature d’attaque, apprentissage automatique, données d’apprentissage.

Cliquez pour accéder au document

RÉSUMÉ : Les applications Web sont l’épine dorsale des systèmes d’information modernes. L’exposition sur Internet de ces applications engendre continuellement de nouvelles formes de menaces qui peuvent mettre en péril la sécurité de l’ensemble du système d’information.

Pour parer à ces menaces, il existe des solutions robustes et riches en fonctionnalités. Ces solutions se basent sur des modèles de détection des attaques bien éprouvés, avec pour chaque modèle, des avantages et des limites.

Nos travaux consistent à intégrer des fonctionnalités de plusieurs modèles dans une seule solution afin d’augmenter la capacité de détection.

Pour atteindre cet objectif, nous définissons dans une première contribution, une classification des menaces adaptée au contexte des applications Web.

Cette classification sert aussi à résoudre certains problèmes d’ordonnancement des opérations d’analyse lors de la phase de détection des attaques. Dans une seconde contribution, nous proposons une architecture de filtrage des attaques basée sur deux modèles d’analyse.

Le premier est un module d’analyse comportementale, et le second utilise l’approche d’inspection par signature. Le principal défi à soulever avec cette architecture est d’adapter le modèle d’analyse comportementale au contexte des applications Web.

Nous apportons des réponses à ce défi par l’utilisation d’une approche de modélisation des comportements malicieux. Ainsi, il est possible de construire pour chaque classe d’attaque son propre modèle de comportement anormal.

Pour construire ces modèles, nous utilisons des classifieurs basés sur l’apprentissage automatique supervisé. Ces classifieurs utilisent des jeux de données d’apprentissage pour apprendre les comportements déviants de chaque classe d’attaques. Ainsi, un deuxième verrou en termes de disponibilité des données d’apprentissage a été levé.

En effet, dans une dernière contribution, nous avons défini et conçu une plateforme de génération automatique des données d’entrainement. Les données générées par cette plateforme ont normalisées et catégorisées pour chaque classe d’attaques.

Le modèle de génération des données d’apprentissage que nous avons développé est capable d’apprendre “de ses erreurs” d’une manière continue afin de produire des ensembles de données d’apprentissage de meilleure qualité.

Abdelhamid MAKIOU

Votre avis