Projet 1 — Prétraitement du jeu de données NSL-KDD

Description

Ce projet a pour objectif le prétraitement du jeu de données NSL-KDD, couramment utilisé pour la détection d'intrusions réseau. Le prétraitement comprend : la gestion des valeurs manquantes, l'encodage des variables catégorielles, la normalisation des variables numériques et la séparation des données en ensembles d'entraînement et de test.

Le projet a été réalisé dans le cadre du cours « Méthodes avancées en cybersécurité basées sur l'intelligence artificielle » (enseignante : Mme Hajar Moudoud) à l'Université du Québec en Outaouais (UQO), Gatineau.

Utilisation

Il faut que vous ayez Python installé sur votre machine, version recommandée : Python 3.13.7
Cloner le dépôt GitHub ou télécharger les fichiers.
Créer un environnement virtuel :

python -m venv env

Entrer dans l'environnement virtuel :

Sur Windows :
```
.\env\Scripts\activate
```
Sur macOS/Linux :
```
source env/bin/activate
```

Installer les dépendances :

pip install -r requirements.txt

Ouvrir le notebook main.ipynb dans un IDE compatible Jupyter (par exemple, Visual Studio Code), puis exécuter les cellules du notebook pour effectuer le prétraitement.

Fichiers importants

Notebook principal : Projet1_Pretraitement_ClementGauthier.ipynb
Sujet du projet : Projet1_sujet.pdf
Rapport / compte rendu : Projet1_Pretraitement_ClementGauthier.pdf
Dépôt GitHub : https://github.com/gogo25171/Projet1_Pretraitement

Données

Les jeux de données se trouvent dans le dossier data/ :

data/Teacher/NSL_KDD.csv — jeu de données principal utilisé pour le projet.
data/NSL-KDD-kaggle/ — copies de la version originale du dataset depuis Kaggle (fichiers .arff et .txt) utilisables si besoin.

Les jeux de données produits par le prétraitement sont enregistrés dans data/Dataset_pre_traiter/ :

À la racine de ce dossier : résultats du prétraitement pour l'exercice 10 (séparations train / test).
data/Dataset_pre_traiter/first_part/ : fichiers CSV du premier prétraitement (X_train.csv, X_test.csv, y_train.csv, y_test.csv).

Schéma d'architecture

graph TD;
    A[NSL_KDD.csv] --> B[Prétraitement]
    B --> C[Jeux de données traités]

Auteur

Clément Gauthier

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Projet 1 — Prétraitement du jeu de données NSL-KDD

Description

Utilisation

Fichiers importants

Données

Schéma d'architecture

Auteur

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
data		data
.gitignore		.gitignore
Projet1_Pretraitement_ClementGauthier.ipynb		Projet1_Pretraitement_ClementGauthier.ipynb
Projet1_Pretraitement_ClementGauthier.pdf		Projet1_Pretraitement_ClementGauthier.pdf
Projet1_sujet.pdf		Projet1_sujet.pdf
readme.md		readme.md
requirements.txt		requirements.txt

gogo25171/Projet1_Pretraitement

Folders and files

Latest commit

History

Repository files navigation

Projet 1 — Prétraitement du jeu de données NSL-KDD

Description

Utilisation

Fichiers importants

Données

Schéma d'architecture

Auteur

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages