Skip to content

pa-paget/Tinder_Data_Analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Dynamiques de rencontre et facteurs de succès : Étude de cas Tinder

Status Role Tools Category

📌 Présentation du projet

Ce projet d'analyse exploratoire (EDA) a été réalisé dans un but pédagogique pour comprendre les mécanismes de décision lors de speed dating. À partir de données de speed-dating, j'ai cherché à identifier ce qui pousse réellement deux personnes à vouloir se revoir.

Problématique : Quels sont les facteurs déterminants qui influencent la décision d'un deuxième rendez-vous ?

📂 Structure du Repository

  • /data : Contient le dataset brut (speed_dating_data.csv).
  • /notebooks : Contient mon analyse complète (eda_tinder_papaget.ipynb).
  • requirements.txt : Liste des dépendances Python nécessaires.
  • README.md : Présentation du projet et synthèse des résultats.

🛠️ Installation et Utilisation

Le notebook utilise des chemins relatifs (../data/), ce qui permet une exécution immédiate après clonage du dépôt. Pour garantir le bon fonctionnement du "Run All", assurez-vous d'installer les bibliothèques nécessaires :

  1. Clonez le dépôt.
  2. Installez les dépendances :
pip install -r requirements.txt

💻 Technologies utilisées

Langage

  • Python

Librairies

  • pandas
  • numpy
  • seaborn
  • matplotlib

Environnement

  • Jupyter Notebook
  • Visual Studio Code
  • Git / Github

📊 Méthodologie Détallée

L'analyse a été conduite selon un workflow rigoureux, structuré autour de trois piliers de la Data Analysis :

1. Data Wrangling (Nettoyage & Préparation)

Le "Data Wrangling" est l'étape de transformation des données brutes en un format exploitable. Pour ce projet, cela a impliqué :

  • Normalisation technique : Gestion de l'encodage spécifique (cp1252) pour éviter les erreurs de lecture des caractères spéciaux.
  • Mapping et Recodage Catégoriel : Le dataset original utilise des codes numériques pour représenter des variables qualitatives (attributs sociaux, parcours académiques, objectifs de rencontre, etc.). J'ai procédé à un recodage complet de ces variables en m'appuyant sur le dictionnaire de données (Data Key) afin de rendre l'analyse intelligible et de permettre des visualisations explicites.
  • Traitement des données manquantes : Analyse de la pertinence des lignes vides.

2. Feature Engineering (Enrichissement des données)

Le "Feature Engineering" consiste à créer de nouvelles variables à partir de celles existantes pour révéler des tendances cachées.

  • Calcul des écarts : Création de variables mesurant la différence entre ce qu'un participant déclare chercher (ex: importance de l'intelligence) et ce qu'il note réellement chez son partenaire.
  • Agrégation des performances : Calcul de moyennes par participant pour définir des "profils types".
  • Variable Cible : Consolidation de la variable match pour isoler les facteurs de succès.

3. Analyse Statistique & Visualisation

  • Étude démographique : Analyse de la représentativité du panel (prédominance de la tranche 20-30 ans, influence du milieu universitaire).
  • Analyse de corrélation : Utilisation de matrices de corrélation pour isoler les 6 attributs clés (Attractivité, Sincérité, Intelligence, Fun, Ambition, Intérêts communs).
  • Segmentation croisée : Comparaison des comportements par genre et par niveau de succès (Taux de match élevé vs faible).

📈 Visualisations Clés

  1. Importance de l'ethnie et de la religion : Analyse de l'impact des préférences "communautaires" sur le choix final. Est-ce qu'une origine commune augmente réellement les chances de match ?

Ethnie et Religion

 

  1. Importance des attributs par sexe (Évolution) : Visualisation de la répartition des attentes (Attractivité, Intelligence, etc.) selon le genre. Comment ces priorités varient-elles au cours de l'expérience ?

Attributs par sexe

 

  1. Perception de soi vs Avis des partenaires : Une confrontation entre la manière dont les participants se notent et les notes réelles attribuées par leurs partenaires.

Perception de soi

 

  1. Corrélation Attributs / Probabilité de Match : Une heatmap identifiant quels attributs (Fun, Ambition, Sincérité...) sont les plus liés à une décision positive.

Corrélation Match

 

  1. Le "Spider Chart" du profil type : Comparaison radar des attributs des participants ayant un fort taux de succès vs ceux ayant un faible taux de match.

Profil Type

 

🚀 Résultats Clés : Les 3 Piliers du Succès

L'analyse a permis d'isoler trois facteurs critiques :

  • 1. Le socle de valeurs (Filtre de base) : La sincérité et l'intelligence sont des prérequis. Des scores faibles ici sont éliminatoires, mais des scores élevés ne garantissent pas un match seul.
  • 2. L'ascendant du divertissement (Le "Game Changer") : Le score de "fun" est statistiquement le plus discriminant. C'est le véritable moteur de la décision positive lors d'un échange court.
  • 3. La justesse de l'auto-évaluation : Une confiance en soi solide, mais alignée sur la perception des partenaires (auto-évaluation réaliste), est un marqueur fort de succès.

🔍 Limites et Perspectives

Limites

  • Temporalité : Les données (2002-2004) précèdent l'ère du "swipe" massif, ce qui peut modifier certains comportements de sélection actuels.
  • Biais de l'échantillon : Le panel (étudiants d'universités américaines) n'est pas représentatif de l'ensemble de la population mondiale.
  • Format : Le speed-dating physique offre des signaux (langage corporel, voix) que les données numériques ne captent qu'indirectement.

Perspectives

  • Machine Learning : Entraîner un modèle de classification pour prédire l'issue d'une rencontre.
  • Analyse de Sentiment : Étendre l'étude aux centres d'intérêt textuels pour affiner le pilier "socle de valeurs".
  • Comparaison temporelle : Croiser ces résultats avec des données récentes pour mesurer l'évolution des critères de choix en 20 ans.

Projet réalisé par Pierre-Alexandre PAGET - Portfolio Business Analyst | Data Analysis

About

Ma vision pour l'analyse du Speed Dating (Tinder) : Piloter une exploration comportementale via une analyse exploratoire (EDA) approfondie. Ce projet transforme des données d'interactions physiques (Python) en leviers de succès quantifiables, pour une visualisation (Plotly/Seaborn) réconciliant critères théoriques et réalité du "match" amoureux.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors