Comment supprimer les doublons dans Excel facilement
Maîtrisez la suppression de doublons sur Excel. Tutoriel complet : fonctions intégrées, formules NB.SI, Power Query et VBA pour des données propres.
Forts de 12 ans d'expérience en Excel, nous avons vu à quel point la suppression des doublons dans Excel peut transformer la gestion des données. Un tableau encombré de doublons peut ralentir les analyses et fausser les résultats, affectant ainsi les décisions stratégiques.
Maîtriser cette compétence vous permettra non seulement d'épurer vos tableaux, mais aussi d'améliorer votre efficacité. Vous apprendrez à utiliser les fonctionnalités intégrées d'Excel (y compris les fonctions dynamiques pour Excel pour Microsoft 365 / Excel 2021), des formules classiques (NB.SI, NB.SI.ENS), Power Query pour les transformations et des scripts VBA pour l'automatisation.
À la fin de ce tutoriel, vous serez capable de nettoyer efficacement vos jeux de données, conserver des copies de sauvegarde avant toute suppression, et intégrer ces méthodes dans vos processus réguliers pour obtenir des rapports plus fiables.
Comprendre les doublons dans Excel
Définition des doublons
Les doublons dans Excel se réfèrent à des lignes ou des cellules contenant des valeurs identiques. Ils peuvent être exacts (toutes les colonnes identiques) ou partiels (mêmes valeurs sur un sous-ensemble de colonnes). Les causes courantes : imports multiples, saisies manuelles, traitements automatiques ou formats incohérents (espaces, casse).
- Doublons exacts : mêmes valeurs dans toutes les colonnes
- Doublons partiels : mêmes valeurs dans certaines colonnes
- Sources potentielles : importations, saisies manuelles, exports
- Conséquences : analyses erronées, décisions biaisées
Exemple de fonction moderne (Excel pour Microsoft 365 / Excel 2021) pour lister les valeurs uniques :
=UNIQUE(A:A) Cette formule renvoie une liste de valeurs uniques à partir de la colonne A (fonction dynamique disponible dans Excel pour Microsoft 365 et Excel 2021).
Utiliser la fonction de suppression de doublons
Accéder à la fonction
Sélectionnez la plage de données, onglet Données → Supprimer les doublons. Dans la boîte de dialogue, choisissez les colonnes à considérer (ex. Nom + Email). Important : sauvegardez une copie avant suppression et travaillez idéalement sur un Tableau (Ctrl+T) pour des références dynamiques.
- Sélectionner la plage ou le tableau
- Onglet « Données » → « Supprimer les doublons »
- Choisir colonnes et confirmer
Remarque : la suppression est destructive. Si vous devez conserver l'original, utilisez Copier vers ou Power Query pour produire une table nettoyée.
Filtrer les doublons avec les outils Excel
Filtres, mise en forme conditionnelle et filtre avancé
Excel permet de masquer ou mettre en évidence les doublons sans suppression immédiate : filtres standards, filtre avancé pour copier les valeurs uniques, et mise en forme conditionnelle pour la visualisation.
Étapes pour un filtre avancé (copie sans modification de l'original) :
- Sélectionnez la plage.
- Onglet « Données » → « Avancé » (groupe Trier et filtrer).
- Choisir « Copier vers un autre emplacement » et cocher « uniques uniquement ».
Cela crée une copie avec les enregistrements uniques au nouvel emplacement spécifié.
Mise en forme conditionnelle pour visualiser les doublons
Avant toute suppression, il est conseillé de visualiser les doublons. La mise en forme conditionnelle permet de marquer les doublons en surbrillance, soit sur une seule colonne, soit sur plusieurs colonnes via une règle personnalisée.
Doublons sur une seule colonne
Sélectionnez la colonne → Accueil → Mise en forme conditionnelle → Règles de mise en surbrillance des cellules → Valeurs en double.
Doublons multi-colonnes (règle personnalisée avec NB.SI.ENS)
Pour identifier les doublons sur plusieurs colonnes (ex. colonnes A et B) sans créer de colonne auxiliaire, utilisez une règle de mise en forme conditionnelle avec la formule suivante :
=NB.SI.ENS($A:$A;$A2;$B:$B;$B2)>1 Instructions :
- Sélectionnez toutes les lignes de votre tableau (ex. A2:B1000).
- Accueil → Mise en forme conditionnelle → Nouvelle règle → "Utiliser une formule...".
- Entrez la formule ci-dessus puis choisissez un format (remplissage visible).
Alternative : helper column + NB.SI
Si vous préférez une colonne d'aide (plus transparente pour l'audit), créez une clé concaténée puis comptez les occurrences :
=CONCATENER(A2;"|";B2)
=NB.SI($C:$C; C2) La première formule (colonne C) assemble les champs; la seconde (colonne D) compte les occurrences de cette clé. Vous pouvez ensuite filtrer D > 1 ou appliquer une mise en forme conditionnelle basée sur D.
Conseils pratiques
- Normalisez les données (SUPPRESPACE, MAJUSCULE) avant d'appliquer les règles pour éviter les faux négatifs dus à des espaces ou à la casse.
- Utilisez une colonne d'audit pour conserver l'information sur les enregistrements marqués en doublon (utile pour validation manuelle).
Exemples : CONCATENER + NB.SI pour doublons multi-critères
CONCATENER (ou l'opérateur &) sert à créer une clé composite à partir de plusieurs colonnes. Elle prépare les données pour une détection simple des doublons avec NB.SI. Exemples concrets :
1) Clé simple Nom + Email
-- Colonne C (clé composite)
=CONCATENER(A2;"|";B2) -- ex: A = Nom, B = Email
-- Colonne D (compte)
=NB.SI($C:$C; C2) Filtrez la colonne D pour valeurs > 1 pour lister les enregistrements en double.
2) Normaliser avant concaténation (enlever espaces et casse)
=MAJUSCULE(SUPPRESPACE(A2)) & "|" & MAJUSCULE(SUPPRESPACE(B2)) La normalisation réduit les faux positifs (ex. "Dupont " vs "Dupont").
3) Utiliser TEXTJOIN (Excel moderne) pour plus de colonnes
=TEXTJOIN("|"; TRUE; A2; B2; C2) TEXTJOIN (Excel pour Microsoft 365 / Excel 2019+) concatène en ignorants les valeurs vides; ensuite appliquez NB.SI sur la colonne résultante.
Utiliser des formules pour identifier les doublons
COUNTIF / NB.SI pour une colonne
Pour détecter les doublons dans une seule colonne :
=NB.SI(A:A; A2) Appliquez la formule sur chaque ligne : les valeurs > 1 sont des doublons.
COUNTIFS / NB.SI.ENS pour plusieurs critères
Pour des critères multiples (ex. Nom + Date) :
=NB.SI.ENS($A:$A;$A2;$B:$B;$B2) Cette méthode évite la concaténation lorsque vous préférez des règles explicites et lisibles.
Automatisation via VBA (exécution après sauvegarde)
Exemple de macro non destructive : fait une copie sur une nouvelle feuille puis supprime les doublons. Sauvegardez toujours avant exécution.
Sub RemoveDuplicates_SafeCopy()
Dim ws As Worksheet
Dim outWs As Worksheet
Set ws = ActiveSheet
Set outWs = Worksheets.Add(After:=Worksheets(Worksheets.Count))
ws.UsedRange.Copy Destination:=outWs.Range("A1")
' Supposons colonnes 1 et 2 comme clé (ajustez selon besoin)
outWs.UsedRange.RemoveDuplicates Columns:=Array(1, 2), Header:=xlYes
MsgBox "Copie nettoyée créée sur " & outWs.Name, vbInformation
End Sub Ce script crée d'abord une copie puis supprime les doublons sur la copie (colonnes 1 et 2 dans l'exemple).
Diagramme : flux de nettoyage des doublons
Schéma récapitulatif du flux recommandé pour nettoyer les doublons en production : sauvegarde → normalisation → identification → validation → suppression/copie propre.
Conseils pour éviter les doublons à l'avenir
Prévention opérationnelle
Mettre en place des règles de saisie et des contrôles automatiques réduit les doublons :
- Validation des données (onglet Données → Validation des données) pour limiter les valeurs inappropriées.
- Utiliser des tableaux et des formulaires contrôlés pour centraliser les saisies (moins d'erreurs manuelles).
- Automatiser les imports avec Power Query et normaliser les colonnes (dates, texte) dès l'import.
- Former les équipes sur les bonnes pratiques : normalisation, vérification avant import.
Ressources et outils complémentaires pour Excel
Outils recommandés
Power Query (Get & Transform) est intégré dans Excel 2016+ (et disponible comme add-in pour Excel 2010/2013) : il permet d'importer, normaliser et supprimer les doublons de manière reproductible. Pour des cas avancés, des compléments commerciaux comme Ablebits Duplicate Remover facilitent la détection et la fusion de doublons.
Bonnes pratiques techniques :
- Archivage : toujours garder une copie brute avant nettoyage.
- Scripts versionnés : stocker les macros/VBA ou étapes Power Query dans un système de contrôle (ex. gestion de versions interne).
- Normalisation : appliquer SUPPRESPACE, MAJUSCULE et formats de date uniformes avant déduplication.
Points Clés à Retenir
- Sauvegardez toujours vos données avant suppression.
- Normalisez (espaces, casse, formats) avant d'identifier les doublons.
- Utilisez la mise en forme conditionnelle et les colonnes d'audit pour valider avant suppression.
- Power Query est recommandé pour des flux reproductibles et non destructifs.
Questions Fréquentes
- Comment supprimer des doublons dans une colonne spécifique uniquement ?
- Sélectionnez la colonne, onglet 'Données' → 'Supprimer les doublons' → cochez uniquement la colonne concernée. Sauvegardez avant toute opération destructive.
- Est-il possible d'exclure certaines valeurs lors de la suppression des doublons ?
- Oui. Marquez d'abord les enregistrements à conserver (colonne d'audit) puis appliquez un filtre pour exclure ces valeurs avant la suppression.
- Quels sont les risques de supprimer des doublons sans vérification préalable ?
- Vous risquez de perdre des données pertinentes si des champs complémentaires contiennent des informations différentes. Toujours valider via mise en forme conditionnelle ou colonne d'audit avant suppression.
- Comment automatiser la suppression des doublons dans Excel ?
- Utilisez Power Query pour créer un flux reproductible non destructif, ou un script VBA qui copie d'abord la feuille puis supprime les doublons sur la copie (exemple fourni ci-dessus).
Conclusion
En appliquant une stratégie structurée (sauvegarde, normalisation, identification, validation, suppression), vous diminuez fortement les risques liés aux doublons et améliorez la qualité de vos analyses. Intégrez Power Query pour automatiser et documenter les étapes, et conservez toujours une trace des actions effectuées pour audit.