Dédoublonnage
base de données
Faites plutôt
confiance à
Faites plutôt
confiance à
SOLUTION de dédoublonnage sat.MATCH
Dédoublonnez votre base de données pour une vision unique du client.
A partir du moment ou connaître vos clients devient stratégique, la solution de dédoublonnage – déduplication sat.MATCH vous apportera une valeur ajoutée considérable.
En effet, la solution sat.MATCH est redoutablement efficace pour s’adapter aux règles métier les plus exigeantes et créatives pour le dédoublonnage.
Outre le dédoublonnage, sat.MATCH permettra de consolider et fusionner les doublons identifiés.
Préventif / Curatif
Vue unique du client, analyses marketing performantes
Evite les doublons en base de données
Fusion et consolidation des données
Déduplication, et enrichissement avec des données externes
Nettoyage
base de données
Fusion / Consolidation
des doublons
Recherche de préexistence
en temps réel
nettoyage de bases de données
sat.MATCH
sat.MATCH est un logiciel de dédoublonnage déduplication expert. Il va de manière très précise réaliser le dédoublonnage initial de votre base de données ou les dédupliquer si vous avez plusieurs fichiers clients !
Et ce, avec des techniques expertes, extrêmement souples et paramétrables.
Dédoublonnage simple ou complexe, sat.MATCH apporte une réponse optimale quel que soit votre contexte.
Véritable logiciel de nettoyage de bases de données relationnelles, sat.MATCH est une solution experte qui s’adaptera facilement aux règles métier les plus exigeantes. Véritable allié d’un projet RCU – Référentiel Client Unique – le logiciel sat.MATCH répondra aux besoins métiers et aux contraintes techniques du service informatique.
Enjeux et définition du dédoublonnage - déduplication
Les doublons ont des conséquences néfastes pour les entreprises
Ils sont un enjeu économique direct pour les budgets marketing et logistiques.
Ils véhiculent une image négative de votre entité. Recevoir un message en double peut être perçu comme un manque de sérieux de gestion. Mais cela risque surtout d’anéantir une relation client personnalisée !
Les doublons vont également polluer les processus d’entreprise orientés client. Les reporting et analyses marketing (RFM, LTV, …) sont faussés si la vision client n’est pas unique, mettant ainsi à risque la qualité des supports décisionnels.
Définition dédoublonnage
Dans le domaine du Data Quality Management, le dédoublonnage est une opération de détection de doublons au sein d’une et une seule base de données.
Définition déduplication
On parle de déduplication dans un contexte de recherche de doublons multi-fichiers ou multi bases de données.
Dans un contexte de prospection, il est ainsi fréquent de confronter plusieurs fichiers d’adresses entre eux.
Par exemple pour envoyer un message unique à des personnes ou sociétés pouvant être présentes dans plus d’un fichier.
Ou tout bonnement pour ne pas envoyer un message de prospection à des clients déjà identifiés (fichier d’adresses “repoussoir”).
Application de dédoublonnage déduplication
Le propre d’un logiciel de déduplication de données est d’aller plus loin qu’un rapprochement sur des données similaires. Les technologies exploitées sont donc nombreuses pour être intelligemment tolérantes aux écarts.
Méthodologie du dédoublonnage & déduplication de données
Le dédoublonnage consiste en une recherche de doublons au sein d’une même et unique base de données. On parle de déduplication de données lorsque le logiciel doit rechercher des doublons intra et inter-fichiers.
La confrontation des fichiers avec la solution sat.MATCH va attribuer un “poids de rapprochement” pour déterminer la présence de doublons, triplons, quadruplons, … Le poids de rapprochement correspond à un score de véracité pour que deux adresses ou données soient des doublons.
Véracité des doublons
Le « poids de rapprochement » est calculé en fonction de nombreuses règles de comparaison. Ces règles sont appelées « grammaire de déduplication » de données. Chaque règle a une note (potentiellement pondérée). La somme des notes déterminant alors le poids de rapprochement, et donc la probabilité de doublons. On parle aussi de seuil de véracité.
Plus le poids de rapprochement est élevé, plus la probabilité de doublon est forte. Par exemple, un poids de rapprochement à 100 veut dire que deux adresses sont 100% similaires.
Doublons douteux, transitivité
Lors d’une déduplication de données, les doublons proches du seuil de véracité sont appelés « doublons douteux ». La notion de doublon dans ce cas est assez subjective : DuponT et DuponD dans le même immeuble sont-ils doublons ?
Ainsi, sat.MATCH intègre de nombreuses astuces et technologies métiers pour limiter drastiquement le nombre de doublons douteux.
Le logiciel de dédoublonnage sat.MATCH permet également de gérer la transitivité dans les groupes de doubles, problème récurrent des projets Master Data Management.
En cas de doublons, le logiciel permet de paramétrer l’adresse « 1ère de groupe » (celle qui sera conservée) selon différents critères paramétrables.
L’outil de déduplication permet aussi de ne pas perdre des données, en consolidant et fusionnant les informations présentes sur les lignes doubles (email, téléphone, date, montant d’achat, …).
Les différents modes de rapprochement
Plus classiquement, le logiciel de déduplication de données sat.MATCH peut dédoublonner vos bases de données sous différents modes :
Dédoublonnage foyer : identifier les membres d’un même foyer dans un même groupe de doubles.
Dédoublonnage individu : Utilise le prénom comme clé différenciante au sein d’un doublon foyer.
Dédoublonnage Raison Sociale (BtoB) : détecter des doublons de sociétés au sein d’un fichier d’entreprises.
Dédoublonnage contact (BtoB) : Ce dédoublonnage est le ‘cousin’ du dédoublonnage individu. Il sert dans un contexte BtoB à trouver les doublons de personnes au sein d’une même entreprise.
Particulièrement personnalisable sat.MATCH peut répondre aux règles métiers les plus exigeantes d’un Référentiel Client Unique.
Fonctionnalités de sat.MATCH
La solution permet d’identifier de manière précise les adresses uniques, les doublons certains et les doublons suspects issus d’un ou plusieurs fichiers d’adresses. Le nettoyage des bases de données peut s’appuyer classiquement sur l’adresse postale, l’email, le téléphone, de manière conjointe ou dissociée, mais aussi sur tout autre de données alpha ou numérique.
Tout type de données peut être configuré comme rapprochant ou discriminant.
La notion de véracité d’un doublon est gérée par un “poids de rapprochement” qui se calcule au travers d’une somme de règles de rapprochement (grammaire de déduplication).
De nombreuses techniques sonr employée pour dédoublonner les données : phonétique, distances mathématiques, synonymes, …
L’application de dédoublonnage sat.MATCH répond idéalement à des contextes de constitution et maintenance de Référentiel Client Unique, de fiabilisation de bases de données, de déduplication de fichiers, …
Avantages du dédoublonnage
Référentiel Client Unique, épuré de doublons :
- Un nettoyage de base de données avec la RNVP et un dédoublonnage performant, cela permet d’avoir un historique client consolidé et réel.
- Vos analyses seront fiables et vos actions marketing bien plus efficaces.
Réduction des coûts grâce au dédoublonnage :
- Des doublons en moins, ce sont des courriers inutiles évités ! Des frais en moins qui mécaniquement font augmenter le ROI.
- Une segmentation plus efficace et qui augmente le ROI de vos action marketing et commerciales.
Satisfaction client et image de marque :
- La satisfaction de vos clients passe par une relation individualisée et personnalisée. Recevoir un courrier en double laissera à vos clients l’impression inverse.
- Dédupliquer les bases de données de prospection avec votre fichier client évite qu’un de vos client reçoive une offre de prospection et ne se sente logiquement pas « connu » ou plutôt « reconnu » par l’enseigne émettrice.
Fusion et consolidation des doublons
sat.MATCH.Consolidation
Une solution de dédoublonnage ne doit pas se contenter d’identifier les doublons de votre fichier client. Il doit les réconcilier.
Le dédoublonnage très précis avec le logiciel sat.MATCH a pour vocation d’identifier et de réunir les doublons en leur affectant un numéro de groupe et un poids de rapprochement.
Il faut ensuite prendre l’initiative de supprimer les enregistrements mutliples… tout en ne perdant pas d’informations ! Par exemple, une fiche client peut contenir un e-mail, … et son doublon le numéro de téléphone. Autant ne pas sacrifier d’information pour optimiser votre connaissance client !
Ce travail est souvent fastidieux. Aussi, 76310 à mis en place un solution fusion de doublons : sat.MATCH.Consolidation.
Intégré dans la solution de dédoublonnage sat.MATCH, ce module va effectuer la fusion et la consolidation des doublons issus de vos bases de données, en fonction des règles souhaitées par le métier.
Pour illustrer la fusion des doublons :
Avantages du logiciel de fusion - Consolidation des données
Fusionner et consolider les doublons de sa base de données n’a jamais été aussi simple. Tout s’effectue par simple jeu de paramétrage.
La solution sat.MATCH.Consolidation permet par exemple :
- d’enrichir les informations présentes dans les enregistrements doubles quand leur champ est vide
- de consolider des informations quand deux champs sont renseignés, (somme, moyenne, …)
- d’appliquer des règles de gestion pour les doublons, en terme de choix d’enregistrement à conserver quand 2 champs sont non vides
Grâce à la solution sat.MATCH.Consolidation, la fusion des doublons devient aisée et permet d’éviter la perte d’information client potentiellement précieuse pour vos ressources marketing et décisionnelles.
Recherche de préExistence en temps réEl
sat.Match.Webservice
La recherche de préexistence en temps réel est entièrement personnalisable en fonction des éléments qui seront utiles d’intégrer (nom, email, tel, adresse postale, date de naissance, …). Elle peut porter sur tout type de données, ou associations de données. Il n’y a pas de limite.
La force de la solution sat.MATCH.WebService est d’être ouverte et entièrement paramétrable. En cas de besoin, il est donc possible d’aller plus loin qu’une recherche sur des éléments classiques de type : nom, nom-prénom, nom-CP, email, téléphone, …
Le logiciel de dédoublonnage en temps réel s’appuie sur des méthodes de dédoublonnages bien plus poussées que de la recherche sur exactitude ou index.
Dédoublonnage en temps réél ou recherche de prééxistence ?
La recherche de préexistence s’effectue traditionnellement sur la base d’index. Ces index sont au mieux « matchcodés » avec des phonèmes pour être tolérants aux fautes d’orthographes phonétiques. Si nous parlons bien de recherche de préexistence, c’est parce que c’est le terme employé pour le besoin.
D’un point de vue technique et qualité, la solution sat.MATCH.WebService va plus loin.
Les experts du DQM de 76310 ont mis en place une solution s’appuyant sur un réel dédoublonnage, afin de proposer une qualité plus forte que la recherche de préexistence.
La solution est donc par exemple tolérante à la dyslexie (inversion de caractères), aux erreurs d’orthographe non phonétiques (DuponT – DuponD), effectue des recherches croisées sur différents champs (par exemple : téléphone fixe / mobile, email1 / email2, téléphone – sms, …), et différentes astuces métier DQM.
Avantages de la recherche de prééxistence
La recherche de pré-existence permet de retrouver efficacement un client déjà présent en base de données. Dans un contexte commercial, cela est pertinent pour rappeler un historique client par exemple, et personnaliser le dialogue pour une efficacité accrue.
Retrouver rapidement une fiche client lors d’un face à face ou d’un appel téléphonique est important à plusieurs titres. La productivité générée est appréciable. Le gain de temps permet de se concentrer sur l’essentiel et non sur une recherche technique. Satisfaction du client car vous vous consacrerez plus vite à répondre à son besoin.
Dédoublonner en temps réel maintient la qualité de vos données et la vue unique du client, bases de vos processus et de votre connaissance clients.
Éviter l’insertion de doublons, c’est à terme des économies importantes de courriers inutiles.
C’est aussi une image préservée de votre établissement. Recevoir une communication en double prête à sourire et à un effet négatif pour le ROI de la campagne.