Lexique

Base marketing multi-canal

Base de données marketing centrale sur laquelle s’appuient simultanément les opérations marketing de différents canaux de prospection (mailing, emailing, phoning …) qui viennent l’enrichir en retour.
A ceux-ci s’ajoutent comme source d’enrichissement, les différents fichiers prospects externes qui sont loués pour effectuer les opérations marketing.
Il s’agit donc d’une base multi-source qui peut être totalement intégrée comme module du système de Gestion de la Relation Client (CRM) ou « autonome » avec un lien sur la base clients comme source supplémentaire.

BI (Business Intelligence ou informatique décisionnelle)

La BI ou informatique décisionnelle qualifie le système d’information qui consolident, synthétisent et diffusent l’information pour les décideurs opérationnels ou stratégiques. Ce système s’alimente avec les données des systèmes de production mais aussi de toutes autres données économiques internes et externes et les intègre dans un data warehouse ou datamart.
L’objectif est de faciliter la prise de décision et le pilotage de l’entreprise à partir des données consolidées et historisées qui donnent une vision de l’état et de l’évolution de l’activité selon différents axes d’analyses.
La qualité des données est donc nécessaire dans les projets de BI pour que les décisions ne s’appuient pas sur des données erronées ou incomplètes. Elle doit fiabiliser le processus de production, de consolidation et de diffusion des données.

BtoB (Business to Business)

Désigne les activités commerciales (produits ou services) à destination des entreprises.

BtoC (Business to Consumer)

Désigne les activités commerciales (produits ou services) à destination du consommateur final.

CNIL (La Commission Nationale de l'Informatique et des Libertés)

La Commission Nationale de l'Informatique et des Libertés (CNIL) est une autorité administrative indépendante qui a pour mission d’informer, de garantir les droits d’accès, de recenser les fichiers, de réglementer leur déclaration. Elle dispose de l’autorité pour contrôler et sanctionner toutes entités qui utilisent des fichiers automatisés contenant des données à caractère personnel.
www.cnil.fr

Data Warehouse (Entrepôt de données)

Base de données conçue pour supporter les décisions. Elle centralise et historises un volume important de données consolidées à partir des différentes sources (bases de données opérationnelles, fichiers de références …) afin de donner une vision de l’activité selon les axes d’analyse choisis. La base de données est conçue pour que l’accès à l'information soit rapide et synthétique.
En tant qu’outil d’aide à la décision, la qualité des données est un élément essentiel pour remporter l’adhésion des utilisateurs dans les projets de datawarehouse et détermine leur valeur ajouté.

Datamart

Sous ensemble d'un Data Warehouse dans lequel est centralisé des données sur une activité, une zone géographique ou un métier (commercial, marketing, comptabilité, etc...) d’une entreprise.

Dédoublonnage

Opération qui consiste à identifier dans une base de données ou un fichier, les enregistrements qui représentent la même entité grâce à différents d’algorithmes de rapprochement (ou matching). A l’issue des traitements, l’enregistrement le plus représentatif est conservé et enrichi par l’information des doubles.

Dimensions de la qualité des données

Les dimensions sont les critères ou les axes d’évaluation de la qualité. Les démentions prioritaires sont définies pour chaque projet selon ses spécificités. Les dimensions les plus communes sont :
• L’exactitude (accuracy)
• La complétude (completness)
• L’intégrité (integrity)
• La consistance  (consistency)
• La disponibilité (timeliness)
• L’accessibilité (access and ease of use)

Donnée

tReprésentation symbolique de la réalité (objet, concept, évènement …) qui peut prendre la forme de texte, de son, d’image. La donnée est l’élément brut qui est créé et fourni par un producteur, stocké et diffusé à travers un système d’information et interprété en information par un utilisateur.
La qualité de données s’attache à réduire l’écart entre la représentation et la réalité à tous les niveaux du processus (création, stockage et interprétation).

Information

Connaissance apportée par un signale ou des données lors de leur interprétation.
Pour que la connaissance apportée soit juste, les données doivent être une représentation conforme de la réalité et le récepteur doit posséder le décodeur adapté (connaissances et référentiels) pour les interpréter correctement.

Profiling / Profil des données

Processus d’étude des données d’un fichier ou d’une base dans le but d’obtenir des mesures descriptives. Le profiling est généralement la première étape du d’analyse dans les projets de qualité de données. Il est utilisé pour définir les normes des données et métadata, valider leur conformité aux normes existantes et faciliter les intégrations.

Master data Management

Regroupe les outils et processus qui centralisent l’information de référence de l’entreprise. Il permet d’uniformiser cette information et la rendre cohérente grâce à une description normalisée et la suppression de référentiels redondants et différents.
L’objectif est de fournir une instance unique et standardisée de chaque entité. Le MDM s’applique couramment pour la gestion du référentiel des entités clients, produits, employés ou vendeurs.

Matching

Opération de comparaison d’enregistrements dans le même fichier ou des fichiers différents afin de les rapprocher ou les associer. Généralement, le rapprochement ne se limite pas à une égalité parfaite entre les enregistrements mais utilise des algorithmes plus complexes comme les « matchs key » ou la « Fuzzy Logic » qui d’attribue un indice de fiabilité dans le rapprochement.
Le matching permet de dédoublonner un fichier ou de l’enrichir avec un fichier externe qui ne comporte pas de clé commune.

Metadata

Données qui décrivent les caractéristiques des données d’une source comme leur format, leur type, leur taille, les valeurs valides …
Les métadata sont utilisées pour faciliter la compréhension, l’utilisation et la gestion des données et sont détaillées dans les dictionnaires de données ou les outils de Master Data Management.

Méthode du juste échange

Méthode qui permet de comparer différentes solutions à partir de critères critiques prédéfinis.
Il s’agit alors de supprimer un critère en lui attribuant la même valeur pour toutes solutions tout en compensant cet ajustement sur un autre critère. On supprime alors les solutions dont tous les critères ont une valeur inférieure à une même autre solution. Puis l’opération est réitérée jusqu’à la mise en évidence de la meilleure solution. Tout l’enjeu de cette méthode est de bien évaluer « l’échange » de valeur entre 2 critères.

Monitoring

Opération de contrôle du niveau de qualité des données et de leur évolution. Le monitoring nécessite la mise en place d’outils d’enregistrement des indicateurs dans le temps et de tableaux de bord.

NPAI (Non Présent à l’Adresse Indiquée)

Abréviation qui regroupe l’ensemble des courriers qui n’ont pu être remis car le destinataire n’a pas été trouvé à l’adresse mentionnée. Les NPAI résultent soit d’une erreur dans la rédaction de l’adresse ou soit d’un changement d’adresse du destinataire.

ROI (Return On Investment ou retour sur investissement)

Ratio financier (bénéfice net / capital investi) qui mesure la rentabilité d’un investissement ou d’un projet.
Dans les projets de qualité des données, le bénéfice net se calcule en prenant en compte la réduction des coûts directs (ex. envoi de courrier à un NPAI), des coûts indirects (ex. temps de retraitement par un employé) et du manque à gagner (ex. opportunités commerciales perdues) auxquels sont retirés les coûts d’investissements (logiciel, intégration, formation...).
Le délai de récupération (temps nécessaire pour récupérer l’investissement initial) et le Coût Total de Possession (ou TCO) sont aussi à prendre en compte pour la valider les risques d’un projet.

Sirétisation

Opération qui consiste à attribuer ou valider le SIRET dans un fichier d’entreprises. Cette opération s’effectue par rapprochement du fichier à la base de référence de l’INSEE sur la dénomination et l’adresse de chaque établissement.

SIRET

Numéro national qui identifie de façon unique tout établissement d’une entité juridique : société, collectivité, administration, professionnel, association.
Il se compose de 14 chiffres constitué par le SIREN (identifiant de la société) de 9 chiffres et du NIC de 5 chiffres.

Système d’information

Ensemble des moyens (acteurs, outils, processus) déployés pour la collecte, les traitements, le stockage et la diffusion de l’information nécessaire à la réalisation et au pilotage des activités d’une organisation. Les systèmes d’information opérationnels supportent la réalisation alors que les systèmes décisionnels supportent le pilotage.