Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Dans cette tâche, vous créez une stratégie de correspondance avec une règle dans celle-ci. La règle aura une condition préalable : ID de fournisseur, ce qui signifie que les ID de fournisseur doivent correspondre avant d’utiliser les autres domaines de la règle. La règle utilise deux autres domaines : Nom du fournisseur avec valeur similarité définie sur 70% et Adresse e-mail de contact avec la valeur Similarity définie sur 30%.
Dans la page principale du client DQS, cliquez sur flèche droite en regard de la base de connaissances Fournisseurs , puis sélectionnez Stratégie de correspondance.
Dans la page Carte , sélectionnez Fichier Excel pour la source de données.
Cliquez sur Parcourir, vérifiez que le filtre est défini sur classeur Excel, puis sélectionnez Fournisseur nettoyé List.xls fichier que vous avez exporté après avoir effectué l’activité de nettoyage.
Remarque
À la fin de cette activité, vous ne pouvez pas exporter les résultats, car cette activité se concentre principalement sur la définition d’une stratégie de correspondance. Vous allez créer un projet de qualité des données pour l’activité correspondante et l’exécuter pour supprimer les doublons de la liste des fournisseurs à l’aide de cette stratégie de correspondance dans la leçon suivante.
Mapper la colonne SupplierID au domaine Id de fournisseur , colonne Nom du fournisseur au domaine Nom du fournisseur , colonne ContactEmailAddress au domaine Contact Email . Vous devez uniquement mapper les colonnes sources aux domaines que vous souhaitez utiliser pour définir la stratégie de correspondance. Dans ce cas, vous créez l’ID du fournisseur, le nom du fournisseur et les domaines e-mail de contact disponibles pour l’activité de stratégie correspondante.
Cliquez sur Suivant pour accéder à la page Stratégie de correspondance dans laquelle vous allez définir une stratégie de correspondance avec une règle dans celle-ci.
Cliquez sur Créer un bouton de règle correspondante dans la barre d’outils pour créer une règle dans la stratégie.
Dans le volet Détails de la règle à droite, entrez Supprimer les fournisseurs dupliqués pour le nom de la règle.
Cliquez sur Ajouter un nouvel élément de domaine dans la barre d’outils dans le volet droit.
Sélectionnez l’ID du fournisseur pour le domaine , puis cochez la case Prérequis . Notez que la similarité est automatiquement définie sur Exact. En définissant l’ID fournisseur comme condition préalable, vous spécifiez que les valeurs de ce champ dans les deux enregistrements doivent retourner une correspondance de 100%, sinon les enregistrements ne sont pas considérés comme une correspondance et les autres clauses de la règle sont ignorées.
Cliquez à nouveau sur Ajouter un nouvel élément de domaine à partir de la barre d’outils.
Sélectionnez le domaine Nom du fournisseur, sélectionnez Similaire pour la Similarité, et tapez 70 pour le Poids. Ici, vous spécifiez que les noms des fournisseurs n’ont pas besoin d’être identiques, mais peuvent être similaires pour que les enregistrements soient considérés comme une correspondance. Le poids indique la contribution du score de ce champ au score de correspondance global.
Répétez les deux étapes précédentes pour ajouter un domaine de messagerie de contact avec 30 pour le poids.
Notez que le score de correspondance minimal est défini sur 80%, qui est la valeur que vous voyez sous l’onglet Général de la page Configuration de l’administration DQS. Vous ne pouvez augmenter ce score qu’au-dessus de cette valeur de seuil ici.
Notez que l’option Clusters qui se chevauchent est sélectionnée. Avec cette option, un enregistrement peut apparaître dans plusieurs clusters. Si vous modifiez le paramètre en clusters qui ne se chevauchent pas, les clusters qui ont des enregistrements communs sont combinés en un seul cluster.
Le bouton Démarrer de cette page vous permet de tester chaque règle dans la stratégie séparément, tandis que le bouton Démarrer de la page suivante vous permet de tester toute la stratégie (toutes les règles de la stratégie).
Cliquez sur Suivant pour basculer vers la page Résultats correspondants .