Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Vous préparez la base de connaissances pour effectuer une activité de correspondance en créant une stratégie de correspondance dans la base de connaissances. Il ne peut y avoir qu’une seule stratégie de correspondance dans une base de connaissances. Une stratégie de correspondance se compose d’une ou plusieurs règles de correspondance. Une règle identifie les domaines impliqués dans le processus de correspondance et spécifie le poids que chaque valeur de domaine porte dans le jugement correspondant. Vous spécifiez dans la règle si les valeurs de domaine doivent être une correspondance exacte ou peuvent être similaires, et à quel degré de similarité. Vous spécifiez également si une correspondance de domaine est un prérequis pour le processus de correspondance. Vous pouvez tester chaque règle séparément et tester l’ensemble de la stratégie sur des exemples de données. Le processus de test affiche les enregistrements dont les scores correspondants sont supérieurs au seuil de score d’enregistrement min spécifié dans la configuration DQS dans un cluster (groupe). Vous pouvez continuer à modifier les règles de la stratégie jusqu’à ce que vous soyez satisfait.
Après avoir défini la stratégie, vous créez un projet de qualité des données pour exécuter l’activité correspondante. Le projet de correspondance applique les règles définies dans la politique de correspondance à la source de données à évaluer. Ce processus évalue la probabilité que n'importe quelles deux lignes soient des doublons. Lorsque DQS effectue l’analyse correspondante, il crée des clusters d’enregistrements que DQS considère comme des correspondances. DQS identifie de façon aléatoire l’un des enregistrements en tant qu'enregistrement pivot. Vous pouvez vérifier et rejeter tout enregistrement qui n’est pas une correspondance appropriée pour le cluster. Pour plus d’informations, consultez La rubrique Créer une stratégie de correspondance .
Dans cette leçon, vous effectuez une activité correspondante pour supprimer les doublons de la liste des fournisseurs. Tout d’abord, vous créez une stratégie de correspondance avec une règle pour identifier les doublons dans la liste des fournisseurs et publier la stratégie dans la base de connaissances. Ensuite, vous créez et exécutez un projet de qualité des données pour la correspondance. Enfin, vous exportez les résultats de l’activité correspondante vers un fichier Excel que vous utilisez ultérieurement dans le chargement de données dans Master Data Services (MDS).