Partager via


Modifications de comportement apportées à la recherche Full-Text

Cette rubrique décrit les modifications de comportement dans la recherche en texte intégral. Les modifications de comportement affectent le fonctionnement ou l’interaction des fonctionnalités dans SQL Server 2014 par rapport aux versions antérieures de SQL Server.

Changements de comportement dans la recherche Full-Text dans SQL Server 2014

Informations à venir plus tard.

Changements de comportement dans la recherche Full-Text dans SQL Server 2012

SQL Server 2012 installe une nouvelle version des analyseurs de mots et des générateurs de lemmes pour l’anglais américain (LCID 1033) et l’anglais britannique (LCID 2057). Toutefois, vous pouvez basculer vers la version précédente de ces composants si vous souhaitez conserver le comportement précédent. Pour plus d’informations, consultez Modifier le séparateur de mots utilisé pour l’anglais américain et britannique.

Nouveaux analyseurs de mots et racineurs installés

SQL Server 2012 met à jour tous les analyseurs textuels et lemmatiseurs utilisés par Full-Text Recherche et recherche sémantique. Pour assurer la cohérence entre le contenu des index et les résultats des requêtes, nous vous recommandons de remplir à nouveau les index de recherche en texte intégral existants.

  1. Il existe de nouveaux analyseurs de mots pour l’anglais. Si vous devez conserver le comportement précédent, consultez Modifier le séparateur de mots utilisé pour l'anglais américain et l'anglais du Royaume-Uni.

  2. Les analyseurs de mots tiers pour danois, polonais et turc inclus dans les versions précédentes de SQL Server ont été remplacés par les composants Microsoft. Les nouveaux composants sont activés par défaut.

  3. Il y a de nouveaux séparateurs de mots pour le tchèque et le grec. Les versions précédentes de SQL Server Full-Text Search n’incluaient pas la prise en charge de ces deux langages.

Changements de comportement des nouveaux séparateurs de mots et des générateurs de formes

Les nouveaux composants peuvent retourner des résultats différents des anciens composants lorsque vous remplissez et interrogez des index de recherche en texte intégral. Les tableaux suivants illustrent certaines des différences qui peuvent être attendues en anglais.

Si vous devez conserver le comportement précédent des analyseurs de mots et des réducteurs de racines, consultez les rubriques suivantes :

Dans certains cas, les nouveaux composants retournent plus de résultats :

Terme Résultats avec l’analyseur de mots précédent et le générateur de tiges Résultats avec un nouveau analyseur de mots et un générateur de tiges
chat-chien chat

chien
chat

chat-chien

chien
cat@dog.com chat

Com

chien
chat

cat@dog.com

Com

chien
12/11/2011

(où le terme est une date)
12/11/2011

dd20111211
11

12

12/11/2011

2011

dd20111211

Dans certains cas, les nouveaux composants retournent des résultats similaires :

Terme Résultats avec l’analyseur de mots précédent et le générateur de tiges Résultats avec un nouveau analyseur de mots et un générateur de tiges
100$ 100$

nn100$
100$

nn100usd
022 022

nn022
022

nn22
10:49AM

(où le terme est une heure)
10h49 du matin

tt1049
10h49 du matin

tt24104900

Dans certains cas, les nouveaux composants retournent moins de résultats ou de résultats qui peuvent être inattendus par les applications :

Terme Résultats avec l’analyseur de mots précédent et le générateur de tiges Résultats avec un nouveau analyseur de mots et un générateur de tiges
jěˊžqCžl

(où les termes ne sont pas des caractères anglais valides)
jěˊÿžqCžl je yq zl
de la table de la table

table
de la table
chat- chat

chat-
chat
v-z*(où v et z sont des mots parasites)* (aucun résultat) v-z
$100 000 USD 100 USD

000

nn000

nn100$

USD
$100 000 usd

nn100000usd
belle terre américaine belle

terre

États-Unis

nous
belle

terre
Mont Kent et Mt Challenger challengeur

Kent

Mt

Mt.
Mt

Kent

challengeur

Changements de comportement dans la recherche Full-Text dans SQL Server 2008

Dans SQL Server 2008 et versions ultérieures, le moteur de Full-Text est intégré en tant que service de base de données dans la base de données relationnelle dans le cadre de l’infrastructure du moteur de requête et de stockage du serveur. La nouvelle architecture de recherche en texte intégral atteint les objectifs suivants :

  • La recherche en texte intégral et de stockage intégré est désormais intégrée directement aux fonctionnalités de stockage et de gestion inhérentes de SQL Server, et le service MSFTESQL n’existe plus.

    • Les index de recherche en texte intégral sont stockés dans les groupes de fichiers de base de données, plutôt que dans le système de fichiers. Les opérations administratives sur une base de données, telles que la création d’une sauvegarde, affectent automatiquement ses index de recherche en texte intégral.

    • Un catalogue de texte intégral est désormais un objet virtuel qui n’appartient à aucun groupe de fichiers ; il s’agit d’un concept logique qui fait référence à un groupe d’index de recherche en texte intégral. Par conséquent, de nombreuses fonctionnalités de gestion de catalogue ont été déconseillées et la dépréciation a créé des modifications cassantes pour certaines fonctionnalités. Pour plus d’informations, consultez Fonctionnalités du moteur de base de données déconseillées dans SQL Server 2014 et modifications cassants apportées à Full-Text recherche.

      Remarque

      SQL Server 2005 Transact-SQL instructions DDL qui spécifient des catalogues de texte intégral fonctionnent correctement.

  • Traitement des requêtes intégré : le nouveau processeur de requêtes de recherche en texte intégral fait partie du moteur de base de données et est entièrement intégré au processeur de requêtes SQL Server. Cela signifie que l’optimiseur de requête reconnaît les prédicats de requête en texte intégral et les exécute automatiquement aussi efficacement que possible.

  • L’administration améliorée et la recherche en texte intégral intégrée intégrée fournissent des outils pour vous aider à analyser des structures de recherche telles que l’index de recherche en texte intégral, la sortie d’un analyseur de mots donné, la configuration de mots vides, etc.

  • Les mots vides et les listes de mots vides ont remplacé les mots parasites et les fichiers noise-word. Une liste de mots vides est un objet de base de données qui facilite la gestion des tâches pour les mots vides et améliore l’intégrité entre différentes instances de serveur et environnements. Pour plus d’informations, consultez Configurer et gérer les mots vides et listes de mots vides pour la recherche en texte intégral.

  • SQL Server 2008 et versions ultérieures incluent de nouveaux analyseurs de mots pour la plupart des langages qui existent dans SQL Server 2005. Seuls les analyseurs de mots pour l’anglais, le coréen, le thaï et le chinois (toutes les formes) restent les mêmes. Pour d’autres langues, si un catalogue de texte intégral a été importé lorsqu’une base de données SQL Server 2005 a été mise à niveau vers SQL Server 2008 ou une version ultérieure, une ou plusieurs langues utilisées par les index de recherche en texte intégral dans le catalogue de texte intégral peuvent désormais être associées à de nouveaux analyseurs de mots qui peuvent se comporter légèrement différemment des analyseurs de mots importés. Pour plus d’informations sur la façon de garantir la cohérence entre les requêtes et le contenu de l’index de recherche en texte intégral, consultez Mettre à niveau Full-Text Recherche.

  • Un nouveau service FDHOST Launcher (MSSQLFDLauncher) a été ajouté. Pour plus d’informations, consultez Prise en main de Full-Text Recherche.

  • L’indexation de texte intégral fonctionne avec une colonne FILESTREAM de la même façon qu’avec une varbinary(max) colonne. La table FILESTREAM doit avoir une colonne qui contient l’extension de nom de fichier pour chaque objet BLOB FILESTREAM. Pour plus d’informations, consultez Requête avec Full-Text Recherche, Configurer et gérer des filtres pour la recherche et sys.fulltext_document_types (Transact-SQL).

    Le moteur de recherche en texte intégral indexe le contenu des BLOBs FILESTREAM. L’indexation de fichiers tels que des images peut ne pas être utile. Lorsqu’un OBJET BLOB FILESTREAM est mis à jour, il est réindexé.

Voir aussi

Recherche en texte intégral
compatibilité descendante de rechercheFull-Text
Mettre à niveau Full-Text Recherche
Commencer à utiliser la recherche en texte intégral