Atualizar Pesquisa de Texto Completo (Pesquisa do SQL Server)

Aplica-se a:SQL ServerBanco de Dados SQL do Azure

O SQL Server atualiza a pesquisa de texto completo durante a instalação ou quando você anexa, restaura ou copia arquivos de banco de dados e catálogos de texto completo do SQL Server 2005 (9.x) e versões anteriores.

Atualizar uma instância do servidor

Para uma atualização local, uma instância do SQL Server é instalada lado a lado com a versão anterior do SQL Server, e os dados são migrados. Se a pesquisa de texto completo estava instalada na versão antiga do SQL Server, uma versão nova da pesquisa de texto completo será instalada automaticamente. A instalação lado a lado significa que cada um dos componentes a seguir existe no nível de instância do SQL Server.

Separadores de palavras, lematizadores e filtros

Agora cada instância usa seu próprio conjunto de separadores de palavras, lematizadores e filtros, em vez de utilizar a versão do sistema operacional desses componentes. Esses componentes também são mais fáceis de registrar e configurar por instância. Para obter mais informações, consulte Configurar e gerenciar separadores de palavras e lematizadores para pesquisa (SQL Server) e configurar e gerenciar filtros para pesquisa.

Host do daemon de filtragem

Os hosts do daemon de filtro de texto completo são processos que carregam e orientam com segurança os componentes externos extensíveis usados para índice e consulta, como separadores de palavras, lematizadores e filtros, sem comprometer a integridade do Mecanismo de Texto Completo. Uma instância de servidor usa um processo multi-threaded para todos os filtros multi-threaded e um processo single-threaded para todos os filtros single-threaded.

O serviço FDHOST Launcher (MSSQLFDLauncher) propaga as informações da conta de serviço para os processos de host do daemon de filtro de uma instância específica do SQL Server. Para obter informações sobre como configurar a conta de serviço, consulte Definir a conta de serviço do Iniciador do Daemon de Filtro de Texto Completo.

Compatibilidade de atualização do SQL Server 2005

Um catálogo de texto completo é um objeto lógico ou virtual que contém um grupo de índices de texto completo. Portanto, um novo catálogo de texto completo não é tratado como um arquivo de banco de dados com um caminho físico. No entanto, se você atualizar do SQL Server 2005 (9.x), será criado um novo grupo de arquivos no mesmo disco para qualquer catálogo de texto completo que contenha arquivos de dados.

Este procedimento mantém o comportamento de E/S do disco antigo após a atualização. Qualquer índice de texto completo desse catálogo será colocado no novo grupo de arquivos se existir o caminho raiz. Se o caminho do antigo catálogo de texto completo for inválido, a atualização manterá o índice de texto completo no mesmo grupo de arquivos que a tabela base ou, no caso de uma tabela particionada, no grupo de arquivos primário.

Opções de atualização de texto completo

Na atualização de uma instância do SQL Server, a interface do usuário permite escolher uma das opções de atualização de texto completo a seguir. Essas opções estão disponíveis apenas para bancos de dados do SQL Server 2005 (9.x).

Import

Os catálogos de texto completo são importados. A importação costuma ser consideravelmente mais rápida do que a recompilação. Por exemplo, quando é usada apenas uma CPU, a importação é executada cerca de 10 vezes mais rápido do que a recompilação. No entanto, um catálogo de texto completo importado não usa os novos separadores de palavras instalados com a versão mais recente do SQL Server. Para garantir a consistência nos resultados da consulta, os catálogos de texto completo precisam ser recompilados.

Observação

A recompilação pode ser executada no modo multi-threaded e, se houver mais de 10 CPUs disponíveis, ela poderá ser executada mais rápido do que a importação se você permitir que a recompilação use todas as CPUs.

Se um catálogo de texto completo não estiver disponível, os índices de texto completo associados serão recriados.

Para obter informações sobre o efeito da importação do índice de texto completo, consulte Considerações para escolher uma opção de atualização de texto completo mais adiante neste artigo.

Rebuild

Os catálogos de texto completo são recriados usando os novos e aprimorados separadores de palavras. A recompilação de índices pode demorar um pouco, e uma quantidade significativa de memória e CPU pode ser necessária após a atualização.

Reiniciar

Os catálogos de texto completo são reinicializados. Durante a atualização do SQL Server 2005 (9.x) os arquivos de catálogos de texto completo são removidos, mas os metadados dos catálogos e dos índices de texto completo são retidos. Após a atualização, todos os índices de texto completo são desabilitados para controle de alterações e os rastreamentos não são iniciados automaticamente. O catálogo permanecerá vazio até você executar uma população completa manualmente, depois que a atualização for concluída.

Considerações sobre como escolher uma opção de atualização de texto completo

Ao escolher a opção de atualização para sua atualização, considere o seguinte:

  • Você precisa de consistência nos resultados da consulta?

    O SQL Server instala novos separadores de palavras para uso pela pesquisa semântica e de texto completo. Os separadores de palavras são usados na indexação e na consulta. Se você não recompilar os catálogos de texto completo, os resultados da pesquisa poderão ser inconsistentes. Se você emitir uma consulta de texto completo que procura uma frase que é interrompida diferentemente pelo separador de palavras em uma versão anterior do SQL Server e o separador de palavras atual, talvez não seja possível recuperar um documento ou linha contendo a frase. Isso ocorre porque as frases indexadas foram quebradas usando uma lógica diferente da usada pela consulta. A solução é preencher novamente (recompilar) os catálogos de texto completo com os novos separadores de palavras de forma que os comportamentos de tempo de indexação e de consulta sejam idênticos. Você pode escolher a opção Recriar para fazer isso ou executar a recompilação manualmente após escolher a opção Importar.

  • Algum índice de texto completo foi compilado em colunas de chave de texto completo integer?

    A recompilação faz otimizações internas que, em alguns casos, melhoram o desempenho de consultas do índice de texto completo atualizado. Especificamente, se você tiver catálogos de texto completo que contenham índices de texto completo em que a coluna de chave de texto completo da tabela base seja do tipo de dados inteiro, a recriação proporcionará o desempenho ideal das consultas de texto completo após a atualização. Nesse caso, é altamente recomendável usar a opção Recriar .

    Observação

    Para os índices de texto completo, recomendamos que a coluna que funciona como a chave de texto completo seja um tipo de dados inteiro. Para obter mais informações, consulte Melhorar o desempenho de índices de texto completo.

  • Qual é a prioridade para colocar a instância do servidor em operação?

    A importação ou a recompilação durante a atualização usa muitos recursos da CPU, o que faz com que o restante da instância do servidor demore para ser atualizado e ficar online. Se colocar a instância do servidor online o mais rápido possível é importante, e se você deseja executar uma população manual depois da atualização, a opção Redefinir é adequada.

Assegurar resultados de consulta consistentes após importar um índice de texto completo

Se um catálogo de texto completo foi importado durante a atualização de um banco de dados do SQL Server 2005 (9.x), pode haver incompatibilidade entre a consulta e o conteúdo do índice de texto completo devido a diferenças no comportamento dos antigos e dos novos separadores de palavras. Nesse caso, para garantir compatibilidade total entre as consultas e o conteúdo do índice de texto completo, escolha uma das opções a seguir:

  • Recompile o catálogo de texto completo que contém o índice de texto completo com ALTER FULLTEXT CATALOG:

    ALTER FULLTEXT CATALOG <catalog_name> REBUILD;
    
  • Execute uma FULL POPULATION no índice de texto completo com ALTER FULLTEXT INDEX:

    ALTER FULLTEXT INDEX ON <table_name> START FULL POPULATION;
    

Para obter mais informações sobre separadores de palavras, consulte Configurar e gerenciar separadores de palavras e lematizadores para pesquisa (SQL Server).

Atualizar arquivos de palavra de ruído para listas de palavras irrelevantes (stoplist)

Quando um banco de dados é atualizado do SQL Server 2005 (9.x), os arquivos de palavras irrelevantes não são mais usados. No entanto, os antigos arquivos de palavras de ruído ficam armazenados na pasta FTDATA\FTNoiseThesaurusBak, e você poderá usá-los posteriormente quando atualizar ou criar as listas de palavras irrelevantes do SQL Server.

Após atualizar o SQL Server 2005 (9.x):

  • Se você nunca adicionou, modificou ou excluiu arquivos de palavras de ruído da sua instalação do SQL Server 2005 (9.x), a lista de palavras irrelevantes do sistema deve atender às suas necessidades.

  • Se os arquivos da palavra de ruído foram modificados no SQL Server 2005 (9.x), essas modificações serão perdidas durante a atualização. Para recriar essas atualizações, recrie manualmente essas modificações na lista de palavras irrelevantes correspondente. Para obter mais informações, consulte ALTER FULLTEXT STOPLIST.

  • Caso não deseje aplicar palavras irrelevantes aos índices de texto completo (por exemplo, se você excluiu ou apagou os arquivos de palavras irrelevantes da sua instalação do SQL Server 2005 (9.x)), é necessário desativar a lista de palavras irrelevantes para cada índice de texto completo atualizado. Execute a seguinte instrução Transact-SQL (substituindo database pelo nome do banco de dados atualizado e table pelo nome da tabela):

    Use database;
    ALTER FULLTEXT INDEX ON table
       SET STOPLIST OFF;
    GO
    

    A cláusula STOPLIST OFF remove a filtragem de palavras irrelevantes e aciona a população da tabela, sem filtrar nenhuma palavra considerada ruído.

Backup e catálogos de texto completo importados

Para catálogos de texto completo que são recriados ou redefinidos durante a atualização (e para novos catálogos de texto completo), o catálogo de texto completo é um conceito lógico e não reside em um grupo de arquivos. Portanto, para fazer backup de um catálogo de texto completo, é necessário identificar cada grupo de arquivos que contém um índice de texto completo do catálogo e fazer backup de cada um deles. Para obter mais informações, consulte Fazer backup e restaurar índices e catálogos de texto completo.

Nos catálogos de texto completo importados do SQL Server 2005 (9.x), o catálogo de texto completo ainda é um arquivo de banco de dados em seu próprio grupo de arquivos. O processo de backup do SQL Server 2005 (9.x) para catálogos de texto completo ainda se aplica, exceto que o serviço MSFTESQL não existe no SQL Server. Para obter informações sobre o processo do SQL Server 2005 (9.x), veja Fazer backup e restaurar catálogos de texto completo nos Manuais Online SQL Server 2005.

Migrar índices de texto completo ao atualizar um banco de dados

Os arquivos de banco de dados e catálogos de texto completo de uma versão anterior do SQL Server podem ser atualizados para uma instância existente por meio de anexação, restauração ou do Assistente para Copiar Banco de Dados. Índices de texto completo do SQL Server 2005 (9.x), se houver, serão importados, restaurados ou recompilados. A upgrade_option propriedade do servidor especifica qual opção de atualização de texto completo a instância do servidor usa durante essas atualizações de banco de dados.

Depois que você anexa, restaura ou copia uma instância de banco de dados mais recente do SQL Server 2005 (9.x), ele fica imediatamente disponível e é atualizado automaticamente. Dependendo da quantidade de dados a ser indexada, a importação poderá levar várias horas e a recompilação poderá ser até dez vezes mais demorada. Quando a opção de atualização está definida para importar, se um catálogo de texto completo não estiver disponível, os índices de texto completo associados serão recriados.

Alterar o comportamento de atualização de texto completo em uma instância de servidor

Considerações para restaurar um catálogo de texto completo do SQL Server 2005 (9.x)

Um método de atualização dos dados de texto completo de um banco de dados do SQL Server 2005 (9.x) consiste em restaurar um backup completo do banco de dados para uma instância mais nova do SQL Server.

Ao importar um catálogo de texto completo do SQL Server 2005 (9.x), é possível fazer backup e restaurar o banco de dados e o arquivo de catálogo. É o mesmo comportamento encontrado no SQL Server 2005 (9.x):

  • O backup completo do banco de dados inclui o catálogo de texto completo. Para consultar o catálogo de texto completo, use o nome de arquivo do SQL Server 2005 (9.x), sysft_+catalog-name.

  • Se o catálogo de texto completo estiver offline, o backup falhará.

Para obter mais informações sobre como fazer backup e restaurar catálogos de texto completo do SQL Server 2005 (9.x), consulte Backup e restauração de catálogos de texto completo e índices e Backup e restauração de arquivos e catálogos de texto completo nos Manuais Online do SQL Server 2005 (9.x).

Quando o banco de dados é restaurado em uma instância mais recente do SQL Server, um novo arquivo de banco de dados é criado para o catálogo de texto completo. O nome padrão desse arquivo é ftrow_catalog-name.ndf. Por exemplo, se o catalog-name for cat1, o nome padrão do arquivo de banco de dados do SQL Server será ftrow_cat1.ndf. Porém, se o nome padrão já estiver sendo usado no diretório de destino, o novo arquivo de banco de dados será chamado ftrow_catalog-name{GUID}.ndf, em que GUID é o Identificador Global Exclusivo do novo arquivo.

Depois que os catálogos são importados, sys.database_files e sys.master_files são atualizados para remover as entradas do catálogo e a coluna path em sys.fulltext_catalogs é definida como NULL.

Fazer o backup de um banco de dados

Restaurar um backup de banco de dados

Exemplo

O exemplo a seguir usa a cláusula MOVE na instrução RESTORE para restaurar um banco de dados do SQL Server 2005 (9.x) chamado ftdb1. O banco de dados SQL Server 2005 (9.x), o log e os arquivos de catálogo são movidos para novos locais da instância de servidor do SQL Server, desta forma:

  • O arquivo de banco de dados, ftdb1.mdf, é movido para C:\Program Files\Microsoft SQL Server\MSSQL.1MSSQL13.MSSQLSERVER\MSSQL\DATA\ftdb1.mdf.

  • O arquivo de log, ftdb1_log.ldf, é movido para um diretório de log na unidade de disco de log, log_drive:\log_directory\ftdb1_log.ldf.

  • Os arquivos de catálogo que correspondem ao catálogo sysft_cat90 são movidos para C:\temp. Depois que os índices de texto completo são importados, eles são colocados automaticamente em um arquivo de banco de dados, C:\ftrow_sysft_cat90.ndf e o C:\temp será excluído.

RESTORE DATABASE [ftdb1] FROM DISK = N'C:\temp\ftdb1.bak'
    WITH FILE = 1,
    MOVE N'ftdb1' TO N'C:\Program Files\Microsoft SQL Server\MSSQL12.MSSQLSERVER\MSSQL\DATA\ftdb1.mdf',
    MOVE N'ftdb1_log' TO N'log_drive:\log_directory\ftdb1_log.ldf',
    MOVE N'sysft_cat90' TO N'C:\temp';

Anexar um banco de dados do SQL Server 2005

No SQL Server 2008 (10.0.x) e em versões posteriores, o catálogo de texto completo é um conceito lógico que se refere a um grupo de índices de texto completo. O catálogo de texto completo é um objeto virtual que não pertence a nenhum grupo de arquivos. Porém, quando você anexa um banco de dados do SQL Server 2005 (9.x) que contém arquivos de catálogo de texto completo a uma instância de servidor do SQL Server mais nova, os arquivos de catálogo são anexados de seus locais anteriores junto com os outros arquivos de banco de dados, assim como ocorre no SQL Server 2005 (9.x).

O estado de cada catálogo de texto completo anexado no SQL Server é o mesmo de quando o banco de dados foi desanexado do SQL Server 2005 (9.x). Se uma população de índice de texto completo for suspensa pela operação de desanexação, ela será retomada no SQL Server, e o índice de texto completo ficará disponível para pesquisa de texto completo.

Se o SQL Server não conseguir encontrar um arquivo de catálogo de texto completo ou se o arquivo de texto completo tiver sido movido durante a operação de anexação sem especificar um novo local, o comportamento dependerá da opção de atualização de texto completo selecionada. Se a opção de atualização de texto completo for Importar ou Recriar, o catálogo de texto completo anexado será recriado. Se a opção de atualização de texto completo for Redefinir, o catálogo de texto completo anexado será redefinido.

Para obter mais informações sobre como desanexar e anexar um banco de dados, consulte Desanexar e anexar banco de dados (SQL Server), CREATE DATABASEsp_attach_db e sp_detach_db.