Indexes - Create Or Update

Servicio:: Search Service

Versión de la API:: 2026-04-01

Crea un nuevo índice de búsqueda o actualiza un índice si ya existe.

PUT {endpoint}/indexes('{indexName}')?api-version=2026-04-01

Con parámetros opcionales:

PUT {endpoint}/indexes('{indexName}')?api-version=2026-04-01&allowIndexDowntime={allowIndexDowntime}

Parámetros de identificador URI

Nombre	En	Requerido	Tipo	Description
endpoint	path	True	string (uri)	La dirección URL del punto de conexión del servicio de búsqueda.
indexName	path	True	string	Nombre del índice.
api-version	query	True	string minLength: 1	Versión de la API que se va a usar para esta operación.
allowIndexDowntime	query		boolean	Permite agregar nuevos analizadores, tokenizadores, filtros de token o filtros char a un índice tomando el índice sin conexión durante al menos unos segundos. Esto provoca temporalmente un error en la indexación y las solicitudes de consulta. La disponibilidad de rendimiento y escritura del índice puede verse afectada durante varios minutos después de actualizar el índice o durante más tiempo para índices muy grandes.

Encabezado de la solicitud

Nombre	Requerido	Tipo	Description
Accept		Accept	El encabezado Aceptar.
If-Match		string	Define la condición If-Match. La operación se realizará solo si la ETag en el servidor coincide con este valor.
If-None-Match		string	Define la condición If-None-Match. La operación se realizará solo si la ETag en el servidor no coincide con este valor.
Prefer	True	Prefer	Para las solicitudes HTTP PUT, indica al servicio que devuelva el recurso creado/actualizado en caso de éxito.
x-ms-client-request-id		string (uuid)	Identificador de cadena globalmente único y generado por el cliente para la solicitud.

Cuerpo de la solicitud

Nombre	Requerido	Tipo	Description
fields	True	SearchField[]	Campos del índice.
name	True	string	Nombre del índice.
@odata.etag		string	ETag del índice.
analyzers		LexicalAnalyzer[]: CustomAnalyzer[] LuceneStandardAnalyzer[] PatternAnalyzer[] StopAnalyzer[]	Analizadores del índice.
charFilters		CharFilter[]: MappingCharFilter[] PatternReplaceCharFilter[]	Los filtros de caracteres para el índice.
corsOptions		CorsOptions	Opciones para controlar el uso compartido de recursos entre orígenes (CORS) para el índice.
defaultScoringProfile		string	Nombre del perfil de puntuación que se va a usar si no se especifica ninguno en la consulta. Si esta propiedad no está establecida y no se especifica ningún perfil de puntuación en la consulta, se usará la puntuación predeterminada (tf-idf).
description		string	La descripción del índice.
encryptionKey		SearchResourceEncryptionKey	Descripción de una clave de cifrado que se crea en Azure Key Vault. Esta clave se utiliza para proporcionar un nivel adicional de cifrado en reposo para tus datos cuando quieres tener la garantía total de que nadie, ni siquiera Microsoft, puede descifrar tus datos. Una vez que haya cifrado los datos, siempre permanecerá cifrado. El servicio de búsqueda omitirá los intentos de establecer esta propiedad en null. Puede cambiar esta propiedad según sea necesario si desea rotar la clave de cifrado; Los datos no se verán afectados. El cifrado con claves administradas por el cliente no está disponible para los servicios de búsqueda gratuitos y solo está disponible para los servicios pagos creados a partir del 1 de enero de 2019.
normalizers		LexicalNormalizer[]: CustomNormalizer[]	Los normalizadores del índice.
scoringProfiles		ScoringProfile[]	Perfiles de puntuación para el índice.
semantic		SemanticSearch	Define parámetros para un índice de búsqueda que influye en las funcionalidades semánticas.
similarity		SimilarityAlgorithm: BM25SimilarityAlgorithm ClassicSimilarityAlgorithm	Tipo de algoritmo de similitud que se va a usar al puntuar y clasificar los documentos que coinciden con una consulta de búsqueda. El algoritmo de similitud solo se puede definir en el momento de creación del índice y no se puede modificar en índices existentes. Si es null, se usa el algoritmo ClassicSimilarity.
suggesters		SearchSuggester[]	Proveedores de sugerencias para el índice.
tokenFilters		TokenFilter[]: AsciiFoldingTokenFilter[] CjkBigramTokenFilter[] CommonGramTokenFilter[] DictionaryDecompounderTokenFilter[] EdgeNGramTokenFilter[] EdgeNGramTokenFilterV2[] ElisionTokenFilter[] KeepTokenFilter[] KeywordMarkerTokenFilter[] LengthTokenFilter[] LimitTokenFilter[] NGramTokenFilter[] NGramTokenFilterV2[] PatternCaptureTokenFilter[] PatternReplaceTokenFilter[] PhoneticTokenFilter[] ShingleTokenFilter[] SnowballTokenFilter[] StemmerOverrideTokenFilter[] StemmerTokenFilter[] StopwordsTokenFilter[] SynonymTokenFilter[] TruncateTokenFilter[] UniqueTokenFilter[] WordDelimiterTokenFilter[]	El token filtra el índice.
tokenizers		LexicalTokenizer[]: ClassicTokenizer[] EdgeNGramTokenizer[] KeywordTokenizer[] KeywordTokenizerV2[] LuceneStandardTokenizer[] LuceneStandardTokenizerV2[] MicrosoftLanguageStemmingTokenizer[] MicrosoftLanguageTokenizer[] NGramTokenizer[] PathHierarchyTokenizerV2[] PatternTokenizer[] UaxUrlEmailTokenizer[]	Tokenizadores del índice.
vectorSearch		VectorSearch	Contiene opciones de configuración relacionadas con la búsqueda vectorial.

Respuestas

Nombre	Tipo	Description
200 OK	SearchIndex	La solicitud se ha realizado correctamente.
201 Created	SearchIndex	La solicitud se ha realizado correctamente y se ha creado un nuevo recurso como resultado.
Other Status Codes	ErrorResponse	Una respuesta de error inesperada.

Seguridad

api-key

Tipo: apiKey
En: header

OAuth2Auth

Tipo: oauth2
Flujo: implicit
Dirección URL de autorización: https://login.microsoftonline.com/common/oauth2/v2.0/authorize

Ámbitos

Nombre	Description
https://search.azure.com/.default

Ejemplos

SearchServiceCreateOrUpdateIndex

Solicitud de ejemplo

HTTP

PUT https://exampleservice.search.windows.net/indexes('temp-example-index')?api-version=2026-04-01&allowIndexDowntime=





{
  "name": "temp-example-index",
  "description": "description",
  "fields": [
    {
      "name": "id",
      "type": "Edm.String",
      "key": true,
      "sortable": true
    },
    {
      "name": "vector1",
      "type": "Collection(Edm.Single)",
      "retrievable": true,
      "searchable": true,
      "dimensions": 20,
      "vectorSearchProfile": "config1"
    },
    {
      "name": "vector1b",
      "type": "Collection(Edm.Single)",
      "retrievable": true,
      "searchable": true,
      "dimensions": 10,
      "vectorSearchProfile": "config2"
    },
    {
      "name": "vector2",
      "type": "Collection(Edm.Single)",
      "retrievable": true,
      "searchable": true,
      "dimensions": 5,
      "vectorSearchProfile": "config3"
    },
    {
      "name": "vector3",
      "type": "Collection(Edm.Single)",
      "retrievable": true,
      "searchable": true,
      "dimensions": 5,
      "vectorSearchProfile": "config3"
    },
    {
      "name": "vector22",
      "type": "Collection(Edm.Single)",
      "retrievable": true,
      "searchable": true,
      "dimensions": 10,
      "vectorSearchProfile": "config2"
    },
    {
      "name": "vector4",
      "type": "Collection(Edm.Single)",
      "retrievable": true,
      "searchable": true,
      "dimensions": 32,
      "vectorSearchProfile": "config4"
    },
    {
      "name": "name",
      "type": "Edm.String",
      "retrievable": true,
      "searchable": true,
      "filterable": true,
      "sortable": true,
      "facetable": true,
      "analyzer": "en.lucene"
    },
    {
      "name": "description",
      "type": "Edm.String",
      "retrievable": true,
      "searchable": true,
      "filterable": true,
      "sortable": true,
      "facetable": true,
      "analyzer": "standard.lucene"
    },
    {
      "name": "category",
      "type": "Edm.String",
      "retrievable": true,
      "searchable": true,
      "filterable": true,
      "sortable": true,
      "facetable": true,
      "analyzer": "en.lucene"
    },
    {
      "name": "ownerId",
      "type": "Edm.String",
      "retrievable": true,
      "searchable": true,
      "filterable": true,
      "sortable": true,
      "facetable": true,
      "analyzer": "en.lucene"
    },
    {
      "name": "price",
      "type": "Edm.Double",
      "retrievable": true,
      "filterable": true,
      "sortable": true,
      "facetable": true
    }
  ],
  "scoringProfiles": [
    {
      "name": "stringFieldBoost",
      "text": {
        "weights": {
          "name": 3,
          "description": 1,
          "category": 2,
          "ownerId": 1
        }
      },
      "functions": [
        {
          "tag": {
            "tagsParameter": "categoryTag"
          },
          "type": "tag",
          "fieldName": "category",
          "boost": 2
        }
      ]
    }
  ],
  "defaultScoringProfile": "stringFieldBoost",
  "corsOptions": {
    "allowedOrigins": [
      "https://www.example.com/foo"
    ],
    "maxAgeInSeconds": 10
  },
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "category",
        "ownerId"
      ]
    }
  ],
  "analyzers": [
    {
      "tokenizer": "standard_v2",
      "tokenFilters": [
        "common_grams"
      ],
      "charFilters": [
        "html_strip"
      ],
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "name": "tagsAnalyzer"
    }
  ],
  "tokenizers": [
    {
      "maxTokenLength": 100,
      "@odata.type": "#Microsoft.Azure.Search.StandardTokenizerV2",
      "name": "my_tokenizer"
    }
  ],
  "tokenFilters": [
    {
      "preserveOriginal": false,
      "@odata.type": "#Microsoft.Azure.Search.AsciiFoldingTokenFilter",
      "name": "my_tokenFilter"
    }
  ],
  "charFilters": [
    {
      "mappings": [
        ".=>,",
        "_=>-"
      ],
      "@odata.type": "#Microsoft.Azure.Search.MappingCharFilter",
      "name": "my_mapping"
    }
  ],
  "normalizers": [
    {
      "tokenFilters": [
        "my_tokenFilter"
      ],
      "charFilters": [
        "my_mapping"
      ],
      "@odata.type": "#Microsoft.Azure.Search.CustomNormalizer",
      "name": "my_normalizer"
    }
  ],
  "similarity": {
    "k1": 10,
    "b": 0.1,
    "@odata.type": "#Microsoft.Azure.Search.BM25Similarity"
  },
  "semantic": {
    "defaultConfiguration": "testconfig",
    "configurations": [
      {
        "name": "testconfig",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "category"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "ownerId"
            }
          ]
        },
        "rankingOrder": "BoostedRerankerScore"
      }
    ]
  },
  "vectorSearch": {
    "profiles": [
      {
        "name": "config1",
        "algorithm": "cosine",
        "vectorizer": "openai",
        "compression": "mySQ8"
      },
      {
        "name": "config2",
        "algorithm": "euclidean",
        "vectorizer": "custom-web-api",
        "compression": "mySQ8"
      },
      {
        "name": "config3",
        "algorithm": "dotProduct",
        "vectorizer": "custom-web-api",
        "compression": "myBQC"
      },
      {
        "name": "config4",
        "algorithm": "dotProduct",
        "vectorizer": "custom-web-api",
        "compression": "myBQWithoutOriginals"
      }
    ],
    "algorithms": [
      {
        "hnswParameters": {
          "metric": "cosine"
        },
        "name": "cosine",
        "kind": "hnsw"
      },
      {
        "hnswParameters": {
          "metric": "euclidean"
        },
        "name": "euclidean",
        "kind": "hnsw"
      },
      {
        "hnswParameters": {
          "metric": "dotProduct"
        },
        "name": "dotProduct",
        "kind": "hnsw"
      }
    ],
    "vectorizers": [
      {
        "azureOpenAIParameters": {
          "resourceUri": "https://test-sample.openai.azure.com/",
          "deploymentId": "model",
          "apiKey": "api-key",
          "modelName": "text-embedding-3-large"
        },
        "name": "openai",
        "kind": "azureOpenAI"
      },
      {
        "customWebApiParameters": {
          "uri": "https://my-custom-endpoint.org/",
          "httpHeaders": {
            "header1": "value1",
            "header2": "value2"
          },
          "httpMethod": "POST",
          "timeout": "PT1M",
          "authResourceId": "api://f89d1c93-58a7-4b07-9a5b-5f89048b927b",
          "authIdentity": {
            "@odata.type": "#Microsoft.Azure.Search.DataNoneIdentity"
          }
        },
        "name": "custom-web-api",
        "kind": "customWebApi"
      },
      {
        "amlParameters": {
          "uri": "https://my-custom-endpoint.org/",
          "resourceId": "aml resource id",
          "timeout": "PT1M",
          "region": "aml region",
          "modelName": "OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32"
        },
        "name": "aml",
        "kind": "aml"
      },
      {
        "amlParameters": {
          "uri": "https://my-custom-endpoint.org/",
          "resourceId": "aml resource id",
          "timeout": "PT1M",
          "region": "aml region",
          "modelName": "Cohere-embed-v4"
        },
        "name": "aml-cohere",
        "kind": "aml"
      }
    ],
    "compressions": [
      {
        "scalarQuantizationParameters": {
          "quantizedDataType": "int8"
        },
        "name": "mySQ8",
        "kind": "scalarQuantization",
        "rescoringOptions": {
          "enableRescoring": true,
          "defaultOversampling": 10,
          "rescoreStorageMethod": "preserveOriginals"
        },
        "truncationDimension": 2
      },
      {
        "name": "myBQC",
        "kind": "binaryQuantization",
        "rescoringOptions": {
          "enableRescoring": true,
          "defaultOversampling": 10,
          "rescoreStorageMethod": "preserveOriginals"
        },
        "truncationDimension": 2
      },
      {
        "name": "myBQWithoutOriginals",
        "kind": "binaryQuantization",
        "rescoringOptions": {
          "enableRescoring": true,
          "defaultOversampling": 10,
          "rescoreStorageMethod": "discardOriginals"
        },
        "truncationDimension": 2
      }
    ]
  },
  "@odata.etag": "0x1234568AE7E58A1"
}

Respuesta de muestra

status code:: 200

{
  "name": "temp-example-index",
  "description": "description",
  "defaultScoringProfile": "stringFieldBoost",
  "fields": [
    {
      "name": "id",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": true,
      "synonymMaps": []
    },
    {
      "name": "vector1",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 20,
      "vectorSearchProfile": "config1",
      "synonymMaps": []
    },
    {
      "name": "vector1b",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 10,
      "vectorSearchProfile": "config2",
      "synonymMaps": []
    },
    {
      "name": "vector2",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 5,
      "vectorSearchProfile": "config3",
      "synonymMaps": []
    },
    {
      "name": "vector3",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 5,
      "vectorSearchProfile": "config3",
      "synonymMaps": []
    },
    {
      "name": "vector22",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 10,
      "vectorSearchProfile": "config2",
      "synonymMaps": []
    },
    {
      "name": "vector4",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 32,
      "vectorSearchProfile": "config4",
      "synonymMaps": []
    },
    {
      "name": "name",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "analyzer": "en.lucene",
      "synonymMaps": []
    },
    {
      "name": "description",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "analyzer": "standard.lucene",
      "synonymMaps": []
    },
    {
      "name": "category",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "analyzer": "en.lucene",
      "synonymMaps": []
    },
    {
      "name": "ownerId",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "analyzer": "en.lucene",
      "synonymMaps": []
    },
    {
      "name": "price",
      "type": "Edm.Double",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "synonymMaps": []
    }
  ],
  "scoringProfiles": [
    {
      "name": "stringFieldBoost",
      "functionAggregation": "sum",
      "text": {
        "weights": {
          "name": 3,
          "description": 1,
          "category": 2,
          "ownerId": 1
        }
      },
      "functions": [
        {
          "fieldName": "category",
          "interpolation": "linear",
          "type": "tag",
          "boost": 2,
          "tag": {
            "tagsParameter": "categoryTag"
          }
        }
      ]
    }
  ],
  "corsOptions": {
    "allowedOrigins": [
      "https://www.example.com/foo"
    ],
    "maxAgeInSeconds": 10
  },
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "category",
        "ownerId"
      ]
    }
  ],
  "analyzers": [
    {
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "name": "tagsAnalyzer",
      "tokenizer": "standard_v2",
      "tokenFilters": [
        "common_grams"
      ],
      "charFilters": [
        "html_strip"
      ]
    }
  ],
  "normalizers": [
    {
      "@odata.type": "#Microsoft.Azure.Search.CustomNormalizer",
      "name": "my_normalizer",
      "tokenFilters": [
        "my_tokenFilter"
      ],
      "charFilters": [
        "my_mapping"
      ]
    }
  ],
  "tokenizers": [
    {
      "@odata.type": "#Microsoft.Azure.Search.StandardTokenizerV2",
      "name": "my_tokenizer",
      "maxTokenLength": 100
    }
  ],
  "tokenFilters": [
    {
      "@odata.type": "#Microsoft.Azure.Search.AsciiFoldingTokenFilter",
      "name": "my_tokenFilter",
      "preserveOriginal": false
    }
  ],
  "charFilters": [
    {
      "@odata.type": "#Microsoft.Azure.Search.MappingCharFilter",
      "name": "my_mapping",
      "mappings": [
        ".=>,",
        "_=>-"
      ]
    }
  ],
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.BM25Similarity",
    "k1": 10,
    "b": 0.1
  },
  "semantic": {
    "defaultConfiguration": "testconfig",
    "configurations": [
      {
        "name": "testconfig",
        "rankingOrder": "BoostedRerankerScore",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "category"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "ownerId"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "algorithms": [
      {
        "name": "cosine",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "cosine",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "euclidean",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "euclidean",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "dotProduct",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "dotProduct",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      }
    ],
    "profiles": [
      {
        "name": "config1",
        "algorithm": "cosine",
        "vectorizer": "openai",
        "compression": "mySQ8"
      },
      {
        "name": "config2",
        "algorithm": "euclidean",
        "vectorizer": "custom-web-api",
        "compression": "mySQ8"
      },
      {
        "name": "config3",
        "algorithm": "dotProduct",
        "vectorizer": "custom-web-api",
        "compression": "myBQC"
      },
      {
        "name": "config4",
        "algorithm": "dotProduct",
        "vectorizer": "custom-web-api",
        "compression": "myBQWithoutOriginals"
      }
    ],
    "vectorizers": [
      {
        "name": "openai",
        "kind": "azureOpenAI",
        "azureOpenAIParameters": {
          "resourceUri": "https://test-sample.openai.azure.com",
          "deploymentId": "model",
          "apiKey": "api-key",
          "modelName": "text-embedding-3-large"
        }
      },
      {
        "name": "custom-web-api",
        "kind": "customWebApi",
        "customWebApiParameters": {
          "httpMethod": "POST",
          "uri": "https://my-custom-endpoint.org/",
          "timeout": "PT1M",
          "authResourceId": "api://f89d1c93-58a7-4b07-9a5b-5f89048b927b",
          "httpHeaders": {
            "header1": "value1",
            "header2": "value2"
          },
          "authIdentity": {
            "@odata.type": "#Microsoft.Azure.Search.DataNoneIdentity"
          }
        }
      },
      {
        "name": "aml",
        "kind": "aml",
        "amlParameters": {
          "resourceId": "aml resource id",
          "region": "aml region",
          "uri": "https://my-custom-endpoint.org/",
          "timeout": "PT1M",
          "modelName": "OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32"
        }
      },
      {
        "name": "aml-cohere",
        "kind": "aml",
        "amlParameters": {
          "resourceId": "aml resource id",
          "region": "aml region",
          "uri": "https://my-custom-endpoint.org/",
          "timeout": "PT1M",
          "modelName": "Cohere-embed-v4"
        }
      }
    ],
    "compressions": [
      {
        "name": "mySQ8",
        "kind": "scalarQuantization",
        "truncationDimension": 2,
        "scalarQuantizationParameters": {
          "quantizedDataType": "int8"
        },
        "rescoringOptions": {
          "enableRescoring": true,
          "defaultOversampling": 10,
          "rescoreStorageMethod": "preserveOriginals"
        }
      },
      {
        "name": "myBQC",
        "kind": "binaryQuantization",
        "truncationDimension": 2,
        "rescoringOptions": {
          "enableRescoring": true,
          "defaultOversampling": 10,
          "rescoreStorageMethod": "preserveOriginals"
        }
      },
      {
        "name": "myBQWithoutOriginals",
        "kind": "binaryQuantization",
        "truncationDimension": 2,
        "rescoringOptions": {
          "enableRescoring": true,
          "defaultOversampling": 10,
          "rescoreStorageMethod": "discardOriginals"
        }
      }
    ]
  }
}

status code:: 201

{
  "name": "temp-example-index",
  "description": "description",
  "defaultScoringProfile": "stringFieldBoost",
  "fields": [
    {
      "name": "id",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": true,
      "synonymMaps": []
    },
    {
      "name": "vector1",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 20,
      "vectorSearchProfile": "config1",
      "synonymMaps": []
    },
    {
      "name": "vector1b",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 10,
      "vectorSearchProfile": "config2",
      "synonymMaps": []
    },
    {
      "name": "vector2",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 5,
      "vectorSearchProfile": "config3",
      "synonymMaps": []
    },
    {
      "name": "vector3",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 5,
      "vectorSearchProfile": "config3",
      "synonymMaps": []
    },
    {
      "name": "vector22",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 10,
      "vectorSearchProfile": "config2",
      "synonymMaps": []
    },
    {
      "name": "vector4",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 32,
      "vectorSearchProfile": "config4",
      "synonymMaps": []
    },
    {
      "name": "name",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "analyzer": "en.lucene",
      "synonymMaps": []
    },
    {
      "name": "description",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "analyzer": "standard.lucene",
      "synonymMaps": []
    },
    {
      "name": "category",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "analyzer": "en.lucene",
      "synonymMaps": []
    },
    {
      "name": "ownerId",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "analyzer": "en.lucene",
      "synonymMaps": []
    },
    {
      "name": "price",
      "type": "Edm.Double",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "synonymMaps": []
    }
  ],
  "scoringProfiles": [
    {
      "name": "stringFieldBoost",
      "functionAggregation": "sum",
      "text": {
        "weights": {
          "name": 3,
          "description": 1,
          "category": 2,
          "ownerId": 1
        }
      },
      "functions": [
        {
          "fieldName": "category",
          "interpolation": "linear",
          "type": "tag",
          "boost": 2,
          "tag": {
            "tagsParameter": "categoryTag"
          }
        }
      ]
    }
  ],
  "corsOptions": {
    "allowedOrigins": [
      "https://www.example.com/foo"
    ],
    "maxAgeInSeconds": 10
  },
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "category",
        "ownerId"
      ]
    }
  ],
  "analyzers": [
    {
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "name": "tagsAnalyzer",
      "tokenizer": "standard_v2",
      "tokenFilters": [
        "common_grams"
      ],
      "charFilters": [
        "html_strip"
      ]
    }
  ],
  "normalizers": [
    {
      "@odata.type": "#Microsoft.Azure.Search.CustomNormalizer",
      "name": "my_normalizer",
      "tokenFilters": [
        "my_tokenFilter"
      ],
      "charFilters": [
        "my_mapping"
      ]
    }
  ],
  "tokenizers": [
    {
      "@odata.type": "#Microsoft.Azure.Search.StandardTokenizerV2",
      "name": "my_tokenizer",
      "maxTokenLength": 100
    }
  ],
  "tokenFilters": [
    {
      "@odata.type": "#Microsoft.Azure.Search.AsciiFoldingTokenFilter",
      "name": "my_tokenFilter",
      "preserveOriginal": false
    }
  ],
  "charFilters": [
    {
      "@odata.type": "#Microsoft.Azure.Search.MappingCharFilter",
      "name": "my_mapping",
      "mappings": [
        ".=>,",
        "_=>-"
      ]
    }
  ],
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.BM25Similarity",
    "k1": 10,
    "b": 0.1
  },
  "semantic": {
    "defaultConfiguration": "testconfig",
    "configurations": [
      {
        "name": "testconfig",
        "rankingOrder": "BoostedRerankerScore",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "category"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "ownerId"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "algorithms": [
      {
        "name": "cosine",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "cosine",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "euclidean",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "euclidean",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "dotProduct",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "dotProduct",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      }
    ],
    "profiles": [
      {
        "name": "config1",
        "algorithm": "cosine",
        "vectorizer": "openai",
        "compression": "mySQ8"
      },
      {
        "name": "config2",
        "algorithm": "euclidean",
        "vectorizer": "custom-web-api",
        "compression": "mySQ8"
      },
      {
        "name": "config3",
        "algorithm": "dotProduct",
        "vectorizer": "custom-web-api",
        "compression": "myBQC"
      },
      {
        "name": "config4",
        "algorithm": "dotProduct",
        "vectorizer": "custom-web-api",
        "compression": "myBQWithoutOriginals"
      }
    ],
    "vectorizers": [
      {
        "name": "openai",
        "kind": "azureOpenAI",
        "azureOpenAIParameters": {
          "resourceUri": "https://test-sample.openai.azure.com",
          "deploymentId": "model",
          "apiKey": "api-key",
          "modelName": "text-embedding-3-large"
        }
      },
      {
        "name": "custom-web-api",
        "kind": "customWebApi",
        "customWebApiParameters": {
          "httpMethod": "POST",
          "uri": "https://my-custom-endpoint.org/",
          "timeout": "PT1M",
          "authResourceId": "api://f89d1c93-58a7-4b07-9a5b-5f89048b927b",
          "httpHeaders": {
            "header1": "value1",
            "header2": "value2"
          },
          "authIdentity": {
            "@odata.type": "#Microsoft.Azure.Search.DataNoneIdentity"
          }
        }
      },
      {
        "name": "aml",
        "kind": "aml",
        "amlParameters": {
          "resourceId": "aml resource id",
          "region": "aml region",
          "uri": "https://my-custom-endpoint.org/",
          "timeout": "PT1M",
          "modelName": "OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32"
        }
      },
      {
        "name": "aml-cohere",
        "kind": "aml",
        "amlParameters": {
          "resourceId": "aml resource id",
          "region": "aml region",
          "uri": "https://my-custom-endpoint.org/",
          "timeout": "PT1M",
          "modelName": "Cohere-embed-v4"
        }
      }
    ],
    "compressions": [
      {
        "name": "mySQ8",
        "kind": "scalarQuantization",
        "truncationDimension": 2,
        "scalarQuantizationParameters": {
          "quantizedDataType": "int8"
        },
        "rescoringOptions": {
          "enableRescoring": true,
          "defaultOversampling": 10,
          "rescoreStorageMethod": "preserveOriginals"
        }
      },
      {
        "name": "myBQC",
        "kind": "binaryQuantization",
        "truncationDimension": 2,
        "rescoringOptions": {
          "enableRescoring": true,
          "defaultOversampling": 10,
          "rescoreStorageMethod": "preserveOriginals"
        }
      },
      {
        "name": "myBQWithoutOriginals",
        "kind": "binaryQuantization",
        "truncationDimension": 2,
        "rescoringOptions": {
          "enableRescoring": true,
          "defaultOversampling": 10,
          "rescoreStorageMethod": "discardOriginals"
        }
      }
    ]
  }
}

Definiciones

Nombre	Description
Accept	El encabezado Aceptar.
AIFoundryModelCatalogName	El nombre del modelo de incrustación del catálogo de Fundición de IA de Azure que se llamará.
AMLParameters	Especifica las propiedades para conectarse a un vectorizador AML.
AMLVectorizer	Especifica un endpoint de Azure Machine Learning desplegado a través del Fundición de IA de Azure Model Catalog para generar la incrustación vectorial de una cadena de consulta.
AsciiFoldingTokenFilter	Convierte caracteres alfabéticos, numéricos y simbólicos Unicode que no están en los primeros 127 caracteres ASCII (el bloque Unicode "Básico latino") en sus equivalentes ASCII, si existen dichos equivalentes. Este filtro de token se implementa mediante Apache Lucene.
AzureOpenAIModelName	Nombre del modelo de Azure Open AI al que se llamará.
AzureOpenAIVectorizer	Especifica el recurso de Azure OpenAI que se usa para vectorizar una cadena de consulta.
AzureOpenAIVectorizerParameters	Especifica los parámetros para conectarse al recurso de Azure OpenAI.
BinaryQuantizationCompression	Contiene opciones de configuración específicas del método de compresión de cuantificación binaria que se usa durante la indexación y la consulta.
BM25SimilarityAlgorithm	Función de clasificación basada en el algoritmo de similitud okapi BM25. BM25 es un algoritmo similar a TF-IDF que incluye la normalización de longitud (controlada por el parámetro 'b'), así como la saturación de frecuencia de términos (controlada por el parámetro 'k1').
CharFilterName	Define los nombres de todos los filtros de caracteres admitidos por el motor de búsqueda.
CjkBigramTokenFilter	Forma bigrams de términos de CJK que se generan a partir del tokenizador estándar. Este filtro de token se implementa mediante Apache Lucene.
CjkBigramTokenFilterScripts	Scripts que CjkBigramTokenFilter puede omitir.
ClassicSimilarityAlgorithm	Algoritmo de similitud heredado que usa la implementación de TFIDFSimilarity de Lucene de TF-IDF. Esta variación de TF-IDF introduce la normalización estática de la longitud del documento, así como la coordinación de factores que penalizan los documentos que solo coinciden parcialmente con las consultas buscadas.
ClassicTokenizer	Tokenizador basado en gramática que es adecuado para procesar la mayoría de los documentos de idioma europeo. Este tokenizador se implementa mediante Apache Lucene.
CommonGramTokenFilter	Construye bigramas para términos que se repiten con frecuencia durante la indexación. Los términos individuales también se indexan, con los bigramas superpuestos. Este filtro de token se implementa mediante Apache Lucene.
CorsOptions	Define las opciones para controlar el uso compartido de recursos entre orígenes (CORS) para un índice.
CustomAnalyzer	Permite tomar el control sobre el proceso de conversión de texto en tokens indexables o que se pueden buscar. Se trata de una configuración definida por el usuario que consta de un único tokenizador predefinido y uno o varios filtros. El tokenizador es responsable de dividir texto en tokens y los filtros para modificar los tokens emitidos por el tokenizador.
CustomNormalizer	Permite configurar la normalización de los campos filtrables, ordenables y facetables, que funcionan de forma predeterminada con coincidencias estrictas. Se trata de una configuración definida por el usuario que consta de al menos uno o varios filtros, que modifican el token almacenado.
DictionaryDecompounderTokenFilter	Descompone las palabras compuestas que se encuentran en muchas lenguas germánicas. Este filtro de token se implementa mediante Apache Lucene.
DistanceScoringFunction	Define una función que aumenta las puntuaciones en función de la distancia desde una ubicación geográfica.
DistanceScoringParameters	Proporciona valores de parámetro a una función de puntuación de distancia.
EdgeNGramTokenFilter	Genera n-gramas de los tamaños especificados a partir de la parte delantera o posterior de un token de entrada. Este filtro de token se implementa mediante Apache Lucene.
EdgeNGramTokenFilterSide	Especifica desde qué lado de la entrada se debe generar un n-grama.
EdgeNGramTokenFilterV2	Genera n-gramas de los tamaños especificados a partir de la parte delantera o posterior de un token de entrada. Este filtro de token se implementa mediante Apache Lucene.
EdgeNGramTokenizer	Tokeniza la entrada de un borde en n gramos de los tamaños especificados. Este tokenizador se implementa mediante Apache Lucene.
ElisionTokenFilter	Elimina elisiones. Por ejemplo, "l'avion" (el plano) se convertirá en "avion" (plano). Este filtro de token se implementa mediante Apache Lucene.
ErrorAdditionalInfo	Información adicional sobre el error de administración de recursos.
ErrorDetail	Detalle del error.
ErrorResponse	Respuesta común a errores para todas las APIs de Azure Resource Manager para devolver detalles de error por operaciones fallidas. (Esto también sigue el formato de respuesta de error de OData).
ExhaustiveKnnAlgorithmConfiguration	Contiene opciones de configuración específicas del algoritmo KNN exhaustivo utilizado durante la consulta, que realizará la búsqueda por fuerza bruta en todo el índice vectorial.
ExhaustiveKnnParameters	Contiene los parámetros específicos del algoritmo KNN exhaustivo.
FreshnessScoringFunction	Define una función que aumenta las puntuaciones en función del valor de un campo de fecha y hora.
FreshnessScoringParameters	Proporciona valores de parámetro a una función de puntuación de actualización.
HnswAlgorithmConfiguration	Contiene opciones de configuración específicas del algoritmo de vecinos más cercanos aproximados de HNSW utilizado durante la indexación y la consulta. El algoritmo HNSW ofrece una compensación ajustable entre la velocidad de búsqueda y la precisión.
HnswParameters	Contiene los parámetros específicos del algoritmo HNSW.
KeepTokenFilter	Filtro de token que solo mantiene los tokens con texto contenido en una lista especificada de palabras. Este filtro de token se implementa mediante Apache Lucene.
KeywordMarkerTokenFilter	Marca los términos como palabras clave. Este filtro de token se implementa mediante Apache Lucene.
KeywordTokenizer	Emite la entrada completa como un solo token. Este tokenizador se implementa mediante Apache Lucene.
KeywordTokenizerV2	Emite la entrada completa como un solo token. Este tokenizador se implementa mediante Apache Lucene.
LengthTokenFilter	Quita las palabras que son demasiado largas o demasiado cortas. Este filtro de token se implementa mediante Apache Lucene.
LexicalAnalyzerName	Define los nombres de todos los analizadores de texto compatibles con el motor de búsqueda.
LexicalNormalizerName	Define los nombres de todos los normalizadores de texto admitidos por el motor de búsqueda.
LexicalTokenizerName	Define los nombres de todos los tokenizadores admitidos por el motor de búsqueda.
LimitTokenFilter	Limita el número de tokens durante la indexación. Este filtro de token se implementa mediante Apache Lucene.
LuceneStandardAnalyzer	Analizador estándar de Apache Lucene; Compuesto por el tokenizador estándar, el filtro en minúsculas y el filtro stop.
LuceneStandardTokenizer	Interrumpe el texto siguiendo las reglas de segmentación de texto Unicode. Este tokenizador se implementa mediante Apache Lucene.
LuceneStandardTokenizerV2	Interrumpe el texto siguiendo las reglas de segmentación de texto Unicode. Este tokenizador se implementa mediante Apache Lucene.
MagnitudeScoringFunction	Define una función que aumenta las puntuaciones en función de la magnitud de un campo numérico.
MagnitudeScoringParameters	Proporciona valores de parámetro a una función de puntuación de magnitud.
MappingCharFilter	Filtro de caracteres que aplica asignaciones definidas con la opción asignaciones. La coincidencia es ambiciosa (la mayor coincidencia de patrones en un momento dado gana). Se permite que la sustitución sea una cadena vacía. Este filtro de caracteres se implementa mediante Apache Lucene.
MicrosoftLanguageStemmingTokenizer	Divide el texto mediante reglas específicas del idioma y reduce las palabras a sus formas base.
MicrosoftLanguageTokenizer	Divide el texto mediante reglas específicas del idioma.
MicrosoftStemmingTokenizerLanguage	Enumera los lenguajes soportados por el tokenizador de stemming de lenguaje de Microsoft.
MicrosoftTokenizerLanguage	Enumera los idiomas soportados por el tokenizador de lenguajes de Microsoft.
NGramTokenFilter	Genera n-gramas de los tamaños especificados. Este filtro de token se implementa mediante Apache Lucene.
NGramTokenFilterV2	Genera n-gramas de los tamaños especificados. Este filtro de token se implementa mediante Apache Lucene.
NGramTokenizer	Tokeniza la entrada en n-gramas de los tamaños especificados. Este tokenizador se implementa mediante Apache Lucene.
PathHierarchyTokenizerV2	Tokenizador para jerarquías similares a rutas de acceso. Este tokenizador se implementa mediante Apache Lucene.
PatternAnalyzer	Separa el texto de manera flexible en términos a través de un patrón de expresión regular. Este analizador se implementa mediante Apache Lucene.
PatternCaptureTokenFilter	Usa expresiones regulares de Java para emitir varios tokens: uno para cada grupo de captura en uno o varios patrones. Este filtro de token se implementa mediante Apache Lucene.
PatternReplaceCharFilter	Filtro de caracteres que reemplaza los caracteres de la cadena de entrada. Usa una expresión regular para identificar las secuencias de caracteres que se desean conservar y un patrón de reemplazo para identificar los caracteres que se desean reemplazar. Por ejemplo, dado el texto de entrada "aa bb aa bb", el patrón "(aa)\s+(bb)" y el reemplazo "$1#$2", el resultado sería "aa#bb aa#bb aa#bb". Este filtro de caracteres se implementa mediante Apache Lucene.
PatternReplaceTokenFilter	Filtro de caracteres que reemplaza los caracteres de la cadena de entrada. Usa una expresión regular para identificar las secuencias de caracteres que se desean conservar y un patrón de reemplazo para identificar los caracteres que se desean reemplazar. Por ejemplo, dado el texto de entrada "aa bb aa bb", el patrón "(aa)\s+(bb)" y el reemplazo "$1#$2", el resultado sería "aa#bb aa#bb aa#bb". Este filtro de token se implementa mediante Apache Lucene.
PatternTokenizer	Tokenizer que usa la coincidencia de patrones regex para construir tokens distintos. Este tokenizador se implementa mediante Apache Lucene.
PhoneticEncoder	Identifica el tipo de codificador fonético que se va a usar con PhoneticTokenFilter.
PhoneticTokenFilter	Crea tokens para coincidencias fonéticas. Este filtro de token se implementa mediante Apache Lucene.
Prefer	Para las solicitudes HTTP PUT, indica al servicio que devuelva el recurso creado/actualizado en caso de éxito.
RankingOrder	Representa la puntuación que se usará para el criterio de ordenación de los documentos.
RescoringOptions	Contiene las opciones de recorción.
ScalarQuantizationCompression	Contiene opciones de configuración específicas del método de compresión de cuantificación escalar que se usa durante la indexación y la consulta.
ScalarQuantizationParameters	Contiene los parámetros específicos de la cuantificación escalar.
ScoringFunctionAggregation	Define la función de agregación utilizada para combinar los resultados de todas las funciones de puntuación de un perfil de puntuación.
ScoringFunctionInterpolation	Define la función utilizada para interpolar el aumento de puntuación en un rango de documentos.
ScoringProfile	Define parámetros para un índice de búsqueda que influye en la puntuación en las consultas de búsqueda.
SearchField	Representa un campo en una definición de índice, que describe el nombre, el tipo de datos y el comportamiento de búsqueda de un campo.
SearchFieldDataType	Define el tipo de datos de un campo en un índice de búsqueda.
SearchIndex	Representa una definición de índice de búsqueda, que describe los campos y el comportamiento de búsqueda de un índice.
SearchIndexerDataNoneIdentity	Borra la propiedad de identidad de un origen de datos.
SearchIndexerDataUserAssignedIdentity	Especifica la identidad de un origen de datos que se va a usar.
SearchResourceEncryptionKey	Una clave de cifrado administrada por el cliente en Azure Key Vault. Las claves que crea y administra se pueden usar para cifrar o descifrar datos en reposo, como índices y mapas de sinónimos.
SearchSuggester	Define cómo se debe aplicar la API suggest a un grupo de campos del índice.
SemanticConfiguration	Define una configuración específica que se usará en el contexto de las funcionalidades semánticas.
SemanticField	Campo que se usa como parte de la configuración semántica.
SemanticPrioritizedFields	Describe los campos de título, contenido y palabras clave que se usarán para la clasificación semántica, los subtítulos, los resaltados y las respuestas.
SemanticSearch	Define parámetros para un índice de búsqueda que influye en las funcionalidades semánticas.
ShingleTokenFilter	Crea combinaciones de tokens como un solo token. Este filtro de token se implementa mediante Apache Lucene.
SnowballTokenFilter	Filtro que deriva las palabras mediante un lematizador generado por Snowball. Este filtro de token se implementa mediante Apache Lucene.
SnowballTokenFilterLanguage	El idioma que se va a utilizar para un filtro de tokens de Snowball.
StemmerOverrideTokenFilter	Proporciona la capacidad de invalidar otros filtros de lematización con lematización personalizada basada en diccionarios. Cualquier término con lematización de diccionario se marcará como palabras clave para que no se lematice con lematizadores hacia abajo de la cadena. Se debe colocar antes de los filtros de lematización. Este filtro de token se implementa mediante Apache Lucene. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/StemmerOverrideFilter.html.
StemmerTokenFilter	Filtro de lematización específico del idioma. Este filtro de token se implementa mediante Apache Lucene. Vea https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters.
StemmerTokenFilterLanguage	El lenguaje que se va a usar para un filtro de token de lematización.
StopAnalyzer	Divide el texto en letras no letras; Aplica los filtros de token en minúsculas y palabras irrelevantes. Este analizador se implementa mediante Apache Lucene.
StopwordsList	Identifica una lista predefinida de palabras irrelevantes específicas del idioma.
StopwordsTokenFilter	Quita las palabras irrelevantes de una secuencia de tokens. Este filtro de token se implementa mediante Apache Lucene. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html.
SynonymTokenFilter	Coincide con sinónimos de una o varias palabras en una secuencia de tokens. Este filtro de token se implementa mediante Apache Lucene.
TagScoringFunction	Define una función que aumenta las puntuaciones de documentos con valores de cadena que coinciden con una lista determinada de etiquetas.
TagScoringParameters	Proporciona valores de parámetro a una función de puntuación de etiquetas.
TextWeights	Define pesos en campos de índice para los que las coincidencias deben aumentar la puntuación en las consultas de búsqueda.
TokenCharacterKind	Representa clases de caracteres en las que puede operar un filtro de token.
TokenFilterName	Define los nombres de todos los filtros de token admitidos por el motor de búsqueda.
TruncateTokenFilter	Trunca los términos a una longitud específica. Este filtro de token se implementa mediante Apache Lucene.
UaxUrlEmailTokenizer	Tokeniza las direcciones URL y los correos electrónicos como un token. Este tokenizador se implementa mediante Apache Lucene.
UniqueTokenFilter	Filtra los tokens con el mismo texto que el token anterior. Este filtro de token se implementa mediante Apache Lucene.
VectorEncodingFormat	El formato de codificación para interpretar el contenido de los campos vectoriales.
VectorSearch	Contiene opciones de configuración relacionadas con la búsqueda vectorial.
VectorSearchAlgorithmKind	El algoritmo utilizado para la indexación y la consulta.
VectorSearchAlgorithmMetric	La métrica de similitud que se utilizará para las comparaciones vectoriales. Se recomienda elegir la misma métrica de similitud con la que se entrenó el modelo de incrustación.
VectorSearchCompressionKind	El método de compresión utilizado para la indexación y la consulta.
VectorSearchCompressionTarget	Tipo de datos cuantificados de valores vectoriales comprimidos.
VectorSearchProfile	Define una combinación de configuraciones que se van a usar con la búsqueda vectorial.
VectorSearchVectorizerKind	El método de vectorización que se utilizará durante el tiempo de consulta.
WebApiVectorizer	Especifica un vectorizador definido por el usuario para generar la inserción de vectores de una cadena de consulta. La integración de un vectorizador externo se logra mediante la interfaz de API web personalizada de un conjunto de aptitudes.
WebApiVectorizerParameters	Especifica las propiedades para conectarse a un vectorizador definido por el usuario.
WordDelimiterTokenFilter	Divide palabras en subpalabras y realiza transformaciones opcionales en los grupos de subpalabras. Este filtro de token se implementa mediante Apache Lucene.

Accept

Enumeración

El encabezado Aceptar.

Valor	Description
application/json;odata.metadata=minimal

AIFoundryModelCatalogName

Enumeración

El nombre del modelo de incrustación del catálogo de Fundición de IA de Azure que se llamará.

Valor	Description
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32	OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336	OpenAI-CLIP-Imagen-Texto-Incrustaciones-ViT-Large-Patch14-336
Facebook-DinoV2-Image-Embeddings-ViT-Base	Facebook-DinoV2-Image-Embeddings-ViT-Base
Facebook-DinoV2-Image-Embeddings-ViT-Giant	Facebook-DinoV2-Image-Embeddings-ViT-Giant
Cohere-embed-v3-english	Cohere-embed-v3-english
Cohere-embed-v3-multilingual	Cohere-embed-v3-multilingüe
Cohere-embed-v4	Modelo de incrustación coherente v4 para generar incrustaciones tanto a partir de texto como de imágenes.

AMLParameters

Objeto

Especifica las propiedades para conectarse a un vectorizador AML.

Nombre	Tipo	Description
key	string	(Necesario para la autenticación de claves) La clave para el servicio AML.
modelName	AIFoundryModelCatalogName	El nombre del modelo de incrustación del Fundición de IA de Azure Catalog que se despliega en el punto final proporcionado.
region	string	(Opcional para la autenticación de tokens). La región en la que se implementa el servicio AML.
resourceId	string	(Necesario para la autenticación de tokens). El ID de recurso de Azure Resource Manager del servicio AML. Debería estar en el formato subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft. MachineLearningServices/workspaces/{workspace-name}/services/{service_name}.
timeout	string (duration)	(Opcional) Cuando se especifica, indica el tiempo de expiración del cliente http que hace la llamada API.
uri	string (uri)	(Necesario para la autenticación sin clave o sin autenticación) El URI de puntuación del servicio AML al que se enviará la carga JSON. Solo se permite el esquema de URI https.

AMLVectorizer

Objeto

Especifica un endpoint de Azure Machine Learning desplegado a través del Fundición de IA de Azure Model Catalog para generar la incrustación vectorial de una cadena de consulta.

Nombre	Tipo	Description
amlParameters	AMLParameters	Especifica las propiedades del vectorizador AML.
kind	string: aml	Tipo de vectorizador de búsqueda vectorial.
name	string	Nombre que se va a asociar a este método de vectorización determinado.

AsciiFoldingTokenFilter

Objeto

Convierte caracteres alfabéticos, numéricos y simbólicos Unicode que no están en los primeros 127 caracteres ASCII (el bloque Unicode "Básico latino") en sus equivalentes ASCII, si existen dichos equivalentes. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.AsciiFoldingTokenFilter		El discriminador para los tipos derivados.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
preserveOriginal	boolean	False	Valor que indica si se conservará el token original. El valor predeterminado es falso.

AzureOpenAIModelName

Enumeración

Nombre del modelo de Azure Open AI al que se llamará.

Valor	Description
text-embedding-ada-002	TextEmbeddingAda002 modelo.
text-embedding-3-large	TextEmbedding3 Modelo grande.
text-embedding-3-small	TextoEmbede3Modelo pequeño.
gpt-5-mini	Modelo Gpt5Mini.
gpt-5-nano	Modelo Gpt5Nano.
gpt-5.4-mini	Modelo GPT54Mini.
gpt-5.4-nano	Modelo Gpt54Nano.

AzureOpenAIVectorizer

Objeto

Especifica el recurso de Azure OpenAI que se usa para vectorizar una cadena de consulta.

Nombre	Tipo	Description
azureOpenAIParameters	AzureOpenAIVectorizerParameters	Contiene los parámetros específicos de la vectorización de inserción de Azure OpenAI.
kind	string: azureOpenAI	Tipo de vectorizador de búsqueda vectorial.
name	string	Nombre que se va a asociar a este método de vectorización determinado.

AzureOpenAIVectorizerParameters

Objeto

Especifica los parámetros para conectarse al recurso de Azure OpenAI.

Nombre	Tipo	Description
apiKey	string	Clave de API del recurso de Azure OpenAI designado.
authIdentity	SearchIndexerDataIdentity: SearchIndexerDataNoneIdentity SearchIndexerDataUserAssignedIdentity	La identidad administrada asignada por el usuario que se usa para las conexiones salientes.
deploymentId	string	Identificador de la implementación del modelo de Azure OpenAI en el recurso designado.
modelName	AzureOpenAIModelName	Nombre del modelo de inserción que se implementa en la ruta de acceso deploymentId proporcionada.
resourceUri	string (uri)	Identificador URI del recurso de Azure OpenAI.

BinaryQuantizationCompression

Objeto

Contiene opciones de configuración específicas del método de compresión de cuantificación binaria que se usa durante la indexación y la consulta.

Nombre	Tipo	Description
kind	string: binaryQuantization	Tipo de Búsqueda VectorCompresión.
name	string	Nombre que se va a asociar a esta configuración concreta.
rescoringOptions	RescoringOptions	Contiene las opciones de recorción.
truncationDimension	integer (int32)	Número de dimensiones en las que se truncan los vectores. Truncar los vectores reduce el tamaño de los vectores y la cantidad de datos que se deben transferir durante la búsqueda. Esto puede ahorrar costos de almacenamiento y mejorar el rendimiento de la búsqueda a costa de la recuperación. Solo se debe usar para incrustaciones entrenadas con Matryoshka Representation Learning (MRL), como OpenAI text-embeding-3-large (small). El valor predeterminado es NULL, lo que significa que no hay truncamiento.

BM25SimilarityAlgorithm

Objeto

Función de clasificación basada en el algoritmo de similitud okapi BM25. BM25 es un algoritmo similar a TF-IDF que incluye la normalización de longitud (controlada por el parámetro 'b'), así como la saturación de frecuencia de términos (controlada por el parámetro 'k1').

Nombre	Tipo	Description
@odata.type	string: #Microsoft.Azure.Search.BM25Similarity	El discriminador para los tipos derivados.
b	number (double)	Esta propiedad controla cómo afecta la longitud de un documento a la puntuación de relevancia. De forma predeterminada, se usa un valor de 0,75. Un valor de 0,0 significa que no se aplica ninguna normalización de longitud, mientras que un valor de 1,0 significa que la puntuación está totalmente normalizada por la longitud del documento.
k1	number (double)	Esta propiedad controla la función de escalado entre la frecuencia de término de cada término coincidente y la puntuación de relevancia final de un par de consulta de documentos. De forma predeterminada, se usa un valor de 1.2. Un valor de 0,0 significa que la puntuación no se escala con un aumento en la frecuencia del término.

CharFilterName

Enumeración

Define los nombres de todos los filtros de caracteres admitidos por el motor de búsqueda.

Valor	Description
html_strip	Filtro de caracteres que intenta quitar construcciones HTML. Vea https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html.

CjkBigramTokenFilter

Objeto

Forma bigrams de términos de CJK que se generan a partir del tokenizador estándar. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.CjkBigramTokenFilter		El discriminador para los tipos derivados.
ignoreScripts	CjkBigramTokenFilterScripts[]		Los scripts que se van a omitir.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
outputUnigrams	boolean	False	Valor que indica si se van a generar unigramas y bigrams (si es true) o solo bigrams (si es false). El valor predeterminado es falso.

CjkBigramTokenFilterScripts

Enumeración

Scripts que CjkBigramTokenFilter puede omitir.

Valor	Description
han	Ignorar la escritura Han al formar bigramas de términos CJK.
hiragana	Ignore el script Hiragana al formar bigramas de términos CJK.
katakana	Ignorar la escritura Katakana al formar bigramas de términos CJK.
hangul	Ignore el script hangul al formar bigramas de términos CJK.

ClassicSimilarityAlgorithm

Objeto

Algoritmo de similitud heredado que usa la implementación de TFIDFSimilarity de Lucene de TF-IDF. Esta variación de TF-IDF introduce la normalización estática de la longitud del documento, así como la coordinación de factores que penalizan los documentos que solo coinciden parcialmente con las consultas buscadas.

Nombre	Tipo	Description
@odata.type	string: #Microsoft.Azure.Search.ClassicSimilarity	El discriminador para los tipos derivados.

ClassicTokenizer

Objeto

Tokenizador basado en gramática que es adecuado para procesar la mayoría de los documentos de idioma europeo. Este tokenizador se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.ClassicTokenizer		El discriminador para los tipos derivados.
maxTokenLength	integer (int32) maximum: 300	255	Longitud máxima del token. El valor predeterminado es 255. Los tokens que sobrepasen la longitud máxima se dividen. La longitud máxima del token que se puede usar es de 300 caracteres.
name	string		Nombre del tokenizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

CommonGramTokenFilter

Objeto

Construye bigramas para términos que se repiten con frecuencia durante la indexación. Los términos individuales también se indexan, con los bigramas superpuestos. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.CommonGramTokenFilter		El discriminador para los tipos derivados.
commonWords	string[]		Conjunto de palabras comunes.
ignoreCase	boolean	False	Valor que indica si las palabras comunes que coinciden no distinguen mayúsculas de minúsculas. El valor predeterminado es falso.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
queryMode	boolean	False	Valor que indica si el filtro de token está en modo de consulta. Cuando está en modo de consulta, el filtro de token genera bigrams y, a continuación, quita palabras comunes y términos únicos seguidos de una palabra común. El valor predeterminado es falso.

CorsOptions

Objeto

Define las opciones para controlar el uso compartido de recursos entre orígenes (CORS) para un índice.

Nombre	Tipo	Description
allowedOrigins	string[]	La lista de orígenes desde los que se concederá acceso al código JavaScript al índice. Puede contener una lista de hosts con el formato {protocol}://{fully-qualified-domain-name}[:{port#}], o un solo '*' para permitir todos los orígenes (no recomendado).
maxAgeInSeconds	integer (int64)	La duración durante la cual los exploradores deben almacenar en caché las respuestas preparatorias de CORS. El valor predeterminado es 5 minutos.

CustomAnalyzer

Objeto

Permite tomar el control sobre el proceso de conversión de texto en tokens indexables o que se pueden buscar. Se trata de una configuración definida por el usuario que consta de un único tokenizador predefinido y uno o varios filtros. El tokenizador es responsable de dividir texto en tokens y los filtros para modificar los tokens emitidos por el tokenizador.

Nombre	Tipo	Description
@odata.type	string: #Microsoft.Azure.Search.CustomAnalyzer	El discriminador para los tipos derivados.
charFilters	CharFilterName[]	Una lista de filtros de caracteres que se usan para preparar el texto de entrada antes de que el tokenizador lo procese. Por ejemplo, pueden reemplazar determinados caracteres o símbolos. Los filtros se ejecutan en el orden en que se muestran.
name	string	Nombre del analizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
tokenFilters	TokenFilterName[]	Una lista de filtros de tokens que se usan para filtrar o modificar los tokens generados por un tokenizador. Por ejemplo, puede especificar un filtro en minúsculas que convierte todos los caracteres a minúsculas. Los filtros se ejecutan en el orden en que se muestran.
tokenizer	LexicalTokenizerName	El nombre del tokenizador que se va a usar para dividir el texto continuo en una secuencia de tokens, como dividir una oración en palabras.

CustomNormalizer

Objeto

Permite configurar la normalización de los campos filtrables, ordenables y facetables, que funcionan de forma predeterminada con coincidencias estrictas. Se trata de una configuración definida por el usuario que consta de al menos uno o varios filtros, que modifican el token almacenado.

Nombre	Tipo	Description
@odata.type	string: #Microsoft.Azure.Search.CustomNormalizer	El discriminador para los tipos derivados.
charFilters	CharFilterName[]	Lista de filtros de caracteres usados para preparar el texto de entrada antes de procesarlo. Por ejemplo, pueden reemplazar determinados caracteres o símbolos. Los filtros se ejecutan en el orden en que se muestran.
name	string	Nombre del filtro char. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
tokenFilters	TokenFilterName[]	Lista de filtros de token usados para filtrar o modificar el token de entrada. Por ejemplo, puede especificar un filtro en minúsculas que convierte todos los caracteres a minúsculas. Los filtros se ejecutan en el orden en que se muestran.

DictionaryDecompounderTokenFilter

Objeto

Descompone las palabras compuestas que se encuentran en muchas lenguas germánicas. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.DictionaryDecompounderTokenFilter		El discriminador para los tipos derivados.
maxSubwordSize	integer (int32) maximum: 300	15	Tamaño máximo de subword. Solo se generan subpalabras más cortas de las que se generan. El valor predeterminado es 15. El máximo es 300.
minSubwordSize	integer (int32) maximum: 300	2	Tamaño mínimo de subword. Solo se generan subpalabras más largas de las que se generan. El valor predeterminado es 2. El máximo es 300.
minWordSize	integer (int32) maximum: 300	5	Tamaño mínimo de palabra. Solo las palabras más largas que se procesan. El valor predeterminado es 5. El máximo es 300.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
onlyLongestMatch	boolean	False	Valor que indica si se va a agregar solo la subword coincidente más larga a la salida. El valor predeterminado es falso.
wordList	string[]		Lista de palabras con las que debe coincidir.

DistanceScoringFunction

Objeto

Define una función que aumenta las puntuaciones en función de la distancia desde una ubicación geográfica.

Nombre	Tipo	Description
boost	number (double)	Multiplicador de la puntuación sin procesar. Debe ser un número positivo no igual a 1,0.
distance	DistanceScoringParameters	Valores de parámetro para la función de puntuación de distancia.
fieldName	string	Nombre del campo utilizado como entrada para la función de puntuación.
interpolation	ScoringFunctionInterpolation	Valor que indica cómo se interpolará la potenciación entre las puntuaciones de los documentos; el valor predeterminado es "Linear".
type	string: distance	Tipo de Función de Puntuación.

DistanceScoringParameters

Objeto

Proporciona valores de parámetro a una función de puntuación de distancia.

Nombre	Tipo	Description
boostingDistance	number (double)	La distancia en kilómetros desde la ubicación de referencia donde termina el rango de impulso.
referencePointParameter	string	El nombre del parámetro pasado en las consultas de búsqueda para especificar la ubicación de referencia.

EdgeNGramTokenFilter

Objeto

Genera n-gramas de los tamaños especificados a partir de la parte delantera o posterior de un token de entrada. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.EdgeNGramTokenFilter		El discriminador para los tipos derivados.
maxGram	integer (int32)	2	Longitud máxima de n-gramas. El valor predeterminado es 2.
minGram	integer (int32)	1	Longitud mínima de n-gramas. El valor predeterminado es 1. Debe ser menor que el valor de maxGram.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
side	EdgeNGramTokenFilterSide	front	Especifica desde qué lado de la entrada se debe generar el n-grama. El valor predeterminado es "front".

EdgeNGramTokenFilterSide

Enumeración

Especifica desde qué lado de la entrada se debe generar un n-grama.

Valor	Description
front	Especifica que el n-grama debe generarse desde el frente de la entrada.
back	Especifica que el n-grama debe generarse desde la parte posterior de la entrada.

EdgeNGramTokenFilterV2

Objeto

Genera n-gramas de los tamaños especificados a partir de la parte delantera o posterior de un token de entrada. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.EdgeNGramTokenFilterV2		El discriminador para los tipos derivados.
maxGram	integer (int32) maximum: 300	2	Longitud máxima de n-gramas. El valor predeterminado es 2. El máximo es 300.
minGram	integer (int32) maximum: 300	1	Longitud mínima de n-gramas. El valor predeterminado es 1. El máximo es 300. Debe ser menor que el valor de maxGram.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
side	EdgeNGramTokenFilterSide	front	Especifica desde qué lado de la entrada se debe generar el n-grama. El valor predeterminado es "front".

EdgeNGramTokenizer

Objeto

Tokeniza la entrada de un borde en n gramos de los tamaños especificados. Este tokenizador se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.EdgeNGramTokenizer		El discriminador para los tipos derivados.
maxGram	integer (int32) maximum: 300	2	Longitud máxima de n-gramas. El valor predeterminado es 2. El máximo es 300.
minGram	integer (int32) maximum: 300	1	Longitud mínima de n-gramas. El valor predeterminado es 1. El máximo es 300. Debe ser menor que el valor de maxGram.
name	string		Nombre del tokenizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
tokenChars	TokenCharacterKind[]		Clases de caracteres que se mantendrán en los tokens.

ElisionTokenFilter

Objeto

Elimina elisiones. Por ejemplo, "l'avion" (el plano) se convertirá en "avion" (plano). Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Description
@odata.type	string: #Microsoft.Azure.Search.ElisionTokenFilter	El discriminador para los tipos derivados.
articles	string[]	Conjunto de artículos que se van a quitar.
name	string	Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

ErrorAdditionalInfo

Objeto

Información adicional sobre el error de administración de recursos.

Nombre	Tipo	Description
info		Información adicional.
type	string	Tipo de información adicional.

ErrorDetail

Objeto

Detalle del error.

Nombre	Tipo	Description
additionalInfo	ErrorAdditionalInfo[]	Información adicional del error.
code	string	Código de error.
details	ErrorDetail[]	Detalles del error.
message	string	El mensaje de error.
target	string	Destino del error.

ErrorResponse

Objeto

Respuesta común a errores para todas las APIs de Azure Resource Manager para devolver detalles de error por operaciones fallidas. (Esto también sigue el formato de respuesta de error de OData).

Nombre	Tipo	Description
error	ErrorDetail	Objeto de error.

ExhaustiveKnnAlgorithmConfiguration

Objeto

Contiene opciones de configuración específicas del algoritmo KNN exhaustivo utilizado durante la consulta, que realizará la búsqueda por fuerza bruta en todo el índice vectorial.

Nombre	Tipo	Description
exhaustiveKnnParameters	ExhaustiveKnnParameters	Contiene los parámetros específicos del algoritmo KNN exhaustivo.
kind	string: exhaustiveKnn	Tipo de AlgoritmoBúsqueda VectorialConfiguración.
name	string	Nombre que se va a asociar a esta configuración concreta.

ExhaustiveKnnParameters

Objeto

Contiene los parámetros específicos del algoritmo KNN exhaustivo.

Nombre	Tipo	Description
metric	VectorSearchAlgorithmMetric	La métrica de similitud que se utilizará para las comparaciones vectoriales.

FreshnessScoringFunction

Objeto

Define una función que aumenta las puntuaciones en función del valor de un campo de fecha y hora.

Nombre	Tipo	Description
boost	number (double)	Multiplicador de la puntuación sin procesar. Debe ser un número positivo no igual a 1,0.
fieldName	string	Nombre del campo utilizado como entrada para la función de puntuación.
freshness	FreshnessScoringParameters	Valores de parámetro para la función de puntuación de actualización.
interpolation	ScoringFunctionInterpolation	Valor que indica cómo se interpolará la potenciación entre las puntuaciones de los documentos; el valor predeterminado es "Linear".
type	string: freshness	Tipo de Función de Puntuación.

FreshnessScoringParameters

Objeto

Proporciona valores de parámetro a una función de puntuación de actualización.

Nombre	Tipo	Description
boostingDuration	string (duration)	El período de vencimiento después del cual se detendrá el impulso para un documento en particular.

HnswAlgorithmConfiguration

Objeto

Contiene opciones de configuración específicas del algoritmo de vecinos más cercanos aproximados de HNSW utilizado durante la indexación y la consulta. El algoritmo HNSW ofrece una compensación ajustable entre la velocidad de búsqueda y la precisión.

Nombre	Tipo	Description
hnswParameters	HnswParameters	Contiene los parámetros específicos del algoritmo HNSW.
kind	string: hnsw	Tipo de AlgoritmoBúsqueda VectorialConfiguración.
name	string	Nombre que se va a asociar a esta configuración concreta.

HnswParameters

Objeto

Contiene los parámetros específicos del algoritmo HNSW.

Nombre	Tipo	Valor predeterminado	Description
efConstruction	integer (int32) minimum: 100 maximum: 1000	400	El tamaño de la lista dinámica que contiene los vecinos más cercanos, que se utiliza durante el tiempo del índice. El aumento de este parámetro puede mejorar la calidad del índice, a expensas de un mayor tiempo de indexación. En cierto punto, aumentar este parámetro conduce a rendimientos decrecientes.
efSearch	integer (int32) minimum: 100 maximum: 1000	500	El tamaño de la lista dinámica que contiene los vecinos más cercanos, que se utiliza durante el tiempo de búsqueda. El aumento de este parámetro puede mejorar los resultados de la búsqueda, a expensas de una búsqueda más lenta. En cierto punto, aumentar este parámetro conduce a rendimientos decrecientes.
m	integer (int32) minimum: 4 maximum: 10	4	El número de enlaces bidireccionales creados para cada nuevo elemento durante la construcción. El aumento del valor de este parámetro puede mejorar la recuperación y reducir los tiempos de recuperación de conjuntos de datos con alta dimensionalidad intrínseca a expensas de un mayor consumo de memoria y un mayor tiempo de indexación.
metric	VectorSearchAlgorithmMetric		La métrica de similitud que se utilizará para las comparaciones vectoriales.

KeepTokenFilter

Objeto

Filtro de token que solo mantiene los tokens con texto contenido en una lista especificada de palabras. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.KeepTokenFilter		El discriminador para los tipos derivados.
keepWords	string[]		Lista de palabras que se van a conservar.
keepWordsCase	boolean	False	Valor que indica si se deben minúsculas todas las palabras en primer lugar. El valor predeterminado es falso.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

KeywordMarkerTokenFilter

Objeto

Marca los términos como palabras clave. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.KeywordMarkerTokenFilter		El discriminador para los tipos derivados.
ignoreCase	boolean	False	Valor que indica si se omitirán mayúsculas y minúsculas. Si es true, todas las palabras se convierten en minúsculas en primer lugar. El valor predeterminado es falso.
keywords	string[]		Lista de palabras que se van a marcar como palabras clave.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

KeywordTokenizer

Objeto

Emite la entrada completa como un solo token. Este tokenizador se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.KeywordTokenizer		El discriminador para los tipos derivados.
bufferSize	integer (int32)	256	El tamaño del búfer de lectura en bytes. El valor predeterminado es 256.
name	string		Nombre del tokenizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

KeywordTokenizerV2

Objeto

Emite la entrada completa como un solo token. Este tokenizador se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.KeywordTokenizerV2		El discriminador para los tipos derivados.
maxTokenLength	integer (int32) maximum: 300	256	Longitud máxima del token. El valor predeterminado es 256. Los tokens que sobrepasen la longitud máxima se dividen. La longitud máxima del token que se puede usar es de 300 caracteres.
name	string		Nombre del tokenizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

LengthTokenFilter

Objeto

Quita las palabras que son demasiado largas o demasiado cortas. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.LengthTokenFilter		El discriminador para los tipos derivados.
max	integer (int32) maximum: 300	300	Longitud máxima en caracteres. El valor predeterminado y máximo es 300.
min	integer (int32) maximum: 300	0	Longitud mínima en caracteres. El valor predeterminado es 0. El máximo es 300. Debe ser menor que el valor máximo.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

LexicalAnalyzerName

Enumeración

Define los nombres de todos los analizadores de texto compatibles con el motor de búsqueda.

Valor	Description
ar.microsoft	Analizador Microsoft para árabe.
ar.lucene	Analizador Lucene para árabe.
hy.lucene	Analizador Lucene para armenio.
bn.microsoft	Analizador Microsoft para bangla.
eu.lucene	Analizador Lucene para euskera.
bg.microsoft	Analizador Microsoft para búlgaro.
bg.lucene	Analizador Lucene para búlgaro.
ca.microsoft	Analizador Microsoft para catalán.
ca.lucene	Analizador Lucene para catalán.
zh-Hans.microsoft	Analizador Microsoft para chino (simplificado).
zh-Hans.lucene	Analizador Lucene para chino (simplificado).
zh-Hant.microsoft	Analizador Microsoft para chino (tradicional).
zh-Hant.lucene	Analizador Lucene para chino (tradicional).
hr.microsoft	Analizador Microsoft para croata.
cs.microsoft	Analizador Microsoft para checo.
cs.lucene	Analizador Lucene para checo.
da.microsoft	Analizador Microsoft para danés.
da.lucene	Analizador Lucene para danés.
nl.microsoft	Analizador de Microsoft para holandés.
nl.lucene	Analizador Lucene para holandés.
en.microsoft	Analizador Microsoft para inglés.
en.lucene	Analizador Lucene para inglés.
et.microsoft	Analizador Microsoft para estonio.
fi.microsoft	Analizador Microsoft para finlandés.
fi.lucene	Analizador Lucene para finlandés.
fr.microsoft	Analizador Microsoft para francés.
fr.lucene	Analizador Lucene para francés.
gl.lucene	Analizador Lucene para gallego.
de.microsoft	Analizador Microsoft para alemán.
de.lucene	Analizador Lucene para alemán.
el.microsoft	Analizador Microsoft para griego.
el.lucene	Analizador Lucene para griego.
gu.microsoft	Analizador de Microsoft para gujarati.
he.microsoft	Analizador Microsoft para hebreo.
hi.microsoft	Analizador Microsoft para hindi.
hi.lucene	Analizador Lucene para hindi.
hu.microsoft	Analizador Microsoft para húngaro.
hu.lucene	Analizador Lucene para húngaro.
is.microsoft	Analizador Microsoft para islandés.
id.microsoft	Analizador Microsoft para indonesio (Bahasa).
id.lucene	Analizador Lucene para indonesio.
ga.lucene	Analizador Lucene para irlandés.
it.microsoft	Analizador Microsoft para italiano.
it.lucene	Analizador Lucene para italiano.
ja.microsoft	Analizador Microsoft para japonés.
ja.lucene	Analizador Lucene para japonés.
kn.microsoft	Analizador Microsoft para kannada.
ko.microsoft	Analizador Microsoft para coreano.
ko.lucene	Analizador Lucene para coreano.
lv.microsoft	Analizador Microsoft para letón.
lv.lucene	Analizador Lucene para letón.
lt.microsoft	Analizador Microsoft para lituano.
ml.microsoft	Analizador Microsoft para malayalam.
ms.microsoft	Analizador Microsoft para malayo (latín).
mr.microsoft	Analizador Microsoft para maratí.
nb.microsoft	Microsoft analyzer for Norwegian (Bokmål).
no.lucene	Analizador Lucene para noruego.
fa.lucene	Analizador Lucene para persa.
pl.microsoft	Analizador Microsoft para polaco.
pl.lucene	Analizador Lucene para polaco.
pt-BR.microsoft	Analizador Microsoft para portugués (Brasil).
pt-BR.lucene	Analizador Lucene para portugués (Brasil).
pt-PT.microsoft	Analizador Microsoft para portugués (Portugal).
pt-PT.lucene	Analizador Lucene para portugués (Portugal).
pa.microsoft	Analizador Microsoft para punjabi.
ro.microsoft	Analizador Microsoft para rumano.
ro.lucene	Analizador Lucene para rumano.
ru.microsoft	Analizador Microsoft para ruso.
ru.lucene	Analizador Lucene para ruso.
sr-cyrillic.microsoft	Analizador Microsoft para serbio (cirílico).
sr-latin.microsoft	Analizador Microsoft para serbio (latín).
sk.microsoft	Analizador de Microsoft para eslovaco.
sl.microsoft	Analizador de Microsoft para esloveno.
es.microsoft	Analizador Microsoft para español.
es.lucene	Analizador Lucene para español.
sv.microsoft	Analizador Microsoft para sueco.
sv.lucene	Analizador Lucene para sueco.
ta.microsoft	Analizador Microsoft para tamil.
te.microsoft	Analizador Microsoft para telugu.
th.microsoft	Analizador Microsoft para tailandés.
th.lucene	Analizador Lucene para tailandés.
tr.microsoft	Analizador Microsoft para turco.
tr.lucene	Analizador Lucene para turco.
uk.microsoft	Analizador Microsoft para ucraniano.
ur.microsoft	Analizador Microsoft para urdu.
vi.microsoft	Analizador Microsoft para vietnamita.
standard.lucene	Analizador Lucene estándar.
standardasciifolding.lucene	Analizador Lucene plegable ASCII estándar. Vea https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers.
keyword	Trata todo el contenido de un campo como un solo token. Esto es útil para datos como códigos postales, identificadores y algunos nombres de producto. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html.
pattern	Separa el texto de manera flexible en términos a través de un patrón de expresión regular. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html.
simple	Divide el texto por donde no hay letras y lo convierte en minúsculas. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html.
stop	Divide el texto en letras no letras; Aplica los filtros de token en minúsculas y palabras irrelevantes. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html.
whitespace	Un analizador que usa el tokenizador de espacios en blanco. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html.

LexicalNormalizerName

Enumeración

Define los nombres de todos los normalizadores de texto admitidos por el motor de búsqueda.

Valor	Description
asciifolding	Convierte caracteres alfabéticos, numéricos y simbólicos Unicode que no están en los primeros 127 caracteres ASCII (el bloque Unicode "Básico latino") en sus equivalentes ASCII, si existen dichos equivalentes. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html.
elision	Elimina elisiones. Por ejemplo, "l'avion" (el plano) se convertirá en "avion" (plano). Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html.
lowercase	Normaliza el texto del token a minúsculas. Vea https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html.
standard	Normalizador estándar, que consta de minúsculas y asciifolding. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html.
uppercase	Normaliza el texto del token en mayúsculas. Vea https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html.

LexicalTokenizerName

Enumeración

Define los nombres de todos los tokenizadores admitidos por el motor de búsqueda.

Valor	Description
classic	Tokenizador basado en gramática que es adecuado para procesar la mayoría de los documentos de idioma europeo. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html.
edgeNGram	Tokeniza la entrada de un borde en n gramos de los tamaños especificados. Vea https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html.
keyword_v2	Emite la entrada completa como un solo token. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html.
letter	Divide el texto en caracteres no alfabéticos. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html.
lowercase	Divide el texto por donde no hay letras y lo convierte en minúsculas. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html.
microsoft_language_tokenizer	Divide el texto mediante reglas específicas del idioma.
microsoft_language_stemming_tokenizer	Divide el texto mediante reglas específicas del idioma y reduce las palabras a sus formas base.
nGram	Tokeniza la entrada en n-gramas de los tamaños especificados. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html.
path_hierarchy_v2	Tokenizador para jerarquías similares a rutas de acceso. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html.
pattern	Tokenizer que usa la coincidencia de patrones regex para construir tokens distintos. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html.
standard_v2	Analizador estándar de Lucene; Compuesto por el tokenizador estándar, el filtro en minúsculas y el filtro stop. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html.
uax_url_email	Tokeniza las direcciones URL y los correos electrónicos como un token. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html.
whitespace	Divide el texto en espacios en blanco. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html.

LimitTokenFilter

Objeto

Limita el número de tokens durante la indexación. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.LimitTokenFilter		El discriminador para los tipos derivados.
consumeAllTokens	boolean	False	Valor que indica si se deben consumir todos los tokens de la entrada incluso si se alcanza maxTokenCount. El valor predeterminado es falso.
maxTokenCount	integer (int32)	1	Número máximo de tokens que se van a generar. El valor predeterminado es 1.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

LuceneStandardAnalyzer

Objeto

Analizador estándar de Apache Lucene; Compuesto por el tokenizador estándar, el filtro en minúsculas y el filtro stop.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.StandardAnalyzer		El discriminador para los tipos derivados.
maxTokenLength	integer (int32) maximum: 300	255	Longitud máxima del token. El valor predeterminado es 255. Los tokens que sobrepasen la longitud máxima se dividen. La longitud máxima del token que se puede usar es de 300 caracteres.
name	string		Nombre del analizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
stopwords	string[]		Lista de palabras irrelevantes.

LuceneStandardTokenizer

Objeto

Interrumpe el texto siguiendo las reglas de segmentación de texto Unicode. Este tokenizador se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.StandardTokenizer		El discriminador para los tipos derivados.
maxTokenLength	integer (int32)	255	Longitud máxima del token. El valor predeterminado es 255. Los tokens que sobrepasen la longitud máxima se dividen.
name	string		Nombre del tokenizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

LuceneStandardTokenizerV2

Objeto

Interrumpe el texto siguiendo las reglas de segmentación de texto Unicode. Este tokenizador se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.StandardTokenizerV2		El discriminador para los tipos derivados.
maxTokenLength	integer (int32) maximum: 300	255	Longitud máxima del token. El valor predeterminado es 255. Los tokens que sobrepasen la longitud máxima se dividen. La longitud máxima del token que se puede usar es de 300 caracteres.
name	string		Nombre del tokenizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

MagnitudeScoringFunction

Objeto

Define una función que aumenta las puntuaciones en función de la magnitud de un campo numérico.

Nombre	Tipo	Description
boost	number (double)	Multiplicador de la puntuación sin procesar. Debe ser un número positivo no igual a 1,0.
fieldName	string	Nombre del campo utilizado como entrada para la función de puntuación.
interpolation	ScoringFunctionInterpolation	Valor que indica cómo se interpolará la potenciación entre las puntuaciones de los documentos; el valor predeterminado es "Linear".
magnitude	MagnitudeScoringParameters	Valores de parámetro para la función de puntuación de magnitud.
type	string: magnitude	Tipo de Función de Puntuación.

MagnitudeScoringParameters

Objeto

Proporciona valores de parámetro a una función de puntuación de magnitud.

Nombre	Tipo	Description
boostingRangeEnd	number (double)	El valor de campo en el que finaliza el impulso.
boostingRangeStart	number (double)	El valor de campo en el que comienza el impulso.
constantBoostBeyondRange	boolean	Un valor que indica si se debe aplicar un aumento constante para los valores de campo más allá del valor final del rango; default es false.

MappingCharFilter

Objeto

Filtro de caracteres que aplica asignaciones definidas con la opción asignaciones. La coincidencia es ambiciosa (la mayor coincidencia de patrones en un momento dado gana). Se permite que la sustitución sea una cadena vacía. Este filtro de caracteres se implementa mediante Apache Lucene.

Nombre	Tipo	Description
@odata.type	string: #Microsoft.Azure.Search.MappingCharFilter	El discriminador para los tipos derivados.
mappings	string[]	Lista de asignaciones del siguiente formato: "a=>b" (todas las apariciones del carácter "a" se reemplazarán por el carácter "b").
name	string	Nombre del filtro char. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

MicrosoftLanguageStemmingTokenizer

Objeto

Divide el texto mediante reglas específicas del idioma y reduce las palabras a sus formas base.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer		El discriminador para los tipos derivados.
isSearchTokenizer	boolean	False	Valor que indica cómo se usa el tokenizador. Se establece en true si se usa como tokenizador de búsqueda, se establece en false si se usa como tokenizador de indexación. El valor predeterminado es falso.
language	MicrosoftStemmingTokenizerLanguage		Idioma que se va a usar. El valor predeterminado es inglés.
maxTokenLength	integer (int32) maximum: 300	255	Longitud máxima del token. Los tokens que sobrepasen la longitud máxima se dividen. La longitud máxima del token que se puede usar es 300 caracteres. Los tokens de más de 300 caracteres se dividen primero en tokens de longitud 300 y, a continuación, cada uno de esos tokens se divide en función del conjunto de longitud máxima del token. El valor predeterminado es 255.
name	string		Nombre del tokenizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

MicrosoftLanguageTokenizer

Objeto

Divide el texto mediante reglas específicas del idioma.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.MicrosoftLanguageTokenizer		El discriminador para los tipos derivados.
isSearchTokenizer	boolean	False	Valor que indica cómo se usa el tokenizador. Se establece en true si se usa como tokenizador de búsqueda, se establece en false si se usa como tokenizador de indexación. El valor predeterminado es falso.
language	MicrosoftTokenizerLanguage		Idioma que se va a usar. El valor predeterminado es inglés.
maxTokenLength	integer (int32) maximum: 300	255	Longitud máxima del token. Los tokens que sobrepasen la longitud máxima se dividen. La longitud máxima del token que se puede usar es 300 caracteres. Los tokens de más de 300 caracteres se dividen primero en tokens de longitud 300 y, a continuación, cada uno de esos tokens se divide en función del conjunto de longitud máxima del token. El valor predeterminado es 255.
name	string		Nombre del tokenizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

MicrosoftStemmingTokenizerLanguage

Enumeración

Enumera los lenguajes soportados por el tokenizador de stemming de lenguaje de Microsoft.

Valor	Description
arabic	Selecciona el tokenizador stemming de Microsoft para árabe.
bangla	Selecciona el tokenizador stemming de Microsoft para el bengalí.
bulgarian	Selecciona el tokenizador stemming de Microsoft para búlgaro.
catalan	Selecciona el tokenizador stemming de Microsoft para catalán.
croatian	Selecciona el tokenizador stemming de Microsoft para croata.
czech	Selecciona el tokenizador stemming de Microsoft para checo.
danish	Selecciona el tokenizador stemming de Microsoft para danés.
dutch	Selecciona el tokenizador stemming de Microsoft para holandés.
english	Selecciona el tokenizador stemming de Microsoft para inglés.
estonian	Selecciona el tokenizador stemming de Microsoft para el estonio.
finnish	Selecciona el tokenizador stemming de Microsoft para finlandés.
french	Selecciona el tokenizador stemming de Microsoft para francés.
german	Selecciona el tokenizador de stemming de Microsoft para alemán.
greek	Selecciona el tokenizador stemming de Microsoft para griego.
gujarati	Selecciona el tokenizador stemming de Microsoft para el gujarati.
hebrew	Selecciona el tokenizador stemming de Microsoft para hebreo.
hindi	Selecciona el tokenizador stemming de Microsoft para hindi.
hungarian	Selecciona el tokenizador stemming de Microsoft para húngaro.
icelandic	Selecciona el tokenizador stemming de Microsoft para islandés.
indonesian	Selecciona el tokenizador stemming de Microsoft para indonesio.
italian	Selecciona el tokenizador stemming de Microsoft para italiano.
kannada	Selecciona el tokenizador stemming de Microsoft para kannada.
latvian	Selecciona el tokenizador stemming de Microsoft para letón.
lithuanian	Selecciona el tokenizador stemming de Microsoft para lituano.
malay	Selecciona el tokenizador stemming de Microsoft para malayo.
malayalam	Selecciona el tokenizador stemming de Microsoft para malayalam.
marathi	Selecciona el tokenizador stemming de Microsoft para maratí.
norwegianBokmaal	Selecciona el tokenizador stemming de Microsoft para noruego (Bokmål).
polish	Selecciona el tokenizador stemming de Microsoft para polaco.
portuguese	Selecciona el tokenizador stemming de Microsoft para portugués.
portugueseBrazilian	Selecciona el tokenizador stemming de Microsoft para portugués (Brasil).
punjabi	Selecciona el tokenizador stemming de Microsoft para el punjabi.
romanian	Selecciona el tokenizador stemming de Microsoft para rumano.
russian	Selecciona el tokenizador stemming de Microsoft para ruso.
serbianCyrillic	Selecciona el tokenizador stemming de Microsoft para serbio (cirílico).
serbianLatin	Selecciona el tokenizador stemming de Microsoft para serbio (latín).
slovak	Selecciona el tokenizador stemming de Microsoft para el eslovaco.
slovenian	Selecciona el tokenizador stemming de Microsoft para esloveno.
spanish	Selecciona el tokenizador stemming de Microsoft para español.
swedish	Selecciona el tokenizador stemming de Microsoft para sueco.
tamil	Selecciona el tokenizador stemming de Microsoft para tamil.
telugu	Selecciona el tokenizador stemming de Microsoft para telugu.
turkish	Selecciona el tokenizador de stemming de Microsoft para turco.
ukrainian	Selecciona el tokenizador stemming de Microsoft para ucraniano.
urdu	Selecciona el tokenizador stemming de Microsoft para urdu.

MicrosoftTokenizerLanguage

Enumeración

Enumera los idiomas soportados por el tokenizador de lenguajes de Microsoft.

Valor	Description
bangla	Selecciona el tokenizador de Microsoft para el bengalí.
bulgarian	Selecciona el tokenizador de Microsoft para búlgaro.
catalan	Selecciona el tokenizador de Microsoft para catalán.
chineseSimplified	Selecciona el tokenizador de Microsoft para chino (Simplificado).
chineseTraditional	Selecciona el tokenizador de Microsoft para chino (Tradicional).
croatian	Selecciona el tokenizador de Microsoft para croata.
czech	Selecciona el tokenizador de Microsoft para checo.
danish	Selecciona el tokenizador de Microsoft para danés.
dutch	Selecciona el tokenizador de Microsoft para neerlandés.
english	Selecciona el tokenizador de Microsoft para inglés.
french	Selecciona el tokenizador de Microsoft para francés.
german	Selecciona el tokenizador de Microsoft para alemán.
greek	Selecciona el tokenizador de Microsoft para griego.
gujarati	Selecciona el tokenizador de Microsoft para gujarati.
hindi	Selecciona el tokenizador de Microsoft para hindi.
icelandic	Selecciona el tokenizador de Microsoft para islandés.
indonesian	Selecciona el tokenizador de Microsoft para indonesio.
italian	Selecciona el tokenizador de Microsoft para italiano.
japanese	Selecciona el tokenizador de Microsoft para japonés.
kannada	Selecciona el tokenizador de Microsoft para kannada.
korean	Selecciona el tokenizador de Microsoft para coreano.
malay	Selecciona el tokenizador de Microsoft para malayo.
malayalam	Selecciona el tokenizador de Microsoft para malayalam.
marathi	Selecciona el tokenizador de Microsoft para maratí.
norwegianBokmaal	Selecciona el tokenizador de Microsoft para noruego (Bokmål).
polish	Selecciona el tokenizador de Microsoft para polaco.
portuguese	Selecciona el tokenizador de Microsoft para portugués.
portugueseBrazilian	Selecciona el tokenizador de Microsoft para portugués (Brasil).
punjabi	Selecciona el tokenizador de Microsoft para el punjabi.
romanian	Selecciona el tokenizador de Microsoft para rumano.
russian	Selecciona el tokenizador de Microsoft para ruso.
serbianCyrillic	Selecciona el tokenizador de Microsoft para serbio (cirílico).
serbianLatin	Selecciona el tokenizador de Microsoft para serbio (latín).
slovenian	Selecciona el tokenizador de Microsoft para esloveno.
spanish	Selecciona el tokenizador de Microsoft para español.
swedish	Selecciona el tokenizador de Microsoft para sueco.
tamil	Selecciona el tokenizador de Microsoft para tamil.
telugu	Selecciona el tokenizador de Microsoft para telugu.
thai	Selecciona el tokenizador de Microsoft para tailandés.
ukrainian	Selecciona el tokenizador de Microsoft para ucraniano.
urdu	Selecciona el tokenizador de Microsoft para urdu.
vietnamese	Selecciona el tokenizador de Microsoft para vietnamita.

NGramTokenFilter

Objeto

Genera n-gramas de los tamaños especificados. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.NGramTokenFilter		El discriminador para los tipos derivados.
maxGram	integer (int32)	2	Longitud máxima de n-gramas. El valor predeterminado es 2.
minGram	integer (int32)	1	Longitud mínima de n-gramas. El valor predeterminado es 1. Debe ser menor que el valor de maxGram.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

NGramTokenFilterV2

Objeto

Genera n-gramas de los tamaños especificados. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.NGramTokenFilterV2		El discriminador para los tipos derivados.
maxGram	integer (int32) maximum: 300	2	Longitud máxima de n-gramas. El valor predeterminado es 2. El máximo es 300.
minGram	integer (int32) maximum: 300	1	Longitud mínima de n-gramas. El valor predeterminado es 1. El máximo es 300. Debe ser menor que el valor de maxGram.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

NGramTokenizer

Objeto

Tokeniza la entrada en n-gramas de los tamaños especificados. Este tokenizador se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.NGramTokenizer		El discriminador para los tipos derivados.
maxGram	integer (int32) maximum: 300	2	Longitud máxima de n-gramas. El valor predeterminado es 2. El máximo es 300.
minGram	integer (int32) maximum: 300	1	Longitud mínima de n-gramas. El valor predeterminado es 1. El máximo es 300. Debe ser menor que el valor de maxGram.
name	string		Nombre del tokenizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
tokenChars	TokenCharacterKind[]		Clases de caracteres que se mantendrán en los tokens.

PathHierarchyTokenizerV2

Objeto

Tokenizador para jerarquías similares a rutas de acceso. Este tokenizador se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.PathHierarchyTokenizerV2		El discriminador para los tipos derivados.
delimiter	string maxLength: 1	/	Carácter delimitador que se va a usar. El valor predeterminado es "/".
maxTokenLength	integer (int32) maximum: 300	300	Longitud máxima del token. El valor predeterminado y máximo es 300.
name	string		Nombre del tokenizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
replacement	string maxLength: 1	/	Valor que, si se establece, reemplaza el carácter delimitador. El valor predeterminado es "/".
reverse	boolean	False	Valor que indica si se van a generar tokens en orden inverso. El valor predeterminado es falso.
skip	integer (int32)	0	Número de tokens iniciales que se van a omitir. El valor predeterminado es 0.

PatternAnalyzer

Objeto

Separa el texto de manera flexible en términos a través de un patrón de expresión regular. Este analizador se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.PatternAnalyzer		El discriminador para los tipos derivados.
flags	string		Flags de expresión regular, especificados como una cadena separada de valores de RegexFlags por '\|'.
lowercase	boolean	True	Valor que indica si los términos deben estar en minúsculas. El valor predeterminado es verdadero.
name	string		Nombre del analizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
pattern	string	\W+	Un patrón de expresión regular para que coincida con los separadores de tokens. El valor predeterminado es una expresión que coincide con uno o más caracteres que no son palabras.
stopwords	string[]		Lista de palabras irrelevantes.

PatternCaptureTokenFilter

Objeto

Usa expresiones regulares de Java para emitir varios tokens: uno para cada grupo de captura en uno o varios patrones. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.PatternCaptureTokenFilter		El discriminador para los tipos derivados.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
patterns	string[]		Lista de patrones que deben coincidir con cada token.
preserveOriginal	boolean	True	Valor que indica si se va a devolver el token original incluso si uno de los patrones coincide. El valor predeterminado es verdadero.

PatternReplaceCharFilter

Objeto

Filtro de caracteres que reemplaza los caracteres de la cadena de entrada. Usa una expresión regular para identificar las secuencias de caracteres que se desean conservar y un patrón de reemplazo para identificar los caracteres que se desean reemplazar. Por ejemplo, dado el texto de entrada "aa bb aa bb", el patrón "(aa)\s+(bb)" y el reemplazo "$1#$2", el resultado sería "aa#bb aa#bb aa#bb". Este filtro de caracteres se implementa mediante Apache Lucene.

Nombre	Tipo	Description
@odata.type	string: #Microsoft.Azure.Search.PatternReplaceCharFilter	El discriminador para los tipos derivados.
name	string	Nombre del filtro char. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
pattern	string	Patrón de expresión regular.
replacement	string	Texto de reemplazo.

PatternReplaceTokenFilter

Objeto

Nombre	Tipo	Description
@odata.type	string: #Microsoft.Azure.Search.PatternReplaceTokenFilter	El discriminador para los tipos derivados.
name	string	Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
pattern	string	Patrón de expresión regular.
replacement	string	Texto de reemplazo.

PatternTokenizer

Objeto

Tokenizer que usa la coincidencia de patrones regex para construir tokens distintos. Este tokenizador se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.PatternTokenizer		El discriminador para los tipos derivados.
flags	string		Flags de expresión regular, especificados como una cadena separada de valores de RegexFlags por '\|'.
group	integer (int32)	-1	Ordinal de base cero del grupo coincidente en el patrón de expresión regular que se va a extraer en tokens. Use -1 si desea usar todo el patrón para dividir la entrada en tokens, independientemente de los grupos coincidentes. El valor predeterminado es -1.
name	string		Nombre del tokenizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
pattern	string	\W+	Un patrón de expresión regular para que coincida con los separadores de tokens. El valor predeterminado es una expresión que coincide con uno o más caracteres que no son palabras.

PhoneticEncoder

Enumeración

Identifica el tipo de codificador fonético que se va a usar con PhoneticTokenFilter.

Valor	Description
metaphone	Codifica un token en un valor de Metaphone.
doubleMetaphone	Codifica un token en un valor de metáfono doble.
soundex	Codifica un token en un valor de Soundex.
refinedSoundex	Codifica un token en un valor de Refined Soundex.
caverphone1	Codifica un token en un valor de Caverphone 1.0.
caverphone2	Codifica un token en un valor de Caverphone 2.0.
cologne	Codifica un token en un valor fonético de Colonia.
nysiis	Codifica un token en un valor NYSIIS.
koelnerPhonetik	Codifica un token mediante el algoritmo Kölner Phonetik.
haasePhonetik	Codifica un token utilizando el refinamiento de Haase del algoritmo Kölner Phonetik.
beiderMorse	Codifica un token en un valor Beider-Morse.

PhoneticTokenFilter

Objeto

Crea tokens para coincidencias fonéticas. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.PhoneticTokenFilter		El discriminador para los tipos derivados.
encoder	PhoneticEncoder	metaphone	Codificador fonético que se va a usar. El valor predeterminado es "metaphone".
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
replace	boolean	True	Valor que indica si los tokens codificados deben reemplazar los tokens originales. Si es false, los tokens codificados se agregan como sinónimos. El valor predeterminado es verdadero.

Prefer

Enumeración

Para las solicitudes HTTP PUT, indica al servicio que devuelva el recurso creado/actualizado en caso de éxito.

Valor	Description
return=representation

RankingOrder

Enumeración

Representa la puntuación que se usará para el criterio de ordenación de los documentos.

Valor	Description
BoostedRerankerScore	Establece el criterio de ordenación como BoostedRerankerScore
RerankerScore	Establece el orden de clasificación como ReRankerScore

RescoringOptions

Objeto

Contiene las opciones de recorción.

Nombre	Tipo	Valor predeterminado	Description
defaultOversampling	number (double)		Factor de sobremuestreo predeterminado. El sobremuestreo recupera un mayor conjunto de documentos potenciales para compensar la pérdida de resolución debido a la cuantificación. Esto aumenta el conjunto de resultados que se volverán a calificar en vectores de precisión completa. El valor mínimo es 1, lo que significa que no hay sobremuestreo (1x). Este parámetro solo se puede establecer cuando 'enableRescoring' es true. Los valores más altos mejoran la recuperación a costa de la latencia.
enableRescoring	boolean	True	Si se establece en true, después de la búsqueda inicial en los vectores comprimidos, las puntuaciones de similitud se vuelven a calcular utilizando los vectores de precisión total. Esto mejorará la recuperación a costa de la latencia.
rescoreStorageMethod	enum: discardOriginals preserveOriginals	preserveOriginals	Controla el método de almacenamiento de los vectores originales. Esta configuración es inmutable.

ScalarQuantizationCompression

Objeto

Contiene opciones de configuración específicas del método de compresión de cuantificación escalar que se usa durante la indexación y la consulta.

Nombre	Tipo	Description
kind	string: scalarQuantization	Tipo de Búsqueda VectorCompresión.
name	string	Nombre que se va a asociar a esta configuración concreta.
rescoringOptions	RescoringOptions	Contiene las opciones de recorción.
scalarQuantizationParameters	ScalarQuantizationParameters	Contiene los parámetros específicos de la cuantificación escalar.
truncationDimension	integer (int32)	Número de dimensiones en las que se truncan los vectores. Truncar los vectores reduce el tamaño de los vectores y la cantidad de datos que se deben transferir durante la búsqueda. Esto puede ahorrar costos de almacenamiento y mejorar el rendimiento de la búsqueda a costa de la recuperación. Solo se debe usar para incrustaciones entrenadas con Matryoshka Representation Learning (MRL), como OpenAI text-embeding-3-large (small). El valor predeterminado es NULL, lo que significa que no hay truncamiento.

ScalarQuantizationParameters

Objeto

Contiene los parámetros específicos de la cuantificación escalar.

Nombre	Tipo	Description
quantizedDataType	VectorSearchCompressionTarget	Tipo de datos cuantificados de valores vectoriales comprimidos.

ScoringFunctionAggregation

Enumeración

Define la función de agregación utilizada para combinar los resultados de todas las funciones de puntuación de un perfil de puntuación.

Valor	Description
sum	Aumente las puntuaciones mediante la suma de todos los resultados de la función de puntuación.
average	Aumente las puntuaciones por el promedio de todos los resultados de la función de puntuación.
minimum	Aumente las puntuaciones al mínimo de todos los resultados de la función de puntuación.
maximum	Aumente las puntuaciones al máximo de todos los resultados de la función de puntuación.
firstMatching	Aumente las puntuaciones utilizando la primera función de puntuación aplicable en el perfil de puntuación.
product	Aumente las puntuaciones por el producto de todos los resultados de la función de puntuación.

ScoringFunctionInterpolation

Enumeración

Define la función utilizada para interpolar el aumento de puntuación en un rango de documentos.

Valor	Description
linear	Aumenta las puntuaciones en una cantidad linealmente decreciente. Esta es la interpolación predeterminada para las funciones de puntuación.
constant	Aumenta las puntuaciones en un factor constante.
quadratic	Aumenta las puntuaciones en una cantidad que disminuye cuadráticamente. Los aumentos disminuyen lentamente para puntajes más altos y más rápidamente a medida que disminuyen los puntajes. Esta opción de interpolación no está permitida en las funciones de puntuación de etiquetas.
logarithmic	Aumenta las puntuaciones en una cantidad que disminuye logarítmicamente. Los aumentos disminuyen rápidamente para puntajes más altos y más lentamente a medida que disminuyen los puntajes. Esta opción de interpolación no está permitida en las funciones de puntuación de etiquetas.

ScoringProfile

Objeto

Define parámetros para un índice de búsqueda que influye en la puntuación en las consultas de búsqueda.

Nombre	Tipo	Description
functionAggregation	ScoringFunctionAggregation	Valor que indica cómo deben combinarse los resultados de las funciones de puntuación individuales. El valor predeterminado es "Suma". Se omite si no hay funciones de puntuación.
functions	ScoringFunction[]: DistanceScoringFunction[] FreshnessScoringFunction[] MagnitudeScoringFunction[] TagScoringFunction[]	El conjunto de funciones que influyen en la puntuación de documentos.
name	string	El nombre del perfil de puntuación.
text	TextWeights	Parámetros que aumentan la puntuación en función de las coincidencias de texto en determinados campos de índice.

SearchField

Objeto

Representa un campo en una definición de índice, que describe el nombre, el tipo de datos y el comportamiento de búsqueda de un campo.

Nombre	Tipo	Description
analyzer	LexicalAnalyzerName	Nombre del analizador que se va a usar para el campo. Esta opción solo se puede usar con campos que se pueden buscar y no se puede establecer junto con searchAnalyzer o indexAnalyzer. Una vez elegido el analizador, no se puede cambiar para el campo. Debe ser null para campos complejos.
dimensions	integer (int32) minimum: 2 maximum: 4096	Dimensionalidad del campo vectorial.
facetable	boolean	Valor que indica si se debe hacer referencia al campo en las consultas de facetas. Normalmente se usa en una presentación de los resultados de búsqueda que incluye el recuento de visitas por categoría (por ejemplo, buscar cámaras digitales y ver visitas por marca, por megapíxeles, por precio, etc.). Esta propiedad debe ser null para campos complejos. Los campos de tipo Edm.GeographyPoint o Collection(Edm.GeographyPoint) no pueden ser facetables. El valor predeterminado es true para todos los demás campos simples.
fields	SearchField[]	Una lista de subcampos si se trata de un campo de tipo Edm.ComplexType o Collection(Edm.ComplexType). Debe ser nulo o vacío para los campos simples.
filterable	boolean	Valor que indica si se debe hacer referencia al campo en $filter consultas. filterable difiere de lo que se puede buscar en la forma en que se controlan las cadenas. Los campos de tipo Edm.String o Collection(Edm.String) que se pueden filtrar no se someten a separación de palabras, por lo que las comparaciones son solo para coincidencias exactas. Por ejemplo, si establece este campo f en "día soleado", $filter=f eq "sunny" no encontrará coincidencias, pero $filter=f eq "sunny day". Esta propiedad debe ser null para campos complejos. El valor predeterminado es true para los campos simples y null para los campos complejos.
indexAnalyzer	LexicalAnalyzerName	Nombre del analizador que se usa en el momento de la indexación del campo. Esta opción solo se puede usar con campos que se pueden buscar. Debe establecerse junto con searchAnalyzer y no se puede establecer junto con la opción analizador. Esta propiedad no se puede establecer en el nombre de un analizador de lenguaje; Use la propiedad analyzer en su lugar si necesita un analizador de lenguaje. Una vez elegido el analizador, no se puede cambiar para el campo. Debe ser null para campos complejos.
key	boolean	Valor que indica si el campo identifica de forma única documentos en el índice. Se debe elegir exactamente un campo de nivel superior en cada índice como campo clave y debe ser de tipo Edm.String. Los campos clave se pueden usar para buscar documentos directamente y actualizar o eliminar documentos específicos. El valor predeterminado es false para los campos simples y null para los campos complejos.
name	string	Nombre del campo, que debe ser único dentro de la colección fields del índice o del campo primario.
normalizer	LexicalNormalizerName	El nombre del normalizador que se va a usar para el campo. Esta opción solo se puede utilizar con campos con filtrable, ordenable o facetable habilitado. Una vez elegido el normalizador, no se puede cambiar para el campo. Debe ser null para campos complejos.
retrievable	boolean	Valor que indica si el campo se puede devolver en un resultado de búsqueda. Puede deshabilitar esta opción si desea usar un campo (por ejemplo, margen) como filtro, ordenación o mecanismo de puntuación, pero no desea que el campo sea visible para el usuario final. Esta propiedad debe ser true para los campos clave y debe ser null para los campos complejos. Esta propiedad se puede cambiar en campos existentes. La habilitación de esta propiedad no provoca ningún aumento en los requisitos de almacenamiento de índices. El valor predeterminado es true para campos simples, false para campos vectoriales y null para campos complejos.
searchAnalyzer	LexicalAnalyzerName	Nombre del analizador usado en tiempo de búsqueda para el campo. Esta opción solo se puede usar con campos que se pueden buscar. Debe establecerse junto con indexAnalyzer y no se puede establecer junto con la opción analyzer. Esta propiedad no se puede establecer en el nombre de un analizador de lenguaje; Use la propiedad analyzer en su lugar si necesita un analizador de lenguaje. Este analizador se puede actualizar en un campo existente. Debe ser null para campos complejos.
searchable	boolean	Valor que indica si el campo es de texto completo que se puede buscar. Esto significa que se somete a un análisis como la separación de palabras durante la indexación. Si establece un campo que se puede buscar en un valor como "día soleado", se dividirá internamente en los tokens individuales "soleado" y "día". Esto permite búsquedas de texto completo para estos términos. Los campos de tipo Edm.String o Collection(Edm.String) se pueden buscar de forma predeterminada. Esta propiedad debe ser false para los campos simples de otros tipos de datos que no sean de cadena y debe ser null para los campos complejos. Nota: Los campos que se pueden buscar consumen espacio adicional en el índice para dar cabida a versiones tokenizadas adicionales del valor del campo para las búsquedas de texto completo. Si desea ahorrar espacio en el índice y no necesita incluir un campo en las búsquedas, establezca searchable en false.
sortable	boolean	Valor que indica si se debe hacer referencia al campo en $orderby expresiones. De forma predeterminada, el motor de búsqueda ordena los resultados por puntuación, pero en muchas experiencias los usuarios querrán ordenar por campos de los documentos. Solo se puede ordenar un campo simple si se trata de un solo valor (tiene un único valor en el ámbito del documento primario). Los campos de colección simples no se pueden ordenar, ya que son multivalor. Los subprocesos simples de colecciones complejas también son multivalor y, por tanto, no se pueden ordenar. Esto es cierto si es un campo primario inmediato o un campo antecesor, que es la colección compleja. Los campos complejos no se pueden ordenar y la propiedad ordenable debe ser null para dichos campos. El valor predeterminado para ordenar es true para campos simples de un solo valor, false para campos simples de varios valores y null para campos complejos.
stored	boolean	Valor inmutable que indica si el campo se conservará por separado en el disco que se devolverá en un resultado de búsqueda. Puede deshabilitar esta opción si no tiene previsto devolver el contenido del campo en una respuesta de búsqueda para ahorrar en la sobrecarga de almacenamiento. Esto solo se puede establecer durante la creación del índice y solo para campos vectoriales. Esta propiedad no se puede cambiar para los campos existentes ni establecerse como false para los nuevos campos. Si esta propiedad se establece como false, la propiedad 'retrievable' también debe establecerse en false. Esta propiedad debe ser true o unset para los campos clave, para los campos nuevos y para los campos no vectoriales, y debe ser null para los campos complejos. Deshabilitar esta propiedad reducirá los requisitos de almacenamiento de índices. El valor predeterminado es true para los campos vectoriales.
synonymMaps	string[]	Lista de los nombres de los mapas de sinónimos que se van a asociar a este campo. Esta opción solo se puede usar con campos que se pueden buscar. Actualmente solo se admite un mapa de sinónimos por campo. La asignación de un mapa de sinónimos a un campo garantiza que los términos de consulta destinados a ese campo se expanden en tiempo de consulta mediante las reglas del mapa de sinónimos. Este atributo se puede cambiar en campos existentes. Debe ser null o una colección vacía para campos complejos.
type	SearchFieldDataType	Tipo de datos del campo.
vectorEncoding	VectorEncodingFormat	Formato de codificación para interpretar el contenido del campo.
vectorSearchProfile	string	Nombre del perfil de búsqueda vectorial que especifica el algoritmo y el vectorizador que se va a usar al buscar en el campo vectorial.

SearchFieldDataType

Enumeración

Define el tipo de datos de un campo en un índice de búsqueda.

Valor	Description
Edm.String	Indica que un campo contiene una cadena.
Edm.Int32	Indica que un campo contiene un entero de 32 bits con signo.
Edm.Int64	Indica que un campo contiene un entero de 64 bits con signo.
Edm.Double	Indica que un campo contiene un número de punto flotante de precisión doble IEEE.
Edm.Boolean	Indica que un campo contiene un valor booleano (true o false).
Edm.DateTimeOffset	Indica que un campo contiene un valor de fecha y hora, incluida la información de zona horaria.
Edm.GeographyPoint	Indica que un campo contiene una ubicación geográfica en términos de longitud y latitud.
Edm.ComplexType	Indica que un campo contiene uno o varios objetos complejos que, a su vez, tienen subcampos de otros tipos.
Edm.Single	Indica que un campo contiene un número de punto flotante de precisión única. Esto solo es válido cuando se usa con Collection(Edm.Single).
Edm.Half	Indica que un campo contiene un número de punto flotante de precisión media. Esto solo es válido cuando se usa con Collection(Edm.Half).
Edm.Int16	Indica que un campo contiene un entero de 16 bits con signo. Esto solo es válido cuando se usa con Collection(Edm.Int16).
Edm.SByte	Indica que un campo contiene un entero de 8 bits con signo. Esto solo es válido cuando se usa con Collection(Edm.SByte).
Edm.Byte	Indica que un campo contiene un entero de 8 bits sin signo. Esto solo es válido cuando se usa con Collection(Edm.Byte).

SearchIndex

Objeto

Representa una definición de índice de búsqueda, que describe los campos y el comportamiento de búsqueda de un índice.

Nombre	Tipo	Description
@odata.etag	string	ETag del índice.
analyzers	LexicalAnalyzer[]: CustomAnalyzer[] LuceneStandardAnalyzer[] PatternAnalyzer[] StopAnalyzer[]	Analizadores del índice.
charFilters	CharFilter[]: MappingCharFilter[] PatternReplaceCharFilter[]	Los filtros de caracteres para el índice.
corsOptions	CorsOptions	Opciones para controlar el uso compartido de recursos entre orígenes (CORS) para el índice.
defaultScoringProfile	string	Nombre del perfil de puntuación que se va a usar si no se especifica ninguno en la consulta. Si esta propiedad no está establecida y no se especifica ningún perfil de puntuación en la consulta, se usará la puntuación predeterminada (tf-idf).
description	string	La descripción del índice.
encryptionKey	SearchResourceEncryptionKey	Descripción de una clave de cifrado que se crea en Azure Key Vault. Esta clave se utiliza para proporcionar un nivel adicional de cifrado en reposo para tus datos cuando quieres tener la garantía total de que nadie, ni siquiera Microsoft, puede descifrar tus datos. Una vez que haya cifrado los datos, siempre permanecerá cifrado. El servicio de búsqueda omitirá los intentos de establecer esta propiedad en null. Puede cambiar esta propiedad según sea necesario si desea rotar la clave de cifrado; Los datos no se verán afectados. El cifrado con claves administradas por el cliente no está disponible para los servicios de búsqueda gratuitos y solo está disponible para los servicios pagos creados a partir del 1 de enero de 2019.
fields	SearchField[]	Campos del índice.
name	string	Nombre del índice.
normalizers	LexicalNormalizer[]: CustomNormalizer[]	Los normalizadores del índice.
scoringProfiles	ScoringProfile[]	Perfiles de puntuación para el índice.
semantic	SemanticSearch	Define parámetros para un índice de búsqueda que influye en las funcionalidades semánticas.
similarity	SimilarityAlgorithm: BM25SimilarityAlgorithm ClassicSimilarityAlgorithm	Tipo de algoritmo de similitud que se va a usar al puntuar y clasificar los documentos que coinciden con una consulta de búsqueda. El algoritmo de similitud solo se puede definir en el momento de creación del índice y no se puede modificar en índices existentes. Si es null, se usa el algoritmo ClassicSimilarity.
suggesters	SearchSuggester[]	Proveedores de sugerencias para el índice.
tokenFilters	TokenFilter[]: AsciiFoldingTokenFilter[] CjkBigramTokenFilter[] CommonGramTokenFilter[] DictionaryDecompounderTokenFilter[] EdgeNGramTokenFilter[] EdgeNGramTokenFilterV2[] ElisionTokenFilter[] KeepTokenFilter[] KeywordMarkerTokenFilter[] LengthTokenFilter[] LimitTokenFilter[] NGramTokenFilter[] NGramTokenFilterV2[] PatternCaptureTokenFilter[] PatternReplaceTokenFilter[] PhoneticTokenFilter[] ShingleTokenFilter[] SnowballTokenFilter[] StemmerOverrideTokenFilter[] StemmerTokenFilter[] StopwordsTokenFilter[] SynonymTokenFilter[] TruncateTokenFilter[] UniqueTokenFilter[] WordDelimiterTokenFilter[]	El token filtra el índice.
tokenizers	LexicalTokenizer[]: ClassicTokenizer[] EdgeNGramTokenizer[] KeywordTokenizer[] KeywordTokenizerV2[] LuceneStandardTokenizer[] LuceneStandardTokenizerV2[] MicrosoftLanguageStemmingTokenizer[] MicrosoftLanguageTokenizer[] NGramTokenizer[] PathHierarchyTokenizerV2[] PatternTokenizer[] UaxUrlEmailTokenizer[]	Tokenizadores del índice.
vectorSearch	VectorSearch	Contiene opciones de configuración relacionadas con la búsqueda vectorial.

SearchIndexerDataNoneIdentity

Objeto

Borra la propiedad de identidad de un origen de datos.

Nombre	Tipo	Description
@odata.type	string: #Microsoft.Azure.Search.DataNoneIdentity	Fragmento de URI que especifica el tipo de identidad.

SearchIndexerDataUserAssignedIdentity

Objeto

Especifica la identidad de un origen de datos que se va a usar.

Nombre	Tipo	Description
@odata.type	string: #Microsoft.Azure.Search.DataUserAssignedIdentity	Fragmento de URI que especifica el tipo de identidad.
userAssignedIdentity	string	El identificador de recurso de Azure completo de una identidad administrada asignada por el usuario normalmente con el formato "/subscriptions/12345678-1234-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" que se debe haber asignado al servicio de búsqueda.

SearchResourceEncryptionKey

Objeto

Una clave de cifrado administrada por el cliente en Azure Key Vault. Las claves que crea y administra se pueden usar para cifrar o descifrar datos en reposo, como índices y mapas de sinónimos.

Nombre	Tipo	Description
accessCredentials.applicationId	string	Un identificador de aplicación de AAD al que se concedieron los permisos de acceso necesarios a Azure Key Vault que se va a usar al cifrar los datos en reposo. El identificador de aplicación no debe confundirse con el id. de objeto de la aplicación de AAD.
accessCredentials.applicationSecret	string	Clave de autenticación de la aplicación de AAD especificada.
identity	SearchIndexerDataIdentity: SearchIndexerDataNoneIdentity SearchIndexerDataUserAssignedIdentity	Una identidad administrada explícita que se va a usar para esta clave de cifrado. Si no se especifica y la propiedad de credenciales de acceso es null, se usa la identidad administrada asignada por el sistema. Al actualizar al recurso, si la identidad explícita no está especificada, permanece sin cambios. Si se especifica "none", se borra el valor de esta propiedad.
keyVaultKeyName	string	Nombre de la clave de Azure Key Vault que se usará para cifrar los datos en reposo.
keyVaultKeyVersion	string	Versión de la clave de Azure Key Vault que se usará para cifrar los datos en reposo.
keyVaultUri	string	El URI de Azure Key Vault, también denominado nombre DNS, que contiene la clave que se va a usar para cifrar los datos en reposo. Un URI de ejemplo podría ser `https://my-keyvault-name.vault.azure.net`.

SearchSuggester

Objeto

Define cómo se debe aplicar la API suggest a un grupo de campos del índice.

Nombre	Tipo	Description
name	string	El nombre del sugestor.
searchMode	enum: analyzingInfixMatching	Valor que indica las capacidades del sugeridor.
sourceFields	string[]	La lista de nombres de campo a los que se aplica el sugeridor. Cada campo debe poder buscarse.

SemanticConfiguration

Objeto

Define una configuración específica que se usará en el contexto de las funcionalidades semánticas.

Nombre	Tipo	Description
name	string	Nombre de la configuración semántica.
prioritizedFields	SemanticPrioritizedFields	Describe los campos de título, contenido y palabra clave que se van a usar para la clasificación semántica, los títulos, los resaltados y las respuestas. Debe establecerse al menos una de las tres propiedades secundarias (titleField, priordKeywordsFields y priorizadoContentFields).
rankingOrder	RankingOrder	Especifica el tipo de puntuación que se utilizará para el criterio de ordenación de los resultados de la búsqueda.

SemanticField

Objeto

Campo que se usa como parte de la configuración semántica.

Nombre	Tipo	Description
fieldName	string	Nombre del archivo

SemanticPrioritizedFields

Objeto

Describe los campos de título, contenido y palabras clave que se usarán para la clasificación semántica, los subtítulos, los resaltados y las respuestas.

Nombre	Tipo	Description
prioritizedContentFields	SemanticField[]	Define los campos de contenido que se utilizarán para la clasificación semántica, los subtítulos, los resaltados y las respuestas. Para obtener el mejor resultado, los campos seleccionados deben contener texto en forma de lenguaje natural. El orden de los campos de la matriz representa su prioridad. Los campos con menor prioridad pueden truncarse si el contenido es largo.
prioritizedKeywordsFields	SemanticField[]	Define los campos de palabras clave que se utilizarán para la clasificación semántica, los subtítulos, los resaltados y las respuestas. Para obtener el mejor resultado, los campos seleccionados deben contener una lista de palabras clave. El orden de los campos de la matriz representa su prioridad. Los campos con menor prioridad pueden truncarse si el contenido es largo.
titleField	SemanticField	Define el campo de título que se utilizará para la clasificación semántica, los subtítulos, los resaltados y las respuestas. Si no tiene un campo de título en el índice, déjelo en blanco.

SemanticSearch

Objeto

Define parámetros para un índice de búsqueda que influye en las funcionalidades semánticas.

Nombre	Tipo	Description
configurations	SemanticConfiguration[]	Las configuraciones semánticas del índice.
defaultConfiguration	string	Le permite establecer el nombre de una configuración semántica predeterminada en el índice, por lo que es opcional pasarlo como parámetro de consulta cada vez.

ShingleTokenFilter

Objeto

Crea combinaciones de tokens como un solo token. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.ShingleTokenFilter		El discriminador para los tipos derivados.
filterToken	string	_	Cadena que se va a insertar para cada posición en la que no hay ningún token. El valor predeterminado es un carácter de subrayado ("_").
maxShingleSize	integer (int32) minimum: 2	2	Tamaño máximo del shingle. El valor predeterminado y mínimo es 2.
minShingleSize	integer (int32) minimum: 2	2	Tamaño mínimo del shingle. El valor predeterminado y mínimo es 2. Debe ser menor que el valor de maxShingleSize.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
outputUnigrams	boolean	True	Valor que indica si el flujo de salida contendrá los tokens de entrada (unigramas) así como los shingles. El valor predeterminado es verdadero.
outputUnigramsIfNoShingles	boolean	False	Valor que indica si se van a generar unigramas para esos momentos en los que no hay ningún shingle disponible. Esta propiedad tiene prioridad cuando outputUnigrams está establecido en false. El valor predeterminado es falso.
tokenSeparator	string		Cadena que se va a usar al unir tokens adyacentes para formar un shingle. El valor predeterminado es un solo espacio (" ").

SnowballTokenFilter

Objeto

Filtro que deriva las palabras mediante un lematizador generado por Snowball. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Description
@odata.type	string: #Microsoft.Azure.Search.SnowballTokenFilter	El discriminador para los tipos derivados.
language	SnowballTokenFilterLanguage	Idioma que se va a usar.
name	string	Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

SnowballTokenFilterLanguage

Enumeración

El idioma que se va a utilizar para un filtro de tokens de Snowball.

Valor	Description
armenian	Selecciona el tokenizador de derivación de bola de nieve de Lucene para armenio.
basque	Selecciona el tokenizador de lematización Lucene Snowball para euskera.
catalan	Selecciona el tokenizador de lematización Lucene Snowball para catalán.
danish	Selecciona el tokenizador de lematización Lucene Snowball para danés.
dutch	Selecciona el tokenizador de lematización Lucene Snowball para holandés.
english	Selecciona el tokenizador de lematización Lucene Snowball para inglés.
finnish	Selecciona el tokenizador de lematización de bola de nieve de Lucene para finlandés.
french	Selecciona el tokenizador de lematización de Lucene Snowball para francés.
german	Selecciona el tokenizador de lematización Lucene Snowball para alemán.
german2	Selecciona el tokenizador de lematización de Lucene Snowball que usa el algoritmo de variante alemán.
hungarian	Selecciona el tokenizador de lematización Lucene Snowball para húngaro.
italian	Selecciona el tokenizador de lematización Lucene Snowball para italiano.
kp	Selecciona el tokenizador de lematización de Lucene Snowball para holandés que usa el algoritmo de lematización Kraaij-Pohlmann.
lovins	Selecciona el tokenizador de lematización de Lucene Snowball para inglés que usa el algoritmo de lematización de Lovins.
norwegian	Selecciona el tokenizador de leal Lucene Snowball para noruego.
porter	Selecciona el tokenizador de lematización de Lucene Snowball para inglés que usa el algoritmo de lematización de Porter.
portuguese	Selecciona el tokenizador de lematización Lucene Snowball para portugués.
romanian	Selecciona el tokenizador de lematización Lucene Snowball para rumano.
russian	Selecciona el tokenizador de lematización Lucene Snowball para ruso.
spanish	Selecciona el tokenizador de lematización Lucene Snowball para español.
swedish	Selecciona el tokenizador de lematización de bola de nieve de Lucene para sueco.
turkish	Selecciona el tokenizador de lematización de bola de nieve de Lucene para turco.

StemmerOverrideTokenFilter

Objeto

Proporciona la capacidad de invalidar otros filtros de lematización con lematización personalizada basada en diccionarios. Cualquier término con lematización de diccionario se marcará como palabras clave para que no se lematice con lematizadores hacia abajo de la cadena. Se debe colocar antes de los filtros de lematización. Este filtro de token se implementa mediante Apache Lucene. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/StemmerOverrideFilter.html.

Nombre	Tipo	Description
@odata.type	string: #Microsoft.Azure.Search.StemmerOverrideTokenFilter	El discriminador para los tipos derivados.
name	string	Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
rules	string[]	Lista de reglas de lematización con el siguiente formato: "word => tallo", por ejemplo: "ran => run".

StemmerTokenFilter

Objeto

Filtro de lematización específico del idioma. Este filtro de token se implementa mediante Apache Lucene. Vea https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters.

Nombre	Tipo	Description
@odata.type	string: #Microsoft.Azure.Search.StemmerTokenFilter	El discriminador para los tipos derivados.
language	StemmerTokenFilterLanguage	Idioma que se va a usar.
name	string	Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

StemmerTokenFilterLanguage

Enumeración

El lenguaje que se va a usar para un filtro de token de lematización.

Valor	Description
arabic	Selecciona el tokenizador de lematización de Lucene para árabe.
armenian	Selecciona el tokenizador de derivación Lucene para armenio.
basque	Selecciona el tokenizador de derivación de Lucene para euskera.
brazilian	Selecciona el tokenizador de derivación Lucene para portugués (Brasil).
bulgarian	Selecciona el tokenizador de derivación Lucene para búlgaro.
catalan	Selecciona el tokenizador de derivación Lucene para catalán.
czech	Selecciona el tokenizador de derivación Lucene para checo.
danish	Selecciona el tokenizador de lematización Lucene para danés.
dutch	Selecciona el tokenizador de derivación Lucene para holandés.
dutchKp	Selecciona el tokenizador de lematización de Lucene para holandés que usa el algoritmo de lematización Kraaij-Pohlmann.
english	Selecciona el tokenizador de lematización de Lucene para inglés.
lightEnglish	Selecciona el tokenizador de lematización de Lucene para inglés que hace lematización ligera.
minimalEnglish	Selecciona el tokenizador de lematización de Lucene para inglés que realiza una lematización mínima.
possessiveEnglish	Selecciona el tokenizador de raíz de Lucene para inglés que elimina los posesivos finales de las palabras.
porter2	Selecciona el tokenizador de lematización de Lucene para inglés que usa el algoritmo de lematización Porter2.
lovins	Selecciona el tokenizador de lematización de Lucene para inglés que usa el algoritmo de lematización de Lovins.
finnish	Selecciona el tokenizador de derivación de Lucene para finlandés.
lightFinnish	Selecciona el tokenizador de lematización de Lucene para finlandés que hace lematización ligera.
french	Selecciona el tokenizador de lematización Lucene para francés.
lightFrench	Selecciona el tokenizador de lematización de Lucene para francés que hace lematización ligera.
minimalFrench	Selecciona el tokenizador de lematización de Lucene para francés que hace una lematización mínima.
galician	Selecciona el tokenizador de derivación Lucene para gallego.
minimalGalician	Selecciona el tokenizador de derivación Lucene para gallego que hace una derivación mínima.
german	Selecciona el tokenizador de lematización Lucene para alemán.
german2	Selecciona el tokenizador de lematización de Lucene que utiliza el algoritmo de variante alemán.
lightGerman	Selecciona el tokenizador de lematización Lucene para alemán que hace lematización ligera.
minimalGerman	Selecciona el tokenizador de lematización de Lucene para alemán que hace una plica mínima.
greek	Selecciona el tokenizador de lematización de Lucene para griego.
hindi	Selecciona el tokenizador de lematización de Lucene para hindi.
hungarian	Selecciona el tokenizador de derivación de Lucene para húngaro.
lightHungarian	Selecciona el tokenizador de lematización de Lucene para húngaro que hace lematización ligera.
indonesian	Selecciona el tokenizador de derivación de Lucene para indonesio.
irish	Selecciona el tokenizador de derivación Lucene para irlandés.
italian	Selecciona el tokenizador de lematización Lucene para italiano.
lightItalian	Selecciona el tokenizador de derivación de Lucene para italiano que hace plica ligera.
sorani	Selecciona el tokenizador de lematización de Lucene para Sorani.
latvian	Selecciona el tokenizador de lematización Lucene para letón.
norwegian	Selecciona el tokenizador de stemming Lucene para noruego (Bokmål).
lightNorwegian	Selecciona el tokenizador de stemming Lucene para noruego (Bokmål) que hace stemming ligero.
minimalNorwegian	Selecciona el tokenizador de stemming Lucene para noruego (Bokmål) que hace un stemming mínimo.
lightNynorsk	Selecciona el tokenizador de lematización de Lucene para noruego (nynorsk) que realiza lematización ligera.
minimalNynorsk	Selecciona el tokenizador de lematización de Lucene para noruego (nynorsk) que realiza una lematización mínima.
portuguese	Selecciona el tokenizador de lematización de Lucene para portugués.
lightPortuguese	Selecciona el tokenizador de lematización de Lucene para portugués que hace lematización ligera.
minimalPortuguese	Selecciona el tokenizador de lematización de Lucene para portugués que hace una lematización mínima.
portugueseRslp	Selecciona el tokenizador de lematización de Lucene para portugués que utiliza el algoritmo de lematización RSLP.
romanian	Selecciona el tokenizador de derivación Lucene para rumano.
russian	Selecciona el tokenizador de lematización de Lucene para ruso.
lightRussian	Selecciona el tokenizador de lematización de Lucene para ruso que hace lematización ligera.
spanish	Selecciona el tokenizador de derivación de Lucene para español.
lightSpanish	Selecciona el tokenizador de lematización de Lucene para español que hace lematización ligera.
swedish	Selecciona el tokenizador de lematización de Lucene para sueco.
lightSwedish	Selecciona el tokenizador de lematización de Lucene para sueco que hace lematización ligera.
turkish	Selecciona el tokenizador de derivación de Lucene para turco.

StopAnalyzer

Objeto

Divide el texto en letras no letras; Aplica los filtros de token en minúsculas y palabras irrelevantes. Este analizador se implementa mediante Apache Lucene.

Nombre	Tipo	Description
@odata.type	string: #Microsoft.Azure.Search.StopAnalyzer	El discriminador para los tipos derivados.
name	string	Nombre del analizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
stopwords	string[]	Lista de palabras irrelevantes.

StopwordsList

Enumeración

Identifica una lista predefinida de palabras irrelevantes específicas del idioma.

Valor	Description
arabic	Selecciona la lista de palabras irrelevantes para el árabe.
armenian	Selecciona la lista de palabras irrelevantes para armenio.
basque	Selecciona la lista de palabras irrelevantes para el euskera.
brazilian	Selecciona la lista de palabras irrelevantes para Portugués (Brasil).
bulgarian	Selecciona la lista de palabras irrelevantes para el búlgaro.
catalan	Selecciona la lista de palabras irrelevantes para el catalán.
czech	Selecciona la lista de palabras irrelevantes para el checo.
danish	Selecciona la lista de palabras irrelevantes para danés.
dutch	Selecciona la lista de palabras irrelevantes para holandés.
english	Selecciona la lista de palabras irrelevantes para inglés.
finnish	Selecciona la lista de palabras irrelevantes para finlandés.
french	Selecciona la lista de palabras irrelevantes para francés.
galician	Selecciona la lista de palabras irrelevantes para el gallego.
german	Selecciona la lista de palabras irrelevantes para el alemán.
greek	Selecciona la lista de palabras irrelevantes para el griego.
hindi	Selecciona la lista de palabras irrelevantes para el hindi.
hungarian	Selecciona la lista de palabras irrelevantes para el húngaro.
indonesian	Selecciona la lista de palabras irrelevantes para indonesio.
irish	Selecciona la lista de palabras irrelevantes para irlandés.
italian	Selecciona la lista de palabras irrelevantes para italiano.
latvian	Selecciona la lista de palabras irrelevantes para el letón.
norwegian	Selecciona la lista de palabras irrelevantes para noruego.
persian	Selecciona la lista de palabras irrelevantes para el persa.
portuguese	Selecciona la lista de palabras irrelevantes para el portugués.
romanian	Selecciona la lista de palabras irrelevantes para rumano.
russian	Selecciona la lista de palabras irrelevantes para el ruso.
sorani	Selecciona la lista de palabras irrelevantes para Sorani.
spanish	Selecciona la lista de palabras irrelevantes para español.
swedish	Selecciona la lista de palabras irrelevantes para sueco.
thai	Selecciona la lista de palabras irrelevantes para tailandés.
turkish	Selecciona la lista de palabras irrelevantes para el turco.

StopwordsTokenFilter

Objeto

Quita las palabras irrelevantes de una secuencia de tokens. Este filtro de token se implementa mediante Apache Lucene. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.StopwordsTokenFilter		El discriminador para los tipos derivados.
ignoreCase	boolean	False	Valor que indica si se omitirán mayúsculas y minúsculas. Si es true, todas las palabras se convierten en minúsculas en primer lugar. El valor predeterminado es falso.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
removeTrailing	boolean	True	Valor que indica si se omitirá el último término de búsqueda si es una palabra irrelevante. El valor predeterminado es verdadero.
stopwords	string[]		Lista de palabras irrelevantes. Esta propiedad y la propiedad de lista de palabras irrelevantes no se pueden establecer.
stopwordsList	StopwordsList	english	Lista predefinida de palabras irrelevantes que se van a usar. Esta propiedad y la propiedad stopwords no se pueden establecer. El valor predeterminado es inglés.

SynonymTokenFilter

Objeto

Coincide con sinónimos de una o varias palabras en una secuencia de tokens. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.SynonymTokenFilter		El discriminador para los tipos derivados.
expand	boolean	True	Valor que indica si todas las palabras de la lista de sinónimos (si => notación no se usan) se asignarán entre sí. Si es true, todas las palabras de la lista de sinónimos (si => notación no se usan) se asignarán entre sí. La siguiente lista: increíble, increíble, fabuloso, increíble es equivalente a: increíble, increíble, fabuloso, increíble => increíble, increíble, fabuloso, increíble. Si es false, la siguiente lista: increíble, increíble, fabuloso, increíble será equivalente a: increíble, increíble, fabuloso, increíble => increíble. El valor predeterminado es verdadero.
ignoreCase	boolean	False	Valor que indica si se debe plegar mayúsculas y minúsculas para buscar coincidencias. El valor predeterminado es falso.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
synonyms	string[]		Lista de sinónimos en uno de los dos formatos siguientes: 1. increíble, increíble, fabuloso => increíble - todos los términos en el lado izquierdo de => símbolo se reemplazarán por todos los términos en su lado derecho; 2. increíble, increíble, fabuloso, increíble - lista separada por comas de palabras equivalentes. Establezca la opción de expansión para cambiar cómo se interpreta esta lista.

TagScoringFunction

Objeto

Define una función que aumenta las puntuaciones de documentos con valores de cadena que coinciden con una lista determinada de etiquetas.

Nombre	Tipo	Description
boost	number (double)	Multiplicador de la puntuación sin procesar. Debe ser un número positivo no igual a 1,0.
fieldName	string	Nombre del campo utilizado como entrada para la función de puntuación.
interpolation	ScoringFunctionInterpolation	Valor que indica cómo se interpolará la potenciación entre las puntuaciones de los documentos; el valor predeterminado es "Linear".
tag	TagScoringParameters	Valores de parámetro para la función de puntuación de etiquetas.
type	string: tag	Tipo de Función de Puntuación.

TagScoringParameters

Objeto

Proporciona valores de parámetro a una función de puntuación de etiquetas.

Nombre	Tipo	Description
tagsParameter	string	El nombre del parámetro pasado en las consultas de búsqueda para especificar la lista de etiquetas que se van a comparar con el campo de destino.

TextWeights

Objeto

Define pesos en campos de índice para los que las coincidencias deben aumentar la puntuación en las consultas de búsqueda.

Nombre	Tipo	Description
weights	object	El diccionario de pesos por campo para mejorar la puntuación de documentos. Las claves son los nombres de campo y los valores son los pesos de cada campo.

TokenCharacterKind

Enumeración

Representa clases de caracteres en las que puede operar un filtro de token.

Valor	Description
letter	Guarda las letras en fichas.
digit	Mantiene los dígitos en fichas.
whitespace	Mantiene los espacios en blanco en los tokens.
punctuation	Mantiene la puntuación en fichas.
symbol	Mantiene los símbolos en fichas.

TokenFilterName

Enumeración

Define los nombres de todos los filtros de token admitidos por el motor de búsqueda.

Valor	Description
arabic_normalization	Un filtro de token que aplica el normalizador de árabe para normalizar la ortografía. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html.
apostrophe	Elimina todos los caracteres después de un apóstrofo (incluyendo el apóstrofo en sí mismo). Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html.
asciifolding	Convierte caracteres alfabéticos, numéricos y simbólicos Unicode que no están en los primeros 127 caracteres ASCII (el bloque Unicode "Básico latino") en sus equivalentes ASCII, si existen dichos equivalentes. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html.
cjk_bigram	Forma bigrams de términos de CJK que se generan a partir del tokenizador estándar. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html.
cjk_width	Normaliza las diferencias de ancho de CJK. Pliega variantes ASCII de ancho completo en el latín básico equivalente, y variantes Katakana de medio ancho en el Kana equivalente. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html.
classic	Quita los posesivos en inglés y los puntos de los acrónimos. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html.
common_grams	Construye bigramas para términos que se repiten con frecuencia durante la indexación. Los términos individuales también se indexan, con los bigramas superpuestos. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html.
edgeNGram_v2	Genera n-gramas de los tamaños especificados a partir de la parte delantera o posterior de un token de entrada. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html.
elision	Elimina elisiones. Por ejemplo, "l'avion" (el plano) se convertirá en "avion" (plano). Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html.
german_normalization	Normaliza los caracteres alemanes según la heurística del algoritmo de bola de nieve alemán2. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html.
hindi_normalization	Normaliza el texto en hindi para quitar algunas diferencias en las variaciones ortográficas. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html.
indic_normalization	Normaliza la representación Unicode de texto en las lenguas hindúes. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html.
keyword_repeat	Emite cada token entrante dos veces, una como palabra clave y una vez como palabra clave no clave. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html.
kstem	Filtro kstem de alto rendimiento para inglés. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html.
length	Quita las palabras que son demasiado largas o demasiado cortas. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html.
limit	Limita el número de tokens durante la indexación. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html.
lowercase	Normaliza el texto de los tokens a minúsculas. Vea https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html.
nGram_v2	Genera n-gramas de los tamaños especificados. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html.
persian_normalization	Aplica la normalización para el idioma persa. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html.
phonetic	Crea tokens para coincidencias fonéticas. Vea https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html.
porter_stem	Usa el algoritmo de lematización porter para transformar la secuencia de tokens. Vea http://tartarus.org/~martin/PorterStemmer.
reverse	Invierte la cadena de tokens. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html.
scandinavian_normalization	Normaliza el uso de los caracteres escandinavos intercambiables entre sí. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html.
scandinavian_folding	Pliega caracteres escandinavos Ã¥ã... Ã¤Ã¦Ã"Ã†->a y Ã¶Ã–Ã ̧Ã ̃-o>. También discrimina el uso de vocales dobles aa, ae, ao, oe y oo, dejando solo el primero. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html.
shingle	Crea combinaciones de tokens como un solo token. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html.
snowball	Filtro que deriva las palabras mediante un lematizador generado por Snowball. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html.
sorani_normalization	Normaliza la representación Unicode del texto Sorani. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html.
stemmer	Filtro de lematización específico del idioma. Vea https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters.
stopwords	Quita las palabras irrelevantes de una secuencia de tokens. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html.
trim	Elimina el espacio en blanco inicial y final de los tokens. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html.
truncate	Trunca los términos a una longitud específica. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html.
unique	Filtra los tokens con el mismo texto que el token anterior. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html.
uppercase	Normaliza el texto del token a letras mayúsculas. Vea https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html.
word_delimiter	Divide palabras en subpalabras y realiza transformaciones opcionales en los grupos de subpalabras.

TruncateTokenFilter

Objeto

Trunca los términos a una longitud específica. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.TruncateTokenFilter		El discriminador para los tipos derivados.
length	integer (int32) maximum: 300	300	Longitud en la que se truncarán los términos. El valor predeterminado y máximo es 300.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

UaxUrlEmailTokenizer

Objeto

Tokeniza las direcciones URL y los correos electrónicos como un token. Este tokenizador se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.UaxUrlEmailTokenizer		El discriminador para los tipos derivados.
maxTokenLength	integer (int32) maximum: 300	255	Longitud máxima del token. El valor predeterminado es 255. Los tokens que sobrepasen la longitud máxima se dividen. La longitud máxima del token que se puede usar es de 300 caracteres.
name	string		Nombre del tokenizador. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.

UniqueTokenFilter

Objeto

Filtra los tokens con el mismo texto que el token anterior. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.UniqueTokenFilter		El discriminador para los tipos derivados.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
onlyOnSamePosition	boolean	False	Valor que indica si se van a quitar duplicados solo en la misma posición. El valor predeterminado es falso.

VectorEncodingFormat

Enumeración

El formato de codificación para interpretar el contenido de los campos vectoriales.

Valor	Description
packedBit	Formato de codificación que representa bits empaquetados en un tipo de datos más amplio.

VectorSearch

Objeto

Contiene opciones de configuración relacionadas con la búsqueda vectorial.

Nombre	Tipo	Description
algorithms	VectorSearchAlgorithmConfiguration[]: ExhaustiveKnnAlgorithmConfiguration[] HnswAlgorithmConfiguration[]	Contiene opciones de configuración específicas del algoritmo utilizado durante la indexación o la consulta.
compressions	VectorSearchCompression[]: BinaryQuantizationCompression[] ScalarQuantizationCompression[]	Contiene opciones de configuración específicas del método de compresión utilizado durante la indexación o consulta.
profiles	VectorSearchProfile[]	Define combinaciones de configuraciones que se van a usar con la búsqueda vectorial.
vectorizers	VectorSearchVectorizer[]: AMLVectorizer[] AzureOpenAIVectorizer[] WebApiVectorizer[]	Contiene opciones de configuración sobre cómo vectorizar consultas vectoriales de texto.

VectorSearchAlgorithmKind

Enumeración

El algoritmo utilizado para la indexación y la consulta.

Valor	Description
hnsw	HNSW (Jerárquico Mundo pequeño navegable), un tipo de algoritmo de vecinos más cercano aproximado.
exhaustiveKnn	Algoritmo KNN exhaustivo que realizará la búsqueda por fuerza bruta.

VectorSearchAlgorithmMetric

Enumeración

La métrica de similitud que se utilizará para las comparaciones vectoriales. Se recomienda elegir la misma métrica de similitud con la que se entrenó el modelo de incrustación.

Valor	Description
cosine	Mide el ángulo entre vectores para cuantificar su similitud, ignorando la magnitud. Cuanto menor sea el ángulo, más cerca de la similitud.
euclidean	Calcula la distancia de línea recta entre vectores en un espacio multidimensional. Cuanto menor sea la distancia, más cerca de la similitud.
dotProduct	Calcula la suma de productos a nivel de elemento para medir la alineación y la similitud de magnitud. Cuanto mayor y más positivo, más cerca de la similitud.
hamming	Solo se aplica a los tipos de datos binarios empaquetados por bits. Determina la disimilaridad contando posiciones diferentes en vectores binarios. Cuantos menos diferencias, más cerca de la similitud.

VectorSearchCompressionKind

Enumeración

El método de compresión utilizado para la indexación y la consulta.

Valor	Description
scalarQuantization	Cuantificación escalar, un tipo de método de compresión. En la cuantificación escalar, los valores de vectores originales se comprimen en un tipo más estrecho al discretizar y representar cada componente de un vector mediante un conjunto reducido de valores cuantificados, lo que reduce el tamaño general de los datos.
binaryQuantization	Cuantificación binaria, un tipo de método de compresión. En la cuantificación binaria, los valores de vectores originales se comprimen al tipo binario más estrecho al discretizar y representar cada componente de un vector mediante valores binarios, lo que reduce el tamaño general de los datos.

VectorSearchCompressionTarget

Enumeración

Tipo de datos cuantificados de valores vectoriales comprimidos.

Valor	Description
int8	Entero de 8 bits con signo.

VectorSearchProfile

Objeto

Define una combinación de configuraciones que se van a usar con la búsqueda vectorial.

Nombre	Tipo	Description
algorithm	string	El nombre de la configuración del algoritmo de búsqueda vectorial que especifica el algoritmo y los parámetros opcionales.
compression	string	Nombre de la configuración del método de compresión que especifica el método de compresión y los parámetros opcionales.
name	string	El nombre que se va a asociar con este perfil de búsqueda vectorial en particular.
vectorizer	string	El nombre de la vectorización que se está configurando para su uso con la búsqueda vectorial.

VectorSearchVectorizerKind

Enumeración

El método de vectorización que se utilizará durante el tiempo de consulta.

Valor	Description
azureOpenAI	Genere incrustaciones mediante un recurso de Azure OpenAI en el momento de la consulta.
customWebApi	Genere incrustaciones mediante un punto de conexión web personalizado en el momento de la consulta.
aiServicesVision	Genere incrustaciones para una entrada de imagen o texto en el momento de la consulta mediante Azure AI Services Vision Vectorize API.
aml	Genere inserciones mediante un punto de conexión de Azure Machine Learning implementado a través del catálogo de modelos de Fundición de IA de Azure en el momento de la consulta.

WebApiVectorizer

Objeto

Especifica un vectorizador definido por el usuario para generar la inserción de vectores de una cadena de consulta. La integración de un vectorizador externo se logra mediante la interfaz de API web personalizada de un conjunto de aptitudes.

Nombre	Tipo	Description
customWebApiParameters	WebApiVectorizerParameters	Especifica las propiedades del vectorizador definido por el usuario.
kind	string: customWebApi	Tipo de vectorizador de búsqueda vectorial.
name	string	Nombre que se va a asociar a este método de vectorización determinado.

WebApiVectorizerParameters

Objeto

Especifica las propiedades para conectarse a un vectorizador definido por el usuario.

Nombre	Tipo	Description
authIdentity	SearchIndexerDataIdentity: SearchIndexerDataNoneIdentity SearchIndexerDataUserAssignedIdentity	La identidad administrada asignada por el usuario que se usa para las conexiones salientes. Si se proporciona un authResourceId y no se especifica, se usa la identidad administrada asignada por el sistema. En las actualizaciones del indexador, si la identidad no está especificada, el valor permanece sin cambios. Si se establece en "none", se borra el valor de esta propiedad.
authResourceId	string	Se aplica a endpoints personalizados que se conectan a código externo en una función de Azure u otra aplicación que proporciona las transformaciones. Este valor debe ser el identificador de aplicación creado para la función o la aplicación cuando se registró con Azure Active Directory. Cuando se especifica, la vectorización se conecta a la función o aplicación mediante un identificador administrado (ya sea del sistema o asignado por el usuario) del servicio de búsqueda y el token de acceso de la función o aplicación, utilizando este valor como identificador de recurso para crear el ámbito del token de acceso.
httpHeaders	object	Los encabezados necesarios para realizar la solicitud HTTP.
httpMethod	string	El método para la solicitud HTTP.
timeout	string (duration)	Tiempo de espera deseado para la solicitud. El valor predeterminado es 30 segundos.
uri	string (uri)	El URI de la API web que proporciona el vectorizador.

WordDelimiterTokenFilter

Objeto

Divide palabras en subpalabras y realiza transformaciones opcionales en los grupos de subpalabras. Este filtro de token se implementa mediante Apache Lucene.

Nombre	Tipo	Valor predeterminado	Description
@odata.type	string: #Microsoft.Azure.Search.WordDelimiterTokenFilter		El discriminador para los tipos derivados.
catenateAll	boolean	False	Valor que indica si todas las partes de subword se clasificarán. Por ejemplo, si se establece en true, "Azure-Search-1" se convierte en "AzureSearch1". El valor predeterminado es falso.
catenateNumbers	boolean	False	Valor que indica si se clasificarán las ejecuciones máximas de partes de número. Por ejemplo, si se establece en true, "1-2" se convierte en "12". El valor predeterminado es falso.
catenateWords	boolean	False	Valor que indica si se clasificarán las ejecuciones máximas de elementos de palabras. Por ejemplo, si se establece en true, "Azure-Search" se convierte en "AzureSearch". El valor predeterminado es falso.
generateNumberParts	boolean	True	Valor que indica si se van a generar subpalabras numéricas. El valor predeterminado es verdadero.
generateWordParts	boolean	True	Valor que indica si se van a generar palabras de parte. Si se establece, hace que se generen partes de palabras; por ejemplo, "AzureSearch" se convierte en "Azure" "Search". El valor predeterminado es verdadero.
name	string		Nombre del filtro de token. Solo debe contener letras, dígitos, espacios, guiones o caracteres de subrayado, solo puede comenzar y terminar con caracteres alfanuméricos y está limitado a 128 caracteres.
preserveOriginal	boolean	False	Valor que indica si se conservarán y agregarán palabras originales a la lista de subwords. El valor predeterminado es falso.
protectedWords	string[]		Lista de tokens que se van a proteger frente a delimitados.
splitOnCaseChange	boolean	True	Valor que indica si se deben dividir palabras en caseChange. Por ejemplo, si se establece en true, "AzureSearch" se convierte en "Azure" "Search". El valor predeterminado es verdadero.
splitOnNumerics	boolean	True	Valor que indica si se va a dividir en números. Por ejemplo, si se establece en true, "Azure1Search" se convierte en "Azure" "1" "Search". El valor predeterminado es verdadero.
stemEnglishPossessive	boolean	True	Valor que indica si se va a quitar "'s" final para cada subword. El valor predeterminado es verdadero.