Indexes - Analyze
Muestra cómo un analizador divide el texto en tokens.
POST {endpoint}/indexes('{indexName}')/search.analyze?api-version=2026-04-01
Parámetros de identificador URI
| Nombre | En | Requerido | Tipo | Description |
|---|---|---|---|---|
|
endpoint
|
path | True |
string (uri) |
La dirección URL del punto de conexión del servicio de búsqueda. |
|
index
|
path | True |
string |
Nombre del índice. |
|
api-version
|
query | True |
string minLength: 1 |
Versión de la API que se va a usar para esta operación. |
Encabezado de la solicitud
| Nombre | Requerido | Tipo | Description |
|---|---|---|---|
| Accept |
El encabezado Aceptar. |
||
| x-ms-client-request-id |
string (uuid) |
Identificador de cadena globalmente único y generado por el cliente para la solicitud. |
Cuerpo de la solicitud
| Nombre | Requerido | Tipo | Description |
|---|---|---|---|
| text | True |
string |
Texto que se va a dividir en tokens. |
| analyzer |
Nombre del analizador que se va a usar para interrumpir el texto especificado. Si no se especifica este parámetro, debe especificar un tokenizador en su lugar. Los parámetros de tokenizador y analizador son mutuamente excluyentes. |
||
| charFilters |
Lista opcional de filtros de caracteres que se usarán al interrumpir el texto especificado. Este parámetro solo se puede establecer cuando se usa el parámetro tokenizer. |
||
| normalizer |
El nombre del normalizador que se usará para normalizar el texto dado. |
||
| tokenFilters |
Una lista opcional de filtros de token que se usarán al interrumpir el texto especificado. Este parámetro solo se puede establecer cuando se usa el parámetro tokenizer. |
||
| tokenizer |
Nombre del tokenizador que se va a usar para interrumpir el texto especificado. Si no se especifica este parámetro, debe especificar un analizador en su lugar. Los parámetros de tokenizador y analizador son mutuamente excluyentes. |
Respuestas
| Nombre | Tipo | Description |
|---|---|---|
| 200 OK |
La solicitud se ha realizado correctamente. |
|
| Other Status Codes |
Una respuesta de error inesperada. |
Seguridad
api-key
Tipo:
apiKey
En:
header
OAuth2Auth
Tipo:
oauth2
Flujo:
implicit
Dirección URL de autorización:
https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Ámbitos
| Nombre | Description |
|---|---|
| https://search.azure.com/.default |
Ejemplos
SearchServiceIndexAnalyze
Solicitud de ejemplo
POST https://exampleservice.search.windows.net/indexes('example-index')/search.analyze?api-version=2026-04-01
{
"text": "Text to analyze",
"analyzer": "ar.lucene"
}
Respuesta de muestra
{
"tokens": [
{
"token": "text",
"startOffset": 0,
"endOffset": 4,
"position": 0
},
{
"token": "to",
"startOffset": 5,
"endOffset": 7,
"position": 1
},
{
"token": "analyze",
"startOffset": 8,
"endOffset": 15,
"position": 2
}
]
}
Definiciones
| Nombre | Description |
|---|---|
| Accept |
El encabezado Aceptar. |
|
Analyzed |
Información sobre un token devuelto por un analizador. |
|
Analyze |
Especifica algunos componentes de texto y análisis que se usan para dividir ese texto en tokens. |
|
Analyze |
Resultado de probar un analizador en el texto. |
|
Char |
Define los nombres de todos los filtros de caracteres admitidos por el motor de búsqueda. |
|
Error |
Información adicional sobre el error de administración de recursos. |
|
Error |
Detalle del error. |
|
Error |
Respuesta común a errores para todas las APIs de Azure Resource Manager para devolver detalles de error por operaciones fallidas. (Esto también sigue el formato de respuesta de error de OData). |
|
Lexical |
Define los nombres de todos los analizadores de texto compatibles con el motor de búsqueda. |
|
Lexical |
Define los nombres de todos los normalizadores de texto admitidos por el motor de búsqueda. |
|
Lexical |
Define los nombres de todos los tokenizadores admitidos por el motor de búsqueda. |
|
Token |
Define los nombres de todos los filtros de token admitidos por el motor de búsqueda. |
Accept
El encabezado Aceptar.
| Valor | Description |
|---|---|
| application/json;odata.metadata=minimal |
AnalyzedTokenInfo
Información sobre un token devuelto por un analizador.
| Nombre | Tipo | Description |
|---|---|---|
| endOffset |
integer (int32) |
Índice del último carácter del token en el texto de entrada. |
| position |
integer (int32) |
Posición del token en el texto de entrada en relación con otros tokens. El primer token del texto de entrada tiene la posición 0, la siguiente tiene la posición 1, etc. Dependiendo del analizador usado, algunos tokens podrían tener la misma posición, por ejemplo, si son sinónimos entre sí. |
| startOffset |
integer (int32) |
Índice del primer carácter del token en el texto de entrada. |
| token |
string |
Token devuelto por el analizador. |
AnalyzeRequest
Especifica algunos componentes de texto y análisis que se usan para dividir ese texto en tokens.
| Nombre | Tipo | Description |
|---|---|---|
| analyzer |
Nombre del analizador que se va a usar para interrumpir el texto especificado. Si no se especifica este parámetro, debe especificar un tokenizador en su lugar. Los parámetros de tokenizador y analizador son mutuamente excluyentes. |
|
| charFilters |
Lista opcional de filtros de caracteres que se usarán al interrumpir el texto especificado. Este parámetro solo se puede establecer cuando se usa el parámetro tokenizer. |
|
| normalizer |
El nombre del normalizador que se usará para normalizar el texto dado. |
|
| text |
string |
Texto que se va a dividir en tokens. |
| tokenFilters |
Una lista opcional de filtros de token que se usarán al interrumpir el texto especificado. Este parámetro solo se puede establecer cuando se usa el parámetro tokenizer. |
|
| tokenizer |
Nombre del tokenizador que se va a usar para interrumpir el texto especificado. Si no se especifica este parámetro, debe especificar un analizador en su lugar. Los parámetros de tokenizador y analizador son mutuamente excluyentes. |
AnalyzeResult
Resultado de probar un analizador en el texto.
| Nombre | Tipo | Description |
|---|---|---|
| tokens |
La lista de tokens devueltos por el analizador especificado en la solicitud. |
CharFilterName
Define los nombres de todos los filtros de caracteres admitidos por el motor de búsqueda.
| Valor | Description |
|---|---|
| html_strip |
Filtro de caracteres que intenta quitar construcciones HTML. Vea https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html. |
ErrorAdditionalInfo
Información adicional sobre el error de administración de recursos.
| Nombre | Tipo | Description |
|---|---|---|
| info |
Información adicional. |
|
| type |
string |
Tipo de información adicional. |
ErrorDetail
Detalle del error.
| Nombre | Tipo | Description |
|---|---|---|
| additionalInfo |
Información adicional del error. |
|
| code |
string |
Código de error. |
| details |
Detalles del error. |
|
| message |
string |
El mensaje de error. |
| target |
string |
Destino del error. |
ErrorResponse
Respuesta común a errores para todas las APIs de Azure Resource Manager para devolver detalles de error por operaciones fallidas. (Esto también sigue el formato de respuesta de error de OData).
| Nombre | Tipo | Description |
|---|---|---|
| error |
Objeto de error. |
LexicalAnalyzerName
Define los nombres de todos los analizadores de texto compatibles con el motor de búsqueda.
| Valor | Description |
|---|---|
| ar.microsoft |
Analizador Microsoft para árabe. |
| ar.lucene |
Analizador Lucene para árabe. |
| hy.lucene |
Analizador Lucene para armenio. |
| bn.microsoft |
Analizador Microsoft para bangla. |
| eu.lucene |
Analizador Lucene para euskera. |
| bg.microsoft |
Analizador Microsoft para búlgaro. |
| bg.lucene |
Analizador Lucene para búlgaro. |
| ca.microsoft |
Analizador Microsoft para catalán. |
| ca.lucene |
Analizador Lucene para catalán. |
| zh-Hans.microsoft |
Analizador Microsoft para chino (simplificado). |
| zh-Hans.lucene |
Analizador Lucene para chino (simplificado). |
| zh-Hant.microsoft |
Analizador Microsoft para chino (tradicional). |
| zh-Hant.lucene |
Analizador Lucene para chino (tradicional). |
| hr.microsoft |
Analizador Microsoft para croata. |
| cs.microsoft |
Analizador Microsoft para checo. |
| cs.lucene |
Analizador Lucene para checo. |
| da.microsoft |
Analizador Microsoft para danés. |
| da.lucene |
Analizador Lucene para danés. |
| nl.microsoft |
Analizador de Microsoft para holandés. |
| nl.lucene |
Analizador Lucene para holandés. |
| en.microsoft |
Analizador Microsoft para inglés. |
| en.lucene |
Analizador Lucene para inglés. |
| et.microsoft |
Analizador Microsoft para estonio. |
| fi.microsoft |
Analizador Microsoft para finlandés. |
| fi.lucene |
Analizador Lucene para finlandés. |
| fr.microsoft |
Analizador Microsoft para francés. |
| fr.lucene |
Analizador Lucene para francés. |
| gl.lucene |
Analizador Lucene para gallego. |
| de.microsoft |
Analizador Microsoft para alemán. |
| de.lucene |
Analizador Lucene para alemán. |
| el.microsoft |
Analizador Microsoft para griego. |
| el.lucene |
Analizador Lucene para griego. |
| gu.microsoft |
Analizador de Microsoft para gujarati. |
| he.microsoft |
Analizador Microsoft para hebreo. |
| hi.microsoft |
Analizador Microsoft para hindi. |
| hi.lucene |
Analizador Lucene para hindi. |
| hu.microsoft |
Analizador Microsoft para húngaro. |
| hu.lucene |
Analizador Lucene para húngaro. |
| is.microsoft |
Analizador Microsoft para islandés. |
| id.microsoft |
Analizador Microsoft para indonesio (Bahasa). |
| id.lucene |
Analizador Lucene para indonesio. |
| ga.lucene |
Analizador Lucene para irlandés. |
| it.microsoft |
Analizador Microsoft para italiano. |
| it.lucene |
Analizador Lucene para italiano. |
| ja.microsoft |
Analizador Microsoft para japonés. |
| ja.lucene |
Analizador Lucene para japonés. |
| kn.microsoft |
Analizador Microsoft para kannada. |
| ko.microsoft |
Analizador Microsoft para coreano. |
| ko.lucene |
Analizador Lucene para coreano. |
| lv.microsoft |
Analizador Microsoft para letón. |
| lv.lucene |
Analizador Lucene para letón. |
| lt.microsoft |
Analizador Microsoft para lituano. |
| ml.microsoft |
Analizador Microsoft para malayalam. |
| ms.microsoft |
Analizador Microsoft para malayo (latín). |
| mr.microsoft |
Analizador Microsoft para maratí. |
| nb.microsoft |
Microsoft analyzer for Norwegian (Bokmål). |
| no.lucene |
Analizador Lucene para noruego. |
| fa.lucene |
Analizador Lucene para persa. |
| pl.microsoft |
Analizador Microsoft para polaco. |
| pl.lucene |
Analizador Lucene para polaco. |
| pt-BR.microsoft |
Analizador Microsoft para portugués (Brasil). |
| pt-BR.lucene |
Analizador Lucene para portugués (Brasil). |
| pt-PT.microsoft |
Analizador Microsoft para portugués (Portugal). |
| pt-PT.lucene |
Analizador Lucene para portugués (Portugal). |
| pa.microsoft |
Analizador Microsoft para punjabi. |
| ro.microsoft |
Analizador Microsoft para rumano. |
| ro.lucene |
Analizador Lucene para rumano. |
| ru.microsoft |
Analizador Microsoft para ruso. |
| ru.lucene |
Analizador Lucene para ruso. |
| sr-cyrillic.microsoft |
Analizador Microsoft para serbio (cirílico). |
| sr-latin.microsoft |
Analizador Microsoft para serbio (latín). |
| sk.microsoft |
Analizador de Microsoft para eslovaco. |
| sl.microsoft |
Analizador de Microsoft para esloveno. |
| es.microsoft |
Analizador Microsoft para español. |
| es.lucene |
Analizador Lucene para español. |
| sv.microsoft |
Analizador Microsoft para sueco. |
| sv.lucene |
Analizador Lucene para sueco. |
| ta.microsoft |
Analizador Microsoft para tamil. |
| te.microsoft |
Analizador Microsoft para telugu. |
| th.microsoft |
Analizador Microsoft para tailandés. |
| th.lucene |
Analizador Lucene para tailandés. |
| tr.microsoft |
Analizador Microsoft para turco. |
| tr.lucene |
Analizador Lucene para turco. |
| uk.microsoft |
Analizador Microsoft para ucraniano. |
| ur.microsoft |
Analizador Microsoft para urdu. |
| vi.microsoft |
Analizador Microsoft para vietnamita. |
| standard.lucene |
Analizador Lucene estándar. |
| standardasciifolding.lucene |
Analizador Lucene plegable ASCII estándar. Vea https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers. |
| keyword |
Trata todo el contenido de un campo como un solo token. Esto es útil para datos como códigos postales, identificadores y algunos nombres de producto. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html. |
| pattern |
Separa el texto de manera flexible en términos a través de un patrón de expresión regular. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html. |
| simple |
Divide el texto por donde no hay letras y lo convierte en minúsculas. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html. |
| stop |
Divide el texto en letras no letras; Aplica los filtros de token en minúsculas y palabras irrelevantes. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html. |
| whitespace |
Un analizador que usa el tokenizador de espacios en blanco. Vea http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html. |
LexicalNormalizerName
Define los nombres de todos los normalizadores de texto admitidos por el motor de búsqueda.
LexicalTokenizerName
Define los nombres de todos los tokenizadores admitidos por el motor de búsqueda.
TokenFilterName
Define los nombres de todos los filtros de token admitidos por el motor de búsqueda.