Indexes - Analyze
Laat zien hoe een analyseprogramma tekst opsplitst in tokens.
POST {endpoint}/indexes('{indexName}')/search.analyze?api-version=2026-04-01
URI-parameters
| Name | In | Vereist | Type | Description |
|---|---|---|---|---|
|
endpoint
|
path | True |
string (uri) |
De eindpunt-URL van de zoekservice. |
|
index
|
path | True |
string |
De naam van de index. |
|
api-version
|
query | True |
string minLength: 1 |
De API-versie die voor deze bewerking moet worden gebruikt. |
Aanvraagkoptekst
| Name | Vereist | Type | Description |
|---|---|---|---|
| Accept |
De Accepteer kop. |
||
| x-ms-client-request-id |
string (uuid) |
Een ondoorzichtige, wereldwijd unieke, door de client gegenereerde tekenreeks-id voor de aanvraag. |
Aanvraagbody
| Name | Vereist | Type | Description |
|---|---|---|---|
| text | True |
string |
De tekst die moet worden opgesplitst in tokens. |
| analyzer |
De naam van de analyse die moet worden gebruikt om de opgegeven tekst te verbreken. Als deze parameter niet is opgegeven, moet u in plaats daarvan een tokenizer opgeven. De tokenizer- en analyseparameters sluiten elkaar wederzijds uit. |
||
| charFilters |
Een optionele lijst met tekenfilters die moeten worden gebruikt bij het verbreken van de opgegeven tekst. Deze parameter kan alleen worden ingesteld wanneer u de tokenizer-parameter gebruikt. |
||
| normalizer |
De naam van de normalisator die moet worden gebruikt om de gegeven tekst te normaliseren. |
||
| tokenFilters |
Een optionele lijst met tokenfilters die moeten worden gebruikt bij het verbreken van de opgegeven tekst. Deze parameter kan alleen worden ingesteld wanneer u de tokenizer-parameter gebruikt. |
||
| tokenizer |
De naam van de tokenizer die moet worden gebruikt om de opgegeven tekst te verbreken. Als deze parameter niet is opgegeven, moet u in plaats daarvan een analyse opgeven. De tokenizer- en analyseparameters sluiten elkaar wederzijds uit. |
Antwoorden
| Name | Type | Description |
|---|---|---|
| 200 OK |
De aanvraag is voltooid. |
|
| Other Status Codes |
Een onverwachte foutreactie. |
Beveiliging
api-key
Type:
apiKey
In:
header
OAuth2Auth
Type:
oauth2
Stroom:
implicit
Autorisatie-URL:
https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Bereiken
| Name | Description |
|---|---|
| https://search.azure.com/.default |
Voorbeelden
SearchServiceIndexAnalyze
Voorbeeldaanvraag
POST https://exampleservice.search.windows.net/indexes('example-index')/search.analyze?api-version=2026-04-01
{
"text": "Text to analyze",
"analyzer": "ar.lucene"
}
Voorbeeldrespons
{
"tokens": [
{
"token": "text",
"startOffset": 0,
"endOffset": 4,
"position": 0
},
{
"token": "to",
"startOffset": 5,
"endOffset": 7,
"position": 1
},
{
"token": "analyze",
"startOffset": 8,
"endOffset": 15,
"position": 2
}
]
}
Definities
| Name | Description |
|---|---|
| Accept |
De Accepteer kop. |
|
Analyzed |
Informatie over een token dat wordt geretourneerd door een analyse. |
|
Analyze |
Hiermee geeft u enkele tekst- en analyseonderdelen op die worden gebruikt om die tekst op te splitsen in tokens. |
|
Analyze |
Het resultaat van het testen van een analyse op tekst. |
|
Char |
Definieert de namen van alle tekenfilters die door de zoekmachine worden ondersteund. |
|
Error |
Aanvullende informatie over de resourcebeheerfout. |
|
Error |
De foutdetails. |
|
Error |
Veelvoorkomende foutrespons voor alle Azure Resource Manager API's om foutdetails terug te geven bij mislukte bewerkingen. (Dit volgt ook de OData-foutreactieindeling.) |
|
Lexical |
Definieert de namen van alle tekstanalysatoren die door de zoekmachine worden ondersteund. |
|
Lexical |
Definieert de namen van alle tekstnormalizers die door de zoekmachine worden ondersteund. |
|
Lexical |
Definieert de namen van alle tokenizers die door de zoekmachine worden ondersteund. |
|
Token |
Definieert de namen van alle tokenfilters die door de zoekmachine worden ondersteund. |
Accept
De Accepteer kop.
| Waarde | Description |
|---|---|
| application/json;odata.metadata=minimal |
AnalyzedTokenInfo
Informatie over een token dat wordt geretourneerd door een analyse.
| Name | Type | Description |
|---|---|---|
| endOffset |
integer (int32) |
De index van het laatste teken van het token in de invoertekst. |
| position |
integer (int32) |
De positie van het token in de invoertekst ten opzichte van andere tokens. Het eerste token in de invoertekst heeft positie 0, de volgende heeft positie 1, enzovoort. Afhankelijk van de gebruikte analyse hebben sommige tokens mogelijk dezelfde positie, bijvoorbeeld als ze synoniemen van elkaar zijn. |
| startOffset |
integer (int32) |
De index van het eerste teken van het token in de invoertekst. |
| token |
string |
Het token dat door de analyse wordt geretourneerd. |
AnalyzeRequest
Hiermee geeft u enkele tekst- en analyseonderdelen op die worden gebruikt om die tekst op te splitsen in tokens.
| Name | Type | Description |
|---|---|---|
| analyzer |
De naam van de analyse die moet worden gebruikt om de opgegeven tekst te verbreken. Als deze parameter niet is opgegeven, moet u in plaats daarvan een tokenizer opgeven. De tokenizer- en analyseparameters sluiten elkaar wederzijds uit. |
|
| charFilters |
Een optionele lijst met tekenfilters die moeten worden gebruikt bij het verbreken van de opgegeven tekst. Deze parameter kan alleen worden ingesteld wanneer u de tokenizer-parameter gebruikt. |
|
| normalizer |
De naam van de normalisator die moet worden gebruikt om de gegeven tekst te normaliseren. |
|
| text |
string |
De tekst die moet worden opgesplitst in tokens. |
| tokenFilters |
Een optionele lijst met tokenfilters die moeten worden gebruikt bij het verbreken van de opgegeven tekst. Deze parameter kan alleen worden ingesteld wanneer u de tokenizer-parameter gebruikt. |
|
| tokenizer |
De naam van de tokenizer die moet worden gebruikt om de opgegeven tekst te verbreken. Als deze parameter niet is opgegeven, moet u in plaats daarvan een analyse opgeven. De tokenizer- en analyseparameters sluiten elkaar wederzijds uit. |
AnalyzeResult
Het resultaat van het testen van een analyse op tekst.
| Name | Type | Description |
|---|---|---|
| tokens |
De lijst met tokens die worden geretourneerd door de analysator die in de aanvraag is opgegeven. |
CharFilterName
Definieert de namen van alle tekenfilters die door de zoekmachine worden ondersteund.
| Waarde | Description |
|---|---|
| html_strip |
Een tekenfilter waarmee HTML-constructies worden verwijderd. Zie https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html |
ErrorAdditionalInfo
Aanvullende informatie over de resourcebeheerfout.
| Name | Type | Description |
|---|---|---|
| info |
De aanvullende informatie. |
|
| type |
string |
Het extra informatietype. |
ErrorDetail
De foutdetails.
| Name | Type | Description |
|---|---|---|
| additionalInfo |
De fout bevat aanvullende informatie. |
|
| code |
string |
De foutcode. |
| details |
De foutdetails. |
|
| message |
string |
Het foutbericht. |
| target |
string |
Het foutdoelwit. |
ErrorResponse
Veelvoorkomende foutrespons voor alle Azure Resource Manager API's om foutdetails terug te geven bij mislukte bewerkingen. (Dit volgt ook de OData-foutreactieindeling.)
| Name | Type | Description |
|---|---|---|
| error |
Het foutobject. |
LexicalAnalyzerName
Definieert de namen van alle tekstanalysatoren die door de zoekmachine worden ondersteund.
| Waarde | Description |
|---|---|
| ar.microsoft |
Microsoft-analyzer voor Arabisch. |
| ar.lucene |
Lucene analyzer voor Arabisch. |
| hy.lucene |
Lucene analyzer voor Armeens. |
| bn.microsoft |
Microsoft-analyzer voor Bengaals. |
| eu.lucene |
Lucene-analysator voor Baskisch. |
| bg.microsoft |
Microsoft-analyzer voor Bulgaars. |
| bg.lucene |
Lucene analyzer voor Bulgaars. |
| ca.microsoft |
Microsoft-analyzer voor Catalaans. |
| ca.lucene |
Lucene analyzer voor Catalaans. |
| zh-Hans.microsoft |
Microsoft-analyzer voor Chinees (vereenvoudigd). |
| zh-Hans.lucene |
Lucene analyzer voor Chinees (Vereenvoudigd). |
| zh-Hant.microsoft |
Microsoft analyzer voor Chinees (traditioneel). |
| zh-Hant.lucene |
Lucene analyzer voor Chinees (traditioneel). |
| hr.microsoft |
Microsoft analyzer voor Kroatisch. |
| cs.microsoft |
Microsoft-analyzer voor Tsjechisch. |
| cs.lucene |
Lucene analyzer voor Tsjechisch. |
| da.microsoft |
Microsoft-analyzer voor Deens. |
| da.lucene |
Lucene analyzer voor Deens. |
| nl.microsoft |
Microsoft analyzer voor Nederlands. |
| nl.lucene |
Lucene analyzer voor Nederlands. |
| en.microsoft |
Microsoft analyzer voor Engels. |
| en.lucene |
Lucene analyzer voor Engels. |
| et.microsoft |
Microsoft analyzer voor Ests. |
| fi.microsoft |
Microsoft-analyzer voor Fins. |
| fi.lucene |
Lucene analyzer voor Fins. |
| fr.microsoft |
Microsoft-analyzer voor Frans. |
| fr.lucene |
Lucene analyzer voor Frans. |
| gl.lucene |
Lucene analyzer voor Galicisch. |
| de.microsoft |
Microsoft-analyzer voor Duits. |
| de.lucene |
Lucene analyzer voor Duits. |
| el.microsoft |
Microsoft-analyzer voor Grieks. |
| el.lucene |
Lucene analyzer voor Grieks. |
| gu.microsoft |
Microsoft analyzer voor Gujarati. |
| he.microsoft |
Microsoft-analyzer voor Hebreeuws. |
| hi.microsoft |
Microsoft-analyzer voor Hindi. |
| hi.lucene |
Lucene analyzer voor Hindi. |
| hu.microsoft |
Microsoft-analyzer voor Hongaars. |
| hu.lucene |
Lucene analyzer voor Hongaars. |
| is.microsoft |
Microsoft-analyzer voor IJslands. |
| id.microsoft |
Microsoft analyzer voor Indonesisch (Bahasa). |
| id.lucene |
Lucene analyzer voor Indonesisch. |
| ga.lucene |
Lucene analyzer voor Iers. |
| it.microsoft |
Microsoft analyzer voor Italiaans. |
| it.lucene |
Lucene analyzer voor Italiaans. |
| ja.microsoft |
Microsoft analyzer voor Japans. |
| ja.lucene |
Lucene analyzer voor Japans. |
| kn.microsoft |
Microsoft analyzer voor Kannada. |
| ko.microsoft |
Microsoft-analyzer voor Koreaans. |
| ko.lucene |
Lucene analyzer voor Koreaans. |
| lv.microsoft |
Microsoft analyzer voor Lets. |
| lv.lucene |
Lucene analyzer voor Lets. |
| lt.microsoft |
Microsoft analyzer voor Litouws. |
| ml.microsoft |
Microsoft-analyzer voor Malayalam. |
| ms.microsoft |
Microsoft-analyzer voor Maleis (Latijn). |
| mr.microsoft |
Microsoft analyzer voor Marathi. |
| nb.microsoft |
Microsoft analyzer for Norwegian (Bokmül). |
| no.lucene |
Lucene analyzer voor Noors. |
| fa.lucene |
Lucene analyzer voor Perzisch. |
| pl.microsoft |
Microsoft analyzer voor Pools. |
| pl.lucene |
Lucene analyzer voor Pools. |
| pt-BR.microsoft |
Microsoft analyzer voor Portugees (Brazilië). |
| pt-BR.lucene |
Lucene analyzer voor Portugees (Brazilië). |
| pt-PT.microsoft |
Microsoft analyzer for Portuguese (Portugal). |
| pt-PT.lucene |
Lucene analyzer voor Portugees (Portugal). |
| pa.microsoft |
Microsoft analyzer voor Punjabi. |
| ro.microsoft |
Microsoft analyzer voor Roemeens. |
| ro.lucene |
Lucene analyzer voor Roemeens. |
| ru.microsoft |
Microsoft-analyzer voor Russisch. |
| ru.lucene |
Lucene analyzer voor Russisch. |
| sr-cyrillic.microsoft |
Microsoft analyzer voor Servisch (Cyrillisch). |
| sr-latin.microsoft |
Microsoft analyzer voor Servisch (Latijn). |
| sk.microsoft |
Microsoft-analyzer voor Slowaaks. |
| sl.microsoft |
Microsoft analyzer voor Sloveens. |
| es.microsoft |
Microsoft analyzer voor Spaans. |
| es.lucene |
Lucene analyzer voor Spaans. |
| sv.microsoft |
Microsoft-analyzer voor Zweeds. |
| sv.lucene |
Lucene analyzer voor Zweeds. |
| ta.microsoft |
Microsoft-analyzer voor Tamil. |
| te.microsoft |
Microsoft analyzer voor Telugu. |
| th.microsoft |
Microsoft-analyzer voor Thais. |
| th.lucene |
Lucene analyzer voor Thais. |
| tr.microsoft |
Microsoft-analyzer voor Turks. |
| tr.lucene |
Lucene analyzer voor Turks. |
| uk.microsoft |
Microsoft-analyzer voor Oekraïens. |
| ur.microsoft |
Microsoft analyzer voor Urdu. |
| vi.microsoft |
Microsoft-analyzer voor Vietnamees. |
| standard.lucene |
Standaard Lucene-analysator. |
| standardasciifolding.lucene |
Standaard ASCII opvouwbare lucene-analysator. Zie https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers |
| keyword |
Behandelt de volledige inhoud van een veld als één token. Dit is handig voor gegevens zoals postcodes, id's en sommige productnamen. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html |
| pattern |
Scheidt tekst flexibel in termen via een normaal expressiepatroon. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html |
| simple |
Verdeelt tekst bij niet-alfabetische tekens en zet deze om naar kleine letters. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html |
| stop |
Verdeelt tekst bij niet-letters; Hiermee past u de tokenfilters voor kleine letters en stopworden toe. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html |
| whitespace |
Een analyse die gebruikmaakt van de whitespace-tokenizer. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html |
LexicalNormalizerName
Definieert de namen van alle tekstnormalizers die door de zoekmachine worden ondersteund.
| Waarde | Description |
|---|---|
| asciifolding |
Converteert alfabetische, numerieke en symbolische Unicode-tekens die zich niet in de eerste 127 ASCII-tekens (het Unicode-blok Basis latijns) bevinden in hun ASCII-equivalenten, als dergelijke equivalenten bestaan. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html |
| elision |
Verwijdert elisies. "l'avion" (het vliegtuig) wordt bijvoorbeeld geconverteerd naar "avion" (vliegtuig). Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html |
| lowercase |
Normaliseert tokentekst naar kleine letters. Zie https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html |
| standard |
Standaard normalisator, die bestaat uit kleine letters en asciifolding. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html |
| uppercase |
Normaliseert tokentekst naar hoofdletters. Zie https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html |
LexicalTokenizerName
Definieert de namen van alle tokenizers die door de zoekmachine worden ondersteund.
TokenFilterName
Definieert de namen van alle tokenfilters die door de zoekmachine worden ondersteund.